题名:
|
强化学习基础、原理与应用 / 张百珂编著 , |
ISBN:
|
978-7-302-68591-3 价格: CNY99.00 |
语种:
|
chi |
载体形态:
|
394页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2025.5 |
内容提要:
|
本书共分为17章, 主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: Predator-Prey游戏及自动驾驶系统。 |
主题词:
|
面向对象语言 程序设计 |
中图分类法:
|
TP312.8PY 版次: 5 |
主要责任者:
|
张百珂 编著 |