题名:
|
强化学习 / 袁莎, 白朔天, 唐杰著 , |
ISBN:
|
978-7-302-58794-1 价格: CNY69.00 |
语种:
|
chi |
载体形态:
|
20, 276页, [4] 页图版 图 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2021 |
内容提要:
|
本书为读者构建了一个完整的强化学习入门路径, 深入浅出地介绍了强化学习算法的基本原理和实现方法。在正文开始前, 本书带着初学者回顾了相关预备知识, 包括数学基础和机器学习基础。在正文部分, 本书首先介绍了强化学习的基本概念, 给出了强化学习的数学框架 (马尔科夫决策过程) , 随后介绍了强化学习的求解算法, 包括表格求解法 (动态规划法、蒙特卡洛法和时序差分法) , 以及近似求解法 (值函数近似法、策略梯度法和深度强化学习) 。本书最后一部分为实践与前沿, 实践部分基于一个相同的例子实现了强化学习领域的主流基础算法, 前沿部分介绍了强化学习领域的最新研究进展。本书配有相当数量的习题可供练习, 配套代码基于Python实现, 源代码均已开源, 可开放获取。 |
主题词:
|
机器学习 |
中图分类法:
|
TP181 版次: 5 |
主要责任者:
|
袁莎 著 |
主要责任者:
|
白朔天 著 |
主要责任者:
|
唐杰 著 |
附注:
|
微课版 |
责任者附注:
|
袁莎, 北京智源人工智能研究院数据总监, 副研究员。白朔天, 国内一线互联网公司资深算法专家、人工智能顾问。唐杰, IEEE Fellow, 清华大学计算机系教授、系副主任。 |