题名:
深度强化学习实践   / (俄) 马克西姆·拉潘著 , 林然, 王薇译
ISBN:
978-7-111-68738-2 价格: CNY149.00
语种:
chi
载体形态:
xvii, 617页 图 24cm
出版发行:
出版地: 北京 出版社: 机械工业出版社 出版日期: 2021
内容提要:
本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。 
主题词:
机器学习   算法
中图分类法:
TP181 版次: 5
主要责任者:
拉潘
次要责任者:
林然
次要责任者:
王薇
责任者附注:
马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士。