题名:
Python深度强化学习入门   / (日) 伊藤多一, 今津义充, 须藤广大等著 , 王卫兵, 杨秋香等译
ISBN:
978-7-111-70072-2 价格: CNY89.00
语种:
chi
载体形态:
xi, 239页 图 25cm
出版发行:
出版地: 北京 出版社: 机械工业出版社 出版日期: 2022
内容提要:
本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念;第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法;第3章通过深度学习、卷积神经网络(CNN)、循环神经网络(RNN)介绍了强化学习中深度学习的特征提取方法;第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现;第5章通过策略梯度法的连续控制、学习算法和策略模型等,介绍了深度强化学习在连续控制问题中的应用及具体实现;第6章通过巡回推销员问题和魔方问题介绍了深度强化学习在组合优化中的应用及具体实现;第7章通过SeqGAN的文本生成和神经网络架构的搜索介绍了深度强化学习在时间序列数据生成的应用。 
主题词:
软件工具   程序设计
中图分类法:
TP311.561 版次: 5
其它题名:
强化学习和深度学习的搜索与控制
主要责任者:
伊藤多一
主要责任者:
今津义充
主要责任者:
须藤广大
次要责任者:
王卫兵
次要责任者:
杨秋香