题名:	基于函数逼近的强化学习与动态规划 / (罗) 卢西恩·布索尼 ... [等] 著 , 刘全, 傅启明, 章宗长译
ISBN:	978-7-115-50830-0 价格： CNY129.00
语种:	chi
载体形态:	249页图 24cm
出版发行:	出版地：北京出版社：人民邮电出版社出版日期： 2019
内容提要:	本书讨论大规模连续空间的强化学习理论及方法，重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6章。第1章为概述；第2章为动态规划与强化学习介绍；第3章为大规模连续空间中的动态规划与强化学习；第4章为基于模糊表示的近似值迭代；第5章为用于在线学习和连续动作控制的近似策略迭代；第6章为基于交叉熵基函数优化的近似策略搜索。
主题词:	机器学习研究
主题词:	动态规划研究
中图分类法:	TP181 版次： 5
主要责任者:	布索尼著
主要责任者:	巴布斯卡著
主要责任者:	舒特著
次要责任者:	刘全译
次要责任者:	傅启明译
次要责任者:	章宗长译
责任者附注:	卢西恩·布索尼，荷兰代尔夫特理工大学代尔夫特系统与控制中心博士后研究员。
责任者附注:	罗伯特·巴布斯卡，荷兰代尔夫特理工大学代尔夫特系统与控制中心教授。
责任者附注:	巴特·德·舒特，荷兰代尔夫特理工大学代尔夫特系统与控制中心海洋与运输技术系教授。
责任者附注:	刘全，苏州大学教授、博士生导师。2004年毕业于吉林大学计算机软件与理论专业，获博士学位。
责任者附注:	傅启明，硕士生导师、苏州科技大学优秀青年骨干教师。
责任者附注:	章宗长，苏州大学副教授、硕士生导师，于2012年在中国科学技术大学获博士学位。