题名:	强化学习的数学原理 / 赵世钰著 ,
ISBN:	978-7-302-65852-8 价格： CNY118.00
语种:	eng
载体形态:	301页图 (部分彩图), 肖像 26cm
出版发行:	出版地：北京出版社：清华大学出版社出版日期： 2024
内容提要:	本书从强化学习最基本的概念开始介绍, 将介绍基础的分析工具, 包括贝尔曼公式和贝尔曼最优公式, 然后推广到基于模型的和无模型的强化学习算法, 最后推广到基于函数逼近的强化学习方法。本书强调从数学的角度引入概念、分析问题、分析算法, 并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景, 仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础, 本书可以帮助读者更深入地理解一些问题并提供新的视角。
主题词:	机器学习英文
中图分类法:	TP181 版次： 5
主要责任者:	赵世钰著
责任者附注:	赵世钰, 西湖大学工学院AI分支特聘研究员, 智能无人系统实验室负责人, 国家海外高层次人才引进计划青年项目获得者; 本硕毕业于北京航空航天大学, 博士毕业于新加坡国立大学, 曾任英国谢菲尔德大学自动控制与系统工程系Lecturer; 致力于研发有趣、有用、有挑战性的下一代机器人系统, 重点关注多机器人系统中的控制、决策与感知等问题。