题名:
强化学习的数学原理   / 赵世钰著 ,
ISBN:
978-7-302-68567-8 价格: CNY108.00
语种:
chi
载体形态:
xx, 271页 图 (部分彩图) 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2025.4
内容提要:
本书从强化学习最基本的概念开始介绍, 将介绍基础的分析工具, 包括贝尔曼方程和贝尔曼最优方程, 然后推广到基于模型的和无模型的强化学习算法, 最后推广到基于值函数和策略函数的强化学习方法。本书强调从数学的角度引入概念、分析问题、分析算法。本书不要求读者具备任何关于强化学习的知识背景, 仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础, 本书可以帮助读者更深入地理解一些问题并提供新的视角。 
主题词:
机器学习  
中图分类法:
TP181 版次: 5
主要责任者:
赵世钰
责任者附注:
赵世钰, 西湖大学人工智能系特聘研究员, 智能无人系统实验室负责人, 国家海外高层次人才引进计划青年项目获得者。