题名:
异策略安全约束强化学习   / 杨奇松 ... [等] 著 ,
ISBN:
978-7-118-13707-1 价格: CNY88.00
语种:
chi
载体形态:
XIII, 117页 图 24cm
出版发行:
出版地: 北京 出版社: 国防工业出版社 出版日期: 2025
内容提要:
本书深入探讨了强化学习在现实世界应用中面临的安全挑战, 特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法, 区分奖励函数与安全相关的成本函数, 以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题, 开发了相应的算法。本书不仅贡献了相关安全强化学习算法理论, 也为实践中强化学习的安全应用提供了全面的算法支持, 同时展望了元学习及无重置学习等技术, 以求安全理论的进一步突破, 为追求更安全、可靠的强化学习应用奠定基础。 
主题词:
机器学习  
中图分类法:
TP181 版次: 5
主要责任者:
杨奇松
主要责任者:
常燕
主要责任者:
武健