题名:
大模型技术30讲   / (美) 塞巴斯蒂安·拉施卡著 , 叶文滔译
ISBN:
978-7-115-65983-5 价格: CNY69.80
语种:
chi
载体形态:
182页 图 24cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025
内容提要:
本书中,我们将学习各种新概念,如深度神经网络架构、计算机视觉、自然语言处理、产品化与部署和模型评估,内容涉及:如何利用修改后的数据集或模型来降低过拟合;如何处理深度神经网络训练中的常见随机性来源;如何在不改变模型架构或降低精度的情况下,通过优化加快模型推断速度;如何在实践中应用彩票机制假设和分布假设;如何使用和微调预训练的大规模语言模型;如何选择正确的时间设置K折交叉验证;以及区分自注意力与普通注意力,常见文本数据的数据增强技术,各种自监督学习技术,多GPU训练范式和各种生成式AI等技术。 
主题词:
人工智能  
中图分类法:
TP18 版次: 5
主要责任者:
拉施卡
次要责任者:
叶文滔
责任者附注:
塞巴斯蒂安·拉施卡,威斯康星大学麦迪逊分校统计学副教授,专注于机器学习和深度学习研究。