题名:
|
大模型技术30讲 / (美) 塞巴斯蒂安·拉施卡著 , 叶文滔译 |
ISBN:
|
978-7-115-65983-5 价格: CNY69.80 |
语种:
|
chi |
载体形态:
|
182页 图 24cm |
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025 |
内容提要:
|
本书中,我们将学习各种新概念,如深度神经网络架构、计算机视觉、自然语言处理、产品化与部署和模型评估,内容涉及:如何利用修改后的数据集或模型来降低过拟合;如何处理深度神经网络训练中的常见随机性来源;如何在不改变模型架构或降低精度的情况下,通过优化加快模型推断速度;如何在实践中应用彩票机制假设和分布假设;如何使用和微调预训练的大规模语言模型;如何选择正确的时间设置K折交叉验证;以及区分自注意力与普通注意力,常见文本数据的数据增强技术,各种自监督学习技术,多GPU训练范式和各种生成式AI等技术。 |
主题词:
|
人工智能 |
中图分类法:
|
TP18 版次: 5 |
主要责任者:
|
拉施卡 著 |
次要责任者:
|
叶文滔 译 |
责任者附注:
|
塞巴斯蒂安·拉施卡,威斯康星大学麦迪逊分校统计学副教授,专注于机器学习和深度学习研究。 |