题名:
从零构建大模型   / (美) 塞巴斯蒂安·拉施卡著 , 覃立波, 冯骁骋, 刘乾译
ISBN:
978-7-115-66600-0 价格: CNY109.80
语种:
chi
载体形态:
325页 图 24cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025.4
内容提要:
本书是关于如何从零开始构建大模型的指南, 由畅销书作家塞巴斯蒂安·拉施卡撰写, 通过清晰的文字、图表和实例, 逐步指导读者创建自己的大模型。在本书中, 读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练, 以及定制特定任务的微调。此外, 本书还将探讨如何利用人工反馈确保大模型遵循指令, 以及如何将预训练权重加载到大模型中。 
主题词:
人工智能  
中图分类法:
TP18 版次: 5
主要责任者:
拉施卡
次要责任者:
覃立波
次要责任者:
冯骁骋
次要责任者:
刘乾
责任者附注:
塞巴斯蒂安·拉施卡 (Sebastian Raschka), 极具影响力的人工智能专家, 本书配套GitHub项目LLMs-from-scratch达4万星。现在大模型独角兽公司Lightning Al任资深研究工程师。博士毕业于密歇根州立大学, 2018-2023年威斯康星大学麦迪逊分校助理教授 (终身教职), 从事深度学习科研和教学。覃立波, 中南大学特聘教授, 博士生导师。现任中国中文信息学会青工委秘书长。主要研究兴趣为人工智能、自然语言处理、大模型等。冯骁骋, 哈尔滨工业大学计算学部社会计算与交互机器人研究中心教授, 博士生导师, 人工智能学院副院长。刘乾, 新加坡某公司的研究科学家, 主要研究方向是代码生成与自然语言推理。