题名:
大语言模型原理、训练及应用   / 魏新宇, 白雪冰, 周博洋编著 ,
ISBN:
978-7-111-76235-5 价格: CNY99.00
语种:
chi
载体形态:
272页, [4] 页图版 彩图 26cm
出版发行:
出版地: 北京 出版社: 机械工业出版社 出版日期: 2024
内容提要:
本书是一本系统介绍大语言模型原理、训练及应用的书,共7章,主要内容包括:认识大语言模型、大语言模型训练、GPU池化——构建大语言模型算力基础、GPT的优化与编排、GPT的行业应用与开发、Copilot的应用与开发、语言模型小型化及在边缘端的部署。本书详尽阐述了大语言模型的起源、定义及其与传统深度学习方法间的关键差异,深入探讨了主流训练框架如何为大语言模型提供动力,并介绍了优化策略以及高效建立算力基础设施所要考虑的因素。内容涵盖从基础概念介绍到复杂系统编排,再到具体行业应用与开发等多个层面。 
主题词:
自然语言处理  
中图分类法:
TP391 版次: 5
主要责任者:
魏新宇 编著
主要责任者:
白雪冰 编著
主要责任者:
周博洋 编著
责任者附注:
魏新宇,现为红帽资深解决方案架构师。在IaaS PaaS方面有丰富的经验,致力于开源解决方案在企业中的推广和应用。 
责任者附注:
白雪冰,微软 (中国) 有限公司高级架构师。曾任IBM中国软件开发中心 (CSDL) 架构师。目前主要从事基于语音识别、计算机视觉、自然语言处理、智能搜索以及OpenAI和其他大语言模型等技术,构建企业级解决方案的工作。 
责任者附注:
周博洋,微软 (中国) 有限公司高级架构师。曾任Juniper、Cisco系统架构师;主要研究生成式AI算法及训练和推理方法的优化。