题名:
|
解构大语言模型 / 唐亘著 , |
ISBN:
|
978-7-121-47740-9 价格: CNY159.00 |
语种:
|
chi |
载体形态:
|
XVIII, 414页 彩图 24cm |
出版发行:
|
出版地: 北京 出版社: 电子工业出版社 出版日期: 2024 |
内容提要:
|
本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。 |
主题词:
|
自然语言处理 |
中图分类法:
|
TP391 版次: 5 |
其它题名:
|
从线性回归到通用人工智能 |
主要责任者:
|
唐亘 著 |