题名:
解构大语言模型   / 唐亘著 ,
ISBN:
978-7-121-47740-9 价格: CNY159.00
语种:
chi
载体形态:
XVIII, 414页 彩图 24cm
出版发行:
出版地: 北京 出版社: 电子工业出版社 出版日期: 2024
内容提要:
本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。 
主题词:
自然语言处理  
中图分类法:
TP391 版次: 5
其它题名:
从线性回归到通用人工智能
主要责任者:
唐亘