|
题名:
|
图解DeepSeek技术 / (沙特) 杰伊·阿拉马尔, (荷) 马尔滕·格鲁滕多斯特著 , 李博杰, 孟佳颖译 |
|
ISBN:
|
978-7-115-67461-6 价格: CNY59.80 |
|
语种:
|
chi |
|
载体形态:
|
94页 彩图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025 |
|
内容提要:
|
本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。全书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享DeepSeek开源周活动。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18-64 版次: 5 |
|
其它题名:
|
DeepSeek技术 |
|
主要责任者:
|
阿拉马尔 著 |
|
主要责任者:
|
格鲁滕多斯特 著 |
|
次要责任者:
|
李博杰 译 |
|
次要责任者:
|
孟佳颖 译 |
|
责任者附注:
|
杰伊·阿拉马尔,Cohere总监兼工程研究员,知名大模型技术博客Language Models & Co作者,DeepLearning,Al和Udacity热门机器学习和自然语言处理课程作者。 |
|
责任者附注:
|
马尔滕·格鲁滕多斯特,IKNL (荷兰综合癌症中心) 高级临床数据科学家,知名大模型技术博客博主,BERTopic等开源大模型软件包作者 (下载量超过百万次),DeepLeaming.Al和Udacity热门机器学习和自然语言处理课程作者。 |
|
责任者附注:
|
李博杰,智能体初创公司 PINE AI联合创始人、首席科学家。曾任华为计算机网络与协议实验室副首席专家,入选华为首批“天才少年”项目。 |
|
责任者附注:
|
孟佳颖,中国科学技术大学博士。现任北京中关村实验窒助理研究员,主要从事网络协议栈的漏洞挖掘与风险分析技术的研究工作。 |