题名:
图解DeepSeek技术   / (沙特) 杰伊·阿拉马尔, (荷) 马尔滕·格鲁滕多斯特著 , 李博杰, 孟佳颖译
ISBN:
978-7-115-67461-6 价格: CNY59.80
语种:
chi
载体形态:
94页 彩图 24cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025
内容提要:
本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。全书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享DeepSeek开源周活动。 
主题词:
人工智能  
中图分类法:
TP18-64 版次: 5
其它题名:
DeepSeek技术
主要责任者:
阿拉马尔
主要责任者:
格鲁滕多斯特
次要责任者:
李博杰
次要责任者:
孟佳颖
责任者附注:
杰伊·阿拉马尔,Cohere总监兼工程研究员,知名大模型技术博客Language Models & Co作者,DeepLearning,Al和Udacity热门机器学习和自然语言处理课程作者。 
责任者附注:
马尔滕·格鲁滕多斯特,IKNL (荷兰综合癌症中心) 高级临床数据科学家,知名大模型技术博客博主,BERTopic等开源大模型软件包作者 (下载量超过百万次),DeepLeaming.Al和Udacity热门机器学习和自然语言处理课程作者。 
责任者附注:
李博杰,智能体初创公司 PINE AI联合创始人、首席科学家。曾任华为计算机网络与协议实验室副首席专家,入选华为首批“天才少年”项目。 
责任者附注:
孟佳颖,中国科学技术大学博士。现任北京中关村实验窒助理研究员,主要从事网络协议栈的漏洞挖掘与风险分析技术的研究工作。