|
题名:
|
DeepSeek架构详解与应用实战 / 薛栋 ... [等] 编著 , |
|
ISBN:
|
978-7-115-66930-8 价格: CNY89.80 |
|
语种:
|
chi |
|
载体形态:
|
228页 图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025 |
|
内容提要:
|
本书系统地介绍了DeepSeek大模型的底层架构、原理、技术创新以及应用实战。全书共分为10章,内容涵盖了DeepSeek的介绍、架构设计、硬件协同、训练与推理技术、语义理解与生成、多模态处理、API应用以及模型微调与定制等方面。在架构设计方面,书中详细阐述了DeepSeek的整体框架、模块划分以及混合专家架构(MoE)等核心技术,同时对比分析了其与其他主流大模型的差异。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18 版次: 5 |
|
主要责任者:
|
薛栋 编著 |
|
主要责任者:
|
刘昌鑫 编著 |
|
主要责任者:
|
陶阳 编著 |
|
责任者附注:
|
薛栋,华东理工大学信息科学与工程学院副教授、硕士生导师,德国慕尼黑工业大学工学博士,上海市浦江人才计划入选者。 |
|
责任者附注:
|
刘昌鑫,华东理工大学教授、博士生导师,国家海外高层次人才计划青年项目入选者;主要从事网络系统分布式控制与优化、机器学习等领域的研究工作。 |
|
责任者附注:
|
陶阳,华东理工大学副教授、硕士生导师,上海市晨光计划项目承担人;主要从事人工智能与大数据相关领域研究;发表学术论文50余篇。 |