|
题名:
|
大模型轻量化 / 梁志远著 , |
|
ISBN:
|
978-7-302-68600-2 价格: CNY129.00 |
|
语种:
|
chi |
|
载体形态:
|
384页 图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2025 |
|
内容提要:
|
本书分为三部分共10章, 首先聚焦大模型的背景与面临的问题, 讲解了Transformer和MoE架构的基本原理; 随后重点讲解模型压缩、训练加速和推理优化等核心技术, 包括量化、蒸馏和剪枝等, 并通过实际案例验证其效用; 后续则详述端侧学习与计算引擎优化策略, 尤其是动态Batch和异构执行的工程实现。最后针对高性能算子库与手工算子开发, 分别以cuDNN、NEON、CUDA等实际案例为导向, 揭示算子优化的细节; 结尾以最新的国产开源模型DeepSeek-V3为例, 展现从训练到推理的综合优化方案。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18 版次: 5 |
|
其它题名:
|
模型压缩与训练加速 |
|
主要责任者:
|
梁志远 著 |