工信精品人工智能系列教材

大模型技术与应用(微课版)

大模型技术体系和典型应用
分享 推荐 0 收藏 33 阅读 783
魏亮 周洪利 颜友军 黄韬 (主编) 978-7-115-69806-3

关于本书的内容有任何问题,请联系 顾梦宇

1. 体系完整,紧跟前沿技术浪潮
构建了从基础理论到前沿趋势的完整知识体系。全面覆盖Transformer架构、预训练与微调等核心原理,并深度融合推理优化、多模态、提示工程及智能体(Agent)等最新技术,帮助读者一站式掌握大模型全貌。
2. 理论与工程并重,突出实战落地能力
打破“重理论、轻实践”的传统,精心设计了系列化实训任务。涵盖模型部署、微调优化、多模态生成及智能体构建等核心环节,通过主流开源工具的实操演练,切实将理论转化为动手能力。
3. 项目驱动教学,实现全链路闭环
特设完整的“轻量化问答系统开发与部署”综合项目,将全书关键技术点有机串联。带领读者亲历从模型开发到最终部署的全流程,有效提升解决复杂工程问题的综合实战能力。
4. 结构科学清晰,高度适配教学需求
遵循由浅入深的认知规律,科学划分为8个逻辑递进的模块。每个模块均配有针对性的练习与实验,既便于高校组织系统化教学,也适合科研人员与行业开发者高效自学。

内容摘要

本书围绕大模型技术体系和典型应用,系统介绍其基础理论、核心架构、关键技术与前沿应用。本书共8个模块,涵盖大模型概述、大模型基础架构与原理、大模型训练技术、大模型推理技术、多模态大模型技术、提示工程、大模型智能体,以及大模型问答系统开发实践等内容。书中结合典型实验与主流开源模型案例,帮助读者深入理解大模型的原理、实现与应用。本书语言简明、内容实用、案例典型、操作性强,适合读者边学边练、融会贯通。 本书不仅可以作为高等院校人工智能、计算机科学与技术等相关专业的教材,还可作为算法工程师、AI应用开发者及广大技术爱好者的自学参考用书。

目录

模块1
大模型概述 1
情景引入 1
知识准备 2
1.1 大模型基础 2
1.1.1 大模型定义与特征 2
1.1.2 大模型发展历程 3
1.1.3 大模型核心分类 5
1.2 大模型构建流程与资源 7
1.2.1 通用型构建流程 7
1.2.2 技术导向型构建流程 10
1.2.3 大模型相关资源 12
1.3 大模型面临的挑战与应对
方法 14
1.3.1 技术挑战 14
1.3.2 应用挑战 15
1.3.3 伦理安全挑战 16
实训任务 18
1.4 开源大模型的本地化部署与基础
应用 18
模块小结 26
模块练习 27

模块2
大模型基础架构与原理 28
情景引入 28
知识准备 29
2.1 Transformer架构 29
2.1.1 概述 29
2.1.2 数据处理 30
2.1.3 编码器组件 34
2.1.4 解码器组件 39
2.1.5 输出组件 40
2.1.6 机器翻译示例 41
2.1.7 Transformer模型变体 42
2.2 Transformers库 44
2.2.1 基本组成 45
2.2.2 使用方法 45
2.2.3 未来发展 46
实训任务 46
2.3 基于Transformer的中英翻译
大模型的部署与使用 46
模块小结 52
模块练习 52

模块3
大模型训练技术 53
情景引入 53
知识准备 54
3.1 预训练 54
3.1.1 数据准备 55
3.1.2 模型架构设计 56
3.1.3 分布式训练与优化 57
3.2 微调 62
3.2.1 全参数微调 63
3.2.2 前缀微调 64
3.2.3 提示微调 66
3.2.4 LoRA 67
实训任务 70
3.3 LoRA轻量化微调 70
模块小结 79
模块练习 79

模块4
大模型推理技术 81
情景引入 81
知识准备 82
4.1 推理概述 82
4.1.1 推理的工作流程 82
4.1.2 核心挑战 83
4.1.3 推理框架 83
4.2 模型压缩和优化技术 88
4.2.1 模型量化 89
4.2.2 知识蒸馏 92
4.2.3 模型剪枝 94
4.2.4 稀疏激活 96
实训任务 98
4.3 知识蒸馏执行流程与可视化 98
模块小结 108
模块练习 108

模块5
多模态大模型技术 109
情景引入 109
知识准备 110
5.1 多模态大模型概述 110
5.1.1 基本概念 110
5.1.2 模型架构 111
5.2 多模态大模型预训练与微调 115
5.2.1 预训练 116
5.2.2 微调 118
5.3 多模态推理与生成 120
实训任务 121
5.4 多模态大模型驱动的图文生成
实践 121
模块小结 132
模块练习 132

模块6
提示工程 133
情景引入 133
知识准备 134
6.1 提示工程概述 134
6.1.1 提示工程核心要素 134
6.1.2 提示工程设计原则 138
6.2 提示方法原理 140
6.2.1 零样本提示 141
6.2.2 少样本提示 141
6.2.3 思维链提示 142
6.2.4 自洽性提示 145
6.2.5 思维树提示 146
实训任务 148
6.3 问答任务提示方法效果
对比 148
模块小结 155
模块练习 155
模块7
大模型智能体 156
情景引入 156
知识准备 157
7.1 大模型智能体简介 157
7.2 大模型智能体核心组件 158
7.2.1 记忆组件 158
7.2.2 工具调用组件 159
7.2.3 任务规划组件 160
7.3 多智能体 161
7.4 大模型智能体主要协议 163
7.4.1 模型上下文协议 163
7.4.2 智能体对智能体协议 166
7.5 主流开发框架 168
实训任务 171
7.6 电商大模型智能体构建与场景
应用 171
模块小结 179
模块练习 179

模块8
大模型问答系统开发实践 180
情景引入 180
8.1 基础知识准备 181
8.1.1 大模型问答系统 181
8.1.2 检索增强生成 182
8.2 开源框架与应用 183
8.2.1 开源框架概述 184
8.2.2 AnythingLLM 184
8.2.3 大模型问答系统整体架构 186
8.3 大模型问答系统开发与部署 187
8.3.1 环境部署 188
8.3.2 构建本地知识库 197
8.4 问答系统开发 203
8.4.1 API介绍 203
8.4.2 问答系统开发 206
模块小结 211
模块练习 211

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

魏亮,博士,江苏省未来网络创新研究院团队总监。国家发改委“未来网络试验设施”重大科技基础设施工程中担任SDN网络组组长,网络技术社区 SDNLAB 创始人,2019 年工信部工业互联网创新发展工程项目负责人,2020年科技部国家重点研发计划宽带通信和新型网络重点专项项目负责人。目前是中国计算学会网络与数据通信专委会副主任、互联网专委会常务委员、中国通信学会信息通信网络技术委员会委员,信息技术新工科联盟未来网络工委秘书长。主要从事软件定义网络、可编程网络、确定性网络等方面的研究工作。发表论文11篇,申请技术发明专利 16 项,获得软件著作权 20 余项。曾作为项目参与人获得中国通信学会技术发明一等奖。

同系列书

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部