现代深度学习教程-图书-人邮教育社区

内容摘要

本书旨在提供从理论基础到前沿探索的系统学习框架。全书共11章，兼具通识性与学术深度：第1~5章系统讲解人工智能历史、机器学习及神经网络原理与实践（如图像分类、序列标注），夯实学术基础；第6、7章聚焦Transformer与生成式模型，剖析注意力机制、生成对抗网络、扩散模型等前沿技术；第8~10章解析GPT、BERT、ChatGPT等大模型，详解RLHF与提示学习，助力深入研究；第11章展望基础模型在多模态智能、生物医学、遥感等领域的跨学科应用，激发创新热情。本书将案例与实践（如语义分割、机器翻译）紧密结合理论与应用，助力读者将知识转化为研究能力，是通向人工智能学术与技术前沿的可靠指南。本书既可用于人工智能、计算机科学与技术、智能科学与技术、电子科学与技术及智能机器人等相关专业学生的实践教学，也可作为相关专业技术人员的参考指南。

第一章人工智能的前世今生 8
1.1人工智能发展历程 8
1.2 机器学习及经典算法 10
1.2.1 数据集、样本及标签 11
1.2.2 监督学习 14
1.2.3 无监督学习 17
1.2.4 强化学习 20
1.2.5 半监督学习 28
1.2.6 自监督学习 30
1.2.7 迁移学习 38
1.3 深度学习 42
本章小结 44
第二章神经网络基础 46
2.1 神经网络基本原理 46
2.1.1 生物神经元模型 46
2.1.2 人工神经元 48
2.1.3 感知机 52
2.2 卷积神经网络基本原理 54
2.2.1 卷积神经网络构造 54
2.2.2 卷积层 55
2.2.3 非线性激活函数 67
2.2.4 池化 75
2.2.5 全连接层 82
2.2.6 归一化层 83
2.3 神经网络优化方法 86
2.3.1 前向传播与网络初始化 86
2.3.2 损失函数与代价函数 93
2.3.3 反向传播 96
2.3.4 随机梯度下降算法 104
2.3.5 动量梯度下降算法 107
2.3.6 牛顿法 111
2.4 简单卷积神经网络实践 114
本章小结 121
第三章卷积神经网络进阶 122
3.1 经典CNN架构 122
3.1.1 LeNet-5 123
3.1.2 AlexNet与Dropout 125
3.1.3 VGG 131
3.2 新颖CNN架构 133
3.2.1 Network in network（NIN） 134
3.2.2 ResNet 136
3.2.3 Inception 140
3.2.4 DenseNet 143
3.2.5 MobileNet 146
3.2.6 EfficientNet 148
3.2.7 ConvNext 150
3.3 新型卷积 152
3.3.1 空洞卷积 153
3.3.2 可行变卷积 155
3.3.3 深度可分离卷积 158
3.3.4 MBConv 161
3.3.5 反卷积 163
3.3.6 可逆卷积 164
3.4 分类案例与实践 166
3.4.1 分类常用数据集 168
3.4.2 分类任务的评价指标 173
3.4.3 基于ResNet34的分类 180
3.5 语义分割案例与实践 184
3.5.1 语义分割常用数据集 187
3.5.2 语义分割任务的评价指标 191
3.5.3 FCN网络 195
3.5.4 U-net网络 202
3.5.5 DeepLabV3 205
3.6 目标检测案例与实践 208
3.6.1 目标检测常用数据集 211
3.6.2 常用指标 213
3.6.3 Faster R-CNN 217
3.6.4 Yolo 223
本章小结 226
第四章循环神经网络 228
4.1循环神经网络的结构和原理 228
4.2 长短时记忆网络（LSTM） 236
4.3 门控循环单元（GRU） 240
4.4 时序数据处理案例与实践 243
4.4.1 机器翻译 244
4.4.2 序列标注 261
4.4.3 GloVe和BERT词向量编码器 269
本章小结 272
第五章图神经网络 274
5.1图神经网络结构和原理 274
5.1.1 图结构 274
5.1.2 图神经网络的基本结构 278
5.2 经典图神经网络基础模型 281
5.2.1 图卷积网络 281
5.2.2 GraphSAGE 285
5.3 图数据处理案例与实践 289
本章小结 302
第六章 TRANSFORMER网络 303
6.1 经典注意力机制 303
6.2 TRANSFORMER基本结构 314
6.3 视觉TRANSFORMER模型 318
6.3.1 Vision Transformer模型 319
6.3.2 Swin Transformer模型 326
6.3.3 DETR 模型 331
6.3.4 SegFormer模型 335
本章小结 338
第七章生成式学习网络 339
7.1自编码器模型 339
7.1.1 传统自编码器 340
7.1.2 去噪自编码器 342
7.1.3 卷积自编码器 344
7.1.4 变分自编码器 347
7.2生成对抗模型 352
7.2.1 生成对抗网络 353
7.2.2 DCGAN网络 360
7.2.3 CycleGAN模型 362
7.3 扩散模型 367
7.3.1 扩散过程 367
7.3.2 DDPM模型 369
7.3.3 DiT模型 371
本章小结 374
第八章 GPT系列大模型 376
8.1 大规模预训练模型 376
8.1.1 发展历程 378
8.1.2 大模型的优势 380
8.1.3 应用场景 381
8.2 大型预训练语言模型 383
8.3 GPT系列模型 385
8.3.1 GPT系列介绍 386
8.3.2 数据集及参数量 387
8.3.3 预训练 388
8.3.4 优势及局限性 390
8.4 BERT 391
8.4.1 BERT的结构 391
8.4.2 BERT的数据集及参数量 393
8.4.3 BERT的预训练 393
8.4.4 BERT的微调 394
8.4.5 优势及局限性 395
8.5 CHATGPT模型 396
8.6 OPENAI-O1系列 396
本章小结 400
第九章基础大模型核心技术——基于人类反馈的强化学习 402
9.1 近端策略优化 402
9.1.1 策略梯度 403
9.1.2 信赖域策略优化算法 405
9.1.3 PPO算法 409
9.2 基于人类反馈的强化学习 412
9.3 强化TRANSFORMER 415
本章小结 417
第十章基础大模型核心技术——提示学习 418
10.1 提示学习的基本流程 418
10.2 提示学习主要构造 420
10.2.1 预训练模型的选择 420
10.2.2 提示工程 420
10.2.3 答案工程 424
10.3 提示学习示例 426
10.3.1 ZeroShot提示学习 427
10.3.2 Few-Shot提示学习 427
10.3.3 COT提示学习 428
10.3.4 自一致性提示学习 430
10.4 提示微调 433
10.5 自我微调 437
本章小结 439
第十一章基础模型进阶与应用 441
11.1 NLP基础模型 441
11.1.1 AudioLM大模型 441
11.1.2 PaLM系列大语言模型 443
11.1.3 LLaMA系列大语言模型 446
11.1.4 GLM大语言模型 450
11.1.5 腾讯混元大模型 453
11.1.6 DeepSeek大语言模型 454
11.2 视觉基础模型 460
11.2.1 ViT-22B视觉大模型 460
11.2.2 SAM分割大模型 464
11.2.3 Painter及SegGPT视觉大模型 469
11.2.4 SEEM分割大模型 472
11.2.5 LVM视觉大模型 477
11.3 多模态基础模型 479
11.3.1 CLIP多模态大模型 479
11.3.2 GLIP 多模态大模型 481
11.3.3 VisualGPT模型 483
11.3.4 Gemini系列大模型 487
11.3.5 ImageBind 大模型 491
11.3.6 文心大模型 494
11.3.7 “通义千问”大模型 499
11.3.8 讯飞星火认知大模型 503
11.3.9 Sora视频生成大模型 506
11.4 生物医学基础模型 510
11.4.1 AlphaFold模型 511
11.4.2 Geneformer模型 513
11.4.3 Med-PaLM2 模型 514
11.4.4 RadFM模型 516
11.4.5 慧影：医学影像智慧解译基础模型 517
11.5 材料科学基础模型 521
11.5.1 GNoME模型 521
11.5.2 DARWIN模型 523
11.6 遥感解译基础模型 524
11.6.1 悟瞳：遥感大模型理论研究与应用框架 525
11.6.2 RVSA遥感大模型 528
11.6.3 SkyEyeGPT遥感大模型 531
11.6.4 AIE-SEG遥感大模型 534
11.6.5 盘古气象大模型 537
11.7 具身智能机器人 540
11.7.1 RT系列机器人模型 540
11.7.2 VoxPoser机器人模型 544
本章小结 546

读者评论

赶紧抢沙发哦！

我要评论

出版信息

书　　名：现代深度学习教程
执行编辑：本书的内容有任何问题，请联系田紫微
出版日期：2026-01-01
书　　号：978-7-115-69186-6
作　　者： 焦李成
定　　价：89.80 元
页　　数：387
印刷方式：黑白印刷
开　　本：16开
出版状态：上市销售

作者介绍

焦李成，欧洲科学院院士，IEEE Fellow。现任西安电子科技大学华山杰出教授、人工智能研究院院长，国家级领军人才首批入选者、“一带一路”人工智能创新联盟理事长，中国人工智能学会第六-七届副理事长，亚洲计算智能学会主席，IEEE/IET/CAAI/CAA/CIE/CCF/CSIG/AAIA/ACIS/AIIA Fellow，入选多个高被引学者榜单。曾获国家自然科学奖二等奖、吴文俊人工智能杰出贡献奖及省部级一等奖以上科技奖励十余项。