计算机视觉开发（慕课版）-图书-人邮教育社区

内容摘要

本书针对高职教育的特点，紧依据职业岗位需求设计建构课程内容，在覆盖基本理论的同时，强调培养学生具体的实践操作能力。本书教材内容主要包括7个单元：计算机视觉基础、图像预处理、BP神经网络、卷积神经网络、Tensorflow2.0基础、图像分类、目标检测。通过关键技术以及整体架构的学习，结合案例，要求学生了解人工智能中计算机视觉的发展状况与研究内容，掌握基本概念、基本原理，了解计算机视觉的一些经典场景应用，掌握计算机视觉开发的一般流程，初步具备计算机视觉开发的能力。

目录

第 1章初识计算机视觉 1
1.1 人类视觉系统 1
1.2 计算机视觉 3
1.2.1 计算机视觉的重要性 3
1.2.2 语义鸿沟 3
1.2.3 基于深度学习的计算机视觉工作原理 4
1.3 计算机视觉常见任务 4
1.3.1 图像分类 5
1.3.2 目标检测 5
1.3.3 图像分割 6
1.4 计算机视觉发展过程 7
1.4.1 20世纪50年代，二维图像的分析和识别 7
1.4.2 20世纪60年代，理解三维场景 8
1.4.3 20世纪70年代，恢复三维结构 8
1.4.4 20世纪80年代，基于专家系统的计算机视觉 9
1.4.5 20世纪90年代，特征对象识别 9
1.4.6 21世纪初，图像特征工程 10
1.4.7 2010年至今，深度学习年代 11
1.5 行业应用 11
1.5.1 在智慧医疗领域的应用 11
1.5.2 在公共安全领域的应用 12
1.5.3 在无人机与自动驾驶领域的应用 12
1.5.4 在其他社会领域的应用 13
1.6 基础开发环境搭建 13
1.6.1 下载及安装Anaconda 13
1.6.2 使用Anaconda安装TensorFlow 17
1.6.3 使用Anaconda安装Opencv 19
1.6.4 Jupyter Notebook使用 20
1.7 本章小结 23

第 2章 TesnorFlow2.X基础 24
2.1 数据类型 25
2.1.1 数值类型 25
2.1.2 字符串类型 29
2.1.3 布尔类型 30
2.1.4 数值精度 31
2.1.5 类型转换 32
2.2 变量 33
2.3 创建张量 34
2.3.1 从数组、列表对象创建 34
2.3.2 创建全0或全1张量 35
2.3.3 创建已知分布的张量 36
2.4 索引与切片 37
2.4.1 索引 37
2.4.2 切片 39
2.5 维度变换 40
2.5.1 改变视图 40
2.5.2 改变维度 42
2.6 数学运算 46
2.6.1 四则常规运算 46
2.6.2 指数和对数运算 47
2.6.3 矩阵相乘运算 47
2.7 自动求导机制 48
2.8 TensorBoard 可视化组件 49
2.8.1 TensorBoard简介 50
2.8.2 TensorBoard的基本用法 51
2.9 keras.datasets 52
2.9.1 数据集加载 53
2.9.2 数据预处理 54
2.10 本章小结 58
第3章图像预处理 60
3.1 图像基础 60
3.2 图像数据解析 62
3.2.1 图像编码 62
3.2.2 图像解码 65
3.3 图像数据处理 68
3.3.1 图像缩放 69
3.3.2 图像翻转 70
3.3.3 图像旋转 73
3.3.4 图像色彩调整 74
3.3.5 图像增强 77
3.4 本章小结 79
第4章深度神经网络 80
4.1 人工神经网络（ANN） 81
4.1.1 生物启发 81
4.1.2 M-P神经元模型 82
4.1.3 单层感知机 84
4.1.4 多层感知机 85
4.1.5 激活函数 86
4.1.6 参数初始化 95
4.1.7 tf.keras神经网络模型构建 98
4.2 人工神经网络训练过程 104
4.2.1 前向传播 104
4.2.2 损失函数 105
4.2.3 反向传播 109
4.2.4 梯度下降算法 109
4.2.5 梯度下降优化方法 111
4.2.6 Epoch，Batch size，Iterations 116
4.3 正则化 118
4.3.1 L1与L2正则化 118
4.3.2 Dropout 120
4.3.3 批归一化 122
4.3.4 提前停止训练 124
4.4 实战：MNIST手写数据识别 126
4.4.1 数据加载 128
4.4.2 数据处理 129
4.4.3 模型构建 130
4.4.4 模型编译 132
4.4.5 模型训练 132
4.4.6 模型评估 135
4.4.7 模型保存 136
4.5 本章小结 136
第5章卷积神经网络 138
5.1 全连接神经网络VS卷积神经网络 139
5.1.1 全连接神经网络处理图像的不足 139
5.1.2 卷积神经网络的解决办法 140
5.1 卷积神经网络基本结构 142
5.1.1 输入层 143
5.1.2 卷积层 144
5.1.3 池化层 144
5.1.4 全连接层 144
5.2 卷积 144
5.2.1 卷积计算 145
5.2.2 填充（padding） 146
5.2.3 步长（stride） 148
5.2.4 多通道卷积 149
5.2.5 多卷积核卷积 151
5.2.6 特征图的大小 151
5.2.7 tf.keras卷积实现 152
5.3 池化 153
5.3.1 池化操作 153
5.3.2 tf.keras池化操作实现 154
5.4 LeNet-5网络构建 155
5.5 BatchNorm层 157
5.6 常见卷积神经网络模型 159
5.6.1 AlexNet 159
5.6.2 VGGNet 160
5.6.3 GoogLeNet 163
5.7 实战：花朵识别 165
5.7.1 前期工作 166
5.7.2 数据预处理 167
5.7.3 构建CNN模型 169
5.7.4 编译模型 171
5.7.5 训练模型 171
5.7.6 评估模型 171
5.8 本章小结 172
第6章图像分类与迁移学习 174
6.1 图像分类概述 175
6.2 实战：自定义网络实现猫狗大战 176
6.2.1 数据集加载 176
6.2.2 数据预处理 177
6.2.3 自定义网络模型 178
6.2.4 编译模型 180
6.2.5 训练模型 180
6.2.6 可视化训练结果 180
6.2.7 数据增强 181
6.3 迁移学习 182
6.4 使用迁移学习实现猫狗大战 184
6.4.1 实例化InceptionV3 185
6.4.2 为模型添加新的层 185
6.4.3 编译模型 186
6.4.4 训练模型 186
6.5 TensorFlow Hub介绍 187
6.6 使用TensorFlow Hub进行花卉分类 188
6.6.1 下载数据 188
6.6.2 创建数据集 189
6.6.3 使数据适应模型 189
6.6.4 建立模型 190
6.6.5 训练与评估 191
6.7 本章小结 193
第7章目标检测 194
7.1 目标检测的基本概念 195
7.2 目标检测常用数据集和标注工具 196
7.3 目标检测常用技术 199
7.3.1 边界框（Bounding box） 199
7.3.2 数据表示 203
7.3.3 效果评估 203
7.4 常用网络类型 203
7.4.1 R-CNN系列 204
7.4.2 YOLO系列 207
7.5 人脸识别 211
7.5.1 MTCNN工作原理 212
7.5.2 FaceNet 216
7.5.3 人脸检测实践 219
7.6 目标检测案例（YOLOv3） 224
7.6.1 YOLOv3模型结构和工作流程 224
7.6.2 YOLOv3应用实践 227
7.6.3 YOLOv3核心功能代码 235
7.6.4 采用YOLOv3源码实现目标检测 238
7.7 本章小结 242

读者评论

赶紧抢沙发哦！

我要评论

出版信息

书　　名：计算机视觉开发（慕课版）
执行编辑：本书的内容有任何问题，请联系刘佳
出版日期：2025-09-01
书　　号：978-7-115-67594-1
作　　者： 凌明胜
定　　价：49.80 元
页　　数：188
印刷方式：黑白印刷
开　　本：16开
出版状态：上市销售

作者介绍

主编曾在世界五百强企业工作多年，具有丰富的企业工作经历。曾担任第二代XX卫星通信系统等多个大型国防装备项目软件定型/鉴定测评负责人。获得信息系统项目管理师（高级），军用软件测评实验室内审员，航空军用软件测试师资格。主持编写企业标准一项，参与企业标准编制一项。参与国防”十二五”课题一项。目前在常州信息职业技术学院从事人工智能技术服务专业相关教学和科研工作，主要讲授计算机视觉开发、数据结构、python程序设计等课程；参与编写《python程序设计》、《Docker容器技术》、《信息技术基础》等专业教材。参与软件技术专业国家教学资源库、江苏省品牌专业建设；全国职业院校技能大赛优秀指导教师、江苏省技术能手、2021年第四届江苏省百万技能人才技能竞赛岗位练兵活动暨江苏省电信与互联网行业人工智能训练师职业技能竞赛（职工组）二等奖。指导学生获2018年全国职业院校技能大赛软件测试赛项一等奖、2020年全国大学生软件测试大赛嵌入式赛项全国一等奖。