计算机视觉——从理论到实践(微课版)

面向计算机视觉、机器视觉等课程的“微课版”新形态精品教材,结构清晰、案例丰富、资源齐全,配套慕课在B站上播放量超百万人次。
分享 推荐 0 收藏 8 阅读 384
鲁鹏 (作者) 978-7-115-66743-4

关于本书的内容有任何问题,请联系 人邮社 王宣

1.结构清晰,层次分明:本书共分为三篇,每篇针对计算机视觉的不同层面进行深入讲解,从基础理论到高级应用,层层递进,便于读者逐步掌握计算机视觉的核心知识。
2.内容丰富,覆盖全面:本书基础篇为读者提供一个全面的计算机视觉概览;识别篇介绍图像分割技术,探讨高效的像素聚类方法,以及这些方法如何提升图像处理的效果;重建篇深入探讨摄像机几何学,为三维重建打下坚实的理论基础。
3.理实结合,侧重应用:本书不仅注重理论知识的讲解,还介绍了大量的实际应用案例,使读者能够更好地将所学知识应用于实际问题的解决之中,进而锤炼扎实的工程实战能力。
4.紧跟前沿,拓展眼界:本书涵盖了计算机视觉领域的最新研究成果和技术动态,可以帮助读者把握行业发展趋势,提升领域专业素养,拓展科技认知边界。
5.讲解深入,适用面广:本书讲解深入,适用面广,适合计算机视觉领域的初学者、本科生、科研人员及相关行业的工程师阅读和学习。

特别说明

本书作者“北京邮电大学 鲁鹏”在B站上讲授的计算机视觉相关课程的录播视频播放量超过100万人次,受到广大读者的一致好评。

内容摘要

本书深入探索计算机视觉的核心技术,围绕五大关键任务展开介绍,即图像分类、图像分割、目标检测、目标跟踪及三维重建。
本书共9章,分为三篇,即基础篇、识别篇和重建篇,系统性地引导读者逐步深入了解计算机视觉的复杂内涵与应用实践。基础篇(第1~4章)着重介绍了构成计算机视觉的通用理论与算法,包括但不限于图像滤波技术的基本原理、边缘检测的实现方法、尺度不变特征的提取策略及模型拟合的数学工具等,为后续章节的学习奠定必要的理论与技术基础。识别篇(第5~7章)深入分析了机器解析图像内容的高级能力,具体涉及图像分割、图像分类、目标检测与跟踪的经典算法及模型。重建篇(第8、9章)聚焦于如何从二维图像数据中复原三维场景结构,详细阐述了摄像机几何原理、极几何的应用、双目立体视觉等关键技术的概念与算法,展现了从图像像素到三维场景结构的转换过程。
本书可作为人工智能、智能科学与技术等专业计算机视觉、机器视觉等课程的教材,也可供计算机视觉领域的专业人士(包括开发人员、科技人员和研究学者)参考使用。

目录

【章名目录】
第1章 绪论 1
第2章 线性滤波器 8
第3章 图像边缘提取与模型拟合 27
第4章 局部特征提取 56
第5章 图像分割 81
第6章 图像检索与分类 94
第7章 目标检测与跟踪 117
第8章 摄像机几何与标定 144
第9章 三维重建 175

【详细目录】
第1章 绪论 1
1.1 计算机视觉概述 1
1.2 相关学科 2
1.3 发展历程 3
1.4 应用领域 5
本章小结 7
习题  7

第2章 线性滤波器 8
2.1 卷积 8
2.1.1 图像表示与线性滤波 8
2.1.2 卷积的定义 10
2.1.3 卷积的性质 11
2.1.4 卷积示例 11
2.1.5 动手实践:图像锐化 13
2.2 图像去噪 14
2.2.1 噪声分析 14
2.2.2 中值滤波器 16
2.2.3 动手实践:去除图像中的椒盐噪声 18
2.2.4 高斯滤波 20
2.2.5 动手实践:去除图像中的高斯噪声 24
本章小结 26
习题  26

第3章 图像边缘提取与模型拟合 27
3.1 图像边缘与图像求导 27
3.1.1 边缘的位置特点 27
3.1.2 图像导数与梯度 29
3.1.3 高斯一阶偏导核 30
3.1.4 动手实践:图像求导 33
3.2 边缘检测 35
3.2.1 Canny边缘检测器 35
3.2.2 动手实践:车道线检测 37
3.3 模型拟合 38
3.3.1 最小二乘拟合 38
3.3.2 鲁棒拟合 41
3.3.3 RANSAC算法 42
3.3.4 动手实践:RANSAC直线拟合 45
3.3.5 霍夫变换 47
3.4 动手实践:硬币定位 53
本章小结 55
习题  55

第4章 局部特征提取 56
4.1 图像拼接问题与局部特征 56
4.2 Harris-Laplace检测器 59
4.2.1 Harris角点检测器 59
4.2.2 尺度不变理论 65
4.2.3 LoG算子 67
4.3 SIFT特征 72
4.3.1 DoG尺度空间 72
4.3.2 SIFT特征点检测 74
4.3.3 SIFT特征描述子 75
4.4 动手实践:图像拼接 76
本章小结 80
习题  80

第5章 图像分割 81
5.1 图像分割概述 81
5.2 人类视觉分组与格式塔理论 82
5.3 基于像素聚类的图像分割 83
5.3.1 基于K-means的图像分割 83
5.3.2 基于均值漂移的图像分割 85
5.3.3 动手实践:图像分割 89
本章小结 92
习题  93

第6章 图像检索与分类 94
6.1 图像分类任务概述 94
6.1.1 图像分类任务的难点 95
6.1.2 图像分类任务的评价指标 98
6.1.3 数据驱动的图像分类系统的基本范式 99
6.2 词袋模型与图像检索 100
6.2.1 文本词袋模型 100
6.2.2 TF-IDF加权 101
6.2.3 视觉词袋模型 102
6.2.4 动手实践:基于词袋模型的图像检索 104
6.3 基于词袋模型的图像分类 107
6.3.1 线性分类模型 107
6.3.2 多类支持向量机损失 108
6.3.3 模型优化 109
6.3.4 欠拟合与过拟合 110
6.3.5 动手实践:场景图像分类 111
本章小结 116
习题  116

第7章 目标检测与跟踪 117
7.1 目标检测任务概述 117
7.2 基于滑动窗口的目标检测范式 118
7.3 基于AdaBoost的人脸检测 121
7.3.1 人脸检测任务概述 121
7.3.2 AdaBoost算法 121
7.3.3 构建弱分类器 122
7.3.4 级联结构 125
7.3.5 动手实践:人脸检测 127
7.4 基于HOG特征的行人检测 129
7.4.1 行人检测任务概述 130
7.4.2 HOG特征 130
7.4.3 应用HOG特征实现行人检测 131
7.4.4 动手实践:行人检测 132
7.5 基于光流的运动跟踪 133
7.5.1 光流计算基本等式 134
7.5.2 Lucas-Kanade光流计算 136
7.5.3 动手实践:车辆运动跟踪 138
本章小结 142
习题  142

第8章 摄像机几何与标定 144
8.1 针孔模型与透镜 144
8.1.1 针孔摄像机 144
8.1.2 透镜成像 148
8.2 摄像机几何 151
8.2.1 齐次坐标 151
8.2.2 坐标系变换和刚体变换 153
8.2.3 一般摄像机的几何模型 157
8.2.4 透视投影矩阵的性质 161
8.3 摄像机标定 161
8.3.1 投影矩阵估计 161
8.3.2 退化情况 163
8.4 径向畸变的摄像机标定 164
8.4.1 径向畸变模型 164
8.4.2 径向畸变标定 165
8.5 动手实践:摄像机标定 167
本章小结 173
习题  173

第9章 三维重建 175
9.1 三维重建基础 175
9.1.1 三角化的概念 175
9.1.2 三角化的线性解法 177
9.1.3 三角化的非线性解法 178
9.2 极几何与基础矩阵 179
9.2.1 极几何 179
9.2.2 本质矩阵与基础矩阵 180
9.2.3 基础矩阵估计 182
9.2.4 动手实践:基础矩阵估计 184
9.3 双目立体视觉 190
9.3.1 基于平行视图的双目立体视觉 190
9.3.2 图像校正 194
9.3.3 对应点搜索 197
9.3.4 动手实践:双目立体视觉定位 201
本章小结 208
习题  208

参考文献 210

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

鲁鹏:
北京邮电大学人工智能学院副教授;2003年7月获得华中科技大学图像所硕士学位,2006年7月获得中国科学院自动化所博士学位,2008年至2010年在北京大学人机交互与多媒体实验室从事博士后研究工作;在北京邮电大学任教以来,长期从事本科生、研究生计算机视觉课程的教学工作,在B站上讲授的计算机视觉相关课程的录播视频播放量超过100万人次,同时,主讲的计算机视觉在线慕课已在“学堂在线”上线;教学经验丰富、成果显著,出版《计算机视觉——从理论到实践(微课版)》《计算机视觉基础》等多部教材。

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部