本书深入探索计算机视觉的核心技术,围绕五大关键任务展开介绍,即图像分类、图像分割、目标检测、目标跟踪及三维重建。
本书共9章,分为三篇,即基础篇、识别篇和重建篇,系统性地引导读者逐步深入了解计算机视觉的复杂内涵与应用实践。基础篇(第1~4章)着重介绍了构成计算机视觉的通用理论与算法,包括但不限于图像滤波技术的基本原理、边缘检测的实现方法、尺度不变特征的提取策略及模型拟合的数学工具等,为后续章节的学习奠定必要的理论与技术基础。识别篇(第5~7章)深入分析了机器解析图像内容的高级能力,具体涉及图像分割、图像分类、目标检测与跟踪的经典算法及模型。重建篇(第8、9章)聚焦于如何从二维图像数据中复原三维场景结构,详细阐述了摄像机几何原理、极几何的应用、双目立体视觉等关键技术的概念与算法,展现了从图像像素到三维场景结构的转换过程。
本书可作为人工智能、智能科学与技术等专业计算机视觉、机器视觉等课程的教材,也可供计算机视觉领域的专业人士(包括开发人员、科技人员和研究学者)参考使用。
我要评论