21世纪高等学校计算机规划教材——名家系列

计算机视觉教程(微课版 第3版)

图形图像领域和计算机视觉领域的不二选择
分享 推荐 9 收藏 222 阅读 11.0K
章毓晋 (作者) 978-7-115-54619-7

关于本书的内容有任何问题,请联系 孙澍

(1)计算机视觉领域的权威理论教材,有极高的学术价值。
(2)书稿内容思路清晰,表述极其严谨,作者对计算机视觉的理解非常深刻,绘制了计算机视觉与相关学科的关系图谱,让读者对该领域的构架一目了然。
(3)增加微课内容,通俗易懂地讲解本书知识点。
(4)我国图像领域的奠基人之一。

内容摘要

本书系统地介绍了计算机视觉的基本原理、典型方法和实用技术,内容包括绪论、图像采集、基元检测、显著性检测、目标分割、目标表达和描述、纹理分析、形状分析、立体视觉、三维景物恢复、运动分析、景物识别、广义匹配、时空行为理解、场景解释等。读者可从中了解计算机视觉的基本原理和典型技术,并能据此解决计算机视觉应用中的一些具体问题。本书例题丰富多样,每章均有小结和参考、思考题和练习题(本书为部分思考题和练习题提供了解答)。

本书可作为信息科学、计算机科学、计算机应用、信号与信息处理、通信与信息系统、电子与通信工程、模式识别与智能系统等学科大学本科或研究生的专业基础课教材,也可作为远程教育或继续教育中计算机应用、电子技术等专业的研究生相关课程教材,还可供涉及计算机视觉技术应用行业(如工业自动化、人机交互、办公自动化、视觉导航和机器人、安全监控、生物医学、遥感测绘、智能交通和军事公安等)的科技工作者自学及科研参考。

前言

本书为《计算机视觉教程》的第3版,是一本介绍计算机视觉的基本原理、典型方法和实用技术的专业教材,希望为普通高等工科院校的计算机及相近专业开设第一门计算机视觉课程服务。

本次再版仍然保持了原版的基本特点和风格,选材比较精练,但基本覆盖了计算机视觉的主要内容,同时兼顾了不同专业背景的学生和其他自学者学习的需要。本书没有过多地强调理论性,尽量减少了公式推导,对先修知识也没有特别要求。本书中的各章内容相对独立,对每个概念或方法尽量一次讲解清楚,使读者基本上不再需要去参考本书中其他章的内容。本书每章后仍都配有总结和复习,一方面,总结每章各节的要点,帮助读者复习;另一方面,有针对性地介绍一些相关的参考文献,帮助学有余力的读者进一步深入探讨。本书仍在书后给出了术语索引(文中标为黑体),其中对每个术语给出了对应的英文,既方便读者对本书进行查阅,也方便读者上网搜索相关资料。

本书也可用于开设使用《图像处理和分析教程》为教材的后续课程。从这个角度出发,本次再版取消了原第3章(相关内容可参见《图像处理和分析教程》),增加了新的第4章,介绍近期得到广泛关注的显著性检测内容。本书更关注图像技术中较高层次的内容。对其他章节,本次再版也结合近几年研究的推进和技术的发展变化,补充了一些新的概念、方法,增加了一些例题和图表,主要涉及邻接、连接、通路、连通之间的关系,距离变换定义,用模板计算距离图的方法,常见光源亮度和实际景物照度,梯度幅度模计算公式,常用显著性检测数据库,地标点和金字塔表达,纹理基元滤波器组,基于目标围盒的描述符,对拓扑结构的描述,立体图像匹配中的本质矩阵和基本矩阵,利用纹理元形状变化计算外观比例,模式分类中的自适应自举方法,豪斯道夫距离计算,形状矩阵匹配,基于内容检索中的图像归档和图像检索的原理,以及检索系统的功能模块等。另外,本书还更新了参考资料,并对思考题和练习题进行了一些调整。

本书如果用于课堂教学,教师可考虑一次课讲一章,用于约一个学期的教学。对专业基础较好或较高年级的学生,可考虑每章用2个学时;对其他一些相近专业或较低年级的学生,可考虑每章用3个学时(或将例题留到课外让学生自己学习)。

本书共有15章,以及部分思考题和练习题解答、参考文献和索引。在18个一级标题下共有80个二级标题(节),再之下还有139个三级标题(小节)。全书(包括图片、绘图、表格、公式等)折合文字60多万字,有编号的图352个、表格42个、公式738个。为便于教学和理解,本书共给出各类例题141个,思考题和练习题180个,对其中的30个思考题和练习题提供了参考解答(它们有些补充了正文内容,有些给出了更多的示例)。另外,本书最后列出了所介绍的240多篇参考文献的目录和用于索引的近700个术语。
在此,感谢人民邮电出版社编辑们的精心组稿、认真审阅和细心修改。
最后,感谢妻子何芸、女儿章荷铭等家人在各方面的理解和支持。

章毓晋
2019年国庆节于书房
通信:北京清华大学电子工程系,100084
电话:(010) 62798540
传真:(010) 62770317
邮箱:zhang-yj@tsinghua.edu.cn
主页:oa.ee.tsinghua.edu.cn/~zhangyujin/

目录

第1章 绪论 1
1.1 计算机视觉 1
1.1.1 视觉概述 1
1.1.2 计算机视觉的目标 2
1.1.3 相关学科 3
1.1.4 应用领域 4
1.2 图像基础 5
1.2.1 图像及类别 5
1.2.2 图像表达和显示 6
1.2.3 图像存储 8
1.3 像素间联系 10
1.3.1 像素邻域 11
1.3.2 像素间距离 12
1.4 本书内容简介 16
1.4.1 计算机视觉系统及模块 17
1.4.2 如何学习使用本书 18
总结和复习 20
第2章 图像采集 22
2.1 采集装置 22
2.2 采集模型 24
2.2.1 几何成像模型 24
2.2.2 亮度成像模型 30
2.2.3 空间和幅度分辨率 33
2.3 采集方式 34
2.3.1 成像方式一览 34
2.3.2 结构光法 35
2.4 摄像机标定 37
2.4.1 标定程序和步骤 37
2.4.2 两级标定法 40
总结和复习 43
第3章 基元检测 45
3.1 边缘检测 45
3.1.1 检测原理 46
3.1.2 一阶导数算子 47
3.1.3 二阶导数算子 51
3.1.4 边界闭合 55
3.1.5 边界细化 55
3.2 SUSAN算子 57
3.2.1 USAN原理 57
3.2.2 角点和边缘检测 57
3.3 哈里斯兴趣点算子 60
3.4 哈夫变换 62
3.4.1 基本哈夫变换 63
3.4.2 广义哈夫变换 66
3.4.3 完整广义哈夫变换 68
3.5 椭圆定位和检测 69
3.6 位置直方图技术 71
总结和复习 73
第4章 显著性检测 76
4.1 显著性概述 76
4.2 基于对比度的检测 79
4.2.1 对比度算法分类 79
4.2.2 基于对比度幅值 80
4.2.3 基于对比度分布 81
4.2.4 基于最小方向对比度 83
4.3 基于最稳定区域的检测 85
4.3.1 区域显著性 85
4.3.2 最稳定区域 87
4.3.3 显著性计算 88
4.3.4 显著性后处理 90
4.4 显著目标区域提取及效果评价 90
4.4.1 显著目标区域提取 90
4.4.2 显著区域提取效果评价 91
总结和复习 96
第5章 目标分割 98
5.1 轮廓搜索 98
5.1.1 图搜索 99
5.1.2 动态规划 100
5.2 主动轮廓模型 101
5.2.1 主动轮廓 102
5.2.2 能量函数 102
5.3 基本阈值技术 105
5.3.1 原理和分类 105
5.3.2 全局阈值的选取 106
5.3.3 局部阈值的选取 108
5.3.4 动态阈值的选取 111
5.4 特色阈值方法 112
5.4.1 多分辨率阈值 112
5.4.2 过渡区阈值 113
5.5 特征空间聚类 115
5.5.1 基本聚类方法 116
5.5.2 均移确定聚类中心 117
总结和复习 117
第6章 目标表达和描述 119
6.1 基于边界的表达 119
6.1.1 链码 120
6.1.2 边界段和凸包 121
6.1.3 边界标记 123
6.1.4 地标点 124
6.2 基于区域的表达 126
6.2.1 四叉树 126
6.2.2 金字塔 127
6.2.3 围绕区域 128
6.2.4 骨架 129
6.3 基于边界的描述 131
6.3.1 边界长度和直径 131
6.3.2 边界形状数 132
6.3.3 轮廓形状矩阵 133
6.4 基于区域的描述 134
6.4.1 区域面积和密度 134
6.4.2 区域形状数 135
6.4.3 区域不变矩 136
6.4.4 拓扑描述符 138
总结和复习 139
第7章 纹理分析 142
7.1 统计描述方法 142
7.1.1 灰度共生矩阵 143
7.1.2 基于共生矩阵的描述 144
7.1.3 基于能量的描述 145
7.2 结构描述方法 147
7.2.1 结构描述原理 147
7.2.2 纹理镶嵌 149
7.2.3 局部二值模式 150
7.3 频谱描述方法 152
7.3.1 傅里叶频谱描述 152
7.3.2 贝塞尔-傅里叶频谱描述 153
7.3.3 盖伯频谱描述 155
7.4 纹理图像分割 157
7.4.1 有监督纹理分割 157
7.4.2 无监督纹理分割 159
总结和复习 161
第8章 形状分析 163
8.1 形状紧凑性描述符 164
8.2 形状复杂性描述符 171
8.3 基于多边形的形状分析 173
8.3.1 多边形计算 173
8.3.2 多边形描述 175
8.4 基于曲率的形状分析 177
8.4.1 轮廓曲率 177
8.4.2 曲面曲率 180
8.5 拓扑结构参数 181
总结和复习 182
第9章 立体视觉 184
9.1 立体视觉模块 184
9.2 双目成像和视差 186
9.2.1 双目横向模式 186
9.2.2 双目横向会聚模式 189
9.2.3 双目纵向模式 190
9.3 基于区域的立体匹配 190
9.3.1 模板匹配 191
9.3.2 双目立体匹配 192
9.4 基于特征的立体匹配 199
9.4.1 点对点的匹配方法 199
9.4.2 动态规划匹配 201
总结和复习 202
第10章 三维景物恢复 205
10.1 由光移恢复表面朝向 205
10.1.1 表面反射特性 206
10.1.2 目标表面朝向 209
10.1.3 反射图 209
10.1.4 光度立体学求解 211
10.2 从影调获取形状信息 212
10.2.1 影调与形状 212
10.2.2 求解亮度方程 215
10.3 纹理变化与表面朝向 217
10.3.1 3种典型变化 217
10.3.2 确定线段的纹理消失点 220
10.4 根据焦距确定深度 223
总结和复习 224
第11章 运动分析 226
11.1 运动分类和表达 227
11.2 全局运动检测 230
11.2.1 利用图像差的运动检测 230
11.2.2 基于模型的运动检测 233
11.3 运动目标检测、跟踪和分割 235
11.3.1 背景建模 235
11.3.2 运动目标跟踪 239
11.3.3 运动目标分割 243
11.4 运动光流和表面取向 244
11.4.1 光流约束方程 244
11.4.2 光流计算 245
11.4.3 光流与表面取向 249
总结和复习 252
第12章 景物识别 254
12.1 统计模式分类 254
12.1.1 模式分类原理 254
12.1.2 最小距离分类器 255
12.1.3 最优统计分类器 256
12.1.4 自适应自举 259
12.2 感知机 260
12.2.1 感知机原理 261
12.2.2 线性可分类感知机 262
12.2.3 线性不可分类感知机 263
12.3 支持向量机 264
12.3.1 线性可分类支持向量机 264
12.3.2 线性不可分类支持向量机 266
12.4 结构模式识别 268
12.4.1 字符串结构识别 268
12.4.2 树结构识别 270
总结和复习 273
第13章 广义匹配 275
13.1 目标匹配 276
13.1.1 匹配的度量 276
13.1.2 字符串匹配 279
13.1.3 惯量等效椭圆匹配 281
13.1.4 形状矩阵匹配 282
13.2 动态模式匹配 283
13.3 关系匹配 286
13.3.1 关系表达和距离 286
13.3.2 关系匹配模型 287
13.4 图同构匹配 289
13.4.1 图论基础 289
13.4.2 图同构和匹配 292
总结和复习 293
第14章 时空行为理解 296
14.1 时空技术 296
14.2 时空兴趣点 298
14.3 动态轨迹学习和分析 300
14.3.1 自动场景建模 300
14.3.2 路径学习 301
14.3.3 自动活动分析 304
14.4 动作分类和识别 305
14.4.1 动作分类 305
14.4.2 动作识别 307
14.5 活动和行为建模 310
14.5.1 动作建模 311
14.5.2 活动建模和识别 314
总结和复习 317
第15章 场景解释 319
15.1 线条图标记解释 319
15.2 视频信息检索 323
15.2.1 基于内容检索 323
15.2.2 视频节目精彩度排序 325
15.3 计算机视觉系统模型 329
15.3.1 多层次串行结构 329
15.3.2 以知识库为中心的辐射结构 330
15.3.3 以知识库为根的树结构 331
15.3.4 多模块交叉配合结构 332
15.4 计算机视觉理论框架 333
15.4.1 马尔视觉计算理论框架 333
15.4.2 对马尔理论框架的改进 336
15.4.3 新理论框架的研究 337
总结和复习 339
部分思考题和练习题解答 341
参考文献 347
索引 357

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

章毓晋
清华大学教授、博士生导师、图象图形研究所副所长、新加坡南洋理工大学访问教授,已编写出版了图象工程系列教材多部,已在国内外发表30多篇教学研究论文。现为中国图象图形学学会副理事长,学术委员会主任;图象图形科学丛书编委会副主任委员;任国际图象图形学术会议程序委员会主席及全国图象图形学术会议程序委员会主席。

同系列书

购买本书用户

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部