商品详情
书名:视觉:对人类如何表示和处理视觉信息的计算研究
定价:119.0
ISBN:9787121423703
作者:(美)David Marr(大卫?马尔)
版次:第1版
出版时间:2021-12
内容提要:
本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
作者简介:
David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。
吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。
目录:
第Ⅰ部分 引言和哲学基础
总述........................................................................................................................... 3
第1章 哲学原理和方法.......................................................................................... 7
1.1 背景知识 ...................................................................................................... 7
1.2 理解复杂的信息处理系统......................................................................... 16
表示和描述 ................................................................................................ 16
处理............................................................................................................ 17
信息处理的三个层次 ................................................................................ 19
计算理论的重要性 .................................................................................... 21
J. J. Gibson 的方法..................................................................................... 22
1.3 视觉的表示框架 ........................................................................................ 24
视觉的目的 ................................................................................................ 25
高级视觉 .................................................................................................... 26
目标与可行性 ............................................................................................ 28
第Ⅱ部分 视觉
第 2 章 图像的表示............................................................................................... 33
2.1 早期视觉的物理背景................................................................................. 33
图像的表示 ................................................................................................ 35
基本物理假设 ............................................................................................ 35
图像表示的一般性质 ................................................................................ 40
2.2 过零点和原初草图..................................................................................... 42
过零点........................................................................................................ 42
生物学的意义 ............................................................................................ 48
原初草图 .................................................................................................... 54
哲学私语 .................................................................................................... 59
2.3 图像的空间排布 ........................................................................................ 62
2.4 光源和透明度 ............................................................................................ 68
其他光源效果 ............................................................................................ 70
透明度........................................................................................................ 70
结论............................................................................................................ 71
2.5 聚合过程和全初草图................................................................................. 71
主要论点 .................................................................................................... 75
纹理辨别的计算方法及其心理物理学意义............................................. 76
第 3 章 从图像到表面 ........................................................................................... 78
3.1 人类视觉处理的模块化组织..................................................................... 78
3.2 图像的处理、约束和可用表示................................................................. 81
3.3 立体视觉 .................................................................................................... 87
测量立体视差 ............................................................................................ 87
从视差中计算距离和表面朝向 .............................................................. 121
3.4 方向选择性 .............................................................................................. 124
视觉运动引言 .......................................................................................... 124
利用方向选择性来分离独立运动的表面............................................... 136
渐进.......................................................................................................... 141
3.5 似动 .......................................................................................................... 141
为什么要研究似动 .................................................................................. 142
把问题一分为二 ...................................................................................... 143
对应问题 .................................................................................................. 146
从运动中恢复结构 .................................................................................. 158
光流.......................................................................................................... 164
3.6 形状轮廓 .................................................................................................. 166
一些例子 .................................................................................................. 167
遮挡轮廓 .................................................................................................. 168
表面朝向的不连续 .................................................................................. 173
表面轮廓 .................................................................................................. 175
3.7 表面纹理 .................................................................................................. 180
分离纹理元素 .......................................................................................... 180
小结.......................................................................................................... 184
3.8 明暗和光度立体视觉............................................................................... 184
梯度空间 .................................................................................................. 185
表面光照、表面反射和图像强度 .......................................................... 188
反射率图 .................................................................................................. 189
从明暗中恢复形状 .................................................................................. 191
光度立体视觉 .......................................................................................... 192
3.9 明度、亮度和色彩................................................................................... 194
Helson-Judd 方法..................................................................................... 195
关于亮度和色彩的视网膜—皮层理论................................................... 196
同时对比的重要性的物理依据 .............................................................. 200
对强度非线性变化的表层起源的假设................................................... 202
测量三色图像的意义 .............................................................................. 203
本方法小结 .............................................................................................. 204
3.10 本章小结 ................................................................................................ 205
第 4 章 可见表面的直接表示............................................................................... 208
4.1 引言 .......................................................................................................... 208
4.2 图像分割 .................................................................................................. 209
4.3 对问题的重新建模................................................................................... 211
4.4 需要表示的信息 ...................................................................................... 213
4.5 2.5 维草图的一般形式............................................................................. 215
4.6 表示的可能形式 ...................................................................................... 216
4.7 可能的坐标系 .......................................................................................... 220
4.8 插值、延续性和不连续性....................................................................... 221
4.9 插值问题的计算 ...................................................................................... 224
不连续...................................................................................................... 224
插值方法 .................................................................................................. 226
4.10 其他内部计算 ........................................................................................ 228
第 5 章 用于识别的形状表示............................................................................... 230
5.1 引言 .......................................................................................................... 230
5.2 形状表示引起的问题............................................................................... 231
评判形状表示的有效性的标准 .............................................................. 232
形状表示的设计选择 .............................................................................. 233
5.3 三维模型表示 .......................................................................................... 235
自然坐标系 .............................................................................................. 236
基于坐标轴的描述 .................................................................................. 236
三维模型表示的模块化组织 .................................................................. 237
三维模型的坐标系 .................................................................................. 239
5.4 自然推广 .................................................................................................. 241
5.5 推导和使用三维模型表示....................................................................... 244
三维模型描述的推导 .............................................................................. 244
以观察者为中心的坐标系和以物体为中心的坐标系的关系............... 247
三维模型的索引和目录 .......................................................................... 247
推导和识别的交互 .................................................................................. 250
5.6 心理学的考量 .......................................................................................... 253
第 6 章 总结........................................................................................................ 256
第Ⅲ部分 尾声
第 7 章 对计算方法的辩护 .................................................................................. 261
7.1 引言 .......................................................................................................... 261
7.2 一段对话 .................................................................................................. 261
原书第 2 版后记 Marr 的《视觉》和计算神经科学............................................. 284
中文版后记 从 Marr 的《视觉》到人类智能问题................................................ 288
术语表................................................................................................................... 292
参考文献 ............................................................................................................... 298
定价:119.0
ISBN:9787121423703
作者:(美)David Marr(大卫?马尔)
版次:第1版
出版时间:2021-12
内容提要:
本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
作者简介:
David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。
吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。
目录:
第Ⅰ部分 引言和哲学基础
总述........................................................................................................................... 3
第1章 哲学原理和方法.......................................................................................... 7
1.1 背景知识 ...................................................................................................... 7
1.2 理解复杂的信息处理系统......................................................................... 16
表示和描述 ................................................................................................ 16
处理............................................................................................................ 17
信息处理的三个层次 ................................................................................ 19
计算理论的重要性 .................................................................................... 21
J. J. Gibson 的方法..................................................................................... 22
1.3 视觉的表示框架 ........................................................................................ 24
视觉的目的 ................................................................................................ 25
高级视觉 .................................................................................................... 26
目标与可行性 ............................................................................................ 28
第Ⅱ部分 视觉
第 2 章 图像的表示............................................................................................... 33
2.1 早期视觉的物理背景................................................................................. 33
图像的表示 ................................................................................................ 35
基本物理假设 ............................................................................................ 35
图像表示的一般性质 ................................................................................ 40
2.2 过零点和原初草图..................................................................................... 42
过零点........................................................................................................ 42
生物学的意义 ............................................................................................ 48
原初草图 .................................................................................................... 54
哲学私语 .................................................................................................... 59
2.3 图像的空间排布 ........................................................................................ 62
2.4 光源和透明度 ............................................................................................ 68
其他光源效果 ............................................................................................ 70
透明度........................................................................................................ 70
结论............................................................................................................ 71
2.5 聚合过程和全初草图................................................................................. 71
主要论点 .................................................................................................... 75
纹理辨别的计算方法及其心理物理学意义............................................. 76
第 3 章 从图像到表面 ........................................................................................... 78
3.1 人类视觉处理的模块化组织..................................................................... 78
3.2 图像的处理、约束和可用表示................................................................. 81
3.3 立体视觉 .................................................................................................... 87
测量立体视差 ............................................................................................ 87
从视差中计算距离和表面朝向 .............................................................. 121
3.4 方向选择性 .............................................................................................. 124
视觉运动引言 .......................................................................................... 124
利用方向选择性来分离独立运动的表面............................................... 136
渐进.......................................................................................................... 141
3.5 似动 .......................................................................................................... 141
为什么要研究似动 .................................................................................. 142
把问题一分为二 ...................................................................................... 143
对应问题 .................................................................................................. 146
从运动中恢复结构 .................................................................................. 158
光流.......................................................................................................... 164
3.6 形状轮廓 .................................................................................................. 166
一些例子 .................................................................................................. 167
遮挡轮廓 .................................................................................................. 168
表面朝向的不连续 .................................................................................. 173
表面轮廓 .................................................................................................. 175
3.7 表面纹理 .................................................................................................. 180
分离纹理元素 .......................................................................................... 180
小结.......................................................................................................... 184
3.8 明暗和光度立体视觉............................................................................... 184
梯度空间 .................................................................................................. 185
表面光照、表面反射和图像强度 .......................................................... 188
反射率图 .................................................................................................. 189
从明暗中恢复形状 .................................................................................. 191
光度立体视觉 .......................................................................................... 192
3.9 明度、亮度和色彩................................................................................... 194
Helson-Judd 方法..................................................................................... 195
关于亮度和色彩的视网膜—皮层理论................................................... 196
同时对比的重要性的物理依据 .............................................................. 200
对强度非线性变化的表层起源的假设................................................... 202
测量三色图像的意义 .............................................................................. 203
本方法小结 .............................................................................................. 204
3.10 本章小结 ................................................................................................ 205
第 4 章 可见表面的直接表示............................................................................... 208
4.1 引言 .......................................................................................................... 208
4.2 图像分割 .................................................................................................. 209
4.3 对问题的重新建模................................................................................... 211
4.4 需要表示的信息 ...................................................................................... 213
4.5 2.5 维草图的一般形式............................................................................. 215
4.6 表示的可能形式 ...................................................................................... 216
4.7 可能的坐标系 .......................................................................................... 220
4.8 插值、延续性和不连续性....................................................................... 221
4.9 插值问题的计算 ...................................................................................... 224
不连续...................................................................................................... 224
插值方法 .................................................................................................. 226
4.10 其他内部计算 ........................................................................................ 228
第 5 章 用于识别的形状表示............................................................................... 230
5.1 引言 .......................................................................................................... 230
5.2 形状表示引起的问题............................................................................... 231
评判形状表示的有效性的标准 .............................................................. 232
形状表示的设计选择 .............................................................................. 233
5.3 三维模型表示 .......................................................................................... 235
自然坐标系 .............................................................................................. 236
基于坐标轴的描述 .................................................................................. 236
三维模型表示的模块化组织 .................................................................. 237
三维模型的坐标系 .................................................................................. 239
5.4 自然推广 .................................................................................................. 241
5.5 推导和使用三维模型表示....................................................................... 244
三维模型描述的推导 .............................................................................. 244
以观察者为中心的坐标系和以物体为中心的坐标系的关系............... 247
三维模型的索引和目录 .......................................................................... 247
推导和识别的交互 .................................................................................. 250
5.6 心理学的考量 .......................................................................................... 253
第 6 章 总结........................................................................................................ 256
第Ⅲ部分 尾声
第 7 章 对计算方法的辩护 .................................................................................. 261
7.1 引言 .......................................................................................................... 261
7.2 一段对话 .................................................................................................. 261
原书第 2 版后记 Marr 的《视觉》和计算神经科学............................................. 284
中文版后记 从 Marr 的《视觉》到人类智能问题................................................ 288
术语表................................................................................................................... 292
参考文献 ............................................................................................................... 298
- 电子工业出版社有限公司
- 电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
- 扫描二维码,访问我们的微信店铺