商品详情
书名:眼动跟踪技术:原理与应用
定价:98.0
ISBN:9787030444073
作者:(美)Andrew T. Duchowski著;赵歆波等译
版次:1
出版时间:2016-02
内容提要:
这是一本全面论述眼动跟踪原理与应用的专著。眼动跟踪技术近年来取得了飞速发展,技术创新层出不穷,应用领域日新月异。为此,作者在前一版的基础上,修订而成此书。全书共四部分,用20章的篇幅全面、系统地阐述了眼动的生理心理机制、眼动跟踪系统开发原理、眼动跟踪方法论以及典型眼动跟踪应用。本书特色鲜明,内容新颖,图文并茂,理论和实用性强,是一本不可多得的有关眼动跟踪的专著。
目录:
目录 译者序 第二版前言 **版前言 **部分人类视觉系统介绍 第1章视觉注意力3 1.1视觉注意力:历史回顾4 1.1.1Von Helmholtz的“哪里”假设4 1.1.2James的“什么”假设4 1.1.3Gibson的“怎么”假设5 1.1.4Broadbent的“选择性滤波”理论5 1.1.5Deutsch J A和Deutsch D的“重要权重”理论5 1.1.6Yarbus、Noton和Stark的“扫描”路径理论7 1.1.7Posner的“聚光灯”理论9 1.1.8Treisman的“整合”理论9 1.1.9Kosslyn的“窗口”理论9 1.2视觉注意力和眼动跟踪10 1.3总结和导读11 第2章人类视觉系统的神经底质13 2.1眼睛16 2.2视网膜17 2.2.1外层19 2.2.2内核层19 2.2.3神经节细胞层19 2.3视束和M/P视觉通路20 2.4枕叶皮质及以上区域22 2.5总结和导读23 第3章视觉心理物理学25 3.1空间视觉25 3.2时间视觉28 3.2.1周边视觉的运动感知30 3.2.2在视觉边缘检测运动的灵敏度30 3.3色彩视觉31 3.4视觉显示注意力设计的启示32 3.5总结与扩展阅读32 第4章眼动的分类与模型34 4.1眼外肌与眼动系统34 4.2跳视36 4.3平滑尾随38 4.4注视39 4.5眼球震颤39 4.6眼动分析的意义39 4.7总结与进一步阅读40 第二部分眼动跟踪系统 第5章眼动跟踪技术43 5.1眼电图法43 5.2巩膜接触镜/搜索线圈法44 5.3眼图照片或眼图录像法45 5.4基于视频的瞳孔/角膜反射法46 5.5视线跟踪与动作捕捉49 5.6总结与进一步阅读50 第6章头戴式系统的硬件安装51 6.1集成的关键和要求51 6.2系统安装54 6.3克莱姆森大学系统安装中的经验教训55 6.4总结与进一步阅读56 第7章头戴式系统软件开发58 7.1眼动仪系统屏幕坐标系的映射58 7.1.1将屏幕坐标系映射到三维视锥59 7.1.2屏幕坐标系到二维图像的映射60 7.1.3测量眼动仪系统屏幕坐标系范围60 7.2鸟群跟踪器坐标映射62 7.2.1获得变换的视线矢量63 7.2.2获取变换的向上矢量64 7.2.3任意矢量变换64 7.33D注视点计算65 7.3.1注视方向的参数化射线表示68 7.4虚拟的视线交点坐标68 7.4.1线与平面的交点68 7.4.2点在多边形内问题70 7.5数据表示与存储71 7.6总结与进一步阅读72 第8章头戴式系统的标定73 8.1软件实现75 8.2辅助标定程序79 8.2.1内部二维标定79 8.2.2内部三维标定81 8.3总结及进一步阅读83 第9章桌面式系统硬件安装84 9.1集成问题及需求85 9.2系统安装86 9.3从克莱姆森硬件安装中学到的课程88 9.4总结和进一步阅读89 第10章桌面式系统软件开发90 10.1Linux Tobii 客户端应用程序界面91 10.1.1Tet_Init91 10.1.2Tet_Connect和Tet_Disconnect92 10.1.3Tet_Start, Tet_Stop92 10.1.4函数 Tet_CalibClear、Tet_CalibLoadFromFile、Tet_CalibSaveToFile、Tet_CalibAddPoint、Tet_CalibRemovePoints、Tet_CalibGetResult、Tet_CalibCalculateAndSet93 10.1.5Tet_SynchronizeTime和Tet_PerformSystemCheck95 10.1.6Tet_GetSerialNumber、Tet_GetLastError和Tet_GetLastErrorAsext95 10.1.7Tet_CallbackFunction96 10.2一个OpenGL/GLUT图形用户界面的简单样例97 10.3警告104 10.4结论和进一步阅读104 第11章桌面式系统标定105 11.1软件实现106 11.2总结和进一步阅读113 第12章眼动分析114 12.1信号去噪115 12.2基于停留时间的注视点检测117 12.3基于速度的扫视检测118 12.4三维眼动分析120 12.4.1参数估计124 12.4.2注视分组127 12.4.3眼动数据镜像128 12.5总结与进一步阅读128 第三部分眼动跟踪方法论 第13章实验设计131 13.1形成假说131 13.2查询形式132 13.2.1实验对观察研究133 13.2.2实验室对现场研究133 13.2.3特殊规律研究对一般规律研究134 13.2.4样本人群对单例实验对案例研究134 13.2.5个体自我设计与受试间设计135 13.2.6样例设计136 13.3测量值与分析138 13.4总结与进一步阅读141 第14章建议的实验指南143 14.1评估计划144 14.1.1数据收集144 14.1.2系统识别147 14.1.3约束147 14.1.4用户选择148 14.1.5现场评估148 14.1.6任务选择148 14.2实践建议149 14.3考虑动态刺激150 14.4总结与进一步阅读150 第15章案例学习152 15.1头戴式VR诊断:视觉检测152 15.1.1案例研究便笺154 15.2头戴式VR诊断:三维迷宫导航154 15.2.1案例研究便笺155 15.3桌面VR诊断:驾驶模拟器155 15.3.1案例研究便笺156 15.4桌面诊断:可用性157 15.5桌面交互:注视跟随鱼眼镜头166 15.6总结与进一步阅读169 第四部分眼动跟踪的应用 第16章眼动跟踪技术应用的多样性和种类173 16.1总结与进一步阅读174 第17章神经科学与心理学175 17.1错觉等高线的神经生理学研究175 17.2注意神经科学176 17.3眼动与脑成像179 17.4阅读180 17.5场景感知183 17.5.1艺术感知186 17.5.2电影感知189 17.6视觉搜索189 17.7自然任务198 17.8在其他信息处理任务中的眼动201 17.9总结与进一步阅读203 第18章工业工程与人因工程204 18.1航空204 18.2驾驶207 18.3视觉检测212 18.4总结和进一步阅读220 第19章营销与广告221 19.1广告文案测试222 19.2印刷广告223 19.3广告位置226 19.4电视增强228 19.5网页229 19.6商品标签设计231 19.7总结与进一步阅读232 第20章计算机科学234 20.1人机交互与协同系统234 20.1.1经典的基于眼睛的交互234 20.1.2认知建模235 20.1.3全局易用性237 20.1.4间接的基于眼睛的交互239 20.1.5注意力用户界面240 20.1.6可用性241 20.1.7协同系统242 20.2注视跟随显示243 20.2.1基于屏幕的显示244 20.2.2基于模型的图形显示249 20.3总结和进一步阅读256 总结258 参考文献259
在线试读:
第1章视觉注意力 在论述眼动跟踪技术之前,首先需要考虑记录人类眼动的动机。就是说,为什么眼动跟踪非常重要?简单地说,我们会移动眼球,将视场中某一部分移动到高分辨区域,以便看清楚注视中心方向更多的细节。通常情况下,我们会同时将意识集中于此点,以便集中注意力于感兴趣物体或者区域(这里假设非常短暂的瞬间)。于是可以设想,如果我们可以跟踪一个人的眼动,便可以了解观察者注意力移动的轨迹。这可以了解观察者是如何发现感兴趣区域的,也就是说,是什么决定着他们的注意力,并且可能为研究感知生理学提供一个线索,揭示人是如何感知所看到的物体的。 通过研究视觉认知中的注意力和神经机理,本书前两章从两个视角描述了眼动研究的动机,即心理学观点,研究注意力行为以及注意力行为的研究历史(本章作了简要介绍);生理学观点,即驱动注意力行为的神经反应机理(在第2章论述)。总的来说,这两章建立了眼动研究的心理学和生理学基础。 为了开始系统阐述和理解人类注意力,首先要建立一个基本的或者至少是直观的感觉,那就是注意力是什么,眼动是否确实能表明内部认知过程,即视觉注意力。 视觉注意力已被研究100多年了。心理学家James给出了一个较好的关于视觉注意力的定性定义: 每个人都知道注意是什么。注意是由意识决定的,它使心理以清晰和鲜明的形式从几个同时显现的可能目标或一系列思想中拥有一个。知觉的指向性和集中性是注意的两个基本特性,它指出意识选择了某个对象而忽略了其余对象……当对象被感官感觉时,只有少数对象会在瞬间被注意。 Pluribus intentus,minor est ad singular sensue. —James(1981)James 所说的这句拉丁语大意为“从大部分注视中筛选出少数用于感知”,这里注意力起着筛选的作用。 人的能力是有限的,无法在瞬间注意所有的东西。一般情况下,人们总是将注意力集中于要被感知的对象,这样,意识就可以成功捕获感兴趣的刺激。人处理信息的能力是有限的,大脑通过专注于所有感官输入中的特殊部分来处理感官输入,这样感兴趣的图像、声音、气味以及类似的信息,可能比次要的刺激获得更多的注意力。在视觉方面更是如此,视觉场景审视是渐进的,不是完整的。也就是说,人类视觉是一个依赖于小区域的感知集成构造一个连续表达的离散过程。 本章从历史的角度沿着Heijden(1992)的讲述,叙述了注意力的概念。讨论集中于视觉中的注意力机理,重点是两类主要的视觉注意力,即“什么”和“哪里”。 1.1视觉注意力:历史回顾人类研究视觉注意力已经有100多年了。早期注意力的研究局限于简单的光学观察和自我测试。之后,该领域增长为包括心理物理学、认知神经科学和计算机科学的交叉学科。本节描述视觉注意力研究的历史背景。 1.1.1Von Helmholtz的“哪里”假设19世纪下半叶,Von Helmholtz(1925)假设视觉注意力是视觉感知的主要机理。他在专著Treatise on Physiological Optics中指出:“我们使眼睛在场景中不断扫视,因为这是我们**可能清楚地了解场景中所有单独部分的途径。”注意力只涉及空间中一个很小的区域,Von Helmholtz观察了视觉注意力慢慢移向新事物的自然趋势。他同时指出,注意力可以被意识和自主的活动控制,人可以在不移动眼球注视次要目标的情况下,注意到这个次要的目标。Von Helmholtz主要专注于眼动与空间位置的关系,或者说视觉在注意“哪里”。本质上,尽管视觉注意力可以被意识控制指向次要目标,眼动仍然反映了详细查看这些目标的意愿。在这个意义上,眼动提供了视觉注意力的明显证据。 1.1.2James的“什么”假设与Von Helmholtz的想法不同,James(1981)相信注意力是一个内在的较为隐秘的机制,类似于想象力、预知力,或者更一般的,如思想。James主要从“什么”的角度来定义注意力,或者说是与注意焦点相关的特性、意义、期望的角度。James偏向于注意力主动的、自愿的方面。他同时关注了注意力被动、反向、非自愿以及轻松的特性。 注意力的这两个方面并不互相排斥,它们对于视觉注意力均具有重要意义。视觉注意力的“什么”和“哪里”分别与中央凹(James)和中央凹周围(Von Helmholtz)的视觉注意力相关。这两个关于视觉的不同视角相应于视觉注意力自底向上或特征驱动的解释。也就是说,当考虑一个图像刺激时,我们可能认为图像中的某个区域将吸引我们的注意。这些区域可能首先被中央凹周围视觉所感知,之后由中央凹视觉感知更详细的内容。从这个意义上说,图像的外围特征可能驱动注意力的“哪里”方面观看其他部分,以便人们可以识别在这些区域中呈现了“什么”细节。视觉由“什么”和“哪里”双特征驱动的观点是对视觉注意力一个有用的简单隐喻。事实上,这形成了构造视觉注意力模型的基础,该模型用于模拟低层或者自下而上的视觉特征。然而,关于注意力的这个观点太简单了。这里必须强调,更为复杂的视觉注意力模型涉及高层视觉和认知方程。也就是说,视觉注意力不能被简单地通过单独的视觉特征来解释,而必须包括高层意识因素(如驱动注意力的自发、预先感知因素)。 1.1.3Gibson的“怎么”假设20世纪40年代,Gibson(1941)以人的意图为中心,提出了视觉注意力的第三个因素。Gibson的假设专注于观察者预先的准备,诸如是否反应,如果反应会怎样反应,以及伴随哪种类型的反应。而且解释了当人持续注视某一固定刺激物时,应对人意图变化的反应能力,相应的,当人陷入对某一固定刺激物的思考时,应对人对刺激物预期变化的能力。设计模糊刺激的实验引起了这些反应。例如,如果受试者希望用词描述动物,那么错误的输入sael会被读成seal。如果希望用词描述轮船或者船,那么会被读成sail。Gibson所说的不同注意力的反应本质指出,“怎么做”或者“怎么反应”行为基于受试者的预感知或者看法。这种视觉注意力的变化与实验的设计相关。考虑受试者对刺激物的感知期待是很重要的,并被实验者的指令所影响。 1.1.4Broadbent的“选择性滤波”理论注意力,从某种意义上说,可以看作负责调节感知信息到容量有限的感知通道的“选择滤波器”。在20世纪50年代,Broadbent(1958)做了一个听觉实验,用于演示声音注意力的选择性质。在这个实验中,从两个不同的信道向受试者发出同时抵达的声音,例如,向左耳说数字{7,2,3},向右耳说数字{9,4,5}。Broadbent记录了受试者的复述数字为{7,2,3,9,4,5}或者{9,4,5,7,2,3},受试者所获得的信息没有互相交织(相间信道干扰)。Broadbent总结为信息虽然平行进入,但是其选择性地滤波到感知信道。 1.1.5Deutsch J A和Deutsch D的“重要权重”理论不同于选择性滤波,Deutsch J A和Deutsch D(1963)提出,所有的感知信息在*高层次上被感知性地加以分析,排除了选择性滤波的需要。Deutsch J A和Deutsch D拒绝了注意力选择性滤波和有限容量系统理论。他们解释说,滤波至少需要与有限容量系统本身一样复杂。相应地,他们提出预先设置的“重要性权值”的中心结构的存在,这个结构负责选择。Deutsch J A和Deutsch D辩论道,是重要性权值而不是注意力本身,在注意力中扮演了起因的角色。也就是说,注意力效果是重要性或者相关性与信息交互的结果。 有趣的是,Broadbent的选择性滤波理论与Von Helmholtz的“哪里”假设在一般意义上来说是一致的,而Deutsch J A和Deutsch D的重要权值理论与James的期待假设或者说“什么”假说是一致的。20世纪60年代(尽管直到1971年,仍然未被充分意识到),这些类似对立的观点被Treisman合并为一个统一的视觉注意力理论。Treisman通过指出注意力的两个组成部分,将Broadbent与Deutsch J A和Deutsch D的注意力模型统一起来:并称为“词典单元”的后续(中心)结构的衰减滤波。衰减滤波的方程是感知信息的选择,在这个方面,衰减滤波类似于Broadbent的选择性滤波。不同于选择性滤波,它并不完全阻塞不希望的信息,而只衰减它们。后续阶段词典单元处理弱化的或者没有弱化的信息,这些单元包括不同的阈值,这些阈值转向重要、相关和上下文。Treisman因此将注意力单元或者选择滤波(“哪里”)以及期望(“什么”)的互补模型组织在一起。 在这之前,虽然Treisman提供了一个令人信服的视觉注意力理论,但是遗留了一个关键问题,即场景融合问题。场景融合问题形成了下面这些问题:虽然我们可以通过类似于选择性滤波的东西看到视场范围内的视觉景色,但是,我们是怎样将整个视场中相当连贯的场景在头脑中拼凑在一起的?例如,当我们看一间房子中的一群人(如教室或者聚会)时,虽然不可能在同一时间看清楚每个人的面貌,然而我们可以拼合出一幅人位于房间中哪个位置的心理图像。我们的大脑具有拼合这个心理图片的能力,尽管视觉的选择性滤波从物理上阻止我们仅用一眼就实现这个功能。另一个广为人知的有关场景合成问题的例子是卡尼莎(Kanizsa,1976)错觉,如图1.1所示,它以发明者名命名。观察图1.1,会看到一个三角形的边缘,即使这个三角形仅由一个圆盘切痕构成。我们还不是很清楚大脑是如何形成这个三角形的。也就是说,尽管通过眼动数据证实了我们的认知,即场景是逐个被观察的,但是仍然不清楚在人的大脑中一幅完整的图片是如何形成的,这正是场景融合问题的症结所在。由格式塔心理学家提供的一个观点是,假设整个场景的识别是由一个并行的单步过程完成的。为了检验这个假设,将一个人观察一幅图片(或者其他图片)的方式形象化会非常有用,这就是记录并可视化一个观察者眼动的动机。即使早在1907年就有对于眼动的研究,但是直到1967年才有了对于眼动确切的定义(参考第5章中对于眼动跟踪技术的综述)。这种后面讨论的早期眼动的形象化表示,说明了记录眼动的重要性不仅仅在于它在描述一个人的视觉扫描特征方面所表现出的强大的作用,还在于它对视觉注意和观察理论的形成产生了重要影响。图1.1Kanizsa错觉
定价:98.0
ISBN:9787030444073
作者:(美)Andrew T. Duchowski著;赵歆波等译
版次:1
出版时间:2016-02
内容提要:
这是一本全面论述眼动跟踪原理与应用的专著。眼动跟踪技术近年来取得了飞速发展,技术创新层出不穷,应用领域日新月异。为此,作者在前一版的基础上,修订而成此书。全书共四部分,用20章的篇幅全面、系统地阐述了眼动的生理心理机制、眼动跟踪系统开发原理、眼动跟踪方法论以及典型眼动跟踪应用。本书特色鲜明,内容新颖,图文并茂,理论和实用性强,是一本不可多得的有关眼动跟踪的专著。
目录:
目录 译者序 第二版前言 **版前言 **部分人类视觉系统介绍 第1章视觉注意力3 1.1视觉注意力:历史回顾4 1.1.1Von Helmholtz的“哪里”假设4 1.1.2James的“什么”假设4 1.1.3Gibson的“怎么”假设5 1.1.4Broadbent的“选择性滤波”理论5 1.1.5Deutsch J A和Deutsch D的“重要权重”理论5 1.1.6Yarbus、Noton和Stark的“扫描”路径理论7 1.1.7Posner的“聚光灯”理论9 1.1.8Treisman的“整合”理论9 1.1.9Kosslyn的“窗口”理论9 1.2视觉注意力和眼动跟踪10 1.3总结和导读11 第2章人类视觉系统的神经底质13 2.1眼睛16 2.2视网膜17 2.2.1外层19 2.2.2内核层19 2.2.3神经节细胞层19 2.3视束和M/P视觉通路20 2.4枕叶皮质及以上区域22 2.5总结和导读23 第3章视觉心理物理学25 3.1空间视觉25 3.2时间视觉28 3.2.1周边视觉的运动感知30 3.2.2在视觉边缘检测运动的灵敏度30 3.3色彩视觉31 3.4视觉显示注意力设计的启示32 3.5总结与扩展阅读32 第4章眼动的分类与模型34 4.1眼外肌与眼动系统34 4.2跳视36 4.3平滑尾随38 4.4注视39 4.5眼球震颤39 4.6眼动分析的意义39 4.7总结与进一步阅读40 第二部分眼动跟踪系统 第5章眼动跟踪技术43 5.1眼电图法43 5.2巩膜接触镜/搜索线圈法44 5.3眼图照片或眼图录像法45 5.4基于视频的瞳孔/角膜反射法46 5.5视线跟踪与动作捕捉49 5.6总结与进一步阅读50 第6章头戴式系统的硬件安装51 6.1集成的关键和要求51 6.2系统安装54 6.3克莱姆森大学系统安装中的经验教训55 6.4总结与进一步阅读56 第7章头戴式系统软件开发58 7.1眼动仪系统屏幕坐标系的映射58 7.1.1将屏幕坐标系映射到三维视锥59 7.1.2屏幕坐标系到二维图像的映射60 7.1.3测量眼动仪系统屏幕坐标系范围60 7.2鸟群跟踪器坐标映射62 7.2.1获得变换的视线矢量63 7.2.2获取变换的向上矢量64 7.2.3任意矢量变换64 7.33D注视点计算65 7.3.1注视方向的参数化射线表示68 7.4虚拟的视线交点坐标68 7.4.1线与平面的交点68 7.4.2点在多边形内问题70 7.5数据表示与存储71 7.6总结与进一步阅读72 第8章头戴式系统的标定73 8.1软件实现75 8.2辅助标定程序79 8.2.1内部二维标定79 8.2.2内部三维标定81 8.3总结及进一步阅读83 第9章桌面式系统硬件安装84 9.1集成问题及需求85 9.2系统安装86 9.3从克莱姆森硬件安装中学到的课程88 9.4总结和进一步阅读89 第10章桌面式系统软件开发90 10.1Linux Tobii 客户端应用程序界面91 10.1.1Tet_Init91 10.1.2Tet_Connect和Tet_Disconnect92 10.1.3Tet_Start, Tet_Stop92 10.1.4函数 Tet_CalibClear、Tet_CalibLoadFromFile、Tet_CalibSaveToFile、Tet_CalibAddPoint、Tet_CalibRemovePoints、Tet_CalibGetResult、Tet_CalibCalculateAndSet93 10.1.5Tet_SynchronizeTime和Tet_PerformSystemCheck95 10.1.6Tet_GetSerialNumber、Tet_GetLastError和Tet_GetLastErrorAsext95 10.1.7Tet_CallbackFunction96 10.2一个OpenGL/GLUT图形用户界面的简单样例97 10.3警告104 10.4结论和进一步阅读104 第11章桌面式系统标定105 11.1软件实现106 11.2总结和进一步阅读113 第12章眼动分析114 12.1信号去噪115 12.2基于停留时间的注视点检测117 12.3基于速度的扫视检测118 12.4三维眼动分析120 12.4.1参数估计124 12.4.2注视分组127 12.4.3眼动数据镜像128 12.5总结与进一步阅读128 第三部分眼动跟踪方法论 第13章实验设计131 13.1形成假说131 13.2查询形式132 13.2.1实验对观察研究133 13.2.2实验室对现场研究133 13.2.3特殊规律研究对一般规律研究134 13.2.4样本人群对单例实验对案例研究134 13.2.5个体自我设计与受试间设计135 13.2.6样例设计136 13.3测量值与分析138 13.4总结与进一步阅读141 第14章建议的实验指南143 14.1评估计划144 14.1.1数据收集144 14.1.2系统识别147 14.1.3约束147 14.1.4用户选择148 14.1.5现场评估148 14.1.6任务选择148 14.2实践建议149 14.3考虑动态刺激150 14.4总结与进一步阅读150 第15章案例学习152 15.1头戴式VR诊断:视觉检测152 15.1.1案例研究便笺154 15.2头戴式VR诊断:三维迷宫导航154 15.2.1案例研究便笺155 15.3桌面VR诊断:驾驶模拟器155 15.3.1案例研究便笺156 15.4桌面诊断:可用性157 15.5桌面交互:注视跟随鱼眼镜头166 15.6总结与进一步阅读169 第四部分眼动跟踪的应用 第16章眼动跟踪技术应用的多样性和种类173 16.1总结与进一步阅读174 第17章神经科学与心理学175 17.1错觉等高线的神经生理学研究175 17.2注意神经科学176 17.3眼动与脑成像179 17.4阅读180 17.5场景感知183 17.5.1艺术感知186 17.5.2电影感知189 17.6视觉搜索189 17.7自然任务198 17.8在其他信息处理任务中的眼动201 17.9总结与进一步阅读203 第18章工业工程与人因工程204 18.1航空204 18.2驾驶207 18.3视觉检测212 18.4总结和进一步阅读220 第19章营销与广告221 19.1广告文案测试222 19.2印刷广告223 19.3广告位置226 19.4电视增强228 19.5网页229 19.6商品标签设计231 19.7总结与进一步阅读232 第20章计算机科学234 20.1人机交互与协同系统234 20.1.1经典的基于眼睛的交互234 20.1.2认知建模235 20.1.3全局易用性237 20.1.4间接的基于眼睛的交互239 20.1.5注意力用户界面240 20.1.6可用性241 20.1.7协同系统242 20.2注视跟随显示243 20.2.1基于屏幕的显示244 20.2.2基于模型的图形显示249 20.3总结和进一步阅读256 总结258 参考文献259
在线试读:
第1章视觉注意力 在论述眼动跟踪技术之前,首先需要考虑记录人类眼动的动机。就是说,为什么眼动跟踪非常重要?简单地说,我们会移动眼球,将视场中某一部分移动到高分辨区域,以便看清楚注视中心方向更多的细节。通常情况下,我们会同时将意识集中于此点,以便集中注意力于感兴趣物体或者区域(这里假设非常短暂的瞬间)。于是可以设想,如果我们可以跟踪一个人的眼动,便可以了解观察者注意力移动的轨迹。这可以了解观察者是如何发现感兴趣区域的,也就是说,是什么决定着他们的注意力,并且可能为研究感知生理学提供一个线索,揭示人是如何感知所看到的物体的。 通过研究视觉认知中的注意力和神经机理,本书前两章从两个视角描述了眼动研究的动机,即心理学观点,研究注意力行为以及注意力行为的研究历史(本章作了简要介绍);生理学观点,即驱动注意力行为的神经反应机理(在第2章论述)。总的来说,这两章建立了眼动研究的心理学和生理学基础。 为了开始系统阐述和理解人类注意力,首先要建立一个基本的或者至少是直观的感觉,那就是注意力是什么,眼动是否确实能表明内部认知过程,即视觉注意力。 视觉注意力已被研究100多年了。心理学家James给出了一个较好的关于视觉注意力的定性定义: 每个人都知道注意是什么。注意是由意识决定的,它使心理以清晰和鲜明的形式从几个同时显现的可能目标或一系列思想中拥有一个。知觉的指向性和集中性是注意的两个基本特性,它指出意识选择了某个对象而忽略了其余对象……当对象被感官感觉时,只有少数对象会在瞬间被注意。 Pluribus intentus,minor est ad singular sensue. —James(1981)James 所说的这句拉丁语大意为“从大部分注视中筛选出少数用于感知”,这里注意力起着筛选的作用。 人的能力是有限的,无法在瞬间注意所有的东西。一般情况下,人们总是将注意力集中于要被感知的对象,这样,意识就可以成功捕获感兴趣的刺激。人处理信息的能力是有限的,大脑通过专注于所有感官输入中的特殊部分来处理感官输入,这样感兴趣的图像、声音、气味以及类似的信息,可能比次要的刺激获得更多的注意力。在视觉方面更是如此,视觉场景审视是渐进的,不是完整的。也就是说,人类视觉是一个依赖于小区域的感知集成构造一个连续表达的离散过程。 本章从历史的角度沿着Heijden(1992)的讲述,叙述了注意力的概念。讨论集中于视觉中的注意力机理,重点是两类主要的视觉注意力,即“什么”和“哪里”。 1.1视觉注意力:历史回顾人类研究视觉注意力已经有100多年了。早期注意力的研究局限于简单的光学观察和自我测试。之后,该领域增长为包括心理物理学、认知神经科学和计算机科学的交叉学科。本节描述视觉注意力研究的历史背景。 1.1.1Von Helmholtz的“哪里”假设19世纪下半叶,Von Helmholtz(1925)假设视觉注意力是视觉感知的主要机理。他在专著Treatise on Physiological Optics中指出:“我们使眼睛在场景中不断扫视,因为这是我们**可能清楚地了解场景中所有单独部分的途径。”注意力只涉及空间中一个很小的区域,Von Helmholtz观察了视觉注意力慢慢移向新事物的自然趋势。他同时指出,注意力可以被意识和自主的活动控制,人可以在不移动眼球注视次要目标的情况下,注意到这个次要的目标。Von Helmholtz主要专注于眼动与空间位置的关系,或者说视觉在注意“哪里”。本质上,尽管视觉注意力可以被意识控制指向次要目标,眼动仍然反映了详细查看这些目标的意愿。在这个意义上,眼动提供了视觉注意力的明显证据。 1.1.2James的“什么”假设与Von Helmholtz的想法不同,James(1981)相信注意力是一个内在的较为隐秘的机制,类似于想象力、预知力,或者更一般的,如思想。James主要从“什么”的角度来定义注意力,或者说是与注意焦点相关的特性、意义、期望的角度。James偏向于注意力主动的、自愿的方面。他同时关注了注意力被动、反向、非自愿以及轻松的特性。 注意力的这两个方面并不互相排斥,它们对于视觉注意力均具有重要意义。视觉注意力的“什么”和“哪里”分别与中央凹(James)和中央凹周围(Von Helmholtz)的视觉注意力相关。这两个关于视觉的不同视角相应于视觉注意力自底向上或特征驱动的解释。也就是说,当考虑一个图像刺激时,我们可能认为图像中的某个区域将吸引我们的注意。这些区域可能首先被中央凹周围视觉所感知,之后由中央凹视觉感知更详细的内容。从这个意义上说,图像的外围特征可能驱动注意力的“哪里”方面观看其他部分,以便人们可以识别在这些区域中呈现了“什么”细节。视觉由“什么”和“哪里”双特征驱动的观点是对视觉注意力一个有用的简单隐喻。事实上,这形成了构造视觉注意力模型的基础,该模型用于模拟低层或者自下而上的视觉特征。然而,关于注意力的这个观点太简单了。这里必须强调,更为复杂的视觉注意力模型涉及高层视觉和认知方程。也就是说,视觉注意力不能被简单地通过单独的视觉特征来解释,而必须包括高层意识因素(如驱动注意力的自发、预先感知因素)。 1.1.3Gibson的“怎么”假设20世纪40年代,Gibson(1941)以人的意图为中心,提出了视觉注意力的第三个因素。Gibson的假设专注于观察者预先的准备,诸如是否反应,如果反应会怎样反应,以及伴随哪种类型的反应。而且解释了当人持续注视某一固定刺激物时,应对人意图变化的反应能力,相应的,当人陷入对某一固定刺激物的思考时,应对人对刺激物预期变化的能力。设计模糊刺激的实验引起了这些反应。例如,如果受试者希望用词描述动物,那么错误的输入sael会被读成seal。如果希望用词描述轮船或者船,那么会被读成sail。Gibson所说的不同注意力的反应本质指出,“怎么做”或者“怎么反应”行为基于受试者的预感知或者看法。这种视觉注意力的变化与实验的设计相关。考虑受试者对刺激物的感知期待是很重要的,并被实验者的指令所影响。 1.1.4Broadbent的“选择性滤波”理论注意力,从某种意义上说,可以看作负责调节感知信息到容量有限的感知通道的“选择滤波器”。在20世纪50年代,Broadbent(1958)做了一个听觉实验,用于演示声音注意力的选择性质。在这个实验中,从两个不同的信道向受试者发出同时抵达的声音,例如,向左耳说数字{7,2,3},向右耳说数字{9,4,5}。Broadbent记录了受试者的复述数字为{7,2,3,9,4,5}或者{9,4,5,7,2,3},受试者所获得的信息没有互相交织(相间信道干扰)。Broadbent总结为信息虽然平行进入,但是其选择性地滤波到感知信道。 1.1.5Deutsch J A和Deutsch D的“重要权重”理论不同于选择性滤波,Deutsch J A和Deutsch D(1963)提出,所有的感知信息在*高层次上被感知性地加以分析,排除了选择性滤波的需要。Deutsch J A和Deutsch D拒绝了注意力选择性滤波和有限容量系统理论。他们解释说,滤波至少需要与有限容量系统本身一样复杂。相应地,他们提出预先设置的“重要性权值”的中心结构的存在,这个结构负责选择。Deutsch J A和Deutsch D辩论道,是重要性权值而不是注意力本身,在注意力中扮演了起因的角色。也就是说,注意力效果是重要性或者相关性与信息交互的结果。 有趣的是,Broadbent的选择性滤波理论与Von Helmholtz的“哪里”假设在一般意义上来说是一致的,而Deutsch J A和Deutsch D的重要权值理论与James的期待假设或者说“什么”假说是一致的。20世纪60年代(尽管直到1971年,仍然未被充分意识到),这些类似对立的观点被Treisman合并为一个统一的视觉注意力理论。Treisman通过指出注意力的两个组成部分,将Broadbent与Deutsch J A和Deutsch D的注意力模型统一起来:并称为“词典单元”的后续(中心)结构的衰减滤波。衰减滤波的方程是感知信息的选择,在这个方面,衰减滤波类似于Broadbent的选择性滤波。不同于选择性滤波,它并不完全阻塞不希望的信息,而只衰减它们。后续阶段词典单元处理弱化的或者没有弱化的信息,这些单元包括不同的阈值,这些阈值转向重要、相关和上下文。Treisman因此将注意力单元或者选择滤波(“哪里”)以及期望(“什么”)的互补模型组织在一起。 在这之前,虽然Treisman提供了一个令人信服的视觉注意力理论,但是遗留了一个关键问题,即场景融合问题。场景融合问题形成了下面这些问题:虽然我们可以通过类似于选择性滤波的东西看到视场范围内的视觉景色,但是,我们是怎样将整个视场中相当连贯的场景在头脑中拼凑在一起的?例如,当我们看一间房子中的一群人(如教室或者聚会)时,虽然不可能在同一时间看清楚每个人的面貌,然而我们可以拼合出一幅人位于房间中哪个位置的心理图像。我们的大脑具有拼合这个心理图片的能力,尽管视觉的选择性滤波从物理上阻止我们仅用一眼就实现这个功能。另一个广为人知的有关场景合成问题的例子是卡尼莎(Kanizsa,1976)错觉,如图1.1所示,它以发明者名命名。观察图1.1,会看到一个三角形的边缘,即使这个三角形仅由一个圆盘切痕构成。我们还不是很清楚大脑是如何形成这个三角形的。也就是说,尽管通过眼动数据证实了我们的认知,即场景是逐个被观察的,但是仍然不清楚在人的大脑中一幅完整的图片是如何形成的,这正是场景融合问题的症结所在。由格式塔心理学家提供的一个观点是,假设整个场景的识别是由一个并行的单步过程完成的。为了检验这个假设,将一个人观察一幅图片(或者其他图片)的方式形象化会非常有用,这就是记录并可视化一个观察者眼动的动机。即使早在1907年就有对于眼动的研究,但是直到1967年才有了对于眼动确切的定义(参考第5章中对于眼动跟踪技术的综述)。这种后面讨论的早期眼动的形象化表示,说明了记录眼动的重要性不仅仅在于它在描述一个人的视觉扫描特征方面所表现出的强大的作用,还在于它对视觉注意和观察理论的形成产生了重要影响。图1.1Kanizsa错觉