第6卷第1期 智能系统学报 Vol.6 No.1 2011年2月 CAAI Transactions on Intelligent Systems Feb.2011 doi:10.3969/i.i8gn.1673-4785.2011.01.001 视错觉现象的分类和研究进展 刘宏12,李哲媛2,许超12 (1.北京大学信息科学技术学院,北京100871;2.北京大学机器感知与智能教育部重点实验室,北京100871) 摘要:视错觉指的是人或动物观察物体时,基于知觉经验或不当参照等形成的与客观事实不一致的特定感知.它 能从独特的角度显示出视觉系统的认知功能和机理,因此研究错觉原理,建立合适的数学模型和计算机模拟模型, 对心理学、生理学和计算机视觉等领域的发展有着重要的意义,在收集整理大量错觉图片的基础上,视错觉可按不 同的现象和成因分为轮廓错觉、运动错觉、细胞群错觉、扭曲错觉、尺寸错觉和不可能图形等6类,其中典型错觉图片 被选以介绍其成因和生理、心理、计算机领域的研究现状,阐述不同视错觉发生在视觉不同认知层次上,且拥有和正 常视觉相同的神经基础,最后概述了视错觉现象的应用意义和前景, 关键词:视错觉;心理学:生理学:计算机视觉:认知科学 中图分类号:TP391文献标识码:A文章编号:16734785(2011)01-0001-12 The categories and research advances of visual illusions LIU Hong'2,LI Zheyuan'2,XU Chao'2 (1.School of Electronics Engineering and Computer Science,Peking University,Beijing 100871,China;2.Machine Perception and Intelligence,Key Laboratory of Education Ministry,Peking University,Beijing 100871,China) Abstract:When humans or animals observe things,visual/optical illusions can occur since the perceptions are sometimes inconsistent with reality and are caused by the observers'experiences or improper references.Visual il- lusions can expose the cognitive functions and mechanisms of the human vision system from a unique perspective. Therefore,they help people to understand vision principles,to establish appropriate mathematical models and com- puter simulation models,and significantly promote the development of many research fields such as psychology, physiology,and computer vision.In this study,due to various phenomenon or causes,620 illusory pictures were analyzed and divided into 6 categories:contour illusions,motion illusions,cell-population illusions,distorted illu- sions,size illusions,and impossible objects/3-D illusions.Additionally,the causes and research status of typical illusions were presented.Furthermore,the conclusion was drawn that different illusions occur in different cognitive levels of the vision system and have the same neural basis as normal vision.Finally,the applications and research future were described. Keywords:visual illusions;psychology;physiology;computer vision;cognitive science 人类研究视错觉的历史可以追溯到公元前4世 型,核心思想是整体大于局部之和)理论逐渐传播, 纪亚里土多德(Aristotle)观察瀑布时记录的运动后 相关研究才逐渐发展.该领域初期多采用行为实验 效(after-effect),柏拉图(Plato)也曾指明人类永远 等传统心理学方法获得推论,随着生物实验技术水 不可能完全避开错觉去认识一切真相.后来几千年 平的提高和20世纪60年代,S.Coren和J.S.Girgus 里,视错觉一直处于曲解的位置上,直至19世纪末 在几何错觉研究中引人系统论方法,其重心逐渐转 德国E.Mach发现侧抑制现象时还未获得足够重 向神经生物学和计算机领域,设计实验发现相关神 视121.随着20世纪初德国格式塔(Cestalt,意为完 经基础来提出和论证心理学说,模拟符合人类视觉 机制的数理算法,以促进认知心理学、神经生理学和 收稿日期:2010-06-13. 计算机视觉领域的发展. 基金项目:国家自然科学基金资助项目(60675025,60875050):国家 目前视错觉的心理学解释有格式塔理论(Ge “863"计划资助项目(2006AA04Z247);广东省自然科学基 金资助项目(9151806001000025);深圳市科技计划及基础 staltism)、生态视觉理论(ecology theory)、建构主义 研究计划资助项目(JG200903160369A). (constructivism)、亮度对比假说、视野学说、常性误 通信作者:李哲援.E-mail:zheyuanlic@cis.pku.edu.cm
.2 智能系统学报 第6卷 用说、反常性误用说、先验论和经验主义等,但没有 biotechnology,information technology and cognitive 一种能适用所有视错觉.生理学解释有侧抑制神经 science,NBIC),其中C为认知科学;日本科技委 网络说、眼动理论、三色色觉学说、三环节论和色觉 员会于1996年提出为期20年预算200亿美元的 相对处理学说等,并有神经生理实验数据支持,但同 “脑科学时代计划”(the age of brain science),包括 样在完善中1331.视错觉现在主要有哪些种类,形 认识脑(思维研究)、保护脑(治疗)、创造脑(信息处 成原理和基础是什么,还可以应用到信息处理等专 理系统)阶段,将脑的认知功能和信息处理机制研 业的哪些方面,这就是本文要回答的问题。 究视为重中之重;欧盟第七研究发展框架(the sev- 研究现状和发展前景 enth research framework program)在2009年发展规 划中进一步规划了大脑相关研究项目 视觉是综合信息处理和主观认知的多层次过 我国自2001年正式加入“人类脑计划”后,更 程,视错觉同样如此.综合各学科可看出哲学探讨视 加重视脑和认知领域的研究.继2005年科技部批准 错觉只注重简单的动作表面和整体意义,而未认识 建立中科院和北师大相关国家重点实验室后,2006 到复杂的信息处理过程;传统心理学试图将高级认 年《国家中长期科学和技术发展规划纲要(2006一 知活动分解成简单心理成分,侧重用整体结构实现 2020)》出台,将脑和认知科学作为八大科学前沿问 心智过程的内部还原(如自底向上、自上而下加 题之一5];2008年,国家自然科学基金委员会发布 工),却未追究产生具体认知的神经活动基础,不能 “视听觉信息的认知计算”研究计划,希望从人类视 证明外在视觉刺激如何转化为内在心理表征:神经 知觉机理出发,构建新的计算模型和方法,在基础理 生理学从神经元、神经组织、神经网络和整体脑区等 论研究和与视觉认知相关的脑机接口等关键技术上 水平上来确认错觉物理实现,却无法知道主观认知 取得重要进展 如何作用.计算机学科若想实现最贴近自然视觉的 2 视错觉分类 算法,就必须了解综合以上学科研究的认知科学 视错觉研究属于认知科学,仅在欧洲和北美就 视错觉目前有背景错觉、侧抑制、缪勒莱耶错 有60多所大学(如Harvard、MT、Dartmouth、Prince 觉、深度错觉、视觉后像、填充错觉、透视错觉、伪装 tom等)建立了专门的研究队伍3].目前研究多偏重 错觉、知觉模糊、透明错觉、轮廓错觉、似动错觉等多 “提出假说,结合计算机技术和心理学理论,进行行 种类型「1,61).视感知的复杂性使认知在不同层次 为认知和神经生理实验,建立神经和数学模型”的 上形成不同种类的视错觉,如轮廓错觉中的Necker 方式,实验技术有患者临床研究、EEG、ERP和MRI 立方体和细胞群错觉中的颜色后效,前者基于不同 等,研究成果多发表在Nature、Science、JNS、PNAS、 组神经元群体竞争结果,后者基于单个视神经节细 Current Biology、Neuron、ACM等顶级期刊、会议和相 胞(anglion cel)自身特性:而同种类的视错觉可能 关网站上.美国Neural Correlate Society从2O05年开 表现为不同现象,如Hermann栅格和颜色后效都可 始举办的“Best Visual Illusion of the Year Contest”, 用细胞群错觉的神经节细胞特性解释,但分属视网 已有美、德、英等十几个国家的视觉科学家和艺术家 膜上的侧抑制和脑纹外区加工后V4-complex区发 参加,并定期在Scientific American上发表研究进 生的错觉8].故已有的错觉分类经常出现归纳现象 展.当前视错觉研究人员代表有德国Frei山burg大学 覆盖面小、同种错觉重复分类、不同错觉错归为同类 的M.Bach、美国Baylor医学院的D.M.Eagleman、日 结果等不足,表1归纳了国内外几种较全面的错觉 本Ritsumeikan大学的A.Kitaoka、意大利Sassari大 分类,并进行了简要评论126,16 学的B.Pinna等.我国错觉研究从20世纪50年代 表2在收集整理620多张典型错觉图片基础 开始,各大高校和研究所已将认知科学研究列为重 上,以避免种类交叉为出发点,按不同现象和成因分 要课题,如北大、清华、中科院和北师大等.一些原从 为六大类错觉:尺寸错觉指人根据深度线索和环境 事心理学、语言哲学研究的学者,及时地捕捉到先进 信息等视觉规则对相同面积、长度、体积的物体得出 科研信息开始研究错觉,科研成果多属于图形分析、 不同认知的现象;细胞群错觉指人因视觉神经上功 脑机能研究、视觉注意机制、数理模拟和算法建立方 能相似的神经元群或神经组织作用对刺激的亮度 面,除发表在国外期刊外,国内典型错觉的简单介绍 颜色、方向模式产生误解的现象;轮廓错觉专指人或 和造型设计类文章多发表于《心理学报》、《心理科 动物对图像中边缘梯度信息和环境认知出现错误的 学进展》、《生理科学进展》及高校学报等综合性自 现象,包括主观轮廓、知觉反转等:不可能错觉是指 然科学期刊, 局部平面结构理解合理却不能客观存在的图像;扭 21世纪各国对认知研究更加重视.美国国家基 曲错觉是指人把规则的点、线、面等结构元素感知为 金会、商务部提出聚合技术概念(nanotechnology, 歪曲结构的现象;运动错觉是指人结合环境线索对
第1期 刘宏,等:视错觉现象的分类和研究进展 ·3… 运动刺激判断出错误方向、目标等或从单一静态刺 激感知出运动效果的现象, 表1几种现有视错觉分类 Table 1 Several current categories of visual illusions 国家 姓名 分类 优点 缺点 亮度对比错觉、运动错觉、几何 范围广,种类多,约86种现 部分原理或现象相近的分类 德国 M.Bach 及角度错觉、尺寸恒常性及不可 能图形、格式塔效应、色彩错觉 象/图片 可以合并 侧抑制、后效、主观轮廓、多重刺生理学成因+研究历史,脉络涵盖范围少,约20种现象/图 Eagleman 激(如知觉反转) 清楚 片 后效、背景错觉、颜色错觉、亮度 美国 图片新颖详细(2005-2010), BVIC 错觉、不可能图形、隐藏图形、运 各类图片量小,类间有重复, 以各类图片的表象特征分类, 动错觉、旋转错觉、形状错觉、梯 可以按现象成因合并 约330种现象/图片 度错觉等 几何错觉、亮度/明度错觉、颜色以错觉的现象和成因分类,覆 日本 Kitaoka 错觉、视觉竞争、运动错觉、其他盖全面、各类错觉有详细研究 亮度错觉、颜色错觉、视觉竞 争、其他错觉间多重复 错觉 和标注,约75种现象/图片 几何图形错觉、对比错觉、形景 覆盖全面,条理较清楚,约 前5项内容相对单薄,把太多 罗正理 错觉、似动错觉、运动错觉、其他 没有共同点的种类都归于其 错觉 1300种现象/图片 他错觉 中国 长短、大小、平行、弯曲、视觉两 从知觉功能分类角度新颖,约 种类过少,集中于轮廓错觉和 孔彬 义性、知觉整体性、简单性、完美 性、理解性 11种现象/图片 扭曲错觉 表2视错觉重新分类 Table 2 The new category of illusions 分类 子类 例子 尺寸错觉 深度错觉 Ponz0错觉及诸多变体 Muller-Lyer错觉、月亮错觉、正弦错觉、Zollner错觉、Horizontal-vertical错觉、Sander错觉、 Shepard桌面错觉、Ehrenstein错觉(1941年)、Ebbinghaus错觉等 视觉后效 颜色后效(正、负后像、McCollough错觉等)、运动后效(瀑布错觉、螺旋后效、圆盘后效等) 细胞群错觉 侧抑制 Wertheimer-Koffka环、Craik-O'Bien-Comsweet现象、Scintilltating栅格错觉、棋盘错觉、Hermann栅 格、调色盘错觉、Mach Band、White's effect、Chevreul错觉、Vasarely错觉等明度对比变体 填充视觉 Bach motion错觉、Watercolor错觉、Wave--linecolor错觉 知觉模糊 墙角错觉、Necker cube等 伪装错觉 达尔马提亚狗、耶稣像等 轮廓错觉 背景错觉 前景背景错觉(图形背景错觉、二义性图像)及诸多变体 主观轮廓 Kanizsa三角形、Ehrenstein圆环及诸多变体 不可能图形 不可能三叉戟、不可能楼梯、不可能三角形、不可能房间等 扭曲错觉 Hering错觉、Fraser错觉、Zollner错觉、Popple错觉、Cafe Wall错觉、Checkered错觉、Poggen- dof错觉、七巧板错觉等 似动 循环蛇、辐条错觉、Ouchi错觉、Ternus Display、Fraser-Wilcox错觉、Sigma错觉等 运动错觉 Pinna-Brelstaff错觉、Flash-Lag错觉、Reverse phi错觉、Kaleidoscope错觉等
智能系统学报 第6卷 与其他分类方法相比,表2的分类方法按汇总 错觉现象,探寻心理生理学成因,综合现象和成因分 类,将现象相近的错觉分成子类,这样就避免了错觉 种类重复.如运动后效通常由于现象和运动有关而 被划分在运动错觉里,但其神经基础是视网膜上神 经元群体响应时间差异,而非似动现象的心理认知, 故被划分到细胞群错觉;又如轮廓错觉中有主观轮 廓、伪装错觉、知觉模糊等子类,主观轮廓指从邻近 区域间明度、色彩突然变化的同质刺激中感觉到并 (a)Rubin壶a (b)Necker立方体2] 不存在的轮廓、线、面的现象,伪装错觉指从一幅 图1前景/背景反转 Fig.1 Figure-background illusion 包含大量无关联成分的图像中感知出有意义图形的 2)图像不变,观察者因观察角度或距离改变而 错觉,两者诱导线索不同,但都从点、线段、图形等元 产生不同认知,常见有回转错觉(如图2所示)、3-D 素信息判断出区域边缘,从而扩展整体图形意义,本 反转错觉(reverspective). 质都基于视觉的边缘提取和自我修复能力,这和V2 主要决定真实和虚幻轮廓知觉的生理学研究成果是 相一致的[0] 根据目前研究成果来看,视觉是将神经节细胞 接受的初级信号按同类组合的模式逐级整合,到达 基础节点(essential node,对目标刺激属性有特定反 映的神经元)所在的脑区后,才产生完整的知觉反 应,逐级整合过程中每一级神经元都向高一级和低 (a)从一个角度看到 (b)图像旋转180°后看到 级的神经元发出前馈和后馈0].结合D.Mar的 带华冠的人物像 的带锥形帽的人物像 计算理论,视错觉可以被看成信息处理的生理机制 图2回转错觉俐 和脑多层次认知的心理机制结合的结果,其神经基 Fig.2 Circular illusions[ 础和产生正常视觉的神经基础一样,只是主观线索、 3)展现2种图形变化过程的“渐变错觉”.但无 经验等导致心理认知发生变化,以及具体神经活动 论如何观察者在某一时刻只能认知其中1种图形的 幅度、时间、类型上的差异.接下来就从以下几种视 存在(如图3所示) 错觉中选取最有代表性的图例验证这一结论, 3 典型视轮廓错觉原理及其在计算机 视觉领域的研究进展 3.1轮廓错觉(contour illusions) 轮廓错觉由来已久,1915年丹麦心理学家E. Rubin在18世纪法国印刷品基础上创造了经典的 Rbin壶21](如图1(a).图形的客观结构没变,变 的只是人类对图形特征的认知,这种认知反转显示 图3飞鸟和游鱼的渐变刊 Fig.3 The change between birds and fish 脑皮层对输入信息有一个积极加工过程,这也是目 轮廓错觉的近期研究多集中于该错觉相关的激 前神经学家研究意识(consciousness)的一个有用工 活脑区和信息处理方式上.1996年D.A.Leopold等记 具.轮廓错觉一般分为3种. 录猴的V1、V2、V4和MT区对多稳态刺激的反映,发 1)视觉反转(多重刺激/歧义图形,ambiguous 现只有小部分神经元响应当前主宰刺激,其余神经元 f五ures):图形不变,观察者可从中看出2种或2种 都响应非主宰或被抑制的刺激a].次年D.L.Shein- 以上图像,这几种认知也可循环转换.常见类型有前 berg等宣布在视觉信息加工的高级阶段,颢上沟(su- 景/背景反转(figure-background illusion,如图1所 perior temporal sulcus)中对主宰刺激响应的神经元比 示)等
第1期 刘宏,等:视错觉现象的分类和研究进展 ·5 例会增长,直到题叶皮层中绝大部分(temporal cor- 知理论和机器视觉结合起来.同年A.J.Noest等对 tex)神经元都被主宰刺激相关的方式激活为止24].这 认知反转进行伽马分布拟合的双参数分析(形状左 说明有不同神经元群体控制对刺激的感知状况.而J. 和入尺度),发现反转率随不同刺激而变化,其中最 V.Dodd等发现猴MT区神经元在多稳态刺激中响应 重要的参数是大致垂直于反转率均值μ=斥·入的 的概率大于它们在运动方向判断中的相关性2],这 个参数入/k=入2/μ,从而方便对不同刺激和任务中 可能说明小群体神经元对前者的决定活动更集中. 的意识进行量化研究0.2007年他们提出一个最小 2003年A.J.Parker等用FMRI技术,除了支持Dodd 神经模型: 的结论外,还发现被试有个决策处理时期,即对歧义 TH,H=X:-(1 +A:)H:+BA:+ys(H), 图形的每种形态认知都对应一组神经元活动,几组神 i,Je{1,2},i≠j, 经元活动的竞争结果决定最终的认知形态2],在心 T A;=-A:+aS(Hi). 理物理学阈值附近的一点变化都会导致认知反转, 式中:i、j标记2组神经元群体,认知结果为H(模拟 2O05年J.Kornmeier等在人脑枕部找到一个与反转相 神经元膜电位,其反双曲转换为S(H:)模拟神经元 关的早期ERP信号,并解决了反转时间的估计问 激活率),时间尺度TH,视觉刺激X,Y决定交叉抑制 题26],4年后他们又从意识控制(volitional control)和 程度,A:为短暂历史信号和B确定与认知j的联合程 离散刺激(discontinuous stimulus presentation)方向入 度,a调制A的幅度.A.J.Noest等认为反转结果主 手,发现两者都可以独立控制认知反转时间,并且不 要取决于神经元分流适应和神经学阈值的互动结 同时间范围中反转来源于不同的神经处理机制(top- 果,刺激的ON/OFF时间控制复杂知觉决策序列的 dowm或bottom-up). 产生3).继H.Atmanspacher等用Necker--Zeno模型 综上可知,认知反转是由2组或2组以上神经 定量研究多稳态刺激认知中反应时间和反转率 元群体竞争的结果,不同的刺激信号从初级神经元 后[2】,J.W.Brascamp等对持续和间歇展示的歧义 和视皮层放大并上传,结合被试的先验经验和意识 刺激对比研究发现:间歇展示的刺激产生的知觉周 控制等,在猴的MT区(人类相似脑区为V5)上进行 期性反转率取决于间歇时期空白时间的长短,并用 反转,反转过程可用反转率和时间等描述.这类似于 不同时间尺度加权来改进最小神经模型: 2007年Liu在信息处理中采用的多组智能体线索竞 Tm0,H=X:-(1+∑A)H:+ 争机制,即用颜色、亮度、方向等表征目标的不同特 max{0,B∑A:-B∑A}+yS(H) 征线索,并按跟踪目标变化进行竞争,注意力始终注 意当前最显著的一组智能体线索] 式中:B决定信号A参与程度,该模型很好解释了反 转中神经网络竞争和相关活动3], 岐义视觉刺激强 神经元平均场干沙 检测转换 度1感对比差4 1+4Cos{Tv+vs月 值得一提的是,2002年T.J.Andrews等研究人 因子x 类面孔鉴别的特定脑区fusiform face area时发现,当 相位调制x 注意力 被试给予一定边界线索时能从robin vace/face刺激 偏差v。 中识别出面孔,且具有和见到真实面孔相同的响应 时延T 区域2].综上所述,可推断人类对知觉反转在神经 反馈增益g(v,)、饱和 元水平上有一个表征(representation)刺激的竞争阶 感状态 时问y和恢复时问t 噪声 段,这个阶段动态递归,且利用与真实刺激时相同的 神经信息通路。 图4歧义认知流程图一 递归注意力干涉模型) 3.2主观轮廓(llusory/subjective contours) Fig.4 Simplified block diagram of perception-atten- 1904年Schumann首次描述该错觉,最著名的 tion recursive interference model( 例证为1941年Ehrenstein的Ehrenstein圆环和1955 从整体水平上来看,近年学者比较热衷从数学 年意大利人Kanizsa提出的Kanizsa三角,见图5所 和认知模型的角度来分析认知反转所涉及的深层活 示.主观轮廓共同点为:静止就可看到、单眼视觉时 动,为计算机模拟认知输出奠定基础.2006年,N. 即能出现、有错觉亮度差异、有深度视觉(轮廓两边 Furstenau利用电磁场干涉和非线性的动态模型成 一面在另一个面上面).任旭明在1996年总结主观 功模拟知觉反转,如图4,把基于神经元平均场 轮廓有心理和生理两方面解释:心理解释认为主观 (neuronal mean fields)的认知过程量化成具有于涉 轮廓发生在中枢神经系统,包括格式塔学说、认知学 和反馈环节的动态数学递归控制过程9,将诸多认 说、深度线索学说等:生理解释认为发生在外周神经
6 智能系统学报 第6卷 系统,包括特征觉察假说、侧抑制亮度对比假说、高 间频率和脑皮层神经元的空间过滤特性共同决 空间频率过滤假说等],但并不统一 定[2].同年,Kouhsari等用fMRI技术发现初级视皮 层V1、V2和相关高级视皮层(V3、hV4等)都适应 主观轮廓的方向选择性,并且按初级一高级顺序递 增[],这是对以前主观轮廓只涉及早期视皮层和腹 侧通路观点的重要拓展。 综合其他生理学发现可知,人类对主观轮廓主 要由V1、V2区完成,V2对来自V1的信息进行轮廓 方向、明度变换方面的处理,在向更高级神经中枢传 (a)Kanizsa三角形 (b)Ehrenstein圆环 图5 Kanizsa三角与Ehrenstain圆环[] 递信息的同时又对V1进行反馈,V2是处理主观轮 Fig.5 Kanizsa triangle and Ehrenstein ring) 廓的关键脑区,V1为辅助脑区,这与识别真实轮廓 时V2的活动一样:但2008年G.Sary等的研究说明 1980年张厚粲等通过比较刺激深度线索和被 起码猕猴下颢叶皮层(inferior temporal cortex)对二 试主规图形完整化倾向在主观轮廓形成中的作用, 者的处理还有所不同4】 发现深度线索是形成主观轮廓的直接决定因素「4]; 除传统生理研究外,近年学者也尝试从信息处 1984年Von der Heydt等首次报道猴视皮层V2区 理和数学模拟等方向开拓研究:Grossberg等人在 约44%的端神经元(end stopped cells)能检测主观 1994年提出FACADE(form and color and depth)理 轮廓方向;随后他们用连续和间断的线段、条块刺激 论,认为边界轮廓系统(boundary contour system)和 对恒河猴实验,得出V2神经元对二者有相似的激 特征轮廓系统(feature contour system)共同作用形成 活反应3571;1989年,马振华通过研究主观轮廓刺 了3-D轮廓和背景前景感知,建立了一个可解释主 激诱导面积和诱导部分反射率对错觉感知的影响发 观轮廓的综合性计算模型,是当今部分边缘图像处 现,侧抑制引起的明度对比起着主要作用];而 理算法的基础[s].2008年,Y.M.Jung等用level-set Go8of等得出初级视皮层单个神经元能检测主观轮 提出一个变偏微分一阶能量最小化的数学模型,从 廓方位[2].这说明刺激的深度和明度线索会激活视 而可对大量主观轮廓进行数学分析和计算机模 网膜神经细胞,信号传至V1检测图像元素方位,V2 拟461.同年,M.A.Hako等认为主观轮廓错觉是内 区用以判断区域边缘,且V2区对真实轮廓和主观 插(interpolation)、外推(extrapolation)和图形(fgu- 轮廓的处理是相似的.之后的发现也证实了前人的 l)类3种信息处理机制的共同作用结果,而非先 猜测:2001年T.S.Lee等在V1区有同Von der 前研究注重的单机制作用).由此可以看出,对主 Heydt类似的发现,但V1比V2的反应时间要长,这 观轮廓深层成因的研究,有利于模拟人类对复杂刺 表明大脑在更高级区域的反馈活动基础上来填补主 激的边界提取鲁棒性和认知修复能力,从而指导计 观轮廓.因此认为主观轮廓的主要认知部位在脑视 算机视觉方向建立特征提取模型和边缘算子 皮层V1、V2区[39].同年,B.M.Ramsden等用光成像 Ullman、ShaShua、Rosa等的不同算法和Gross- 和电生理学技术,比较“abutting line grating”刺激和 berg的FACADE主观轮廓感知修复模型研究则为 真实刺激对V1区的影响,发现能让V1有强烈响应 计算机模拟主观轮廓感知奠定了基础,如国防科大 的主观轮廓方位和真实刺激轮廓方位是相反的,因 的邵晓芳等提出一个计算机分级模型构造了边界轮 此推断V1神经元对主观轮廓是一个“去强调(de 廓系统和特征轮廓系统,模拟了视觉系统的有向边 emphasis)”过程,它辅助V2区完成人对主观轮廓的 缘检测、竞争合作机制和轮廓边缘端点重组,有效 认知o1 实现了图像轮廓提取[ 2006年,M.L.Seghier等综合1991年来主观轮 3.3运动错觉(motion illusions) 廓的20多项神经成影方面的主要研究,从研究技 本文中的似s动(apparent motion/illusory motion) 术、发生时期、位置、信息处理机制等方面总结了成 指在某些条件下人由单一刺激可以产生运动感觉, 果和问题11.2007年Zhan等对人脑V1/V2区和猫 而刺激实际并不运动,而非将客观不连续刺激位移 脑A17/18区研究发现:主观轮廓刺激分别在人脑 认知成连续位移的现象.1912年德国格式塔心理学 和猫脑这两区域中产生的映射(mp)都相反,从而 创始人Max Wertheimer说明后者是一种通过视觉幻 认为映射的恒定性或相反性由刺激中诱导元素的空 觉产生运动假象的Ph现象,他认为刺激的不同部
第1期 刘宏,等:视错觉现象的分类和研究进展 7 分引起脑区相应皮层区域的兴奋,在适当时空条件 下兴奋回路发生融合短路得到运动印象.而心理学 上Kote定律说明了刺激强度、时间间隔和空间距 离间隔对产生似动影响的相互关系。 前者典型图例有周边漂移错觉(peripheral drift illusion)和旋转蛇(rotating snakes)[9),如图6~7所 示,此类“似动”最早于1875年被德国人Exner发 现1.1983年R.L.Gregory等首次发现不对称的亮度 变化能引起运动错觉so.2003年,日本Ritsumeikan 大学的A.Kitaoka等对似动现象进行归纳,认为亮度 (a)扫视车轮和背景可产生微弱运动错觉 渐变和线段边缘断层是2个基本因素5],并根据此 结论设计出“旋转蛇”及其系列变体(如图8所示). (b)扫视烟花有旋转错觉 图8旋转蛇图形的一些变体 Fig.8 Two variations of rotating snakes 图6周边漂移错觉1],每个锐角扇形亮度都在渐变,产 2005年Backus等认为原因是对亮度(lumi- 生微弱的旋转错觉 nance)和对比度(contrast)响应的神经元随时间变 Fig.6 Peripheral drift illusion.The circle appears to 化而变化,在高低亮度对比条件下响应时间不同,对 rotate clockwise 比度越高,响应时间越短,从而使RAPs相对快速运 动s21.次年P.Sterzer等用fMRL技术研究似动,除 V1参与外,还首次发现在此过程中V5区会产生增 强反馈,与V1皮层间发生耦合[3];而T.Kumar对 Enigma错觉进行心理测试发现人们产生似动速率 和真实刺激旋转起来速率是同样的4];2008年丁 晓攀等利用ERPs技术发现初级视皮层产生错觉形 成的最初加工[s];同年,B.Ahmed等对白鼬的脑皮 图7旋转蛇部分效果6),图中每个圆盘都在旋转,但 层17、18、19、21区神经元群的膜电位动态特性进行 被凝视时错觉消失 研究,发现皮层产生的运动反馈信号和去极化活动 Fig.7 Part of the rotating snakes1.Each disc seems 与似动有关.由此可见,似动现象是在V5神经元 to rotate,but to be static when stared 水平上进行认知的,V1接受刺激各类信息,向高级 然而A.Kitaoka等仅解释了错觉设计规则,并 视皮层传送,不同对比度线索到V5区时激活对真 未找到生理机制.同年,他又与B.R.Conway等对猴 实运动响应的神经元,从而产生运动的心理认知.似 和人实验,除肯定亮度对比是必要因素外,还发现 动也与颜色、听觉等刺激相关,但目前还没有较成熟 V1、MT区有方向选择特性的神经元,这是首次发现 的信息处理模型来表征似动 V1单神经元能对重复不对称现象(Repeated Asym- 似动现象与其他类型刺激的关系也是近年研究 metric Patterns,.RAPs)产生方向性响应,说明了低水 的对象:2006年V.S.Ramachandran等用与颜色关 平神经元对似动的解释作用,并提出基于亮度对比 联的数字对被试实验发现共感(synesthesia)中的色 的反应时间差模型(contrast--dependant latency-differ- 彩能产生似动[s;次年D.Sanabria等发现空间注意 ence model)1491. 力在跨模态信号(cross--model)互动中能削弱似动效
8 智能系统学报 第6卷 果,认为在接收运动信息过程中,空间注意发挥作用 觉主要源于视网膜神经节细胞(ganglion cells)的生 的时刻至少不晚于视听信号互动s];以及E.Free 理结构和响应特性[6],此后大约半个世纪Hermann man等通过双耳接受不同时信号成功影响似动效 栅格都被认为是侧抑制所致.1996年Xiang等发现 果,从视听融合角度去研究视觉感知运动方向的时 节细胞有2种中央周边结构,通过锥状体输人的红 空处理(spatio--temporal processing)特性s9],这说明 绿/蓝黄信息差传送色彩信息,其在传导速度、亮度 似动可能是多种认知途径交互作用的结果。 差异敏感度、分辨率以及分布位置的差异是许多视 3.4细胞群错觉(cell population illusions)) 错觉产生的生理基础,依然支持了侧抑制学说6 除了似动,细胞群错觉是最常见的基于神经元 与此同时,不少科学家发现侧抑制并不能解释 群体的错觉,包括关于亮度的侧抑制(lateral inhibi-- Hermann栅格中的所有现象.如1984年Wolfe发现 tion),关于亮度、运动的后效(after--effect)等.这里介 栅格间的十字交汇处的位置和数量会影响错觉效 绍侧抑制:视网膜由许多光敏细胞组成,单个细胞的 果a1;2004年J.Geier等对栅格形状稍加修改,灰 激活会影响邻近的细胞活动,当刺激某个细胞得到 斑效果就消失了(见图10右半部分):同年M.Bach 较大响应时,再刺激邻近细胞,该细胞反应会减弱, 认为Hermann栅格还与视皮层其他加工结构,如有 即周围细胞抑制了其反应,这种现象被称为侧抑制, 方向选择特性的神经元有关;2008年J.Geier又指 典型例子有Hermann栅格(如图9左半部分所示) 出栅格交线是否笔直是产生灰斑的主要因素[364]」 和同时对衬(simultaneous contrast,.如图10所示). 随后部分学者开始转向以不同的角度解释 ■■ Hermann栅格.比如与视网膜的联系:2005年Ares- Gomez等对原发性开角型青光眼患者进行研究,发 现该错觉是关于栅格线宽度的一个空间调谐函 数[s];2年后M.J.Cox在不同亮度、偏心度等条件 下用基于标准神经节细胞感受野的模型,良好预测 了Hermann栅格的空间调谐性,认为该错觉是在视 网膜节细胞特性上产生的结果,而非脑皮层],又 比如与整体感知的联系:2007年,D.Corney等训练 图9左边正常的Hermann格和右边消失错觉的 一个人工神经网络来说明视觉系统的亮度恒常性, Hermann栅格) 从错觉定义本身理解Hermann栅格现象[6];2008 Fig.9 The left original Hermann grids and right dis- 年M.Bach总结近年来的科学发现指出侧抑制已不 torted Hermann grids(2 能解释该错觉. 然而目前侧抑制还是Hermann栅格的通用解 释,当前的研究说明侧抑制在小群体神经元水平上 接受亮度等信息,引起相应感受野的抑制,致使对应 区域心理认知亮度产生差异.现可以用高斯带通滤 波函数和Gbor算子来模拟单个神经节细胞对信息 图10 Munker-White错觉图的变体,同时对衬,图中左 的选通性,用小型神经网络来模拟神经元群体产生 右两矩形框灰度一致,源自E.Bach 侧抑制的过程,用基于最大离散小波的非线性模型 Fig.10 Munker-White simultaneous contrast illusion. 来模拟侧抑制和其他亮度错觉[],并得到心理实验 The two vertical stripes have the same gray 的支持 from the website of E.Bach 1865年,E.Mach首次发现马赫带现象:在亮度 4视错觉的应用前景 逐渐变化的条纹交界处会发生亮带更亮、暗带更暗 视错觉的应用大量存在于现实生活和专业研究 的错觉[6o.1870年,L.Hermann发现“Hermann栅 中.如美国EP Industries公司以Pulfrich现象为核心 格”:以矩阵排列的黑方格交叉处会闪现灰色斑点, 研制出优于3-D的Circlescan4-D技术[1,使看立 斑点被凝视时不可见1.1956年,H.K.Hartline通 体电影所需佩戴的特制眼镜从2片偏振片变为1片 过生物实验微观上证明了侧抑制的存在「0].4年后 灰滤光片和1片透明镜片,成本大大降低;基于色彩 Baumgartner提出侧抑制学说,认为栅格中的灰斑错 恒常性提出的McCann Retinex算法对迭代参数改进
第1期 刘宏,等:视错觉现象的分类和研究进展 ·9 后应用于彩色图像亮度、对比度的处理结果符合人 轮廓的信息编码方式可以用来研究图像目标轮廓的 类视觉感知特性,应用在人脸检测中能够较大程度 高效率压缩,以节省存储空间用于网络传输 提高识别率;而基于侧抑制模型的去除单张内窥镜 视错觉还应用于平面艺术设计、建筑工程、脑科 图像高光算法被应用在医学电子内窥镜系统软件平 学临床研究、跨文化心理学、运动员与飞行员训练、 台中,具有侧抑制机制的神经网络和视觉系统模型 服饰形象设计、道路交通、电影艺术等方面.如艺术 则被用于红外噪声配准、红外制导、图像预处理、图 家Andrea Pozzo利用深度错觉知识在罗马著名的 像增强、联想记忆等领域中 St.Ignatius教堂天花板上创作的平面炮楼,立体效 除此之外,Hotmail、Yahoo、PayPal等邮箱和论坛 果使许多游客浑然不觉;又如基于人类视觉会简单 使用的CAPTCHA验证系统为防止人工智能体自动 地把标准字体原样放大缩小从而产生视错觉误差, 注册和信息丢失,验证码通常使用图文结合的形式, 常见的BM标志在尺寸变化时,要调整蓝色条纹粗 根据人类特有的感知判断力进行图灵测试0,其中 细、色彩等以产生恒定印象.表3是对一些领域涉及 验证环节可使用错觉图片来诚少判断误差;而主观 的视错觉知识进行的整理, 表3艺术和科研领域视错觉应用 Table 3 Applications of illusion in art and scientific fields 应用方向 所用视错觉种类或知识 建筑设计、室内设计 色彩错觉、建筑元素结构、表面、质感、节奏等方面引起深度错觉等 电影艺术 视觉正后效、事物的多义性和模糊性、对视知觉的心理预测判断导致错觉 平面艺术设计:海 报、广告、包装、网 轮廓借觉中的深度和反转错觉,不可能图形,色彩错觉(轻重、胀缩感、冷暖)的同时对称,视觉后 效,主观轮廊,格式塔知觉组织原则(相似、接近、连续、完整和闭合等)等 页、印刷版面等 舞台美术 尺寸错觉中深度错觉,色彩错觉(冷暖、强弱等),知觉预测制造悬念导致错觉 服饰搭配 色彩错觉(深浅、冷暖、胀缩感)、裁减线、分割线、饰品和图案引起尺寸错觉 人像摄影 色彩错觉、尺寸错觉(拍摄角度、拍摄光投射方向等) 飞行员视觉超分辨 尺寸错觉(Ponzo错觉、Ebbinghaus错觉、uller-Lyer错觉等)来检验错开、弯曲、评分、倾斜等识别能力 能力的检验 细胞群错觉中的Scintillating栅格错觉、似动错觉中的Rotating Snake错觉、扭曲错觉中的Cafe Wall 图灵测试 错觉和棋盘错觉 轮廓错觉中的主观轮廓模型、细胞群错觉中侧抑制错觉的center-urround理论提取特征、circle scan 图像处理和计算机视觉 4D技术等 信息安全 验证码中使用扭曲错觉等防止邮箱、网站非正常注册 地质制图 尺寸错觉、运动错觉、色彩错觉中的同时和即时对比 体育教学 尺寸错觉中的横竖错觉、面积错觉、深度错觉、重量错觉导致场地、器材的错觉 跨文化研究 尺寸错觉中的横竖错觉、桑氏错觉、横竖错觉、pozo错觉等研究不同地域、受教育程度、肤色人们 的心理和知识现状 大脑两半球不对称研究McCollough效应 以Hering和Wundt等错觉从脑不同部分病变、左右半球不对称性和视觉障碍方面研究几何图形错 脑损伤临床研究 觉的神经基础,用Hermann栅格等错觉研究失读症 但视错觉引起的危害也不容小觑.交通部门调 研究视错觉的意义还在于推进视感知机理、注 查,视错觉还是交通事故的主因之一.雪后放晴,阳 意力转移机制、脑和认知功能等方面的研究,从而使 光在雪层表面反射形成的雪盲,是严重干扰飞行员 认知科学在信息安全、临床医疗、心理控制、学习教 视力、延误航班的颜色后效错觉;强光、变换过速的 育、智能机器人等领域深入,代表性的智能机器人系 阴影等会引起驾驶者视觉后效,视物不清;复杂路段 统有服务机器人、脑式计算机等, 交错的信号和周边线索缺失会引起司机歧义认知, 作出错误判断;雨雪在车玻璃上则会产生扭曲错觉. 5结束语 同时,人们在设计道路时要注意避免道路线性轮廓 本文进行典型视错觉的分类,并总结了错觉研 不清、周围景观元素不协调、交叉路口和交角位置不 究现状和应用前景.认为视错觉是综合信息处理生 当引起的尺寸错觉、色彩后效等错觉.研究视错觉很 理机制和心理认知的多层次过程,不同层次上形成 大程度上能避免严重事故发生 不同种类的视错觉,不存在仅产生视错觉却不响应
第1期 刘宏,等:视错觉现象的分类和研究进展 ·11 [26]KOMMEIER J,BACH M.The necker cube an ambiguous formation in the early visual corte[J].Proceedings of the figure disambiguated in early visual processing[J].Vision National Academy of Sciences of the USA,2001,98(4): Research,2005,45:955-960. 1907-1911. [27]KOMMEIER J,HEIN C M,BACH M.Multistable per- [40]RAMSDEN B M,HUNG C P,ROE A W.Real and illuso- ception:when bottom-up and top-down coincide[J].Brain ry contour processing in area V1 of the primate:a cortical and Cognition,2009,69(1):138-147. balancing act[J].Cerebral Cortex,2001,17:648-665. [28]LIU Hong,ZHANG Lin,YU Ze,et al.Collaborative [41]SEGHIER M L,VUILLEUMIE P.Functional neuroimag- meanshift tracking based on multi-cue integration and aux- ing findings on human perception of illusory contours[J]. iliary objects[C]//The Interational Conference on Image Neuroscience and Biobehavioral Reviews,2006,30:595- Processing.San Antonio,USA,2007,3:217-220. 612. [29]FURSTENAU N.Modeling and simulation of spontaneous [42]ZHAN Changan,BAKER C L Jr.Critical spatial frequen- perception switching with ambiguous visual stimuli in aug- cies for illusory contour processing in early visual cortex mented vision systems[J].Lecture Notes in Computer Sci- [J].Cerebral Cortex,2008,18(5):1029-1041. ence,2006,4021:20-31. [43]MONTASER-KOUHSARI L,LANDY M S,HEEGER D J, [30]Van EE R,NOEST A J,BRASCAMP J W,et al.Atten- et al.Orientation-selective adaptation to illusory contours tional control over either of the two competing percepts of in human visual cortex[J].The Joumal of Neuroscience, ambiguous stimuli revealed by a two-parameter analysis: 2007,27(9):2186-2195. means do not make the difference[J].Vision Research, [44]SARY G,KOTELES K,KAPOSVARI P,et al.The rep- 2006,46:3129-3141. resentation of Kanizsa illusory contours in the monkey infe- [31]NOEST A J,Van EE R,NIJS MM,et al.Percept-choice rior temporal cortex J].Cognitive Neuroscience,2008, sequences driven by interrupted ambiguous stimuli:a low- 28(10):2137-2146. level neural model[J].Journal of Vision,2007,7(8):1- [45]GROSSBERG S.3D vision and figure-ground separation by 14. visual cortex []]Percept Psychophys,1994,55 (1): [32]ATMANSPACHER H,BACH M,FILK T,et al.Cogni- 48-121. tive time scales in a Necker-Zeno model for bistable per- [46]JUNG Y M,SHEN J.First-order modeling and stability a- ception[J].The Open Cybernetics and Systemics Journal, nalysis of illusory contours[J].Journal of Vision Commu- 2008,2:234-251. nication and Image Representation,2008,19(1):42-55. 33]BRASCAMP J W,PEARSON J,BLAKE R,et al.Inter- [47]HALKO M A,MINGOLLA E,SOMERS D C.Multiple mittent ambiguous stimuli:implicit memory causes periodic mechanisms of illusory contour perception[J].Joumal of perceptual alternations[J].Journal of Vision,2009,9 Vision,2008,8(11):1-17. (3):1-23. [48]邵晓芳.主观轮廓感知修复模型及相关算法研究[D]. [34]张厚粲,彭聃龄,孟庆茂.主观轮廓和深度线索[J].心 长沙:国防科学技术大学研究生院,2006:6080. 理学报,1980(1):6367. SHAO Xiaofang.Studies on perceptual completion models ZHANG Houcan,PENG Danling,MENG Qingmao.Sub- and algorithms for subjective contour D].Changsha: jective contour and depth cue[J].Acta Psychologica Sini- Graduate School of National University of Defense Technol- ca,1980(1):6367. 08,2006:60-80. [35]Von DER HEYDT R,PETERHANS E,BAUMGARTNER [49]CONWAY B R,KITAOKA A.Neural basis for a powerful G.Illusory contours and cortical neuron responses[J]. static motion illusion[J].The Journal of Neuroscience, Science,1984,224(4654):1260-1262. 2005,25(23):5651-5656. [36]Von DER HEYDT R,PETERHANS E.Mechanisms of [50]GREGORY R L,HEARD P F.Visual dissociations of contour perception in monkey visual cortex.I.lines of movement,position,and stereo depth:some phenomenal pattern discontinuity[J].The Journal of Neuroscience, phenomena[J].Quarterly Joural of Experimental Psy- 1989,9(5):1731-1748. chology,1983,35(A):217-237. [37]Von DER HEYDT R,PETERHANS E.Mechanisms of [51]KITAOKA A,ASHIDA H.Phenomental characteristic of contour perception in monkey visual cortex.II.contours the peripheral drift illusion[J].Vision,2003,15(4): bridging gaps[J].The Journal of Neuroscience,1989,9 261-262. (5):1749-1763. [52]BACKUS B T,ORUC I.Illusory motion from change over [38]马振华.主观轮廓与明度对比的实验研究[J].心理学 time in the response to contrast and luminance[J].Journal 报,1989(3):230-236. of Vision,2005,5:1055-1069. MA Zhenhua.An experimental study of subjective contours [53]STERZER P,HAYNES J D,REES G.Primary visual cor- and brightness contrast J].Acta Psychologica Sinica, tex activation on the path of apparent motion is mediated by 1989(3):230-236. feedback from hMT/V5 J ]Neurolmage,2006,32: [39]LEE T S,NGUYEN M.Dynamics of subjective contour 1308-1316