11月8日至9日,美国麻省理工学院(MIT)资深教授Tomaso Poggio访问了自动化所模式识别国家重点实验室。8日下午,实验室副主任刘成林陪同Poggio教授参观了实验室,观看了虹膜识别、人脸识别等多个演示。随后,Poggio教授出席了谭铁牛研究组的每周例会,与组内师生就当前研究进展和热点研究问题进行了深入讨论。9日上午,Poggio教授面向全所师生做了题为“The Secret of Visual Cortex: Learning to Learn Invariant Representation”的学术报告,介绍了其在计算神经科学和基于视觉皮层机理的视觉计算模型方面的最新研究成果。

Tomaso Poggio于1971年在意大利热那亚大学(Genoa)取得理论物理学博士学位,1981年后在MIT从事计算神经科学的教学科研工作直到现在,创立和领导MIT“生物计算学习”中心实验室(CBCL),使之成为国际上极具影响力的实验室。Poggio教授早年与视觉计算理论开创者David Marr一起工作,从事立体视觉的计算与神经机理研究,此后对人类视觉从理论、工程应用以及神经机理等方面展开了深入的研究,试图从“学习”的角度揭开人脑工作之谜。他提出的HMAX对象识别模型是近年来计算机视觉、计算神经领域极具影响力的一个工作,该计算模型模拟了人类视觉通道各皮层的神经机理,被称为“最接近人类视觉系统”的模型,在物体识别、行为识别中的成功应用进一步验证了该模型的合理性。Poggio教授曾获得多项荣誉,他是神经科学研究项目(NRP)的荣誉成员,美国艺术与科学学院成员,2009年因其在“计算神经科学的杰出贡献、视觉系统的生物物理学和行为学研究等方面的开创性研究”而获得Okawa奖。至今虽年事已高,仍然活跃在各个研究领域,出现在各个国际重大学术会场。

Poggio教授在此次学术报告中介绍了其最新理论成果:负责对象识别的视觉腹侧通路(visual ventral pathway)的主要任务是解决对象表示的几何不变性,而不是传统意义上的类间差异性,这是由识别任务的复杂性所决定的。这个理论分为两个阶段:首先是学习阶段,通过运动序列学习对象的各种变换从而获取不变性表示;然后是测试阶段,获取单个对象图像、提取特征并识别。与会师生对此理论表现了极大的兴趣,分别就光照等其他不变性问题、不变性对象的普适性、反馈机制在对象识别中的作用等问题进行了热烈的讨论。同时,大家还对当前研究比较热的深度神经网络、视觉注意机制、物体识别与物体检测、非欧空间表示等问题,与Poggio教授交换了意见。

 

附件: