2019年6月1日,由模式识别国家重点实验室举办的2019模式识别学科发展战略研讨会在中科院自动化所成功召开,一百多位专家学者参加了此次会议。研讨会开幕式由模式识别国家重点实验室主任刘成林研究员主持,国家自然科学基金委信息科学部张兆田主任致辞,张钹院士、谭铁牛院士、徐宗本院士等十四位本领域知名专家学者受邀做大会报告。

   

  图1. 2019模式识别学科发展研讨会开幕式

  会议开始,刘成林主任首先表达了对与会专家学者的热烈欢迎。他表示本次研讨会是在中科院学部项目支持下召开的,希望基于与会专家的主题报告及深入讨论,形成本领域真正具有指导意义与参考价值的学科发展报告。紧接着,张兆田主任进行会议致辞,张主任就基金委的部分规划做了简要介绍,并鼓励大家对未来五到十年的发展布局出谋划策、贡献力量。

   

  图2. 张兆田主任致辞

  随后,清华大学张钹院士首先做题为“后深度学习时代的模式识别”的主题报告。报告指出,与以符号模型为基础的第一代人工智能、基于概率演进的第二代人工智能相比,后深度学习时代的模式识别研究应该是可解释的、鲁棒的、可信的、安全的。

   

  图3. 张钹院士做主题报告

  中科院自动化所谭铁牛院士做题为“生物启发的模式识别”的主题报告。报告从模式识别的基本概念、发展现状和生物启发的模式识别三个方面出发,阐述了一些新的思考。他强调为了解决鲁棒性、自适应性和可泛化性等问题,需要参考生物机制以及大脑处理信息的方式,加强脑科学和信息科学的交叉研究。

   

  图4. 谭铁牛院士做主题报告

  西安交通大学徐宗本院士做题为“人工智能与数学:融通共进”的主题报告。报告首先分析了深度学习框架、深度对抗、强化学习背后的数学原理,然后提出了人工智能特别需要关注的问题。他强调数学是人工智能发展的基石,不仅能够提供人工智能模型,也可以提供新的思路。人工智能应该关注数学的作用,数学家也应该关注人工智能的价值。

   

  图5. 徐宗本院士做主题报告

  北京大学查红彬教授做题为“SLAM与在线学习”的主题报告。报告首先介绍了动态视觉和SLAM的基本概念和研究历史,并解释了两者之间的关系。然后总结了当前SLAM研究中存在的基本问题,如计算成本高、误差累积严重、缺乏有效的结构信息指导等。最后他提出通过在线学习、利用传感器数据流的连续性、预测和映射机制等方式来提高算法的性能和效力。

   

  图6. 査红彬教授做主题报告

  国防科技大学胡德文教授做题为“脑功能的模式识别”的主题报告。报告首先介绍了如何使用全脑模式识别研究精神分裂症、网络成瘾、海洛因成瘾等疾病,以及在这些领域所取得的超越传统方法的最新发现,然后他介绍了全脑链接网络的多变量模式分析方法和多模态脑影像好的特征提取与分类方法的最新研究成果。

   

  图7. 胡德文教授做主题报告

  香港科技大学权龙教授做题为“计算机视觉三维重建现状与挑战”的主题报告。报告阐述了人工智能对三维重建的影响,包括计算力有效提高了神经网络模型自动学习特征的效率,以及如何把这些特征用于三维重建来进一步提高三维重建的精确度。

   

  图8. 权龙教授做主题报告

  北京理工大学黄河燕教授做题为“语言智能研究进展与展望”的主题报告。报告指出,语言智能处理的难点在于计算机如何对知识进行有效的表示,以及如何进行语言的理解、推理,其中核心就是如何让计算机有自主学习的能力。报告探讨了未来如何结合声调、语音、面部表情和视觉信息等多模态协同的方式来研究语言。

   

  图9. 黄河燕教授做主题报告

  西北工业大学陈景东教授做题为“声信号的感知与处理”的主题报告。报告指出,信号是连接物理空间和信息智能空间的桥梁,利用传感技术从客观物理事件获取信号并对之进行组合、处理、变化和融合,最后能够找到从物理空间到信息智能空间的映射。

   

  图10. 陈景东教授做主题报告

  中科院计算所陈熙霖研究员做题为“讲解机器视觉—从识别到理解”的主题报告。报告指出,机器视觉解决的是“what”和“where”的问题,解决不了“how”、“why”、“When”等问题。理解是在场景层面看到物体属性,如果想要理解图像的概念,则需要将语言概念和视觉对齐来支持背后更深层次的语义理解。

   

  图11. 陈熙霖研究员做主题报告

  中科院软件所田丰研究员做题为“智能时代的人机交互”的主题报告。报告指出人机交互经历了开关和指代、键盘、图形用户界面、触控或手势四个阶段,每次变革都深刻推动信息技术的广泛普及。人机交互的发展依赖于人机协同问题的求解,人机共生将是人类社会的新常态。

   

  图12. 田丰研究员做主题报告

  北京大学王立威教授做题为“机器学习理论”的主题报告。报告从机器学习理论过去几十年主要成果、现在或者未来最基本问题是什么这两个方面展开,介绍了经典的监督学习和强化学习理论,如VC理论、PAC学习、TD learning等,探讨了深度学习表示的有效性、非凸优化的收敛性、小样本分布式强化学习等机器学习领域前沿研究方向。

   

  图13. 王立威教授做主题报告

  北京大学的黄铁军教授做题为“类脑视觉:重新审视视觉信息处理”的主题报告。报告指出,如果我们将视频当作机器视觉的起点,它会成为天花板。希望机器视觉能够回到本位,首先是对视觉时空信息有效保留,然后才是真正的检测视觉。

   

  图14. 黄铁军教授做主题报告

  北京交通大学赵耀教授做题为“跨媒体统一表示”的主题报告。报告介绍了跨媒体的基本概念、跨媒体统一表征的意义及最新进展,并指出,跨模态分析推理技术已经成为新一轮人工智能的关键。

   

  图15. 赵耀教授做主题报告

  西安交通大学薛建儒教授做题为“人机混合增强智能驾驶”的主题报告。人机混合增强智能驾驶把人的认知模型引入到自动驾驶当中,构建人在驾驶系统当中的行为理解模型,增加人机交互协同的语态系统分析,建立人机交互的计算框架,最终实现自主驾驶。

   

  图16. 薛建儒教授做主题报告

  主题报告结束后,研讨会进行了集中及分组讨论。刘成林主任首先介绍了“模式识别学科报告规划”,并和与会嘉宾就模式识别学科发展进行了集中讨论。随后,分别就模式识别与机器学习、语音语言及交互、图像视觉及多媒体三个主题进行了更为深入的分组讨论,模式识别国家重点实验室将在汇集各位专家学者关于学科发展的建议基础之上,形成正式完整的学科发展报告,为学术界提供研究建议,以期推动模式识别与人工智能学科领域的发展。

   

  图17. 集中讨论现场

   

  图18. 分组讨论现场(1)

   

  图19. 分组讨论现场(2)

   

  图20. 分组讨论现场(3)

   

  图21. 与会嘉宾合影

附件: