3月27日,强化学习与运筹优化前沿技术论坛在线上成功举办。论坛由中国科学院自动化研究所主办,自动化所所长徐波担任论坛主席。
当前,人工智能加速发展的一个重要的趋势是从感知智能向认知、决策智能跨越,而强化学习和运筹优化是实现决策智能的重要方法。在这一背景下,自动化所举办强化学习与运筹优化前沿技术论坛,邀请国内外有影响力的专家学者,为促进决策智能研究向纵深方向发展提供交流和讨论的平台。
本次论坛包括嘉宾报告和圆桌讨论2个环节,邀请了阿里巴巴(美国)达摩院决策智能实验室负责人印卧涛博士、华为诺亚方舟决策推理实验室主任郝建业博士、滴滴AI Labs首席研究员秦志伟博士、腾讯绝悟AI技术负责人叶德珩博士、启元世界首席算法官王湘君先生、字节跳动游戏AI团队负责人郭祥昊博士等6位国内外一流的强化学习和运筹优化技术专家作为嘉宾。
在嘉宾报告环节,由自动化所副研究员张海峰担任主持人。各位嘉宾分别探讨了整数规划在决策智能中的新应用、深度强化学习的挑战及落地、网约车交易市场中的深度强化学习方法、强化学习技术在游戏智能体和游戏参数优化方面的应用等决策智能领域的最新成果和发展趋势,涵盖了工业生产的个性化定制、5G网络的负载优化、网约车的派单和调度、游戏智能体的训练、机器人自动控制、游戏参数的设计等诸多现实问题,引发了线上参会者的热烈讨论。
在圆桌讨论环节,由伦敦大学学院教授汪军担任主持人。嘉宾们围绕“决策智能的未来应用”等问题做了深入的讨论。嘉宾们认为,决策智能目前还处在发展的早期阶段,未来的应用前景广泛,包括工业生产、集成电路制造、交通运输优化、游戏体验升级等,相信决策智能大规模解决现实世界问题的时代即将到来。
论坛主席、中科院自动化所所长徐波表示,基于强化学习和运筹优化等方法的决策智能在学术界产生了诸多的理论,并正在形成实用的技术,为解决现实世界中的问题赋能。当前,自动化所正把自主进化的决策智能作为重点投入、发展和突破的方向,希望通过本次论坛与国内外同行一起,加强学术交流,探寻发展方向,寻求合作机会,共同为国家新一代人工智能发展贡献力量。