202315-6日,第七届深度强化学习理论与应用研讨会顺利举行。活动聚焦深度强化学习(DRL)与博弈、自动驾驶和机器人等方向的前沿进展与最新成果开展研讨交流,并邀请4位领域专家分别从“小样本强化学习算法及应用的研究进展”,“基于深度强化学习的交通信号控制进展”,“无人系统分布式协同控制”,“基于深度强化学习的智能电网新能源高效利用”等不同主题进行了精彩分享。报告环节在线上平台进行同步直播,吸引了共计1.9万余观众参与,讨论热烈。 

  国防科技大学教授徐昕以“小样本强化学习算法及应用的研究进展”为主题结合智能自主系统对优化决策与控制的技术发展需求,对强化学习在求解大规模空间优化决策与控制问题中面临的挑战性问题、特别是小样本强化学习问题进行了分析和讨论。报告重点介绍了小样本强化学习在正则化特征表示、基于模型预测的算法设计、知识迁移机制、示教学习等方面的研究进展,并结合若干实际应用问题进行探讨,分享了对未来研究方向的展望。 

  清华大学教授李力的分享主题为“基于深度强化学习的交通信号控制进展”。报告从交通信号控制应用角度出发,系统详实地介绍了深度强化学习方法在单智能体路口信号控制及多智能体干线信号控制中的应用情况,涉及SACPPO等多种深度强化学习方法研究,着重比较了经典的max-band绿波带交通控制和DRL拟绿波带交通控制的相同和差异,深度强化学习应用相关经验对于其他应用领域同样具备很强的启发性。 

  自主智能无人系统是人工智能的重要前沿领域,体现人工智能与实际应用场景的深度融合,是人工智能研究的重要抓手和切入点。北京理工大学教授孙健以“无人系统分布式协同控制”为题进行分享,在总结自主智能无人系统的发展现状的基础上,介绍了自主智能无人系统轨迹规划、分布式协同运动控制、信息安全等方面的最新研究进展。 

  强化学习和深度强化学习的快速发展,使基于数据和知识学习的复杂系统优化控制和决策成为可能。在双碳战略的背景下,天津大学教授穆朝絮带来题为“基于深度强化学习的智能电网新能源高效利用”的报告,深入浅出地介绍了TD3SACPPO等深度强化学习方法及在新能源高效利用中的优化决策的原理,为构建以清洁能源为主的新型电力系统优化决策提供了思路。 

  本届研讨会由中国自动化学会、复杂系统管理与控制国家重点实验室主办,中国科学院自动化研究所深度强化学习团队与中国自动化学会数据驱动控制、学习与优化专委会承办。深度强化学习作为人工智能热点方向之一,受到国内外学者的广泛关注,近年来取得了一系列突破性成果,以深度强化学习理论与应用研讨会为契机,自动化所将持续推进领域研究,加强合作交流,共同探索新的机遇和挑战。 

附件: