中国科学院自动化研究所研究员,中国科学院大学岗位教授,博士生导师 2014-01~2014-02,新加坡科技研究局, 访问学者
2012-11~现在, 中科院自动化所, 研究员、博导
2002-04~2012-10,中国科学院自动化研究所, 副研、硕导-博导
2000-05~2002-01,清华大学, 博士后
深度强化学习理论和方法,以及在智能游戏博弈,智能驾驶,智能机器人等领域的应用
[1] 国家重点研发计划“数学和应用研究”2022年度重点专项:强化学习的数学理论与随机优化的自学习方法,课题4—“变化环境下的新型强化学习算法及应用”,2022年11月—2027年10月,课题负责人
[2] 中科院“全球共性挑战专项”项目,非稳态环境下的多智能体自主学习技术,2023年1月-2025年12月,课题负责人
[3] 国家自然科学基金重点:面向多任务的多智能体深度强化学习理论与应用,2022年1月—2026年12月,课题负责人
[4] 国家自然科学基金面上:室外复杂视觉条件下的机器人感知和目标识别,2022年1月—2025年12月,课题负责人
[5] 中科院人工智能创新院2035任务,虚实融合的智能博弈技术与应用,2021年1月—2023年12月,课题负责人
[6] 科技创新2030—“新一代人工智能”重大项目:非完全信息条件下的博弈决策,课题5“知识与数据共同驱动的深度强化学习算法”,2020年1月—2022年12月,课题负责人。
[7] 中国科学院战略性先导科技专项(A类):多智能体深度强化学习,2020年7月—2021年6月,课题负责人。
[8] 北京市科技计划新一代人工智能技术培育项目:复杂城市交互场景下的电动汽车智能决策技术,2019年7月—2021年6月,课题负责人。
[9] 北京市科技计划重大专项:高度自动驾驶(L4级)电动汽车关键技术研发及验证平台开发,2018年1月—2019年12月,子课题负责人(负责人:国汽智能网联汽车中心李克强)。
[10] 华为技术有限公司:面向智能驾驶的深度强化学习方法研究,2018年9月—2019年8月,课题负责人。
[1] Jiajun Chai, Wenzhang Chen, Yuanheng Zhu*, Zongxin Yao, Dongbin Zhao, “A hierarchical deep reinforcement learning framework for 6-DOF UCAV air-to-air combat,” IEEE Transactions on Systems, Man and Cybernetics: Systems, vol. 53, no. 9, pp. 5417-5429, Sep. 2023. (Popular Article)
[2] Jiajun Chai, Weifan Li, Yuanheng Zhu, Dongbin Zhao*, “UNMAS: multi-agent reinforcement learning for unshaped cooperative scenarios,” IEEE Transactions on Neural Networks and Learning Systems, vol. 34, no. 4, pp. 2093-2104, 2023.
[3] Zhentao Tang, Yuanheng Zhu, Dongbin Zhao*, Simon Lucas, “Enhanced rolling horizon evolution algorithm with opponent model learning: results for the fighting game AI competition,” IEEE Transactions on Games, vol. 15, no. 1, pp. 5-15, 2023. (Popular Article, reported by IEEE CIS Newsletter )
[4] Yuanheng Zhu, Dongbin Zhao*, “Online minimax Q network learning for two-player zero-sum Markov games,” IEEE Transactions on Neural Networks and Learning Systems, vol. 33, no. 3, pp. 1228-1241, March 2022. (ESI Highly Cited Paper).
[5] Qichao Zhang, Yinfeng Gao, Yikang Zhang, Youtian Guo, Dawei Ding, Yunpeng Wang, Peng Sun, Dongbin Zhao*, “TrajGen: generating realistic and diverse trajectories with reactive and feasible agent behaviors for autonomous driving," IEEE Transactions on Intelligent Transportation Systems, vol. 23, no. 12, pp. 24474-24487, 2022.
[6] Zixiang Ding, Yaran Chen, Nannan Li, Dongbin Zhao*, Z. Q. Sun, P. C. L. Chen, “BNAS: neural architecture search using broad scalable architecture,” IEEE Transactions on Neural Networks and Learning Systems, vol. 33, no. 9, pp. 5004-5018, Sep. 2022.
[7] Yi Lu, Yaran Chen, Dongbin Zhao*, Bao Liu, Zhichao Lai, Jianxin Chen, “CNN-G: convolutional neural network combined with graph for image segmentation with theoretical analysis,” IEEE Transactions on Cognitive and Developmental Systems, vol. 13, no. 3, pp. 631 – 644, Sept. 2021. (Popular Article)
[8] Yuanheng Zhu, Dongbin Zhao, Haibo He*, “Optimal feedback control of pedestrian flow in heterogeneous corridors,” IEEE Transactions on Automation Science and Engineering, vol. 18, no. 3, pp. 1097 – 1108, July 2021. (Best Paper Award).
[9] Haoran Li, Qichao Zhang, Dongbin Zhao*, “Deep reinforcement learning based automatic exploration for navigation in unknown environment,” IEEE Transactions on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2064–2076, June 2020. (2020 RoboMaster AI Challenge最高学术激励奖,Popular Article)
[10] Kun Shao, Yuanheng Zhu, Dongbin Zhao*, “StarCraft micromanagement with reinforcement learning and curriculum transfer learning,” IEEE Transactions on Emerging Topics in Computational Intelligence, vol. 3, no. 1, pp. 73-84, 2019. (Outstanding Paper Award, Popular Article, cited by DeepMind in Nature paper “AlphaStar”)
[1] 2022年,北京市科学技术奖自然科学二等奖,排序第1,“高效深度强化学习算法和最优性分析”。
[2] 2022, Kun Shao, Yuanheng Zhu, Dongbin Zhao, “StarCraft micromanagement with reinforcement learning and curriculum transfer learning,” IEEE Transactions on Emerging Topics in Computational Intelligence, 2022年度唯一杰出论文奖,热点论文,Nature论文引用。
[3] 2022, Yuanheng Zhu, Dongbin Zhao, Haibo He, “Optimal feedback control of pedestrian flow in heterogeneous corridors,” IEEE Transactions on Automation Science and Engineering, 2022年度唯一最佳论文奖。
[4] 2020, Dongbin Zhao*, Yaran, Chen, Le Lv, “Deep reinforcement learning with visual attention for vehicle classification,” IEEE Transactions on Cognitive and Developmental Systems, 2020年度唯一唯一论文奖,热点论文第一,IEEE CIM焦点论文。
[5] 2018, 赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红。深度强化学习综述: 兼论计算机围棋的发展,控制理论与应用,2018年度优秀论文奖(唯二),科技部F5000领跑论文。
[6] 2022年,中国科学院大学校级研究生优秀课程,强化学习;
[7] 2022年,2021年,教育部-华为智能基座“栋梁之师”。
[8] 2022年,AAIA Fellow;
[9] 2021年,中国自动化学会会士。
[10] 2020年,IEEE Fellow。
[1] 李浩然,张启超,赵冬斌,面向地铁视觉图像的轨道检测方法及系统,专利授权号:ZL202010466033.0,CN 111611956 B,授权日,2023年9月26日。
[2] 赵冬斌,唐振韬,朱圆恒,多机器人协作对抗方法、装置、电子设备和存储介质,专利号:ZL202111136603.0,申请日:2021年9月27日,授权公告日:2023年5月5日。
[3] 陈亚冉,赵晓东,赵冬斌,面向智能驾驶的移动目标轨迹预测方法、系统、装置,专利号: ZL202010400600.2,申请日:2020年5月13日,授权公告日:2023年4月25日。
[4] 陈亚冉,赵冬斌,张启超,基于光流和卡尔曼滤波的多目标追踪方法、系统、装置,专利号: ZL201910669359.0,2019年7月24日申请,2022年3月8日授权。
[5] 朱圆恒,李伟凡,熊华,赵冬斌,一种基于强化学习的导弹制导方法和装置,专利号: ZL202110775732.8,2021年9月1日。
[6] 朱圆恒,赵冬斌,基于加速度前馈的异构车队协同自适应巡航控制方法,专利号: ZL2019111110197.3,2021年3月22日。
[7] 张启超,王俊杰,赵冬斌,智能驾驶横向换道决策方法、系统和装置,专利号: ZL201910552495.1,2020年12月15日。
[8] 赵冬斌,陈亚冉,面向驾驶辅助系统的危险目标检测方法、装置,2018年1月19日公开,专利号 : ZL201710696755.3,2020年6月16日。
[9] 赵冬斌,李栋,张启超,陈亚冉,朱圆恒,智能驾驶车道保持方法及系统,2018年10月26日公开,专利号:ZL201811260601.0,2020年6月4日。
[10] 赵冬斌,张启超,夏中谱,驾驶员跟车行为分析中的期望跟车距离计算方法,专利号:ZL201710226893.5,2020年1月13日。