张海峰

张海峰  /  

  • 职  称: 副研究员
  • 邮  编: 100190
  • 电子邮件: haifeng.zhang@ia.ac.cn
  • 部门/实验室: 复杂系统认知与决策实验室
  • 通讯地址: 北京市海淀区中关村东路95号

个人简历

张海峰,中国科学院自动化研究所副研究员,群体决策智能团队负责人,于北京大学计算机系获得本科、博士学位,曾在英国伦敦大学学院(UCL)从事博士后研究工作。致力于多智能体和强化学习的学术研究和平台研发工作,在ICML、IJCAI、AAAI、AAMAS、《软件学报》等国内外知名学术会议、期刊发表论文20余篇,主持研发中科院自动化所“及第”智能体博弈平台(www.jidiai.cn),承担国家自然科学基金、科技部“新一代人工智能”重大项目、中科院先导A类项目等多项课题,所做研究应用于油气产业链调度、铁路运行图调整等多个领域。目前担任中国计算机学会计算经济学专业组常务委员。

研究方向

多智能体强化学习,博弈决策智能

承担科研项目情况

科技部“新一代人工智能”重大项目课题负责人、国自然青年基金项目负责人

代表论著

Qirui Mi, Siyu Xia, Yan Song, Haifeng Zhang, Shenghao Zhu, Jun Wang. "TaxAI: A Dynamic Economic Simulator and Benchmark for Multi-Agent Reinforcement Learning." [AAMAS 2024]
Yan Song, He Jiang, Haifeng Zhang, Zheng Tian, Weinan Zhang, Jun Wang. "Boosting Studies of Multi-Agent Reinforcement Learning on Google Research Football Environment: the Past, Present, and Future." [AAMAS 2024]
Linghui Meng, Muning Wen, Chenyang Le, Xiyun Li, Dengpeng Xing, Weinan Zhang, Ying Wen, Haifeng Zhang, Jun Wang, Yaodong Yang, Bo Xu. “Offline Multi-agent Decision Transformer.” [Machine Intelligence Research 2022]
Bo Liu, Xidong Feng, Jie Ren, Luo Mai, Rui Zhu, Haifeng Zhang, Jun Wang, Yaodong Yang. “A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning.” [NeurIPS 2022]
Xue Yan, Yali Du, Binxin Ru, Jun Wang, Haifeng Zhang, Xu Chen. “Learning to Identify Top Elo Ratings as A Dueling Bandits Problem.” [AAAI 2022]
Yali Du, Xue Yan, Xu Chen, Jun Wang, Haifeng Zhang. “Estimating α-Rank from A Few Entries with Low Rank Matrix Completion.” [ICML 2021]
Yali Du, Bo Liu, Vincent Moens, Ziqi Liu, Zhicheng Ren, Jun Wang, Xu Chen, Haifeng Zhang. “Learning Correlated Communication Topology in Multi-Agent Reinforcement Learning.” [AAMAS 2021]
Haifeng Zhang, Weizhe Chen, Zeren Huang, Minne Li, Yaodong Yang, Weinan Zhang, Jun Wang. “Bi-level Actor-Critic for Multi-agent Coordination.” [AAAI 2020]

社会任职

中国计算机学会计算经济学专业组常务委员