2017-10~2018-05,中国科学院自动化研究所,研究员
2009-10~2012-05,中国科学院自动化研究所,副研究员
2006-07~2007-07,中国科学院自动化研究所,助理研究员2003-09--2006-07 中科院研究生院 研究生/博士学位
2001-09--2003-07 哈尔滨工业大学 研究生/硕士学位
1997-09--2001-07 哈尔滨工程大学 本科/学士学位
博弈与决策智能
科学院先导专项智能应用项目
Zhiwei Xu,Bin Zhang,Dapeng Li,Guangchong Zhou,Zeren Zhang,Guoliang Fan. Dual self-awareness value decomposition framework without individual global max for cooperative MARL. Advances in Neural Information Processing Systems,36,2024
Dapeng Li;Zhiwei Xu;Bin Zhang;Guoliang Fan.SEA:A Spatially Explicit Architecture for Multi-Agent Reinforcement Learning.International Joint Conference on Neural Networks
Bin Zhang,Lijuan Li,Zhiwei Xu,Dapeng Li,Guoliang Fan.Bin Zhang,et al. Inducing Stackelberg Equilibrium through Spatio-Temporal Sequential Decision-Making in Multi-Agent Reinforcement Learning. International Joint Conference on Artificial Intelligence,2023: 353-361.
Guangchong Zhou,Zhiwei Xu,Zeren Zhang,Guoliang Fan. Mastering Complex Coordination Through Attention-Based Dynamic Graph[C]//International Conference on Neural Information Processing. Singapore: Springer Nature Singapore,2023: 305-318.
科学院青促会成员
中组部专项工程人才
高科技创新人才引进
CN202011597352.1推演数据生成及行动方案推演系统、方法及装置
CN202210709172.0基于热力图的决策方法、装置、电子设备及存储介质