王金桥----中国科学院自动化研究所

人才队伍

您当前的位置 :

王金桥 /

职　　称: 研究员
邮　　编: 100190
电子邮件: jqwang@nlpr.ia.ac.cn
部门/实验室: 紫东太初大模型研究中心
通讯地址: 北京海淀区中关村东路95号自动化大厦

个人简历

王金桥，中国科学院自动化所副总工程师，紫东太初大模型中心常务副主任，研究员，博导，武汉人工智能研究院院长，中国科学院大学人工智能学院岗位教授，一直从事人工智能应用基础研究。作为跨模态通用人工智能平台负责人，带领团队研发了业内第一个支持图像、文本、语音和视频的千亿参数“紫东太初”多模态大模型，第一批通过国家网信办备案，突破可变形Transformer、多粒度高效自监督预训练统一框架、快速通用分割模型等多项关键技术，迈出人工智能通用化的重要一步。获得2022年9月世界人工智能大会最高奖项SAIL奖。近三年承担科技部、工信部、北京市等大模型重大专项5个。目前共发表论文260余篇，国际权威期刊IEEE T-PAMI、T-IP等50篇和NeurIPS、CVPR等会议200多篇。Google Scholar 引用次数总计10000，H-index 45。完成国家标准制定6项，授权发明专利40余项，荣获北京市科技进步一等奖、中国发明创新银奖、北京市高聚人才、新时代中国经济创新人物、武汉楷模等竞赛或荣誉20余项。。所研发的核心技术为产业服务，填补国内空白，已在华为、阿里、京东、联想、中国移动、中国电子进出口总公司、京东方、精伦、兆维集团、华润集团、国家电网、平安科技、杰创智能等多家上市公司产品中进行技术转移和应用，技术转化已形成数亿元产值。曾携自主研发的人工智能机器人“小加”上CCTV1加油向未来节目第二季为众人展示萌宠识别技术，在加油向未来第三季“ 机器人守门员”节目中展示动态轨迹识别技术，开门大吉节目中展示“鼻纹识别”，北京卫视“北京您早”节目中展示“智能辨物技术”，并担任湖南卫视“我是未来”的科学代言人，研发的人工智能音乐评分系统担任央视“渴望现场”机器人评委。

研究方向

视频图像分析
多模态大模型
自监督学习
目标检测与跟踪
细粒度识别
行为识别

承担科研项目情况

[1] 模拟集成电路版图智能化生成方法，科技部人工智能2030重大专项课题负责人，2022.6-2025.5；
[2]国家自然科学基金面上项目：基于局部关系与语义约束的视觉检索， 2023.1-2026.12；
[3]基于结构关系和知识学习的大规模视觉目标检索，国家自然科学基金面上项目：2018.1-2021.12；
[4]基于混合增强智能的平行智能理论研究及验证，广东省重点领域研发计划资助项目，2019.1-2022.12
[5]主持青年科学基金一项"基于视觉关注与语义分析的视频自适应";
[6] 主持自然科学基金面上项目一项"面向移动终端的视频检索与浏览";
[7] 主持863子课题一项"面向先进加工的智能安全监控技术研究";
[4] 国家自然科学基金重点项目:面向无线网络环境的个性化视频定制及适配关键技术
[5] 国家自然科学基金重点项目:数据理解的若干基本问题研究。
[6] 973项目:数字媒体理解的理论与方法研究
[7] 国家自然基金青年基金:基于跨媒体信息挖掘的网络舆情分析研究
[8] 国家自然基金重大研究计划:面向互联网的跨媒体挖掘与搜索引擎。
[9] 人脸识别与目标检测系统
[10] 基于深度学习的车型识别
[11] 智能多目标识别
[12] 物体追踪轨迹识别
[13] 智能服务机器人
[14] 家庭物联网实验室
其中青年基金项目"基于视觉关注与语义分析的视频自适应"成果优秀，获得基金委滚动支持，获得青年-面上连续项目"面向移动终端的视频检索与浏览"。

代表论著

[1].Zhaowen Li, Yousong Zhu, Fan Yang, Wei Li, Chaoyang Zhao, Yingying Chen, Zhiyang Chen, Jiahao Xie, Liwei Wu, Rui Zhao, Ming Tang, Jinqiao Wang:UniVIP: A Unified Framework for Self-Supervised Visual Pre-training. CVPR 2022: 14607-14616(CCF A类)
[2].Kuan Zhu, Haiyun Guo, Tianyi Yan, Yousong Zhu, Jinqiao Wang, Ming Tang:PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification. ECCV (14) 2022: 198-214(CCF B类)
[3].Tong Wang, Yousong Zhu, Chaoyang Zhao, Wei Zeng, Yaowei Wang, Jinqiao Wang, Ming Tang: Large Batch Optimization for Object Detection: Training COCO in 12 minutes. ECCV (21) 2020: 481-496(CCF B类)
[4].Tong Wang, Yousong Zhu, Yingying Chen, Chaoyang Zhao, Bin Yu, Jinqiao Wang, Ming Tang: C2AM Loss: Chasing a Better Decision Boundary for Long-Tail Object Detection. CVPR 2022: 6970-6979(CCF A类)
[5].Mingfei Tu, Kuan Zhu, Haiyun Guo, Qinghai Miao, Chaoyang Zhao, Guibo Zhu, Honglin Qiao, Gaopan Huang, Ming Tang, Jinqiao Wang: Multi-Granularity Mutual Learning Network for Object Re-Identification. IEEE Trans. Intell. Transp. Syst. 23(9): 15178-15189 (2022)(CCF A类)
[6].Zhiyang Chen, Yousong Zhu, Zhaowen Li, Fan Yang, Wei Li, Haixin Wang, Chaoyang Zhao, Liwei Wu, Rui Zhao, Jinqiao Wang, Ming Tang. Obj2Seq: Formatting Objects as Sequences with Class Prompt for Visual Tasks. NeurIPS 2022(CCF A类)
[7].Zhiyang Chen, Yousong Zhu, Chaoyang Zhao, Guosheng Hu, Wei Zeng, Jinqiao Wang, Ming Tang: DPT: Deformable Patch-based Transformer for Visual Recognition. ACM Multimedia 2021: 2899-2907
[8].Yulong Liu, Guibo Zhu, Bin Zhu, Qi Song, Guojing Ge, Haoran Chen, Guanhui Qiao, Ru Peng, Lingxiang Wu, and Jinqiao Wang. TaiSu: A 166M Large-scale High-Quality Dataset for Chinese Vision-Language Pre-training. NeurIPS 2022
[9].Haixin Wang, Lu Zhou, Yingying Chen, Ming Tang, and Jinqiao Wang. Regularizing Vector Embedding in Bottom-Up Human Pose Estimation. European Conference on Computer Vision (ECCV), 2022
[10].Xiaomei Zhang, Yingying Chen, Ming Tang, Zhen Lei, Jinqiao Wang. Grammar-Induced Wavelet Network for Human Parsing. IEEE Transactions on Image Processing (TIP), 2022. (CCF A类)
[11].Xiaomei Zhang, Yingying Chen, Ming Tang, Jinqiao Wang, Xiangyu Zhu, Zhen Lei. Human Parsing with Part-aware Relation Modeling. IEEE Transactions on Multimedia (TMM), 2022. (CCF A类)
[12].Xiaomei Zhang, Yingying Chen, Bingke Zhu, Jinqiao Wang, Ming Tang. Part-aware Context Network for Human Parsing. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020:8971-8980.（CCF A类）
[13].Xiaomei Zhang, Yingying Chen, Bingke Zhu, Jinqiao Wang, Ming Tang. Blended Grammar Network for Human Parsing. European Conference on Computer Vision (ECCV), 2020:189-205.(CCF B类)
[14].Xiaoqing Liang, Xu Zhao, Chaoyang Zhao, Nanfei Jiang, Ming Tang, Jinqiao Wang: Task Decoupled Knowledge Distillation For Lightweight Face Detectors. ACM Multimedia 2020: 2184-2192(CCF A类)
[15].Si Liu, Guanghui Ren, Yao Sun, Jinqiao Wang, Changhu Wang, Bo Li, Shuicheng Yan:Fine-Grained Human-Centric Tracklet Segmentation with Single Frame Supervision. IEEE Trans. Pattern Anal. Mach. Intell. 44(2): 610-621 (2022)(CCF A类)
[16].Yongqi An, Xu Zhao, Tao Yu, Haiyun Gu, Chaoyang Zhao, Ming Tang, Jinqiao Wang: ZBS: Zero-Shot Background Subtraction via Instance-Level Background Modeling and Foreground Selection. CVPR 2023: 6355-6364(CCF A类)
[17]. Zhaopeng Gu, Bingke Zhu, Guibo Zhu, Yingying Chen, Ming Tang, Jinqiao Wang: AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models. AAAI 2024(CCF A类)

获奖及荣誉

[1]. 2022 北京市科技进步一等奖大型科普节目《加油向未来》省部级
[2]. 2022 世界人工智能大会SAIL奖（卓越人工智能引领者）基于昇腾AI的全球首个三模态大模型“紫东太初” 省部级[]
[3].2023 中国科学院科苑名匠紫东太初多模态大模型省部级
[4].2023 中国算力大会算力中国年度突破成果紫东太初全模态大模型省部级
[5].2022 中国计算机学会“DC Tech创新先锋” “紫东太初”人工智能基础大模型省部级
[6].2020 中国发明协会创业奖创新奖基于多模态协同学习的视频大数据语义理解技术及产业化应用省部级
[7]2019 中国科学院北京分院科技成果转化奖二等奖交通车纹识别技术及产业化省部级
[8]2021 新时代中国经济创新人物 2021中国经济高峰论坛暨第十九届中国经济人物年会省部级
[9]2023 武汉楷模城市英雄深耕人工智能技术推动行业发展的科学先锋省部级
[10]2023 3551光谷人才计划领军人才 “3551光谷人才计划”专项省部级
[11]2019 泰山产业领军人才现代服务业及社会民生产业创新类省部级
[12]2020 中关村高端领军人才中关村高端领军人才聚集工程专项省部级

专利成果

[1] 朱贵波, 朱炳科, 古兆鹏, 陈盈盈, 王金桥. 异常检测模型训练方法、异常检测方法、装置及电子设备. CN: CN116403077B, 2023-08-15.
[2] 赵朝阳, 王金桥, 郭海云. 人脸识别模型的训练方法、装置、设备和存储介质. CN: CN115953819B, 2023-08-15.
[3] 郭海云, 伍虹燕, 王金桥. 基于粗标签辅助的半监督细粒度图像识别方法和设备. CN: CN115294350B, 2023-08-04.
[4] 郭海云, 闫天翊, 王金桥, 唐明. 视觉检索模型的无监督训练方法、装置和电子设备. CN: CN116089652B, 2023-07-18.
[5] 朱优松, 李朝闻, 陈志扬, 赵朝阳, 唐明, 王金桥. 图像重建模型的迭代方法和图像重建方法. CN: CN116030156B, 2023-07-18.
[6] 朱贵波, 朱炳科, 古兆鹏, 陈盈盈, 王金桥. 异常检测模型训练方法、异常检测方法、装置及电子设备. CN: CN116403077A, 2023-07-07.
[7] 王金桥, 李宗树, 朱贵波, 吴凌翔, 刘智威, 葛国敬. 一种目标检测方法、装置、设备及存储介质. CN: CN115953665A, 2023-04-11.
[8] 赵朝阳, 王金桥, 郭海云. 人脸识别模型的训练方法、装置、设备和存储介质. CN: CN115953819A, 2023-04-11.
[9] 郭海云, 伍虹燕, 王金桥. 基于粗标签辅助的半监督细粒度图像识别方法和设备. CN: CN115294350A, 2022-11-04.
[10] 朱贵波, 李宗树, 葛国敬, 赵旭, 王金桥. 少样本目标检测方法、装置和电子设备. CN114861842b, 2022-10-28.
[11] 吴凌翔, 王金桥, 牛蕴方. 图像生成方法、图像去噪模型的训练方法和设备. CN: CN115222630A, 2022-10-21.
[12] 朱优松, 陈志扬, 赵朝阳, 李朝闻, 王金桥, 唐明. 目标检测方法、装置、电子设备及存储介质. CN: CN115100419A, 2022-09-23.
[13] 郭海云, 王金桥, 唐明, 朱宽. 行人重识别模型训练方法、行人重识别方法、装置和设备. CN: CN115082966A, 2022-09-20.
[14] 朱优松, 陈志扬, 赵朝阳, 李朝闻, 王金桥, 唐明. 图像分析方法、装置及电子设备. CN: CN115082430A, 2022-09-20.
[15] 朱优松, 葛翔, 赵朝阳, 王金桥, 赵会盼, 王文帅, 高跃清. 一种目标识别方法及装置、计算机存储介质. CN: CN115035379A, 2022-09-09.
[16] 吴凌翔, 王金桥, 牛蕴方. 图像生成方法、装置和电子设备. CN: CN115018954A, 2022-09-06.
[17] 朱贵波, 李宗树, 葛国敬, 赵旭, 王金桥. 少样本目标检测方法、装置和电子设备. CN: CN114861842A, 2022-08-05.
[18] 葛国敬, 朱贵波, 王金桥. 基于生成对抗网络的人脸修复方法、装置及存储介质. CN: CN114862699A, 2022-08-05.
[19] 朱优松, 李朝闻, 赵朝阳, 陈志扬, 王金桥. 掩码图像模型训练方法、掩码图像内容预测方法和设备. CN: CN114842307A, 2022-08-02.
[20] 郭海云, 吴畏, 王金桥, 唐明. 基于一致性损失的细粒度图像模型训练及识别方法和装置. CN: CN114821203A, 2022-07-29.
[21] 葛国敬, 王金桥, 朱贵波. 图像生成器的训练方法、装置、电子设备和可读存储介质. CN: CN114782291A, 2022-07-22.
[22] 王金桥, 葛国敬, 朱贵波. 基于Transformer的非接触式呼吸率测量方法. CN114343612B, 2022-05-24.
[23] 王金桥, 葛国敬, 朱贵波. 图像扫描识别方法、装置及电子设备. CN: CN114429636A, 2022-05-03.
[24] 李朝闻, 朱优松, 杨帆, 李韡, 赵朝阳, 陈志扬, 吴立威, 赵瑞, 唐明, 王金桥. 模型训练及图像处理方法、装置、设备、存储介质. CN: CN114419374A, 2022-04-29.
[25] 王金桥, 葛国敬, 朱贵波. 基于transfomer的非接触式呼吸率测量方法. CN: CN114343612A, 2022-04-15.
[26] 赵旭, 王金桥, 赵朝阳, 丁文超. 一种多层级目标检测方法及系统. CN: CN114333040A, 2022-04-12.
[27] 陈志扬, 朱优松, 杨帆, 李韡, 李朝闻, 赵朝阳, 陈盈盈, 朱贵波, 吴立威, 赵瑞, 王金桥, 唐明. 图像处理、缺陷检测方法及装置、电子设备和存储介质. CN: CN114299296A, 2022-04-08.
[28] 陈志扬, 朱优松, 杨帆, 李韡, 李朝闻, 赵朝阳, 陈盈盈, 朱贵波, 吴立威, 赵瑞, 王金桥, 唐明. 图像处理、缺陷检测方法及装置、电子设备和存储介质. CN: CN114255221A, 2022-03-29.
[29] 王金桥, 葛国敬, 朱贵波. 基于通用视觉预训练模型的图像质量评价方法及系统. CN113743332B, 2022-03-25.
[30] 陈盈盈, 周鲁, 王金桥, 王海鑫. 人体姿态估计方法、装置、电子设备及存储介质. CN: CN114140831A, 2022-03-04.
[31] 陈盈盈, 朱炳科, 王金桥, 唐明, 黄吟月. 一种图像分类方法、装置、电子设备及存储介质. CN: CN114120034A, 2022-03-01.
[32] 葛国敬, 朱贵波, 王金桥. 基于Transformer的非接触式心率测量方法. CN: CN113408508B, 2021-11-30.
[33] 陈盈盈, 周鲁, 胡益珲, 王金桥. 基于自适应时空纠缠的视频行为识别方法、系统、设备. CN: CN113435430A, 2021-09-24.
[34] 王金桥, 张森, 郭海云, 蔡岗, 凃鸣非, 张慧辰, 尤冬海, 杨卓敏. 基于关键点检测和局部特征对齐的车辆重识别方法. CN: CN112990152A, 2021-06-18.
[35] 陈盈盈, 朱炳科, 王金桥, 唐明, 黄吟月. 一种图像分类方法、装置、电子设备及存储介质. CN: CN112801238A, 2021-05-14.
[36] 郭海云, 温馨, 王金桥, 唐明, 伍虹燕. 基于分布学习的自适应方差和权重的人脸年龄估计方法. CN: CN112560823A, 2021-03-26.
[37] 郭海云, 王金桥, 唐明, 刘松岩. 基于循环一致性的无监督人体姿态迁移方法、系统及装置. CN: CN111739115B, 2021-03-16.
[38] 郭海云, 王金桥, 唐明, 刘松岩. 基于特征对抗学习和自相似性聚类的跨域目标重识别方法. CN: CN111738172B, 2021-02-12.
[39] 葛国敬, 朱贵波, 王金桥. 基于端到端网络的非接触式心率测量方法、系统和装置. CN: CN112200162A, 2021-01-08.
[40] 陈盈盈, 冯文霓, 王金桥. 基于多属性融合的分布式车牌识别方法、系统、装置. CN: CN112200193A, 2021-01-08.
[41] 郭海云, 王金桥, 伍虹燕. 基于图网络的多粒度特征学习的图像精细分类方法及系统. CN: CN111814920B, 2021-01-05.
[42] 陈盈盈, 周鲁, 王金桥, 卢汉清. 基于空间变换信息传递的人体关键点检测方法与系统. CN: CN111783755B, 2021-01-05.
[43] 郭海云, 朱宽, 王金桥, 唐明. 基于语义一致水平条和前景修正的行人重识别方法. CN: CN111783753B, 2020-12-15.
[44] 陈盈盈, 张小梅, 王金桥, 唐明. 基于部位上下文的人体属性图像分类方法、系统和装置. CN: CN111783754B, 2020-12-08.
[45] 陈盈盈, 郑林宇, 王金桥, 卢汉清. 基于深度学习和判别式模型训练的目标跟踪方法及存储器. CN: CN111815681A, 2020-10-23.
[46] 郭海云, 王金桥, 伍洪燕. 基于图网络的多粒度特征学习的精细分类方法及系统. CN: CN111814920A, 2020-10-23.
[47] 陈盈盈, 朱炳科, 王金桥, 唐明. 基于深度解耦的人体实例解析方法、系统. CN: CN111738174A, 2020-10-02.
[48] 朱翔昱, 雷震, 王金桥, 刘智威. 基于语义对齐的人脸关键点检测方法、系统、装置. CN: CN109902641A, 2019-06-18.
[49] 王金桥, 赵飞, 唐明. 视觉目标跟踪方法及系统. CN: CN109785385A, 2019-05-21.
[50] 王金桥, 赵朝阳. 目标检测模型构建方法. CN: CN107038448A, 2017-08-11.
[51] 王金桥, 郭海云, 卢汉清. 基于深度学习的车型识别模型构建方法及车型识别方法. CN: CN106570477A, 2017-04-19.
[52] 汤淑明, 朱新亮, 王金桥. 一种RGB-D图像获取方法. CN: CN104463880A, 2015-03-25.
[53] 卢汉清, 王金桥, 屈展. 一种缩略图生成方法和系统. CN: CN103902730A, 2014-07-02.
[54] 卢汉清, 王金桥, 刘晶晶. 基于群组上下文的行人计数方法. CN: CN102289817A, 2011-12-21.
[55] 卢汉清, 刘静, 王金桥, 祝晓斌. 基于视频监控网络的视频自动浓缩方法. CN: CN102256065A, 2011-11-23.
[56] 卢汉清, 王金桥, 杨杰. 基于动态群组划分的多目标跟踪方法. CN: CN102148921A, 2011-08-10.
[57] 徐常胜, 肖宪, 王金桥. 基于三维点云模型的地标建筑图像分类方法. CN: CN102147812A, 2011-08-10.
[58] 卢汉清, 王金桥, 刘荣. 基于极小化上界误差的视觉跟踪方法. CN: CN102054170A, 2011-05-11.
[59] 卢汉清, 王金桥, 张天柱. 用计算机对运动目标的场景图像建立语义场景模型的方法. CN: CN102054176A, 2011-05-11.

社会任职

担任International Conference on Internet Multimedia Computing and Service（ICIMCS2009）出版主席。担任ICME2011和MMM2011、ICIP2014和ACM Multimedia 2015的程序委员会委员。担任IEEE Trans. on Multimedia、Computer Vision and Image Understanding、Multimedia Systems、IEEE Trans. Circuits and Systems for Video Technology、Neurocomputing等国际期刊杂志以及CVPR、ICME、ICIP、ICPR、ACCV、MMM、PCM、ACM Multimedia等国际会议的审稿人。 ICIMCS2009（互联网多媒体计算与服务国际会议）的出版主席; PCM2011和MMM2011的程序委员会委员；