王金桥

王金桥  /  

  • 职  称: 研究员
  • 邮  编: 100190
  • 电子邮件: jqwang@nlpr.ia.ac.cn
  • 部门/实验室: 紫东太初大模型研究中心
  • 通讯地址: 北京海淀区中关村东路95号自动化大厦

个人简历

王金桥,中国科学院自动化所副总工程师,紫东太初大模型中心常务副主任,研究员,博导,武汉人工智能研究院院长,中国科学院大学人工智能学院岗位教授,一直从事人工智能应用基础研究。作为跨模态通用人工智能平台负责人,带领团队研发了业内第一个支持图像、文本、语音和视频的千亿参数“紫东太初”多模态大模型,第一批通过国家网信办备案,突破可变形Transformer、多粒度高效自监督预训练统一框架、快速通用分割模型等多项关键技术,迈出人工智能通用化的重要一步。获得2022年9月世界人工智能大会最高奖项SAIL奖。近三年承担科技部、工信部、北京市等大模型重大专项5个。目前共发表论文260余篇,国际权威期刊IEEE T-PAMI、T-IP等50篇和NeurIPS、CVPR等会议200多篇。Google Scholar 引用次数总计10000,H-index 45。完成国家标准制定6项,授权发明专利40余项,荣获北京市科技进步一等奖、中国发明创新银奖、北京市高聚人才、新时代中国经济创新人物、武汉楷模等竞赛或荣誉20余项。。所研发的核心技术为产业服务,填补国内空白,已在华为、阿里 、京东、联想、中国移动、中国电子进出口总公司、京东方、精伦、兆维集团、华润集团、国家电网、平安科技、杰创智能等多家上市公司产品中进行技术转 移和应用,技术转化已形成数亿元产值。曾携自主研发的人工智能机器人“小加”上CCTV1加油向未来节目第二季为众人展示萌宠识别技术,在加油向未来第三季“ 机器人守门员”节目中展示动态轨迹识别技术,开门大吉节目中展示“鼻纹识别”,北京卫视“北京您早”节目中展示“智能辨物技术”,并担任湖南卫视“我是未来”的 科学代言人,研发的人工智能音乐评分系统担任央视“渴望现场”机器人评委。

研究方向

视频图像分析
多模态大模型
自监督学习
目标检测与跟踪
细粒度识别
行为识别

承担科研项目情况

[1] 模拟集成电路版图智能化生成方法,科技部人工智能2030重大专项课题负责人,2022.6-2025.5;
[2]国家自然科学基金面上项目:基于局部关系与语义约束的视觉检索, 2023.1-2026.12;
[3]基于结构关系和知识学习的大规模视觉目标检索,国家自然科学基金面上项目:2018.1-2021.12;
[4]基于混合增强智能的平行智能理论研究及验证,广东省重点领域研发计划资助项目,2019.1-2022.12
[5]主持青年科学基金一项"基于视觉关注与语义分析的视频自适应";
[6] 主持自然科学基金面上项目一项"面向移动终端的视频检索与浏览";
[7] 主持863子课题一项"面向先进加工的智能安全监控技术研究";
[4] 国家自然科学基金重点项目:面向无线网络环境的个性化视频定制及适配关键技术
[5] 国家自然科学基金重点项目:数据理解的若干基本问题研究。
[6] 973项目:数字媒体理解的理论与方法研究
[7] 国家自然基金青年基金:基于跨媒体信息挖掘的网络舆情分析研究
[8] 国家自然基金重大研究计划:面向互联网的跨媒体挖掘与搜索引擎。
[9] 人脸识别与目标检测系统
[10] 基于深度学习的车型识别
[11] 智能多目标识别
[12] 物体追踪轨迹识别
[13] 智能服务机器人
[14] 家庭物联网实验室
其中青年基金项目"基于视觉关注与语义分析的视频自适应"成果优秀,获得基金委滚动支持,获得青年-面上连续项目"面向移动终端的视频检索与浏览"。

代表论著

[1].Zhaowen Li, Yousong Zhu, Fan Yang, Wei Li, Chaoyang Zhao, Yingying Chen, Zhiyang Chen, Jiahao Xie, Liwei Wu, Rui Zhao, Ming Tang, Jinqiao Wang:UniVIP: A Unified Framework for Self-Supervised Visual Pre-training. CVPR 2022: 14607-14616(CCF A类)
[2].Kuan Zhu, Haiyun Guo, Tianyi Yan, Yousong Zhu, Jinqiao Wang, Ming Tang:PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification. ECCV (14) 2022: 198-214(CCF B类)
[3].Tong Wang, Yousong Zhu, Chaoyang Zhao, Wei Zeng, Yaowei Wang, Jinqiao Wang, Ming Tang: Large Batch Optimization for Object Detection: Training COCO in 12 minutes. ECCV (21) 2020: 481-496(CCF B类)
[4].Tong Wang, Yousong Zhu, Yingying Chen, Chaoyang Zhao, Bin Yu, Jinqiao Wang, Ming Tang: C2AM Loss: Chasing a Better Decision Boundary for Long-Tail Object Detection. CVPR 2022: 6970-6979(CCF A类)
[5].Mingfei Tu, Kuan Zhu, Haiyun Guo, Qinghai Miao, Chaoyang Zhao, Guibo Zhu, Honglin Qiao, Gaopan Huang, Ming Tang, Jinqiao Wang: Multi-Granularity Mutual Learning Network for Object Re-Identification. IEEE Trans. Intell. Transp. Syst. 23(9): 15178-15189 (2022)(CCF A类)
[6].Zhiyang Chen, Yousong Zhu, Zhaowen Li, Fan Yang, Wei Li, Haixin Wang, Chaoyang Zhao, Liwei Wu, Rui Zhao, Jinqiao Wang, Ming Tang. Obj2Seq: Formatting Objects as Sequences with Class Prompt for Visual Tasks. NeurIPS 2022(CCF A类)
[7].Zhiyang Chen, Yousong Zhu, Chaoyang Zhao, Guosheng Hu, Wei Zeng, Jinqiao Wang, Ming Tang: DPT: Deformable Patch-based Transformer for Visual Recognition. ACM Multimedia 2021: 2899-2907
[8].Yulong Liu,  Guibo Zhu, Bin Zhu, Qi Song, Guojing Ge, Haoran Chen, Guanhui Qiao, Ru Peng, Lingxiang Wu, and Jinqiao Wang. TaiSu: A 166M Large-scale High-Quality Dataset for Chinese Vision-Language Pre-training. NeurIPS 2022
[9].Haixin Wang, Lu Zhou, Yingying Chen, Ming Tang, and Jinqiao Wang. Regularizing Vector Embedding in Bottom-Up Human Pose Estimation. European Conference on Computer Vision (ECCV), 2022
[10].Xiaomei Zhang, Yingying Chen, Ming Tang, Zhen Lei, Jinqiao Wang. Grammar-Induced Wavelet Network for Human Parsing. IEEE Transactions on Image Processing (TIP), 2022. (CCF A类)
[11].Xiaomei Zhang, Yingying Chen, Ming Tang, Jinqiao Wang, Xiangyu Zhu, Zhen Lei. Human Parsing with Part-aware Relation Modeling. IEEE Transactions on Multimedia (TMM), 2022. (CCF A类)
[12].Xiaomei Zhang, Yingying Chen, Bingke Zhu, Jinqiao Wang, Ming Tang. Part-aware Context Network for Human Parsing. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020:8971-8980.(CCF A类)
[13].Xiaomei Zhang, Yingying Chen, Bingke Zhu, Jinqiao Wang, Ming Tang. Blended Grammar Network for Human Parsing. European Conference on Computer Vision (ECCV), 2020:189-205.(CCF B类)
[14].Xiaoqing Liang, Xu Zhao, Chaoyang Zhao, Nanfei Jiang, Ming Tang, Jinqiao Wang: Task Decoupled Knowledge Distillation For Lightweight Face Detectors. ACM Multimedia 2020: 2184-2192(CCF A类)
[15].Si Liu, Guanghui Ren, Yao Sun, Jinqiao Wang, Changhu Wang, Bo Li, Shuicheng Yan:Fine-Grained Human-Centric Tracklet Segmentation with Single Frame Supervision. IEEE Trans. Pattern Anal. Mach. Intell. 44(2): 610-621 (2022)(CCF A类)
[16].Yongqi An, Xu Zhao, Tao Yu, Haiyun Gu, Chaoyang Zhao, Ming Tang, Jinqiao Wang: ZBS: Zero-Shot Background Subtraction via Instance-Level Background Modeling and Foreground Selection. CVPR 2023: 6355-6364(CCF A类)
[17]. Zhaopeng Gu, Bingke Zhu, Guibo Zhu, Yingying Chen, Ming Tang, Jinqiao Wang: AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models. AAAI 2024(CCF A类)

获奖及荣誉

[1]. 2022 北京市科技进步一等奖 大型科普节目《加油向未来》 省部级
[2]. 2022 世界人工智能大会SAIL奖(卓越人工智能引领者) 基于昇腾AI的全球首个三模态大模型“紫东太初” 省部级[]
[3].2023 中国科学院科苑名匠 紫东太初多模态大模型 省部级
[4].2023 中国算力大会算力中国年度突破成果 紫东太初全模态大模型 省部级
[5].2022 中国计算机学会“DC Tech创新先锋” “紫东太初”人工智能基础大模型 省部级
[6].2020 中国发明协会创业奖创新奖 基于多模态协同学习的视频大数据语义理解技术及产业化应用 省部级
[7]2019 中国科学院北京分院科技成果转化奖二等奖 交通车纹识别技术及产业化 省部级
[8]2021 新时代中国经济创新人物 2021中国经济高峰论坛暨第十九届中国经济人物年会 省部级
[9]2023 武汉楷模城市英雄 深耕人工智能技术推动行业发展的科学先锋 省部级
[10]2023 3551光谷人才计划领军人才 “3551光谷人才计划”专项 省部级
[11]2019 泰山产业领军人才 现代服务业及社会民生产业创新类 省部级
[12]2020 中关村高端领军人才 中关村高端领军人才聚集工程专项 省部级

专利成果

[1] 朱贵波, 朱炳科, 古兆鹏, 陈盈盈, 王金桥. 异常检测模型训练方法、异常检测方法、装置及电子设备. CN: CN116403077B, 2023-08-15.
[2] 赵朝阳, 王金桥, 郭海云. 人脸识别模型的训练方法、装置、设备和存储介质. CN: CN115953819B, 2023-08-15.
[3] 郭海云, 伍虹燕, 王金桥. 基于粗标签辅助的半监督细粒度图像识别方法和设备. CN: CN115294350B, 2023-08-04.
[4] 郭海云, 闫天翊, 王金桥, 唐明. 视觉检索模型的无监督训练方法、装置和电子设备. CN: CN116089652B, 2023-07-18.
[5] 朱优松, 李朝闻, 陈志扬, 赵朝阳, 唐明, 王金桥. 图像重建模型的迭代方法和图像重建方法. CN: CN116030156B, 2023-07-18.
[6] 朱贵波, 朱炳科, 古兆鹏, 陈盈盈, 王金桥. 异常检测模型训练方法、异常检测方法、装置及电子设备. CN: CN116403077A, 2023-07-07.
[7] 王金桥, 李宗树, 朱贵波, 吴凌翔, 刘智威, 葛国敬. 一种目标检测方法、装置、设备及存储介质. CN: CN115953665A, 2023-04-11.
[8] 赵朝阳, 王金桥, 郭海云. 人脸识别模型的训练方法、装置、设备和存储介质. CN: CN115953819A, 2023-04-11.
[9] 郭海云, 伍虹燕, 王金桥. 基于粗标签辅助的半监督细粒度图像识别方法和设备. CN: CN115294350A, 2022-11-04.
[10] 朱贵波, 李宗树, 葛国敬, 赵旭, 王金桥. 少样本目标检测方法、装置和电子设备. CN114861842b, 2022-10-28.
[11] 吴凌翔, 王金桥, 牛蕴方. 图像生成方法、图像去噪模型的训练方法和设备. CN: CN115222630A, 2022-10-21.
[12] 朱优松, 陈志扬, 赵朝阳, 李朝闻, 王金桥, 唐明. 目标检测方法、装置、电子设备及存储介质. CN: CN115100419A, 2022-09-23.
[13] 郭海云, 王金桥, 唐明, 朱宽. 行人重识别模型训练方法、行人重识别方法、装置和设备. CN: CN115082966A, 2022-09-20.
[14] 朱优松, 陈志扬, 赵朝阳, 李朝闻, 王金桥, 唐明. 图像分析方法、装置及电子设备. CN: CN115082430A, 2022-09-20.
[15] 朱优松, 葛翔, 赵朝阳, 王金桥, 赵会盼, 王文帅, 高跃清. 一种目标识别方法及装置、计算机存储介质. CN: CN115035379A, 2022-09-09.
[16] 吴凌翔, 王金桥, 牛蕴方. 图像生成方法、装置和电子设备. CN: CN115018954A, 2022-09-06.
[17] 朱贵波, 李宗树, 葛国敬, 赵旭, 王金桥. 少样本目标检测方法、装置和电子设备. CN: CN114861842A, 2022-08-05.
[18] 葛国敬, 朱贵波, 王金桥. 基于生成对抗网络的人脸修复方法、装置及存储介质. CN: CN114862699A, 2022-08-05.
[19] 朱优松, 李朝闻, 赵朝阳, 陈志扬, 王金桥. 掩码图像模型训练方法、掩码图像内容预测方法和设备. CN: CN114842307A, 2022-08-02.
[20] 郭海云, 吴畏, 王金桥, 唐明. 基于一致性损失的细粒度图像模型训练及识别方法和装置. CN: CN114821203A, 2022-07-29.
[21] 葛国敬, 王金桥, 朱贵波. 图像生成器的训练方法、装置、电子设备和可读存储介质. CN: CN114782291A, 2022-07-22.
[22] 王金桥, 葛国敬, 朱贵波. 基于Transformer的非接触式呼吸率测量方法. CN114343612B, 2022-05-24.
[23] 王金桥, 葛国敬, 朱贵波. 图像扫描识别方法、装置及电子设备. CN: CN114429636A, 2022-05-03.
[24] 李朝闻, 朱优松, 杨帆, 李韡, 赵朝阳, 陈志扬, 吴立威, 赵瑞, 唐明, 王金桥. 模型训练及图像处理方法、装置、设备、存储介质. CN: CN114419374A, 2022-04-29.
[25] 王金桥, 葛国敬, 朱贵波. 基于transfomer的非接触式呼吸率测量方法. CN: CN114343612A, 2022-04-15.
[26] 赵旭, 王金桥, 赵朝阳, 丁文超. 一种多层级目标检测方法及系统. CN: CN114333040A, 2022-04-12.
[27] 陈志扬, 朱优松, 杨帆, 李韡, 李朝闻, 赵朝阳, 陈盈盈, 朱贵波, 吴立威, 赵瑞, 王金桥, 唐明. 图像处理、缺陷检测方法及装置、电子设备和存储介质. CN: CN114299296A, 2022-04-08.
[28] 陈志扬, 朱优松, 杨帆, 李韡, 李朝闻, 赵朝阳, 陈盈盈, 朱贵波, 吴立威, 赵瑞, 王金桥, 唐明. 图像处理、缺陷检测方法及装置、电子设备和存储介质. CN: CN114255221A, 2022-03-29.
[29] 王金桥, 葛国敬, 朱贵波. 基于通用视觉预训练模型的图像质量评价方法及系统. CN113743332B, 2022-03-25.
[30] 陈盈盈, 周鲁, 王金桥, 王海鑫. 人体姿态估计方法、装置、电子设备及存储介质. CN: CN114140831A, 2022-03-04.
[31] 陈盈盈, 朱炳科, 王金桥, 唐明, 黄吟月. 一种图像分类方法、装置、电子设备及存储介质. CN: CN114120034A, 2022-03-01.
[32] 葛国敬, 朱贵波, 王金桥. 基于Transformer的非接触式心率测量方法. CN: CN113408508B, 2021-11-30.
[33] 陈盈盈, 周鲁, 胡益珲, 王金桥. 基于自适应时空纠缠的视频行为识别方法、系统、设备. CN: CN113435430A, 2021-09-24.
[34] 王金桥, 张森, 郭海云, 蔡岗, 凃鸣非, 张慧辰, 尤冬海, 杨卓敏. 基于关键点检测和局部特征对齐的车辆重识别方法. CN: CN112990152A, 2021-06-18.
[35] 陈盈盈, 朱炳科, 王金桥, 唐明, 黄吟月. 一种图像分类方法、装置、电子设备及存储介质. CN: CN112801238A, 2021-05-14.
[36] 郭海云, 温馨, 王金桥, 唐明, 伍虹燕. 基于分布学习的自适应方差和权重的人脸年龄估计方法. CN: CN112560823A, 2021-03-26.
[37] 郭海云, 王金桥, 唐明, 刘松岩. 基于循环一致性的无监督人体姿态迁移方法、系统及装置. CN: CN111739115B, 2021-03-16.
[38] 郭海云, 王金桥, 唐明, 刘松岩. 基于特征对抗学习和自相似性聚类的跨域目标重识别方法. CN: CN111738172B, 2021-02-12.
[39] 葛国敬, 朱贵波, 王金桥. 基于端到端网络的非接触式心率测量方法、系统和装置. CN: CN112200162A, 2021-01-08.
[40] 陈盈盈, 冯文霓, 王金桥. 基于多属性融合的分布式车牌识别方法、系统、装置. CN: CN112200193A, 2021-01-08.
[41] 郭海云, 王金桥, 伍虹燕. 基于图网络的多粒度特征学习的图像精细分类方法及系统. CN: CN111814920B, 2021-01-05.
[42] 陈盈盈, 周鲁, 王金桥, 卢汉清. 基于空间变换信息传递的人体关键点检测方法与系统. CN: CN111783755B, 2021-01-05.
[43] 郭海云, 朱宽, 王金桥, 唐明. 基于语义一致水平条和前景修正的行人重识别方法. CN: CN111783753B, 2020-12-15.
[44] 陈盈盈, 张小梅, 王金桥, 唐明. 基于部位上下文的人体属性图像分类方法、系统和装置. CN: CN111783754B, 2020-12-08.
[45] 陈盈盈, 郑林宇, 王金桥, 卢汉清. 基于深度学习和判别式模型训练的目标跟踪方法及存储器. CN: CN111815681A, 2020-10-23.
[46] 郭海云, 王金桥, 伍洪燕. 基于图网络的多粒度特征学习的精细分类方法及系统. CN: CN111814920A, 2020-10-23.
[47] 陈盈盈, 朱炳科, 王金桥, 唐明. 基于深度解耦的人体实例解析方法、系统. CN: CN111738174A, 2020-10-02.
[48] 朱翔昱, 雷震, 王金桥, 刘智威. 基于语义对齐的人脸关键点检测方法、系统、装置. CN: CN109902641A, 2019-06-18.
[49] 王金桥, 赵飞, 唐明. 视觉目标跟踪方法及系统. CN: CN109785385A, 2019-05-21.
[50] 王金桥, 赵朝阳. 目标检测模型构建方法. CN: CN107038448A, 2017-08-11.
[51] 王金桥, 郭海云, 卢汉清. 基于深度学习的车型识别模型构建方法及车型识别方法. CN: CN106570477A, 2017-04-19.
[52] 汤淑明, 朱新亮, 王金桥. 一种RGB-D图像获取方法. CN: CN104463880A, 2015-03-25.
[53] 卢汉清, 王金桥, 屈展. 一种缩略图生成方法和系统. CN: CN103902730A, 2014-07-02.
[54] 卢汉清, 王金桥, 刘晶晶. 基于群组上下文的行人计数方法. CN: CN102289817A, 2011-12-21.
[55] 卢汉清, 刘静, 王金桥, 祝晓斌. 基于视频监控网络的视频自动浓缩方法. CN: CN102256065A, 2011-11-23.
[56] 卢汉清, 王金桥, 杨杰. 基于动态群组划分的多目标跟踪方法. CN: CN102148921A, 2011-08-10.
[57] 徐常胜, 肖宪, 王金桥. 基于三维点云模型的地标建筑图像分类方法. CN: CN102147812A, 2011-08-10.
[58] 卢汉清, 王金桥, 刘荣. 基于极小化上界误差的视觉跟踪方法. CN: CN102054170A, 2011-05-11.
[59] 卢汉清, 王金桥, 张天柱. 用计算机对运动目标的场景图像建立语义场景模型的方法. CN: CN102054176A, 2011-05-11.

社会任职

担任International Conference on Internet Multimedia Computing and Service(ICIMCS2009)出版主席。担任ICME2011和MMM2011、ICIP2014和ACM Multimedia 2015的程序委员会委员。担任IEEE Trans. on Multimedia、Computer Vision and Image Understanding、Multimedia Systems、IEEE Trans. Circuits and Systems for Video Technology、Neurocomputing等国际期刊杂志以及CVPR、ICME、ICIP、ICPR、ACCV、MMM、PCM、ACM Multimedia等国际会议的审稿人。 ICIMCS2009(互联网多媒体计算与服务国际会议)的出版主席; PCM2011和MMM2011的程序委员会委员;