张吉光

张吉光  /  

  • 职  称: 副研究员
  • 邮  编: 100190
  • 电子邮件: jiguang.zhang@ia.ac.cn
  • 部门/实验室: 多模态人工智能系统全国重点实验室
  • 通讯地址: 北京市海淀区中关村东路95号智能化大厦

个人简历

中国科学院自动化研究所多模态人工智能系统全国重点实验室,副研究员。长期围绕无人系统的三维环境感知、开放场景语义理解、复杂场景三维建模、目标检测、轻量化及动态推理等技术和智能移动机器人应用等方面的研究工作,与本项目相关的技术方面,申请人发表相关论文30余篇,主要包括JCR I 区顶级SCI国际期刊 (Information Fusion, IEEE TIP, IEEE TGRS, Remote Sensing 和 Mathematics 等)和CCF A 顶级国际会议(SIGGRAPH ASIA、MM等)。现任中国指挥与控制学会,虚拟现实与人机交互专业委员会,委员。中国图像图形学学会,CSIG虚拟现实专业委员会,秘书。
近年来,在复杂场景三维感知关键技术的研究成果,获2023年第二届全国博士后创新创业大赛银奖(“基于深度学习的高性能轻量化视觉检测一体化平台”),中国图学学会2021年科技进步奖二等奖(“三维复杂场景语义重建和应用服务平台”)。已公开和授权发明专利8个。
作为负责人主持省部级科研项目(虚拟现实技术与系统全国重点实验室开放课题基金项目“基于动态神经辐射场的三维场景高质量建模”)1项,作为子课题负责人和主要参加多个国家项目,其中包括:重点基金(“道路交通场景的环境目标三维状态感知与验证”,课题经费200万)和面上基金等,项目总经费达500万。作为技术负责人之一,参与北京魔门塔公司共建的“无人驾驶环境感知联合实验室”(300 万),负责国科思博智车科技“低速无人车物流末端配送的三维视觉感知”项目、北方天途航空技术发展(北京)有限公司“序列化稠密点云地图重建技术”项目、中科院空间应用工程与技术中心,有效载荷运控中心,“中国空间站某实验舱机械臂三维目标运动状态预测”、聚蜂智能科技“屋顶灾害受损三维智能感知”项目等,项目总经费达260万。成果应用于多家知名企业,得到行业内的认可,取得的经济与社会效益显著。

研究方向

计算机图形图像、计算机视觉、点云处理、深度学习、人工智能、无人系统的环境感知等

承担科研项目情况

(2)多源可视信息融合学习的隧道高精度重建与自主定位,国家自然科学基金面上项目,54万,主要参与人,2023-01-01 至 2026-12-31
(3)基于高精度三维语义模型的水稻群体空间布局优化策略研究,国家自然科学基金面上项目,54万,子课题负责人,2023-01-01 至 2026-12-31
(4)道路交通场景的环境目标三维状态感知与验证,国家自然科学基金区域联合重点基金项目,260万,主要参与人,2022-01-01 至 2025-12-31
(5)基于相关性学习的跨模态行人重识别方法研究, 国家自然科学基金面上项目,57万元,子课题负责人,2022-01-01 至 2025-12-31
(6)基于小样本学习的红外视频人体行为识别方法研究,国家自然科学地区科学基金项目,36万,子课题负责人,2022-01-01 至 2025-12-31
(7)城市场景序列化图像稠密重建与高精语义模型构建,国家自然科学基金面上项目,60万,主要参与人,2020-01-01 至 2023-12-31
(8)基于多视角卷积网络的稠密SLAM场景重建与识别,国家自然科学基金面上项目,58万,主要参与人,2020-01-01 至 2023-12-31
(9)基于动态神经辐射场的三维场景高质量建模,虚拟现实技术与系统全国重点实验室开放课题基金项目,6万,负责人,2024-01-01至 2026-12-31

代表论著

(1)Aerial Orthoimage Generation for UAV Remote Sensing: Review,Information Fusion 2022, 89:91-120 (sci期刊,JCR 1区,影响因子:17.564,第一作者
(2)Deep learning-based low overlap point cloud registration for complex scenario: The review,Information Fusion 2024,107,102305 (sci期刊,JCR 1区,影响因子:17.564 共同一作
(3)Key Point localization and Recurrent Neural Network based Water Meter Reading Recognition IEEE Displays 2022, 74, 02222 (sci期刊, JCR 2区,影响因子:3.074) 第一作者
(4)Semantic Enhancement based Adaptive Geometric Encoding Network for Low Overlap Point Cloud Registration,IEEE Displays 2024, 81, 102615 (sci期刊, JCR 2区,影响因子:3.074) 共同一作
(5)Large-Scale Semantic Scene Understanding with
Cross-Correction Representation,Remote Sensing 2022,15(6): 1625 (sci期刊, JCR 1区,影响因子:5.349) 学生一作 本人二作
(6)Slicing Components Guided Indoor Objects Vectorized Modeling from Unilateral Point Cloud Data,IEEE Displays 2022,74, 102255 (sci期刊, JCR 2区,影响因子:3.074) 通讯作者
(7)Accurate and Serialized Dense Point Cloud Reconstruction for Aerial Video Sequences,Remote Sensing 2023,15(6): 1625 (sci期刊, JCR 1区,影响因子:5.349) 通讯作者
(8)Door State Recognition Method for Wall Reconstruction from Scanned Scene in Point Clouds,Mathematics 2023, 11(5), 1149  (sci期刊, JCR 1区,影响因子:2.592) 通讯作者
(9)SCOOT: Self-supervised Centric Open-set Object Tracking,  SIGGRAPH ASIA, 2023(CCF A 类国际会议) 共同通讯

获奖及荣誉

(1)第二届全国博士后创新创业大赛银奖,人力资源社会保障部,2023。
(2)中国图学学会2021年度科技进步奖二等奖,中国图学学会, 2021。

专利成果

[1] 多视角图像一致性的无监督深度预测方法、系统、装置,国家发明专利, 2021,专利号: CN202010437242.2.已授权。
[2] 基于主动筛选的半监督病灶检测网络的病灶检测系统,国家发明专利, 2020,专利号: CN202010440471.X. 已授权
[3] 一种基于显著图像块分析的图像运动模糊去除方法,国家发明专利,2017, 专利号: CN108154488B. 已授权
[4] 一种基于特征级对齐的协同感知噪声位姿鲁棒的矫正方法,国家发明专利,2023,专利号:CN116958925A. 已授权
[5] 联合知识图谱和视觉图像检测引导的海量视频拷贝检测,国家发明专利,2023,公开
[6] 基于无监督数据域互学习的场景像素级语义分割方法、系统,国家发明专利,2023,公开
[7] 一种基于协同感知噪声位姿鲁棒矫正的目标检测方法和装置,国家发明专利,2023,公开
[8] 图像分割方法、装置、电子设备及存储介质,国家发明专利,2023,公开

社会任职

(1)中国指挥与控制学会,虚拟现实与人机交互专业委员会,委员(2)中国图像图形学学会,CSIG虚拟现实专业委员会,秘书