长期从事多模态信息智能处理技术研究,发表SCI/EI国际论文20余篇,申请授权国家发明专利19项,主持/参与国家新一代人工智能、JKW应用推进、国铁集团系统性重大、中科院任务等重大项目10余项,获得2019 王选新闻科学技术二等奖、2021首届人工智能应用创新大赛一等奖、 第十五届中国电影电视技术学会科技进步一等奖与2023铁路人工智能算法大赛特等奖等荣誉,目前担任计算机学报、ICASSP、ICONIP等一级学报或国际会议的审稿人,广电总局、国铁集团等单位的科技项目评审专家。近年来,围绕多模态智能信息处理、语音识别、大模型等前沿技术展开研究与应用。
多模态智能信息处理、语音识别、大模型
1.JKW应用推进重大项目独立课题:大模型驱动的xxxx智能分析技术研究,2024-2026,主持
2.国铁集团系统性重大项目:面向铁路多专业融合的人工智能大模型构建关键技术研究,主持
3.2023-2024,主持;国家创新平台开放基金:基于计算机视觉的接触网异物智能识别模型研究,主持
4.科技创新2030——新一代人工智能重大项目独立课题:面向普惠金融场景的大规模语音实时感知与理解,2020-2023,主持
5.军队委托:**智能信息处理系统南,2018-2026,参与
6.军队委托:**智能信息处理系统北,2018-2026,参与
7.军队委托:**智能信息处理系统西,2018-2026,参与
8.军队委托:**智能信息处理系统七,2018-2026,参与
9.中科院任务: 基于短信息的语种识别技术研究,2015-2016,主持
10.民口整机:智能语音处理系统,2014-2016,参与
1. Fangyuan Wang, Bo Xu, Bo Xu, SSCFormer: Push the Limit of Chunk-wise Conformer for Streaming ASR Using Sequentially Sampled Chunks and Chunked Causal Convolution. IEEE Signal Processing Letters, 2024.
2. Xiyuan Wang#, Fangyuan Wang#, Bo Xu, Liang Xu, Jing Xiao. “ P-vectors: A Parallel-coupled TDNN/Transformer Network for Speaker Verification. ”Proc. INTERSPEECH 2023, 3182-3186.
3. Fangyuan Wang, Ming Hao, Yuhai Shi, and Bo Xu. “Lead ASR Models to Generalize Better Using Approximated Bias-Variance Tradeoff.” International Conference on Neural Information Processing (2023).
4. M Hao, F Wang, Y Shi, C Zhang, "H-vectors: Hybrid Transformer and ResNet Based TDNN for Speaker Verification", 2023 International Conference on Culture-Oriented Science and Technology (CoST)
5. Fangyuan Wang and Bo Xu. “Shifted Chunk Encoder for Transformer Based Streaming End-to-End ASR.” International Conference on Neural Information Processing (2022).
6. Fangyuan Wang, Zhigang Song, Hongchen Jiang and Bo Xu. “MACCIF-TDNN: Multi Aspect Aggregation of Channel and Context Interdependence Features in TDNN-Based Speaker Verification.” 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) (2021): 214-219.
7. 郝洺, 徐博, 殷绪成, 王方圆, 基于 n-gram 频率的语种识别改进方法, 自动化学报, 2018.
8. Peng Wang, Jiaming Xu, Bo Xu, Chenglin Liu, Heng Zhang, Fangyuan Wang, Hongwei Hao, "Semantic clustering and convolutional neural network for short text categorization", Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics, 2015
9. 王方圆,张树武, 李和平,基于时空灰度序特征的视频片段定位算法,软件学报,2013
10. Fangyuan Wang, Hai Wang, Heping Li, Shuwu Zhang, "Large scale image retrieval with practical spatial weighting for bag-of-visual-words", MMM, 2013.
1.铁路人工智能算法大赛特等奖,中国铁道学会智能铁路委员会,2023,排名第1
2.第十五届中国电影电视技术学会科技进步一等奖,中国电影电视技术学会,2022,排名第7
3.广播电视和网络视听人工智能应用创新大赛一等奖, 国家广播电视总局,2021,排名第3
4.王选新闻科学技术二等奖,中国新闻技术工作者联合会,2019,排名第3
1.流式语音识别方法、装置、电子设备及存储介质,王方圆、徐波,CN202210576178.5
2.基于顺序采样分块机制的端到端流式语音识别方法及装置,王方圆、徐波,CN202211735842.2
3.模型检查点参数域平均方法、装置、电子设备及存储介质,王方圆、徐波,CN202210576193.X
4.说话人确认模型训练方法、装置及设备,王方圆、王溪源、徐波,CN202211679705.1
5.文本分类方法、装置、电子设备及存储介质,王方圆、宋明,ZL202010203466.7
6.文本聚类方法及系统、电子设备和存储介质,王方圆、王欣盛,CN202110858705.7
7.广播效果分类方法及系统、电子设备和存储介质,王方圆、王欣盛,CN202110858717.X
8.维语识别方法、装置、电子设备、存储介质和产品,王方圆、王溪源,CN202111553113.0
9.无锚框和提议框的场景文字检测方法,黄燃东、王方圆、徐波,ZL202110237052.0