日前,国家工业和信息化部公布了“2021年人工智能产业创新任务揭榜挂帅项目”立项名单,由自动化所牵头的“大规模多模态预训练模型的研发与行业应用”项目在1200余个申报项目中脱颖而出,获得优胜揭榜资格。
该项目聚焦大规模多模态预训练模型的研发与行业应用,以自主可控基础软硬件平台为基础,突破不同领域的共性平台技术,实现万亿级参数量规模的大模型分布式训练,构建覆盖多语种文本、语音、图像、视频的多模态预训练大模型,通过在工业、医疗、城市、金融、物流、科学研究等行业领域开展典型应用示范,改变当前单一模型对应单一任务的人工智能研发范式,推动我国人工智能研发规则产生重大变革。
此前,已经以全栈自主可控基础软硬件平台为基础,与武汉市东湖高新区深度合作,依托武汉智能计算中心的昇腾GPU,研发了面向超大规模模型的高效分布式训练框架,在图、文、音三个基础模型上加入跨模态编码和解码网络,打造了业内首个千亿参数三模态大模型“紫东太初”。
“紫东太初”大模型开拓性地实现了图-文-音语义统一表达,首次实现了“语音生成视频”的功能,迈出朝向人工智能通用化的关键一步。并依托紫东太初大模型研发了跨模态通用人工智能平台,打造了多模态人机对话机器人“小初”,兼具图文音的理解、推理和生成能力,具有图像生成、智能问答、语音识别、文字识别、视频生成、视频描述、智能翻译等30多项功能。目前,“紫东太初”已经与上汽集团、魏桥创业、爱奇艺和新华社、美亚大千等行业领军企业合作,共同探索了丰富的应用落地场景。
据悉,工业和信息化部组织开展的“2021年人工智能产业创新任务揭榜挂帅工作”,聚焦人工智能产业发展的核心基础、重点产品、公共支撑等3类创新任务,旨在发掘培育一批掌握关键核心技术、具备较强创新能力的优势单位,突破一批人工智能标志性技术产品,加快突破产业发展瓶颈、补齐短板,推动我国人工智能产业与实体经济融合发展。