6月27日,国际口语翻译先进研究联盟(Universal Speech Traslation Advanced Research Consortium,简称 U-Star)在伦敦发布23国语言翻译实验系统,以多国语言翻译服务迎接奥运。中科院自动化所作为U-Star发起单位之一,承担了其中中英互译项目。
U-Star此次发布的系统名叫“Voice Tra4U-M”,涵盖了世界应用较为广泛的23个语种,并能同时支持5人以移动终端在不同地点用不同语种进行实时对话。基于该系统,会话用户在手机上以各自语种通话,系统会将各方的语音信息通过网络传送到后台云计算中心,计算中心首先对口语语音进行识别,并将语音信息转换为文本信息,随后将文本信息翻译为会话各方所需语种的文本信息,最后通过文本转语音模块,将翻译后的目标语音发送到相应会话用户的手机上,从而实现跨语种对话。在网络良好条件下,整个翻译交互过程在数秒钟之内即能完成,为用户带来了便捷和高效的使用体验。
实现无障碍的跨语言沟通一直是机器翻译追求的目标。从1945年信息论先驱Warren Weaver提出机器翻译的可计算性,计算机自动翻译之路已走了60多年。而加上语音识别因口音问题带来的大量模糊,正确可靠的口语翻译并不是一件容易的事,科学界一度将此技术突破的难度比作“人类登陆火星”。近年来,互联网海量数据的爆炸性增长、大规模云计算技术应用为口语翻译技术的突破提供了有力的技术支撑,而基于3G移动通信技术的智能终端普及为该项技术从实验室走向应用提供了理想的平台。虽然离理想的人类同声传译技术还有相当长距离要走,然而此次系统的发布标志着国际口语翻译技术向实用化发展迈出了重要而关键一步。
在 “Voice Tra4U-M”系统中,中科院自动化所承担并完成了汉语普通话识别、中文-英文双向翻译以及汉语普通话合成等四大任务。目前,该所自主研发的基于Android和iPhone手机的中文-英文双向口语翻译系统“紫冬口译Beta版”(又名“由你说”)已开发完成,并在Android平台上用户可免费下载。在3G或者无线局域网环境中用户可通过该软件获得在线中英口语翻译服务。