基于云计算的移动终端口语翻译
实现无障碍的跨语言沟通一直是机器翻译追求的目标。在口语交流的场合,比如旅游观光、对外交流和商务谈判等,这方面的需求尤其迫切。近年来,基于互联网海量数据和大规模云计算平台的翻译技术取得了很大进展;另一方面,3G移动通信技术的普及,为口语翻译技术从实验室走向实际应用提供了理想的应用平台。中科院自动化所在多年的语音识别和机器翻译技术积累基础上,持续研究基于海量数据和云计算平台的口语翻译核心技术,于近期推出了移动终端上的实用化口语翻译系统。
自动化所的口语翻译可以安装运行在安卓、iOS等操作系统的智能手机或平板电脑上,使用者通过3G或者无线局域网访问口语翻译的云计算中心,能够随时随地获得在线翻译服务。用户在手机上打开口语翻译软件,对着手机说出想翻译的话(比如是一句中文),用户的语音通过网络送到后台云计算中心,先进行口语语音识别,得到用户所说的文字,然后用海量语料训练的翻译系统进行翻译,得到目标语言(比如英文)的翻译结果,最后通过文本转语音模块,将目标语言的语音信息连同之前的识别和翻译文本一同发回到用户手机上,用户将在手机上看到和听到刚才自己说的那句话翻译之后的结果。在强大的云计算集群和高速网络连接的支持下,整个翻译交互过程在数秒钟之内就能完成,识别和翻译结果均能达到可用的水平,为用户带来了非常便捷和高效的使用体验。随着用户使用频率的增加,云计算后台也会逐步改进和完善,为用户更加个性化的和更准确的翻译服务。
口语翻译系统集合了云计算、语音识别、机器翻译、语音合成、人工智能等技术,本身又有可操控性、直观性、生动性等特点,且其应用面向生活,可以使高深前沿的人工智能技术更容易走进大众的视野。
口语翻译系统的基本原理