将英语逐出中学必修课的话题余音未了,谷歌翻译就“翻车”了。
近日,谷歌翻译对一份英文药物说明译出:“您可以根据疼痛程度使用尽可能多的反坦克导弹”的句子。有研究者发布了谷歌翻译在急诊指导中应用效果的评估报告。结果显示,对于不同语言,谷歌翻译的准确率存在差距,最高可达到94%,而最低只有55%。
机器,能否扛起翻译的大旗?
机器翻译的本质
“对机器翻译来说,即使不是医药等专业领域,也有可能出现类似的错误,这是机器翻译的本质决定的。”中科院自动化所模式识别国家重点实验室研究员张家俊对《中国科学报》说。
时至今日,机器翻译已走过基于手工书写翻译规则的翻译技术(RBMT),通过统计机器翻译技术(SMT),和基于神经网络的机器翻译技术(NMT)三代。不管谷歌还是微软,目前提供在线翻译的公司都利用深度学习模型,从数以亿计的,人类翻译过的数据中,学习一种语言到另一种语言句子的自动转换。
“这本质上是基于概率统计的映射,翻译模型并没有正真理解语言,无法感知生成译文的质量,因此会产生一些对人类来说非常低级的错误而不自知。”张家俊说,“由于模型是数据驱动的,所以数据的规模、领域和质量直接决定了最终翻译的效果。”
科大讯飞研究院副院长刘俊华同样认为,当前机器翻译主要通过基于神经网络的端到端序列建模和大规模双语平行数据训练,实现源语言到目标语言的转换。因此,“训练数据的覆盖度和质量对机器翻译系统性能有着决定性的影响”。
“当机器翻译模型在训练过程中,没有学习过相应的词语或句子时,就很难保证翻译准确,这可能是导致谷歌翻译出现莫名其妙错误的主要原因。”刘俊华告诉《中国科学报》,“另一个原因是语言本身的丰富性和变化性所致。比如语言中的双关、歧义等,也导致机器翻译很难完全避免错误。”
刘俊华认为,对这类问题,目前比较有效的方法是不断地积累专业领域的训练数据、提升机器翻译算法的建模能力以及对专业术语次进行干预解决。
差距为啥这么大
谷歌翻译的模型基于新闻为主的全领域数据训练而成,没有针对医药领域进行专门处理,所以翻译系统对新闻和日常用语等总体翻译得比较好,而在一些专业领域表现就不够理想。
“相对于新闻等通用领域,医药、学术领域中人类翻译的数据没那么多。更重要的是,大部分人类翻译的数据要么没有电子版,要么没有共享。”张家俊说,“数据量少导致机器无法很好地学习到两种语言序列间的映射关系。另外一个难点在于专业领域里术语特别多,而术语通常采用约定俗成的固定翻译,这对于目前基于概率统计的模型来说是个非常棘手的问题。目前学术界正关注这个问题,但有效的解决办法不多。”
“专业领域的翻译要求更精准,而且有特定的术语或语言表达方式,机器翻译很难遵从这样的约定。”刘俊华补充说,“专业领域训练数据稀缺,还会不断出现新的词语(如新型冠状病毒肺炎)等。同时,术语往往存在一词多义现象(如doctor在医学领域翻译成医生的概率要大于博士),这导致机器翻译难度加大。”
机器翻译准确率与用于模型训练的数据量密切相关。由于不同语言之间,模型训练的数据量存在很大的差距,如英语、西班牙语、汉语等联合国官方语言,使用人口多,现有用于机器翻译模型训练的平行数据也非常多,机器翻译准确率整体会更好一些。而对于亚美尼亚语、波斯语等“小语种”来说,可用于训练的数据量较少,翻译准确率自然会偏低一些。
刘俊华说:“不同语言本身的特点和难度,不同语种间的关联度也导致翻译准确率出现较大差异。”
刘俊华举例说,如波斯语、阿拉伯语是从右往左书写,阿拉伯语文本一般不书写元音符号,俄语存在复杂的属格变化等都是翻译的难点,导致需要投入更大的精力来提升机器翻译的准确性。
在语种间关联度方面,汉语与英语之间关联度较低,翻译难度比较大。而西班牙语吸收了大量的英语词汇,两者在语法上也存在较多相似点,翻译难度相对低一些。
“一般来说,同一语系或语族内的语言之间翻译起来难度低一些,准确率也会更高。”刘俊华说。
机器难以替代人类
在刚闭幕的两会上,全国政协委员许进改革义务教育阶段,英语必修课地位的提案曾引起热议。其理由是英语占课时多,成果应用率低,在人工智能时代,机器翻译能解决日常应用中的问题。
在日常交流时,机器翻译的表现的确可圈可点。
记者用两款常用软件翻译:“研表究明,汉字序顺并不定一影阅响读。”这样故意颠倒语序的句子。翻译软件居然和人一样避开了干扰,“聪明”地识别出句意并正确地翻译出来。
专家认为,由于训练数据量越来越多、模型能力越来越强、算力越来越强,机器翻译的效果确实越来越好,越来越流畅。
“对于语序,人类在阅读时是有预期的,如果看到的字符串与预期的很像可能就不会觉察到。如果翻译模型在海量文本上学习过这样的情况,就能避开干扰,识别词语间的正确顺序。”张家俊说。
尽管如此,受访专家也表示机器翻译依然任重道远。
中科院自动化研究所研究员宗成庆认为,翻译中口语、书面语和专业领域各有特点,口语有语气、表情、重音、语速、口音(方言)、噪音等机器翻译的难点;书面语有词汇、成语、人名,句子结构复杂等不确定因素。因此进行专业领域的翻译更要“有目标地,根据用户需求个性化定制”。
“机器翻译不可能完全替代人,尤其在需要中高级翻译的情况下。”宗成庆告诉《中国科学报》,“机器翻译的工具属性更强,人机应该是互助关系,在一些简单场景,不太重要的场合,机器翻译可以快速处理,帮助人们提高效率。但对翻译质量要求高的地方,如文学作品,重要国际会议等场合,还需要人工翻译。”
宗成庆认为,中国在机器翻译应用系统开发方面,能够跟跑甚至在某些语言方面领跑国际,“但原创性的理论方法尚待提高”。这其中原因很多,比如数据收集规模小、公共基础资源缺乏等。
“目前有80多种语言与汉语之间的翻译找不到对照资源。一些小语种(如达利语)语言学家太少,做翻译系统时,能评价的人都没有。”宗成庆说,“还有些小语种因为就业困难,面临后继无人了的窘境。呼吁国家作为储备力量,加大这方面人才的培养力度。”