本篇文章2442字,读完约6分钟
不久前,一条新闻几乎席卷了整个网络。谷歌最近发布了谷歌神经机器翻译(GNMT)系统,称该系统采用了最先进的训练技术,可以实现机器翻译质量的最大提高。
一些从事翻译行业的网民甚至这样描述:
当我作为一名翻译看到这条新闻时,我理解了纺织工人在18世纪看到蒸汽机时的担忧和恐惧。
这种观点有点危言耸听。特别是在业内专家看来,机器翻译的效果远远没有取代人工专家翻译的水平。事实上,谷歌这次应用的技术并不是最新的“黑色技术”。早在2015年,百度就发布了基于深层神经网络的端到端翻译系统,微软必应翻译也利用神经网络技术来提高其翻译质量。与传统的基于短语的翻译(pbmt)相比,基于神经网络的翻译系统对整个输入句子进行编码,可以充分利用语境信息,生成更高质量的译文。
最近,备受争议的谷歌神经机器翻译只用于汉译英,所以下面的测试都是在汉译英下进行的。从几个角度看百度、谷歌、冰等翻译软件的实际使用效果:
复合句的翻译
1.定语从句(用句子修饰名词短语):
我没什么要告诉你的。
从上到下,是谷歌翻译、百度翻译、冰翻译
2.多个修饰符
从上到下,是谷歌翻译、百度翻译、冰翻译
3.长短句子的翻译
从上到下,是谷歌翻译、百度翻译、冰翻译
4.俚语翻译
从左到右依次是谷歌翻译、百度翻译和冰翻译
可以看出,在定语从句部分,谷歌和百度的翻译结果几乎相同,句子流畅连贯。如果将两者进行比较,谷歌的翻译结果更接近标准答案。另一方面,冰的翻译结果与原意不同。
在很多形容词中,这三个词翻译出来的意思一般,但当遇到黄老板和黄山,这两个词很容易混淆名词和形容词时,百度的翻译似乎更准确。
在长句和短句中,谷歌翻译和冰翻译都同时翻译了两次时态和动词“已经看到”。虽然百度翻译没有这种情况,但它没有把两个名词之间的连词“和”翻出来,这对句子理解影响不大。
说到俚语翻译,谷歌翻译几乎完全按照短语翻译字面意思,而冰却有一个奇怪的遗漏,语义不连贯。相比之下,百度翻译也翻译了原句的引申意义,并保持了句子的连贯性和准确性。
俗语的翻译
1.修饰语,如“得”、“了”、“好”
2.省略和重复的重叠短语句子
在口语翻译部分,涉及到修饰语,谷歌和百度的翻译是相似的,而冰的翻译却与原意大相径庭。
然而,在重复重叠的短语中,百度翻译会主观地翻译“take”,这在语义的流畅性和连贯性方面要优于谷歌和冰的“brave”。
第1段的整体翻译。简短的段落
2.长段落
在整个段落翻译部分,翻译了段落的三个基本语义。谷歌翻译在一些连接词的翻译上比较简洁,而百度和冰会在一些地方增加一些连接词。
然而,当涉及到长句和短句、语气词和多个修饰语时,它们在某些地方都是平均的。
例如:“我的父亲是一个胖子,所以走路会有些麻烦。”
谷歌将其翻译为“父亲是个胖子,走过去自然会更麻烦。”
百度翻译成“我爸爸是个男人,去有些麻烦。”
冰被翻译成“父亲是胖子,走路自然要靠别人。”
三者在连贯性方面都不是很好,但是谷歌翻译在语义方面更好。
另一个例子是:“所以我扑向我衣服上的污垢,我的心很放松。过了一会儿,我说,“我要走了,我会在那边写信的!"
楚天舒把它翻译成“所以笛子衣服放在土里,我的心很容易喜欢,过了一会儿那个,”我走了;信的另一面!""
百度翻译成“这时衣服上突然脏了,他看了看东西松了口气,过了一会儿说,“我去那边;信!" "
冰被翻译成“便便和靴子,感觉很旧,人们会说,“我要走了;陶莱特。" "
这里三个的翻译不是很好。从对应短语的翻译来看,冰的翻译效果较好,但在没有主语的情况下翻译“一”是不正确的。谷歌翻译直接理解整个句子中的主语默认是一个人,而百度翻译准确地识别出说话者是父亲,即“他”,但从句的结构存在错误。
特性和功能的比较1。离线翻译
在离线翻译部分,从测试语句来看,谷歌翻译的效果几乎无法理解。百度需要购买离线翻译包才能翻译,而必应不提供离线翻译功能。
2.图片翻译
图像翻译部分使用今天标题的统一页面
从左到右依次是谷歌翻译、百度翻译和冰翻译
谷歌翻译可以把手机放在图片前面,无需任何操作就可以开始实时翻译。按下照片按钮,涂抹您想要翻译的部分,然后翻译相应的结果。
与谷歌翻译相比,百度没有在图片前不做任何事情就开始实时翻译的功能。但是,百度翻译器也可以涂抹要翻译的部分,并在按下照片按钮后翻译相应的结果。但是百度翻译有最全面的个性化功能,包括
实物翻译
长句翻译
菜单翻译
单词翻译
四大类,最完美的定制功能。
此外,百度翻译提供的物理翻译和菜单翻译功能也可以在某些场合使用。
Bing翻译只能在翻译前拍照,没有自定义功能选项。
3.语音翻译
在语音翻译部分,正确的句子是:你好,我要杀了李。谷歌和百度有类似的翻译效果,而必应不提供语音翻译功能。
此外,谷歌翻译提供多语言语音输入功能,而百度目前只提供中文、英文和粤语(谷歌翻译不提供)语音输入功能。两者都具有良好的语言识别和输入功能,准确率高,句子流畅连贯。两者都可以以对话的方式呈现,这将给商务或旅游带来很多便利。
从上到下,是谷歌翻译和百度翻译
从以上比较可以看出,与以往基于短语的翻译相比,使用神经机器系统的翻译取得了很大的进步。当你读它的时候,你不再觉得有什么不对劲,甚至有些翻译结果已经到了稍加修改就几乎不能使用的地步。
但在使用过程中,比如需要翻译复杂的句子和口语表达,大多数时候谷歌翻译和百度翻译表现相对较好。不仅流畅性和语义保持性相对较好,而且句子错误率和单词错误率也相对较小。
另外,在图片翻译部分,谷歌翻译可以达到实时翻译的效果,并且准确率很高。虽然百度翻译没有实时翻译功能,但其自定义功能是最完善的,可以选择四类个性化功能,更有针对性。
综上所述,与过去相比,机器翻译与神经网络真的是天壤之别。在某些方面,它与人类的翻译水平有些接近,所以让译者关注并不夸张。然而,对于普通人来说,百度翻译在术语、段落准确性和语义流畅性方面都是一个不错的选择。