\u00A0 \u00A012月16日,在PingWest 品玩“HAY!17”在北京798舉辦。在其中的人工智能翻譯大賽中,谷歌翻譯、有道翻譯官、搜狗翻譯三款翻譯軟件同臺競技,實測翻譯效果。最終,有道翻譯官憑借著突出的對話翻譯和拍照翻譯功能,以及幾乎無短板的優(yōu)勢,在比賽中拔得頭籌。

比賽規(guī)則是三局兩勝,第一局是「溝通大挑戰(zhàn)」,挑戰(zhàn)對話翻譯。第二局是「口音大評測」,挑戰(zhàn)產(chǎn)品的識別翻譯。第三局是「拍照大 PK」,挑戰(zhàn)圖像翻譯。除了翻譯產(chǎn)品,現(xiàn)場還邀請了 3 位挑戰(zhàn)者一起來“折磨”翻譯軟件,挑戰(zhàn)人工智能對人類的理解和忍耐極限。

挑戰(zhàn)經(jīng)典,看人工智能翻譯如何“真情告白”第一局里先“上場”的是谷歌翻譯,隨機翻譯一段對話。但可能是第一上場的緣故,谷歌翻譯表現(xiàn)并不理想。比如挑戰(zhàn)者說:“我好像被你嫌棄了的樣子”,谷歌翻譯卻譯成了:“I really want to be your\u00A0 ex-wife, look.”,意思完全不對。測試有道翻譯官的素材,來自《大話西游》的經(jīng)典臺詞,“曾經(jīng)有一份真摯的愛情擺在我面前,但是我沒有好好珍惜。”“等失去后我才后悔莫及,人世間最痛苦的事莫過于此。”“如果上天再給我一次,我會對那個女孩說三個字:我愛你”有道翻譯官給出的翻譯結(jié)果是:“There once was a ture love before me, but I didn’t cherish it”“ when I lost my later regret, the most painful thing in the world is this.”“ If God give me one opportunity again, I can say 3 words for that girl: I love you.”,這已經(jīng)十分準確到位了。值得一提的是,有道翻譯官的使用體驗最流暢的,幾乎沒有卡頓并且能第一時間外放出翻譯結(jié)果。搜狗翻譯也發(fā)揮正常,對于“你的聲音里,滿滿的都是我們將要創(chuàng)造的美好回憶”這樣的挑戰(zhàn)能夠準確完成。不過在英文翻譯中文的過程中,發(fā)音比較容易混淆的 sing 被搜狗翻譯成了 see,“我喜歡你,我感覺你能看到我”也被誤翻譯成了“I like your business, look.”。至此,有道翻譯官率先拿下一局。

拍照翻譯,看人工智能黑科技如何“即拍即譯”第二局的口音大評測環(huán)節(jié),三款翻譯軟件都表現(xiàn)突出,翻譯得都比較準確。挑戰(zhàn)者演唱了一首 Lady Gaga 的 《Telephone》和說唱歌手 Eminem 的 《Lose yourself》開頭的幾句,Google 翻譯和有道翻譯官翻譯結(jié)果都不錯,而搜狗翻譯也同樣表現(xiàn)良好。直到第三局“拍照翻譯”環(huán)節(jié),再一次拉開實力的差距。主持人隨機挑選了BBC上一篇題為《How Greenland would look without its ice sheet》的新聞報道。

三款翻譯軟件現(xiàn)場的翻譯結(jié)果是這樣的:Google\u00A0翻譯:如何格陵蘭島看起來沒有它的冰 表。有道翻譯官:如果沒有冰蓋,格陵蘭島將會怎樣?搜狗翻譯:如果沒有冰,格陵蘭島將會怎樣。換行之后又多翻譯了一個字:表。筆者親測的效果也差不多,而且排版上看,有道翻譯官整潔很多:

在圖例注釋的翻譯中,也只有有道翻譯官將“The map reveals a hidde world of mountains and canyons”翻譯為“這張地圖揭示了一張隱藏的山脈和峽谷”,而Google 翻譯和搜狗翻譯的結(jié)果都是:“療法 安塞德”。

最終,憑借在對話翻譯、拍照翻譯中的出色表現(xiàn),有道翻譯官奪得此次人工智能翻譯大賽冠軍。而現(xiàn)場的不少觀眾也被比賽過程中各種精準的翻譯結(jié)果所折服,紛紛表示“簡直碾壓了我四級英語水平。”此前,由第三方翻譯評測機構(gòu)“試譯寶”發(fā)起的一場人機翻譯PK賽中,以有道翻譯領(lǐng)銜的機器翻譯軍團,以碾壓之態(tài)勝過人類翻譯軍團。“截止12月19日最新的結(jié)果,人類獲得32%譯星,機器獲得68%譯星。在機器軍團貢獻榜,有道獲得譯星最多,遠多于谷歌、百度、搜狗和必應(yīng)。(,獲得譯星越多,表明翻譯準確度越高;數(shù)據(jù)來源“試譯寶”)

有道神經(jīng)網(wǎng)絡(luò)翻譯,讓翻譯更“聰明”實際上,人工智能的突飛猛進,已經(jīng)在很多領(lǐng)域帶來了驚人的改變。以機器翻譯領(lǐng)域為例,今年5月正式推出的有道神經(jīng)網(wǎng)絡(luò)翻譯,實際上正是此次人工智能翻譯大賽的真正主角。其給機器翻譯帶來的效果提升,是過去統(tǒng)計翻譯模型(SMT)十年的總和,有些翻譯效果甚至堪比專業(yè)八級水平。作為目前機器翻譯領(lǐng)域最前沿的技術(shù),神經(jīng)網(wǎng)絡(luò)翻譯(NMT)采用獨到的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)Ψg的全過程整體建模,整個神經(jīng)網(wǎng)絡(luò)翻譯模型更像一個有機體。它能對整個句子進行編碼,能夠更充分地利用上下文信息,判定多義詞的詞義,生成更高質(zhì)量的譯文。NMT翻譯出來的句子結(jié)構(gòu)完整,語序更接近人類語言使用習慣,翻譯結(jié)果更加通順。

而神經(jīng)網(wǎng)絡(luò)翻譯模型各家都在用,為什么有道神經(jīng)網(wǎng)絡(luò)翻譯的效果卻更好呢?此前,網(wǎng)易有道首席科學家段亦濤曾表示,其原因在于有道在用戶翻譯場景上十年的積累,尤其是在中文查詞、翻譯等方面,使得其擁有獨有的、極其豐富的數(shù)據(jù)資源和技術(shù)沉淀;有道的技術(shù)團隊還攻克了數(shù)據(jù)處理、大規(guī)模框架、模型優(yōu)化、領(lǐng)域適配等技術(shù)難題,并開發(fā)出一些特有的技術(shù),比如領(lǐng)域適配技術(shù)。例如,在此次人工翻譯大賽中表現(xiàn)突出的對于新聞的拍照翻譯,就是緣于有道神經(jīng)網(wǎng)絡(luò)翻譯在新聞、學習、口語和一些科技領(lǐng)域等場景下,把翻譯效果做到了最優(yōu)。據(jù)悉,有道神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)目前已經(jīng)全面應(yīng)用于有道詞典、有道翻譯官、有道翻譯網(wǎng)頁版、翻譯蛋等產(chǎn)品中,同時已接入有道智云開放平臺,面向所有開發(fā)者開放,超過8億用戶正在享受有道神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)帶來的高效與便利。