用經典文學測試新版 Google 翻譯,「取代人類還需要時間」

作者 | 發布日期 2016 年 10 月 04 日 7:22 | 分類 Google , 軟體、系統 follow us in feedly

9 月 27 日,Google 發表了神經機器翻譯系統(Google Neural Machine Translation,GNMT),並且將 GNMT 投入到了難度係數頗高的中文─英語翻譯應用中,準確率得到相當程度的提升,英語專業的群眾紛紛表示遭遇一次重大的失業危機。



Google Research Blog  上的相關文章指出,GNMT 使用了當前最先進的訓練技術,能夠達到目前為止機器翻譯品質的最大提升。

pingwest 配圖

圖表顯示,在這幾種翻譯模式中,中翻英是最難的。

儘管機器越來越聰明,但也有研究翻譯的人類代表站了出來。經常活躍於社群媒體上「翻譯」話題的華東師範大學比較文學教授金雯(ID:莫水田)撰文指出:

Google 中翻英對寫得像英文的中文句子比較能應對自如,就是那些主語謂語賓語等成分清晰的句子。尤其驚豔的是對於包含 2、3 個短句,當中用逗號連接,邏輯關係清晰(即西化)的中文句子,Google 翻譯能夠正確辨識何為主句,何為表達因果、伴隨狀態的狀語從句。當然,對許多四字成語和俗語(如「樑上君子」、「圖樣圖森破」等)也有備而來,至少在單獨出現的時候能夠辨別並正確翻譯。

這也就是說,Google 中翻英比較適用於一板一眼的中文,比如寫得乾澀而又十分清晰的科學論文和人文社科類論文(即便是這類論文,也會出現機器無法處理的長難句),或許也適用於一部分新聞社論。這類中文用 Google 翻譯成英文後,經人工修改把關,問題就不大了。這樣的確可以節省許多初級、機械的翻譯人工,對翻譯生產力是一種解放。至於會不會引發大量翻譯失業的問題,還不能就此做出判斷。

然而,Google 中翻英對於大部分散文作品、日常電郵交流(可能有官話,可能有省略式表達)、口語化的生動表達、詩詞曲藝、文字遊戲等,都還只能望洋興嘆。而且,我發現,即使是 Google 認識的短句式和俗語,出現在有些複雜蜿蜒的句子中時,也會讓 Google 犯迷糊。

中文與英文也有許多不兼容的地方,有自己獨特而狡黠的語法。況且,自然語言是靈動的,不論中英文,寫的靈動的時候都是不容易理解的。對語言的靈動,機器目前是無能為力的,不知未來如何。還是希望研究語言文學的人與科技界人士多多交流互補,雖然主力軍還是人工智慧人士。

有的人說,為了使用 Google 翻譯,可以將自己的中文句子寫成機器可以辨認的樣子。這個技巧當然是沒錯的,為了論文能夠順利快速地翻譯成英文,也不失為一個權宜之計。可是這項技術不應該是為人服務的嗎?如果讓自然語言削足適履,科技就真的變成禁錮人類語言才華的枷鎖了。

有的人就拿文言文去調戲 Google 中翻英,但這種「松下問童子」式的機巧並不能令人滿足。

Screen Shot 2016-10-03 at 5.23.37 PM

因此,我選擇把一些大家熟知的著名段落交給 GNMT,進行中英對比。這些段落難易有別,有的原著是英文、有的是中文,有的是兩者之外的其他語言,還有的曾透過英中翻譯,經過了不同譯者之手。它們不能做為嚴謹的語言學研究素材,至少可以得出一個結論──優秀的翻譯仍然是手藝活兒。

1、段落節選自《百年孤獨》,原文西班牙語,作者加布列·賈西亞·馬奎斯

英語版本,譯者 Gregory Rabassa:

Many years later, as he faced the firing squad, Colonel Aureliano Buendía was to remember that distant afternoon when his father took him to discover ice.

中文版本,譯者范曄:

多年以後,面對行刑隊,奧里雷亞諾.布恩迪亞上校將會回想起父親帶他去見識冰塊的那個遙遠的下午。

這是《百年孤獨》的經典開頭,幾個中文譯本差別不大,這裡就考考 Google 對中文版本的翻譯:

Years later, in the face of the firing squad, Colonel Orijano Buendia recalls the distant afternoon when his father took him to see the ice.

基本上準確率還是不錯的。

 

2、段落節選自《大亨小傳》,原文英語,作者史考特·費茲傑羅

英語版本:

In my younger and more vulnerable years my father gave me some advice that I’ve been turning over in my mind ever since.

“Whenever you feel like criticizing anyone,”he told me,”just remember that all the people in this world haven’t had the advantages that you’ve had.”

中文版本,譯者巫寧坤:

我年紀還輕,閱歷不深的時候,我父親教導過我一句話,我至今還念念不忘。

「每逢你想要批評任何人的時候,」他對我說,「你就記住,這個世界上所有的人,並不是個個都有過你那些優越條件。」

這是另一個著名的開頭,就詞句本身來說也很簡單,由於原文就是英語,這次就讓 Google 來做英譯中的工作:

在我更年輕,更容易年,我的父親給了我一些建議,我一直在我心中從此翻身。

「每當你覺得批評任何人,」他告訴我,「只記得,所有的在這個世界上的人都沒有,你有過的優勢。」

前半句的錯誤還是非常明顯,失去了一些字詞,也沒能翻譯出願意;後半句基本能讓人明白,但仍然稱不上通順。

 

3、段落節選自《萬壽寺》,原文漢語,作者王小波

中文版本:

莫迪阿諾在《暗店街》裡寫道:「我的過去一片朦朧……」這本書就放在窗台上,是本小冊子,黑黃兩色的封面,紙很糙,清晨微紅色的陽光正照在它身上。

英文《萬壽寺》本身就是非常好的中文小說,我們就直接把 Google 請出來:

“My past is hazy …” the book was placed on the windowsill, this brochure, black and yellow cover, the paper is very rough, early morning micro The red sun was shining on it.

不知道為什麼,Google 省略掉了莫迪阿諾和《暗店街》,「清晨微紅色的陽光正照在它身上」這半句也沒能翻譯出來。

 

4、段落節選自《論十大關係》,原文漢語,作者毛澤東

漢語版本:

什麼是國內外的積極因素?在國內,工人和農民是基本力量。中間勢力是可以爭取的力量。反動勢力雖是一種消極因素,但是我們仍然要做好工作,盡量爭取化消極因素為積極因素。在國際上,一切可以團結的力量都要團結,不中立的可以爭取為中立,反動的也可以分化和利用。總之,我們要調動一切直接的和間接的力量,為把我國建設成為一個強大的社會主義國家而奮鬥。

也直接請出 Google:

What are the positive factors at home and abroad? In the country, workers and peasants are the basic forces. The middle forces are the forces that can be striven. Although reactionary forces are a negative factor, we still have to do our best to try to turn negative factors into positive factors. In the international arena, all forces that can be united must be united, neutrality can be striven for neutrality, reaction can be divided and utilized. In short, we must mobilize all direct and indirect forces, to build our country into a strong socialist country and struggle.

由於《論十大關係》最初就是一份會議講話,因此文本更口語化,只要理解其中的概念,基本上是很易懂的,所以不論是語法還是字詞都顯得翻譯通順了許多。

(本文由 PingWest 授權轉載)

延伸閱讀:

關鍵字: , ,

發表迴響