Re: [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英

作者: derekhsu (華麗的天下無雙)   2018-03-15 19:03:31
※ 引述《Cyuhsuan (姆斯沒去過強隊)》之銘言:
: 1.媒體來源:
: iThome
: 2.完整新聞標題:
: 機器翻譯大突破!微軟加入新方法,AI中翻英程度達人類專業水準
: 3.完整新聞內文:
: 微軟AI研究團隊近日於官方的部落格中表示,微軟的AI機器翻譯系統可以將中文的新聞文章翻譯成英文,透過雙語專業人員評估,AI機器翻譯系統的表現與人類相當,微軟表示,中文和英文有較充足的詞彙資料庫,透過新聞的常見詞彙搭配深度學習演算法,再加入新方法模仿人類翻譯的流程,不斷地調整,讓機器翻譯系統產出的結果更加準確。
: 特別的是,微軟的研究團隊在AI機器翻譯系統中,加入雙重學習(Dual learning)的機制,也就是說,系統將中文的新聞文章翻成英文後,會再將英文的翻譯結果翻成中文,重新比對兩者的相似性,並讓系統從錯誤中學習。除此之外,該AI機器翻譯系統還加入了審議網路(Deliberation network),系統會學習研究員翻譯句子的過程,模擬人類一次次編修文字的過程。
: 而為了確保翻譯結果的準確性,微軟加入聯合訓練方法(Joint training),透過中翻英和英翻中2個系統交互學習,英翻中的系統可以提供新的中文句子,與原文的中文句子形成一組資料集,增加訓練集的資料量,中翻英也是如此,將2個系統互相學習時,即可以改善各自的準確率。
: 另外,微軟也嘗試採用一致性正規化(Agreement regularization)的方法來加強翻譯結果的準確性,簡單來說,AI機器翻譯系統從左到右,或是從右到左閱讀語句,翻譯出來的結果必須一致,微軟相信,系統若產生相同的翻譯結果,是比較準確的。
: 在微軟負責語音、自然語言和機器翻譯的技術團隊成員Xuedong Huang表示,這項成果是自然語言處理任務中,非常重要的里程碑,機器翻譯達到人類的水準一直是團隊的目標,他表示,沒想到這麼快就能實現。
: 過去幾十年來,機器翻譯一直是研究員想要解決的問題之一,許多語言專家也認為機器翻譯不可能達到人類的水準,這項成果雖然是重要的里程碑,但是不代表機器翻譯的問題已經解決,微軟亞洲研究院副院長周明表示,還有許多挑戰和問題,像是在即時新聞上測試機器翻譯系統,他期待,這項成果可以應用在不同的語言,甚至是不同的AI研究領域中。
: 4.完整新聞連結 (或短網址):
: https://www.ithome.com.tw/news/121818
: 5.備註:
: 翻譯人員是否要失業了?
這個翻譯系統目前還在實驗室,所以我們無法測試,不過根據Google以及微軟(Bing)
目前在線上的系統來看,我們還是可以看得出目前英文自動翻譯中文的極限。
然後,其實這世界上執行英翻中最強的公司,並非Google以及微軟。
而是中國公司「有道詞典」。以目前Google跟Bing的翻譯結果來看,他們要達到有道
的程度還差很遠,所以我是滿懷疑微軟能達到的成效。有道詞典即使面對GRE等級的
閱讀,也可以達到相當令人滿意的翻譯結果。
我用這篇CNN今天的新聞為例,分別用Google, Bing以及有道詞典的類神經網路翻譯
得到的結果,我附在最後面,我知道大家不太有時間看,所以我挑幾句翻譯的摘要
詳情可以看最後的內容。
http://cnn.it/2FSD3Me
原文:
"This latest action by Russia fits into a pattern of behavior in
which Russia disregards the international rules-based order,
undermines the sovereignty and security of countries worldwide,
and attempts to subvert and discredit Western democratic
institutions and processes."
Bing:
"俄羅斯最近採取的行動符合一種行為模式, 俄羅斯無視國際規則秩序, 破壞
世界各國的主權和安全, 企圖顛覆和詆毀西方民主體制。和進程。
Google:
“俄羅斯這一最新行動符合俄羅斯無視國際規則秩序,破壞世界各國主權和
安全的行為模式,並試圖顛覆和詆毀西方民主機構和進程。”
有道詞典:
“俄羅斯最近采取的行動符合俄羅斯無視國際規則秩序的行為模式,破壞了
世界各國的主權和安全,並試圖顛覆和敗壞西方民主體制和進程。”
評論-Bing無法正確翻譯which子句,他的中文裡面第一句話跟第二句話兩個俄羅斯
都變成了主詞,這破壞了原本英文的詞性。最後一句話的and居然被翻譯成兩句話。
Google的翻譯基本上大致正確,但是對於子句的認知感到有點奇怪。原文中逗號的
三句話的主詞都是This latest action by Russia,應該是 fits..., undermines...,
跟and attemps to...這三句詞,用,跟and連接起來。但Google把第一句跟第二句混在
一起,變成「符合俄羅斯...秩序,破壞..模式」這也翻譯不正確。
而有道詞典厲害的地方在於,他不但正確判斷了三個子句,他也跟Bing一樣補上了
「採取」,原主詞原本可以寫成The latest action (taken) by Russia。基本上
有道翻譯的結果不用任何修飾,直接可以變成新聞稿。
原文:
The United Kingdom believes Russia was behind the attempted
murders of Sergei Skripal and his daughter Yulia because the nerve
agent used, Novichok, was developed in the Soviet Union and could
not be replicated by non-state actors. London announced Wednesday
it would expel 23 Russian diplomats after Moscow failed to meet a
UK deadline to give a "credible response."
Bing:
英國認為, 俄羅斯是在試圖謀殺謝爾蓋 Skripal 和他的女兒的背後, 因為使
用的神經代理, 諾維喬克, 是在蘇聯發展, 不能由非國家行動者複製。星期
三, 倫敦宣佈將驅逐23俄羅斯外交官, 因為莫斯科未能在英國最後期限前做
出 "可信的回應"。
Google:
聯合王國認為,俄羅斯支持對Sergei Skripal和他的女兒尤利婭的企圖謀殺
背後,因為使用的神經毒劑Novichok是在蘇聯開發的,無法由非國家行為體
複製。倫敦週三宣布,在莫斯科未能在英國的最後期限之前提出“可信的回
應”,將驅逐23名俄羅斯外交官。
有道詞典:
聯合王國認為,俄羅斯是企圖謀殺謝爾蓋·斯克裡帕爾和他的女兒尤利婭的
幕後黑手,因為他們使用的神經毒氣,諾維科夫,是在蘇聯發展起來的,不
能被非國家行為者復制。倫敦周三宣布,將驅逐23名俄羅斯外交官。此前,
莫斯科未能在英國的最後期限前給出“可信的回應”。
評論-Bing翻譯姓名只翻譯了一半,無法正確翻譯behind,nerve agent翻成神經代理
,數字背後不會接量詞(這是英翻中一項最困難的一點)。不過Bing執得稱讚的一點
是他是唯一翻譯出「英國」的翻譯系統。
Google跟Bing一樣無法應對behind的翻譯,但是正確的把develop翻成了開發,然後
「非國家行為體」也是三者當中似乎最靠近原意的,但是他最後卻嚴重了誤判了最後
一段,雖然他正確補上了「名」但是,他把順序搞錯了,俄羅斯已經錯過了deadline
,而Google卻翻譯成if。
有道詞典最棒的地方是它成功的把behind翻譯成幕後黑手,這句話翻譯得很漂亮,可惜
聯合王國依然無法翻譯成英國,沒能把develop翻譯成開發。「非國家行為者」有點
奇怪,整體來說,依然是三者最優。
原文:
But Haley laid the blame firmly at Russia's door. Highlighting
Moscow's support of the Assad regime in Syria following that
government's use of chemical weapons against civilians, Haley told
fellow diplomats the world had reached "a defining moment."
Bing:
但是海莉把責任牢牢地放在了俄羅斯的門上。在敘利亞政府對平民使用化學
武器後, 俄羅斯支援阿薩德政權, 哈利告訴外交官們, 世界已經達到了 "一
個決定性的時刻"。
Google:
但是海莉牢牢地將責任歸咎於俄羅斯的大門。海萊在政府對平民使用化學武
器之後強調莫斯科支持敘利亞的阿薩德政權,他告訴外交官,世界已經達到
了“一個決定性時刻”。
有道詞典:
但海利卻把責任推到了俄羅斯的家門口。在敘利亞政府使用化學武器對付平
民之後,哈雷強調了莫斯科對敘利亞阿薩德政權的支持,他告訴其他外交官
,世界已經到了“決定性時刻”。
評論-Bing沒有翻譯出Highlighting,「把責任牢牢地放在了俄羅斯的門上」感覺
非常奇怪。Haley在前後兩句話姓名可以翻成兩個不一樣的海莉跟哈利?
「fellow diplomat」的fellow沒有翻譯出來。
Google這句「但是海莉牢牢地將責任歸咎於俄羅斯的大門」完全不知所云,甘俄羅斯
的大門什麼事?然後一個Haley在前後兩句話姓名可以翻成兩個不一樣的-海莉跟海萊
。「fellow diplomat」跟bing一樣沒有翻譯出來
有道詞典:「但海利卻把責任推到了俄羅斯的家門口。」是唯一合理把door的意思準
確用中文翻譯出來的系統,「Highlighting」正確翻譯出「強調」,不過整句話「
強調」應該翻譯成「哈雷強調了莫斯科在敘利亞政府使用化學武器對付平民之後對敘
利亞阿薩德政權的支持」比較通順。正確的翻譯出「其他外交官」但是他們還是無法
正確應對姓名的翻譯,跟Bing以及Google一樣。Haley變成海利跟哈雷。
作者: irumina   2017-03-15 19:03:00
推!!!
作者: medama ( )   2018-03-15 19:05:00
感謝分享 下次試用看看
作者: livewater (螢幕比本人帥)   2018-03-15 19:05:00
難得有認真文
作者: conpo (獅子たちの旗)   2018-03-15 19:06:00
感謝分享
作者: wayne1997 (大俠皮老闆)   2018-03-15 19:06:00
認真文 推
作者: sads333 (阿鼎)   2018-03-15 19:07:00
推中國AI 比歐美強太多了
作者: medama ( )   2018-03-15 19:07:00
好像要安裝才能用 沒有網頁版整篇翻譯 不太方便
作者: arod13arod (50_ohm)   2018-03-15 19:07:00
內行優質文給推
作者: Yui5 (唯控)   2018-03-15 19:08:00
認真給推,不知道有道翻日文會不會比日本的Exite好
作者: jerrylin (嘴砲無視)   2018-03-15 19:08:00
可是中國的東西碰到關鍵字不就被卡掉了嗎
作者: Yui5 (唯控)   2018-03-15 19:09:00
不過Google和微軟面向的都是英語客戶較多吧,中翻英會更好?
作者: StarTouching (撫星)   2018-03-15 19:09:00
太好了 以後看mcstories有中文了
作者: TimeLeft (100天)   2018-03-15 19:10:00
作者: eddieyu (正妹都愛ばか囧)   2018-03-15 19:10:00
專業推
作者: ABuJiuHaoBun (新資料夾(2))   2018-03-15 19:11:00
習包子維尼64沒辦法翻譯啊
作者: StarCat76 (灰色星星)   2018-03-15 19:12:00
翻譯王
作者: gibson72 (丹神快拜)   2018-03-15 19:13:00
日文表現九彎十八拐 希望可以達成
作者: legendsleep (時渡)   2018-03-15 19:13:00
其實有道辭典的資料庫背後都是幾十萬個童工在翻譯
作者: Yui5 (唯控)   2018-03-15 19:15:00
去有道翻譯網站,下面號稱有人工翻譯時刻待命XDD好肝……
作者: derekhsu (華麗的天下無雙)   2018-03-15 19:16:00
人工翻譯還滿便宜的,很誇張很誇張照他們的翻譯金額,台灣的翻譯社都倒光了
作者: silverair (木柵福山雅治)   2018-03-15 19:18:00
我覺得是本身就是中文語系,最佳化可能比較容易吧,我
作者: dv6 (為台灣加油)   2018-03-15 19:18:00
認真文
作者: avans (阿緯)   2018-03-15 19:20:00
推 認真比較機翻效果!
作者: pttpepe (Ptt屁屁)   2018-03-15 19:20:00
這翻譯品質令人驚訝...
作者: seemoon2000 (no)   2018-03-15 19:21:00
我剛剛貼了我論文上去 真的滿屌...
作者: Yui5 (唯控)   2018-03-15 19:22:00
剛試了有道和百度的網頁翻譯看小說家日文,感覺有道沒百度好
作者: gn00295120 (Longway)   2018-03-15 19:22:00
台灣的翻譯社本來就快倒光了 有些還都等大陸翻好再簡轉繁
作者: KangSuat   2018-03-15 19:23:00
訊飛比google語音輸入好很多 win7可用 win10問題多
作者: Yui5 (唯控)   2018-03-15 19:23:00
在測試了下google原生翻譯…好吧完全看不懂了…
作者: shutout5566 (5566給我閉嘴!!打個電話 )   2018-03-15 19:23:00
好猛的AI....
作者: Yui5 (唯控)   2018-03-15 19:25:00
純粹看小說家這種網路小說日翻中,對比了下還是百度最好…
作者: KangSuat   2018-03-15 19:25:00
看到有人說訊飛不再開發支援電腦 專注在手機市場
作者: Szmanda87 (豬豬愛搗蛋)   2018-03-15 19:26:00
推,很強的感覺,你也太認真測試了
作者: Yui5 (唯控)   2018-03-15 19:26:00
有道把ドラゴン翻譯成勇者我直接傻眼……
作者: or0706555 (owentw)   2018-03-15 19:26:00
作者: pttpepe (Ptt屁屁)   2018-03-15 19:27:00
大概都是中文語系 在開發的時候會比較考慮使用者問題
作者: peter41308 (peter)   2018-03-15 19:28:00
日文機翻的話,有些日轉英比直接轉中文還要清楚
作者: Yui5 (唯控)   2018-03-15 19:30:00
百度翻譯AI是不是比較宅XD?記得以前有人說lulu譯成魯魯修
作者: Plot3D (3D做圖)   2018-03-15 19:30:00
中國真是世界最大亂源
作者: schumi7401 (死蚊子給我出來)   2018-03-15 19:30:00
嗯嗯
作者: lazioliz   2018-03-15 19:30:00
為什麼新聞說中翻英這邊整篇都是英翻中啊?
作者: iceyeman (Xen)   2018-03-15 19:31:00
剛才翻笑話 威力不錯 有空拿雙關試試
作者: king22649   2018-03-15 19:31:00
google那是免錢的翻譯? 還是另一個google翻譯?上面的google翻譯 是用這個嗎?https://cloud.google.com/translate/
作者: vvrr (vvrr)   2018-03-15 19:33:00
人工智慧 vs 工人智慧
作者: derekhsu (華麗的天下無雙)   2018-03-15 19:33:00
免費的,那我用這個翻看看,等等
作者: king22649   2018-03-15 19:36:00
google的ml系列都丟在cloud platform
作者: DH3020 (ckcloud)   2018-03-15 19:37:00
百度超宅的,看fate同人結果專有名詞全翻出來
作者: derekhsu (華麗的天下無雙)   2018-03-15 19:38:00
你提供的這個比免費Google翻譯好,但還是不如有道很多
作者: wulaw5566   2018-03-15 19:44:00
中國軟體真的猛
作者: IHD (終於要等到時空變異了嗎?)   2018-03-15 19:48:00
考試能帶電腦嗎?能就有救 不能?那一樣沒救啊
作者: weliche (時雨)   2018-03-15 19:49:00
這翻譯機好猛....
作者: jupei (沛)   2018-03-15 19:50:00
其實是真人ㄧ人ㄧ行翻

Links booklink

Contact Us: admin [ a t ] ucptt.com