微軟亞洲研究院與雷德蒙研究院團隊宣布,其研發的機器翻譯系統突破了數十年來的技術關卡,在中文新聞翻譯成英文的任務中,達到了可與人工翻譯媲美的水準。
微軟技術院士黃學東表示,翻譯是自然語言處理領域最具挑戰性的任務,「在機器翻譯方面達到與人類相同的水準是所有人的夢想,我們沒有想到這麼快就能實現。」他表示,「消除語言障礙,代表人們的溝通進步,這非常有意義,值得我們多年來為此付出的努力。」
機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水準。雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。
由於表達同一個句子的「正確的」方法不止一種,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,「由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的演算法和系統去應對。」
突破機器翻譯難關
創新AI技術神助攻
該研究使用的資料為「newstest2017」新聞報導測試集,包括約2000個句子,由專業人員從線上報紙樣本翻譯而來。為了確保翻譯結果準確且達到人類的翻譯水準,微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。
微軟亞洲研究院機器學習組將他們的最新研究成果 -「 對偶學習(Dual Learning)」和「推敲網路(Deliberation Networks)」應用在此次取得突破的機器翻譯系統中。
例如,使用「對偶學習」技術,可以讓中翻英、英翻中兩個對偶的任務互相充當對方的環境,並互相產生有效的回饋信號,而這些回饋資訊可以用來訓練深度學習模型。