9月21日,一篇指責科大訊飛“AI同傳造假”的文章引發了社會廣泛關注,文中知乎用戶、同傳譯員Bell Wang表示,在日前舉行的2018創新與新興產業發展國際會議上,科大訊飛在現場和直播中展示的“AI同傳”,用的其實是自己現場同傳翻譯的內容。
當晚,科大訊飛在電話會議回應中稱:應主辦方要求提供語音識別技術,直接轉寫譯員翻譯結果在會場大屏呈現,主辦方同時要求在直播中合成識別結果,展示最新語音合成技術。
早在2017年,“科大訊飛翻譯機讓同傳下崗”的文章就刷爆各大平臺,表示同聲傳譯職業將直接消亡、被科大訊飛機器翻譯技術完全替代。這次的事件再一次引發熱烈討論:機器翻譯技術與同聲傳譯之間到底還有多少差距?
事件回溯與科大訊飛回應
9月20日,Bell Wang發表文章稱“要揭露一下所謂智能翻譯的真相”,他表示在知領直播平臺的“機器同傳”,就是把同傳譯員的聲音精確轉錄為文本,然后再語音合成為機器聲音向聽眾播放。
文章稱,“科大訊飛事前沒有告知有語音識別的字幕,沒有告知直播的同傳是機器朗讀同傳經過識別出來的文稿,更沒有征得同意就冒名使用了譯員翻譯成果。”
他的文章發出后,同傳圈也“炸了鍋”。微博博主“同聲翻譯櫻桃羊”表示:“現在這種所謂的‘人機耦合’,實行之前和譯員溝通過么?有沒有調查過譯員是否接受這種方式?縱觀整件事,譯員的意見在哪一個環節得到了尊重?” 當晚,針對Bell Wang的質疑,科大訊飛回應稱:“科大訊飛目前翻譯服務主要提供兩種方案:一種是全自動翻譯,現場機器翻譯并同步展示在屏幕上,沒有任何人工同傳參與;另一種是人機耦合翻譯模式,由機器提供語音轉寫和翻譯結果給同傳參考。”
機器同時提供轉寫和翻譯服務時,文字展示區Logo顯示為“訊飛聽見—離線翻譯系統”;機器僅提供轉寫服務時,文字展示區Logo顯示為“訊飛聽見”。
科大訊飛表示,“某位同傳譯員對于科大訊飛產生了誤解,是對會議服務方面的分工溝通了解不清,也沒有聽到科大訊飛的說明。”
針對科大訊飛的回應,《中國科學報》記者聯系了Bell Wang,但他表示不能接受采訪。對科大訊飛提到的“應主辦方要求展示最新語音合成技術”,他回應道:“只能無可奉告,我不能說啥”。
同時記者注意到,Bell Wang在知乎上的文章在9月21日晚上有修改痕跡,他在開頭聲明:對視頻進行了修改。
機器翻譯能否替代同傳譯員?
來自科大訊飛微信公眾號的內容顯示,目前機器翻譯的主流方式叫“統計翻譯”,其基本原理是:從語料庫大量的翻譯實例中自動學習翻譯知識,然后利用這些翻譯知識自動翻譯其他句子。
那么隨著機器翻譯技術的進步,不少人會發出疑問:機器會搶同聲傳譯的飯碗嗎?
科大訊飛創始人、董事長劉慶峰表示:“我們希望用機器幫助頂尖同傳更好地發展他的能力,機器和人未來必須是協同的。”
一位不愿具名的專家告訴記者:“訊飛的技術在國內語音行業積累較多,但目前的情況是,人工智能只是處在初級階段,機器翻譯的難點在于語音識別和語義識別。在語義識別上,現在全球做得都不是太好。”
“目前機器在字、詞的識別速度上是快于人的,但人在語意理解和提煉上又優于機器。因此,各取所長、優勢互補的人機耦合是一個重要發展方向。”一位訊飛聽見工作人員在接受其他媒體采訪時說。
9月21日,記者曾聯系科大訊飛執行總裁、消費者事業群總裁胡郁,他表示“要找市場部和公關部,本人不作回應”。但當天下午胡郁在微博發聲:“目前整個行業機器同傳處于風口浪尖之上,不同廠商之間的競爭日加激烈,主要原因還是動了誰的奶酪吧。”
上述不具名的專家認為,網絡媒體對人工智能存在過度宣傳和炒作。“受到利益驅使,一些企業利用媒體進行宣傳,同時網絡媒體也不會對內容和信息準確性進行核實,就造成了目前的狀況。”
胡郁還在微博中表示:“我相信大家也都知道科大訊飛真正的機器同傳和將同傳人員的語音轉換成文字貼出來便于大家理解是兩個完全不同的事情。不管是前者還是后者,都經過了廣大最終用戶和同傳從業人員的檢驗,我就不再多說了。”
專家表示AI同傳還不是一項成熟技術
自1989年美國成功做出第一個語音翻譯系統以來,眾多科研機構和包括微軟、百度在內的公司都在進行AI翻譯的研究。得益于人工神經網絡的深入研究,這些年,AI同傳技術發展很快。
“但是,這仍然不是一項成熟的技術,AI同傳仍然有很多技術難題需要攻克。”中國科學院自動化研究所研究員宗成慶告訴《中國科學報》記者。
就目前AI同傳技術水平而言,在某些簡單的場景中,可以實現較準確的語言同步翻譯,如問路。但是,在復雜、專業、嚴謹的場景中,AI無法實現精準翻譯,做到“信”“達”“雅”。
出于語言本身的特點,詞匯有多重含義,且經常出現有歧義、似是而非的語句。其次,口語的規范性不高,有很多省略、顛倒句式。此外,說話人的口音、語速、多種語言混合,場景其他聲源的干擾,也會讓AI同傳“不知所措”。
“但最重要的一點是,機器無法精準把握說話人的意圖。對語義的理解不夠,是目前AI同傳尚未解決的一大難題。因此,目前AI同傳無法高水平地替代人工翻譯。”宗成慶說。
宗成慶介紹,語音轉文字技術主要的難點是同音字、詞的處理,不同的字、詞有相同的發音,需要結合上下文進行判斷,如“保鮮”和“保先”、“反攻”和“返工”。
由于語音識別技術不需要太多的語言理解,在聲源干擾不強烈的情況下,較標準的語音可以轉換成準確率較高文本。“這比AI同傳成熟得多、容易得多。”宗成慶表示。
(記者趙廣立對本文亦有貢獻)
摘自《中國科學報》