國際口語翻譯先進(jìn)研究聯(lián)盟(U-Star)日前在倫敦發(fā)布23國語言翻譯實驗系統(tǒng),以多國語言翻譯服務(wù)迎接奧運。作為該聯(lián)盟的發(fā)起單位之一,中科院自動化所承擔(dān)了其中中英互譯項目。
此次發(fā)布會由日本情報通信研究機構(gòu)(NICT)主辦,來自26個研究機構(gòu)的代表出席發(fā)布會,會上進(jìn)行了多人同時運用不同語言的在線翻譯展示。
U-Star此次發(fā)布的系統(tǒng)名叫“Voice Tra4U-M”,涵蓋了世界應(yīng)用較為廣泛的23個語種,并能同時支持5人以移動終端在不同地點用不同語種進(jìn)行實時對話?;谠撓到y(tǒng),會話用戶在手機上以各自語種通話,系統(tǒng)會將各方的語音信息通過網(wǎng)絡(luò)傳送到后臺云計算中心,計算中心首先對口語語音進(jìn)行識別,并將語音信息轉(zhuǎn)換為文本信息,隨后將文本信息翻譯為會話各方所需語種的文本信息,最后通過文本轉(zhuǎn)語音模塊,將翻譯后的目標(biāo)語音發(fā)送到相應(yīng)會話用戶的手機上,從而實現(xiàn)跨語種對話。
實現(xiàn)無障礙的跨語言溝通一直是機器翻譯追求的目標(biāo)。從1945年信息論先驅(qū)Warren Weaver提出機器翻譯的可計算性,計算機自動翻譯之路已走了60多年。而由于語音識別因口音問題帶來的大量模糊,以及周圍環(huán)境中的噪音影響,正確可靠的口語翻譯并不是一件容易的事,科學(xué)界一度將此技術(shù)突破的難度比作“人類登陸火星”。
近年來,互聯(lián)網(wǎng)海量數(shù)據(jù)的爆炸性增長、大規(guī)模云計算技術(shù)應(yīng)用為口語翻譯技術(shù)的突破提供了有力的技術(shù)支撐,而基于3G移動通信技術(shù)的智能終端普及為該項技術(shù)從實驗室走向應(yīng)用提供了理想的平臺,降低了此技術(shù)的應(yīng)用門檻,使其快速發(fā)展起來。
“我們要讓普通民眾都可以應(yīng)用此項技術(shù),僅僅通過手機終端就可進(jìn)行無語言障礙的流暢對話?!盢ICT發(fā)言人堀智織教授介紹。但目前,翻譯速度受到網(wǎng)絡(luò)環(huán)境的影響,在網(wǎng)絡(luò)條件良好的條件下,整個翻譯交互過程在數(shù)秒鐘之內(nèi)即能完成,為用戶帶來了便捷和高效的使用體驗。
該項目中,中科院自動化所承擔(dān)了其中中英互譯項目,其中包括漢語普通話識別、中文-英文雙向翻譯以及漢語普通話合成等四大任務(wù)。據(jù)中科院自動化所副所長徐波介紹:“我所研究成果的最大突破,便是無專業(yè)領(lǐng)域的限定。例如以往總是考慮在旅游中會用到的詞匯,而在真實情況下很難判斷語句實際應(yīng)用的可能性,使得系統(tǒng)的可靠性很難保證。云計算技術(shù)和3G技術(shù)的推進(jìn),讓我們能獲取海量數(shù)據(jù)信息,運用有效的算法進(jìn)行翻譯轉(zhuǎn)換,因此該系統(tǒng)并沒有限定翻譯領(lǐng)域?!?
目前,該所自主研發(fā)的基于Android和iPhone手機的中文-英文雙向口語翻譯系統(tǒng)“紫冬口譯Beta版”(又名“由你說”)已開發(fā)完成,并將于倫敦奧運會前在Android和iphone平臺上免費提供下載。該系統(tǒng)加入了奧運場館、競賽項目等奧運相關(guān)詞匯。在奧運期間,用戶可以在3G或者無線局域網(wǎng)環(huán)境中通過該軟件獲得在線中英口語翻譯服務(wù)。