來源:科技日?qǐng)?bào)
本報(bào)記者房琳琳
3月,對(duì)于微軟亞洲研究院院長(zhǎng)洪小文來說,最興奮的事莫過于參加“微軟技術(shù)節(jié)”了。
他很認(rèn)同西安交通大學(xué)校長(zhǎng)鄭南寧院士的感觸:“無所不在的計(jì)算機(jī),造就了無所不在的微軟,同時(shí)微軟的創(chuàng)造活動(dòng)加速推動(dòng)了現(xiàn)在計(jì)算機(jī)技術(shù)在人的社會(huì)及生產(chǎn)活動(dòng)的各個(gè)方面的滲透。”
此次技術(shù)節(jié),微軟亞洲研究院帶去了不少令世界IT同行感到振奮的“中國創(chuàng)新”,他們的創(chuàng)新技術(shù),也讓世界各地來訪的記者為之嘖嘖稱贊。
筆者試著解讀其中之二三,以饗廣大讀者。
動(dòng)態(tài)煙實(shí)時(shí)測(cè)繪:讓電影煙霧效果更形象
創(chuàng)意由來:很多愛玩游戲的朋友都有同感,做得越接近真實(shí)世界的游戲畫面越能引人入境。而其中表現(xiàn)自然現(xiàn)象的哪怕一個(gè)小細(xì)節(jié),背后所蘊(yùn)含的都是巨大的數(shù)據(jù)運(yùn)算量。
現(xiàn)在表現(xiàn)建筑光的特效技術(shù)都已經(jīng)成熟,但是,諸如云、煙、水、皮膚等越是自然的東西卻越難表現(xiàn)得真實(shí)。
煙的繪制是計(jì)算機(jī)圖形學(xué)中一個(gè)具有挑戰(zhàn)性的問題,因?yàn)楣庠跓熤械膫鞑シ浅?fù)雜。于是,微軟亞洲研究院網(wǎng)絡(luò)圖形組的研究員周昆和副研究員任重,就想實(shí)現(xiàn)“動(dòng)態(tài)煙的實(shí)時(shí)測(cè)繪”。
任重對(duì)記者解釋,在布滿煙的三維空間中,光在每一點(diǎn)都會(huì)被吸收或者散射,由于煙在空間中的不規(guī)則性,空間中每一點(diǎn)的吸收和散射程度都是不相同的。
即使是對(duì)一個(gè)靜止的煙,這些吸收和散射的次數(shù)和復(fù)雜度都會(huì)帶來龐大的計(jì)算“開銷”,對(duì)于動(dòng)態(tài)煙來說,這種計(jì)算代價(jià)更為昂貴。也就是說,“實(shí)時(shí)”的難度,在于獲得大數(shù)據(jù)量的處理能力。
據(jù)了解,這項(xiàng)技術(shù)在全世界范圍,屬于國人“首創(chuàng)”。
按照以往的技術(shù)水平,每20秒的動(dòng)態(tài)煙的數(shù)據(jù)處理量要達(dá)到4—5個(gè)G,而任重小組創(chuàng)新了一種實(shí)時(shí)煙的繪制算法,可以減少10—20倍的數(shù)據(jù)量。如果做個(gè)簡(jiǎn)單的計(jì)算,原來用1-2天來處理復(fù)雜實(shí)時(shí)光源,現(xiàn)在只用幾秒就可以解決了。
這樣,電影導(dǎo)演就可以在拍攝現(xiàn)場(chǎng)加入想要的煙霧效果,而不需后期大量的離線繪制后再回放成動(dòng)畫了,游戲也是如此。
那么,除了電影和游戲,還有哪些應(yīng)用領(lǐng)域呢?微軟亞洲研究院常務(wù)副院長(zhǎng)郭百寧說,“防火門和指示燈的設(shè)計(jì)也需要用到這個(gè)技術(shù)”———一旦發(fā)生火災(zāi)大家都會(huì)沿著指示燈標(biāo)注的路去逃生,大家知道火燃起來就有煙霧,煙霧會(huì)在這里面到處跑,這些標(biāo)志到時(shí)候還能不能看到呢?所以在設(shè)計(jì)的時(shí)候就需要模擬煙霧的擴(kuò)散路徑。
洪小文補(bǔ)充說:“現(xiàn)在非常通用的航空模擬器,也需要用到這個(gè)技術(shù)。”在美國考飛機(jī)駕照的人非常多,因此美國很流行航空模擬器,但是里面有一個(gè)東西做得不好———就是云霧。“為什么這個(gè)東西重要呢?實(shí)際上飛機(jī)出事就是因?yàn)樵旗F等惡劣天氣導(dǎo)致的。怎么讓飛行模擬器做到更真實(shí)化,在那種情況下能夠辨別你的飛行方向是正確的呢?這個(gè)動(dòng)態(tài)煙的實(shí)時(shí)繪制技術(shù)就很重要了。
能說會(huì)唱的小人頭:讓您時(shí)時(shí)刻刻聽“演講”
創(chuàng)意由來:我們很早以前就通過看電影,或者讀科幻小說知道了“機(jī)器人”這個(gè)名詞了,但是到目前為止,真正能夠動(dòng)起來的機(jī)器人還只是按照一定程序作機(jī)械運(yùn)動(dòng)的流水線機(jī)器人。
當(dāng)然,要真正實(shí)現(xiàn)機(jī)器人的仿真化還需要有很遠(yuǎn)的路要走,但是,能不能讓個(gè)人電腦這種機(jī)器,在某種程度上像人一樣能說會(huì)唱呢?
這就是微軟語音組的最初想法,負(fù)責(zé)研發(fā)的是兩個(gè)女研究員,她們的頭兒叫宋哥平。
記者看到,在計(jì)算機(jī)屏幕上,一個(gè)卡通形象演唱一首流行音樂《喜唰唰》,每一句歌詞都和小人頭的嘴形相對(duì)應(yīng),真是個(gè)“能說會(huì)唱的小人頭”。
據(jù)錢瑤研究員介紹,這種技術(shù)集中展示了一個(gè)新的音頻/視頻的人機(jī)界面。這個(gè)活潑可愛的小人頭背后,是一個(gè)復(fù)雜的統(tǒng)計(jì)模型,它可以將文字轉(zhuǎn)成語音,將詞與譜轉(zhuǎn)換成歌唱。此外,頭部動(dòng)作與嘴形同步的視頻信號(hào)也與說/唱的音頻信號(hào)一同播放。
也就是說,只要你輸入一段文字、或者一段詞和相關(guān)的譜,小人頭就會(huì)繪聲繪色地給你演講,或者歡快地一邊搖頭一邊唱歌。
能讓小人頭說話,是基于用一個(gè)統(tǒng)計(jì)模型進(jìn)行批量資料的學(xué)習(xí)和訓(xùn)練的結(jié)果,而能讓小人頭搖頭晃腦并對(duì)準(zhǔn)口型,也是通過在學(xué)習(xí)相關(guān)視頻資料中,因韻律變更而產(chǎn)生相應(yīng)的發(fā)音口型。
還不等科研人員說出來,記者們已經(jīng)在你一言我一語地幫著想這個(gè)技術(shù)的應(yīng)用領(lǐng)域了。
“比如,在公共場(chǎng)所有很多人需要接待員重復(fù)同樣一段話的時(shí)候,就可以把這個(gè)小人頭搬上去,據(jù)研究員介紹,小人頭的形象是可以根據(jù)不同需要而變化的”;“再比如,你可以在開車上路之前,從網(wǎng)絡(luò)上下載一些當(dāng)日的新聞,然后一邊開車,一邊享受小人頭給你播送的最新消息”;“還比如,有些失聰?shù)臍堈先耸啃枰獙W(xué)習(xí)發(fā)音,可以用小人頭一遍一遍不厭其煩地教會(huì)他們讀唇直至學(xué)會(huì)說話。”……
可視化電子地圖:以動(dòng)畫形式重現(xiàn)旅游經(jīng)歷
創(chuàng)意由來:不知道你有過這樣的煩惱沒有。某一天,您跟家人到北京好幾個(gè)景點(diǎn)玩了一圈,回家后通過上傳照片到自己的博客里想分享給朋友們,但是朋友要想看全它們還是需要不斷地打開不同時(shí)間、不同主題的博客頁,這些照片看起來還是非常零碎而無章法。怎么能讓朋友直觀地、方便地認(rèn)同你的感受呢?
有這種困擾的人不在少數(shù),搜索組的鄭宇也很早就意識(shí)到,這已經(jīng)成為一個(gè)問題———隨著GPS設(shè)備,如GPS手機(jī)、PDA在人們?nèi)粘I钪兄饾u普及,大量的GPS數(shù)據(jù)正伴隨著照片、視頻等多媒體數(shù)據(jù)而不斷積累。他和同伴所要做的,就是管理好并利用這些數(shù)據(jù)為人們提供更有利的服務(wù)。
這種技術(shù)被命名為GeoLife,它是以GPS數(shù)據(jù)為中心,并基于電子地圖的應(yīng)用系統(tǒng)。它不但是可視化、管理和理解個(gè)人旅行經(jīng)歷的工具,也是多個(gè)用戶共享GPS數(shù)據(jù)和交流生活經(jīng)歷的平臺(tái)。
基于用戶拍攝的照片和相關(guān)的GPS數(shù)據(jù),GeoLife可在地圖上以動(dòng)畫的形式生動(dòng)地重現(xiàn)用戶的旅游經(jīng)歷,既有助于自身對(duì)過去往事的回憶又方便了朋友之間的生活經(jīng)歷分享。此外,從多人的數(shù)據(jù)中,GeoLife可以有效地發(fā)掘熱點(diǎn)區(qū)域和經(jīng)典的旅行線路,并推薦給游客。同時(shí),GeoLife可以幫助用戶快速找到特定區(qū)域和/或時(shí)間段的軌跡。
該搜索不但有助于用戶從他人的數(shù)據(jù)中高效發(fā)掘出自己感興趣的經(jīng)歷,也有利于個(gè)人從自己模糊的記憶中快速激發(fā)想要回憶的事件。
比如,用戶可通過空間搜索功能查看他人在頤和園區(qū)域內(nèi)拍攝的照片和視頻,從而為自己日后的行程安排積累豐富的經(jīng)驗(yàn)。此外,基于時(shí)間段的查詢方式,用戶也可發(fā)掘他人在圣誕節(jié)期間的有趣經(jīng)歷。在2008年奧運(yùn)會(huì)期間,大量的外國游客將來到北京,此時(shí),GeoLife提供的基于時(shí)間和/或空間的搜索功能將為外國游客消除語言障礙,并幫助他們快速獲取自己想要的信息。
總之,通過搜索地圖,用戶可以反思自己的過去并規(guī)劃自己的未來。
■新聞緣起
最近,微軟技術(shù)節(jié)在美國微軟總部開幕。微軟亞洲研究院攜45項(xiàng)最新研究成果參展,這些成果涉及多媒體技術(shù)在互聯(lián)網(wǎng)的應(yīng)用、網(wǎng)絡(luò)信息處理等廣闊領(lǐng)域。可觀的參展技術(shù)數(shù)量和創(chuàng)新的研究成果,使微軟亞洲研究院再次成為備受矚目的焦點(diǎn)。
被譽(yù)為“計(jì)算機(jī)研究領(lǐng)域盛宴”的微軟技術(shù)節(jié)是微軟研究院年度最大的活動(dòng),其主要目的就是讓微軟產(chǎn)品部門可以零距離接觸各種最新技術(shù),從而為技術(shù)向產(chǎn)品轉(zhuǎn)化提供便利。
■記者手記
不斷變革的新技術(shù)給我?guī)砜鞓?BR> 很多年前,我想要一臺(tái)計(jì)算機(jī),但又不知道拿它干什么;后來,當(dāng)我有了一臺(tái)計(jì)算機(jī),就逐漸知道了它能干什么。是不斷變革的新技術(shù)教會(huì)了我享受計(jì)算機(jī)帶來的快樂。
“技術(shù)創(chuàng)造需求”。這句話放在這里似乎很合適。然而,我仍然認(rèn)為,計(jì)算機(jī)新技術(shù)的神秘在于,你幾乎永遠(yuǎn)不能準(zhǔn)確地知道,今天的創(chuàng)造能給明天的人類帶來怎樣的改變。
美國著名電視欄目《科學(xué)美國人》主持人艾倫·奧德說———“我們正在建立一個(gè)由計(jì)算機(jī)組成的社區(qū),人們既對(duì)這個(gè)社區(qū)貢獻(xiàn)知識(shí),又從中吸取知識(shí)”。
是的,自從以互聯(lián)網(wǎng)為代表的計(jì)算機(jī)革命出現(xiàn),到現(xiàn)在,人們?cè)谒查g可獲得的知識(shí)已經(jīng)成幾何倍數(shù)增長(zhǎng),而且還將不斷增長(zhǎng)下去。生于“計(jì)算機(jī)時(shí)代”,我應(yīng)該感到慶幸。
但是,蘊(yùn)藏在互聯(lián)網(wǎng)和計(jì)算機(jī)里的海量數(shù)據(jù)中,能夠被有效用于分析和解決問題的數(shù)據(jù)有多少?能夠讓計(jì)算機(jī)社區(qū)中的人們順暢溝通甚至相互協(xié)作的智能工具又有多少?
數(shù)據(jù)畢竟是對(duì)孤立事件的描述,而應(yīng)用數(shù)據(jù)的人則是社會(huì)性動(dòng)物,只有讓數(shù)據(jù)活起來,變成社會(huì)運(yùn)行不可缺少的一部分,我們及我們的后人才可以說,這是個(gè)真正偉大的時(shí)代!