2月8日,在北京冬奧會自由式滑雪女子大跳臺決賽中,中國選手谷愛凌憑借最后一跳的出色發(fā)揮逆轉(zhuǎn)奪冠,AI合成主播“小聰”用手語解說了這個激動人心的奪冠時刻。作為全球首個手語AI合成主播,“小聰”利用深度合成技術(shù),為聽障人士獲取信息帶來極大便利。
作為人工智能領(lǐng)域的新應(yīng)用,深度合成技術(shù)以深度學(xué)習(xí)、虛擬現(xiàn)實(shí)為代表的生成合成類算法制作文本、圖像、音頻、視頻,因較強(qiáng)娛樂性在社交媒體平臺廣受關(guān)注。相關(guān)研究顯示,在國內(nèi)外主流音視頻網(wǎng)站、社交媒體平臺上,2021年新發(fā)布的深度合成視頻數(shù)量較2017年增長10倍以上。
但大規(guī)模普及也導(dǎo)致濫用案例頻出。不久前,國家網(wǎng)信辦公布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見稿)》,對深度合成內(nèi)容的用途、標(biāo)記、使用范圍以及濫用處罰作出具體規(guī)定。業(yè)內(nèi)認(rèn)為,管理新規(guī)的即將出臺,意味著深度合成將迎來規(guī)范化發(fā)展關(guān)鍵期。
應(yīng)用豐富 帶動產(chǎn)業(yè)快速發(fā)展
清華大學(xué)人工智能研究院、國家工業(yè)信息安全發(fā)展研究中心等日前聯(lián)合發(fā)布的《深度合成十大趨勢報告(2022)》指出,2017年以來,深度合成內(nèi)容被大量創(chuàng)作和傳播,數(shù)量逐年高速增長。
技術(shù)不斷成熟是深度合成內(nèi)容快速增長的重要原因。自2017年開始,深度合成領(lǐng)域新發(fā)表論文數(shù)量和開源項(xiàng)目均以每年30%的速度增長?!把芯空撐某掷m(xù)增多,開源技術(shù)工具、大量代表性方法集中涌現(xiàn),使得深度合成內(nèi)容的效果更加逼真、制作更加高效。”北京瑞萊智慧科技有限公司CEO田天告訴記者,縱觀計算機(jī)行業(yè)發(fā)展,開源項(xiàng)目已成為推動產(chǎn)業(yè)進(jìn)步的強(qiáng)大力量,深度合成在開源社區(qū)中備受青睞,將繼續(xù)推動該技術(shù)在產(chǎn)業(yè)中落地。
通過升級傳統(tǒng)內(nèi)容制作方法,深度合成在影視制作、廣告營銷、社交娛樂等領(lǐng)域應(yīng)用不斷豐富,包括AI合成主播、虛擬偶像、修復(fù)歷史老照片等。2021年,虛擬偶像洛天依登上央視春晚,2022年,已經(jīng)“出道”10年的她再次現(xiàn)身元宵晚會舞臺。公開數(shù)據(jù)顯示,2020年6月至2021年5月,共有32412位虛擬主播在嗶哩嗶哩開播,同比增長40%。
與此同時,越來越多的企業(yè)機(jī)構(gòu)開始利用深度合成技術(shù)提供面向公眾的產(chǎn)品和服務(wù),涵蓋圖像、視頻、音頻、文本等多個領(lǐng)域。語音合成已經(jīng)成為人機(jī)交互的重要一環(huán),被應(yīng)用于智能客服、語音導(dǎo)航、有聲讀物、語音助手等場景,多家企業(yè)機(jī)構(gòu)已發(fā)布基于深度神經(jīng)網(wǎng)絡(luò)技術(shù)合成音頻的商用開放平臺,而以文本為形式的深度合成在新聞報道、詩文創(chuàng)作、聊天問答等方面顯現(xiàn)出巨大的創(chuàng)作效率和潛力。
此外,“元宇宙”等新商業(yè)思維的提出也為深度合成提供更廣闊的應(yīng)用場景?!吧疃群铣蓪⒅匦露x虛擬數(shù)字化空間,從傳播社會學(xué)意義上看,一個新的人類生存場景將以深度合成技術(shù)為基石展開?!鼻迦A大學(xué)新聞與傳播學(xué)院常務(wù)副院長陳昌鳳說。
風(fēng)險加劇 檢測技術(shù)持續(xù)更新
深度合成激發(fā)新形式內(nèi)容創(chuàng)造的同時,也帶來新威脅、新挑戰(zhàn)。《深度合成十大趨勢報告(2022)》分析認(rèn)為,深度偽造影響新聞對真相的記錄,對虛假內(nèi)容高難度甄別也降低了事實(shí)核查的有效性。在社會重大突發(fā)事件上,深度合成技術(shù)可能被用于操作輿論意見,借助社交媒體,使虛假信息短時間內(nèi)發(fā)酵。
隨著負(fù)面風(fēng)險日益加劇,以及合成質(zhì)量不斷提升,基于生物特征的傳統(tǒng)鑒別方式越來越難以發(fā)揮作用?!澳壳皩ι疃群铣蓛?nèi)容的自動化鑒別主要依靠人工智能技術(shù)完成?!闭憬髮W(xué)網(wǎng)絡(luò)空間安全學(xué)院院長任奎介紹,訓(xùn)練人工智能模型需要大量真實(shí)和偽造數(shù)據(jù),人臉和音頻數(shù)據(jù)都是高度敏感的個人信息,難以獲取,而偽造數(shù)據(jù)也包含各種不同方法合成的數(shù)據(jù),這都給構(gòu)建自動化檢測能力帶來不小挑戰(zhàn)。
新型偽造方法的層出不窮,加上檢測算法存在結(jié)構(gòu)性缺陷,反深度偽造檢測技術(shù)面臨“強(qiáng)對抗性”。田天解釋說,這類似于“貓鼠游戲”,深度合成和檢測在不斷學(xué)習(xí)攻防過程中會自我進(jìn)化,規(guī)避上一代對抗技術(shù),因此檢測技術(shù)需要持續(xù)更新與迭代優(yōu)化。
目前學(xué)術(shù)界和產(chǎn)業(yè)界均已對反深偽檢測投入了大量研究,谷歌、微軟等機(jī)構(gòu)均推出深度合成視頻認(rèn)證的方法或產(chǎn)品。在國內(nèi),瑞萊智慧推出的深度偽造內(nèi)容檢測平臺DeepReal,擁有工業(yè)級的檢測性能和應(yīng)對實(shí)網(wǎng)環(huán)境對抗變化的檢測能力?!吧疃葌卧鞕z測面臨持續(xù)的攻防和博弈,未來還需融合多模態(tài)內(nèi)容的取證分析、基于數(shù)字水印的溯源技術(shù)等多方面能力,實(shí)現(xiàn)精準(zhǔn)識別?!鼻迦A大學(xué)人工智能研究院基礎(chǔ)理論研究中心主任朱軍說。
構(gòu)建多維度治理機(jī)制
近年來,針對深度合成技術(shù)惡意使用所帶來的問題,世界各國紛紛出臺管理法律法規(guī),探索深度合成的治理路徑。歐盟將深度合成納入《通用數(shù)據(jù)保護(hù)條例(GDPR)》等現(xiàn)有法律框架規(guī)制,德國、新加坡、英國、韓國等國家,均有適用于深度合成技術(shù)相關(guān)犯罪案件審理的法律法規(guī)。
我國正積極探尋建設(shè)有效治理機(jī)制。自2019年11月起,先后出臺的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》等文件,均對生成合成類內(nèi)容提出不同程度的監(jiān)管要求。
中國工程院院士鄔賀銓認(rèn)為,治理深度合成不能搞“一刀切”,要持續(xù)發(fā)展技術(shù),避免阻礙其正向應(yīng)用與創(chuàng)新。其衍生出的安全問題需從源頭解決,引導(dǎo)人工智能學(xué)術(shù)界、產(chǎn)業(yè)界不斷加強(qiáng)技術(shù)研發(fā),并擴(kuò)展深度合成溯源、深度合成鑒定等方面的研究,防范倫理安全風(fēng)險和合規(guī)風(fēng)險。
引導(dǎo)深度合成技術(shù)良性發(fā)展,需探索多維度治理機(jī)制。中國社科院哲學(xué)所科技哲學(xué)研究室主任段偉文建議,加強(qiáng)對深度合成的技術(shù)、法律和倫理問題展開系統(tǒng)性前瞻性跨學(xué)科研究,對其可能出現(xiàn)的高風(fēng)險應(yīng)用場景采取有針對性的治理與監(jiān)管。
中科院自動化所研究員曾毅則倡導(dǎo)產(chǎn)學(xué)研發(fā)展自律自治,他表示,在法律法規(guī)未形成體系化之前,產(chǎn)業(yè)界自身應(yīng)強(qiáng)化理論先行意識,防范濫用、嚴(yán)禁惡用。
在對外經(jīng)濟(jì)貿(mào)易大學(xué)法學(xué)院副教授許可看來,社會層面應(yīng)加大宣傳普及力度,強(qiáng)化公民對深度合成等人工智能技術(shù)的認(rèn)識,提高全社會防范意識。
田天對此有相同看法,他認(rèn)為深度偽造的本質(zhì)問題是透明度不足,因此提高公眾對深度合成技術(shù)的認(rèn)知尤為重要,只有將門檻降低到所有受眾能夠在共同框架下認(rèn)識、討論、理解這個問題的時候,深度合成技術(shù)才能健康良性發(fā)展。
業(yè)內(nèi)專家建議,各方應(yīng)當(dāng)落實(shí)好新的規(guī)范要求,在此前提下不斷追求技術(shù)突破,開拓深度合成技術(shù)應(yīng)用場景,形成對人工智能產(chǎn)業(yè)的帶動效應(yīng)。
來源:《經(jīng)濟(jì)日報》