夢想不息,創(chuàng)新不止。百度從成立的那一天起,就始終致力于人工智能技術(shù)(AI)的研發(fā)與應(yīng)用。
百度高級副總裁、AI技術(shù)平臺體系(AIG)總負(fù)責(zé)人王海峰告訴《中國科學(xué)報》,2010年初,基于多年的技術(shù)積累,百度開始全面布局AI,涵蓋自然語言處理、語音、圖像、深度學(xué)習(xí)、個性化推薦等技術(shù)的研發(fā)和應(yīng)用,這些AI技術(shù)在悄然地改變著百度內(nèi)部的各個產(chǎn)品。而外界意識到百度從技術(shù)里“謀未來”則是在2014年2月。
彼時,“2014中國民營經(jīng)濟大家談”在全國工商聯(lián)舉行,百度董事長兼首席執(zhí)行官李彥宏首次對外披露,百度目前正在推進(jìn)一個名為“百度大腦”的項目,利用計算機技術(shù)模擬人腦,已經(jīng)可以做到2~3歲孩子的智力水平。同年7月1日,“百度大腦”亮相《人民日報》。從此“百度大腦”被外界廣為關(guān)注。
形成完整的技術(shù)體系
“百度大腦先后完成了基礎(chǔ)能力搭建和核心技術(shù)初步開放,形成了完整的技術(shù)體系,逐步開放AI核心能力。”王海峰介紹,到了2018年,百度大腦已經(jīng)進(jìn)入“多模態(tài)深度語義理解”、并且核心AI能力豐富全面開放的階段。
“多模態(tài)深度語義理解”是指對文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進(jìn)行深層次多維度的語義理解,包括數(shù)據(jù)語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術(shù)。
在語音方面,“百度大腦”中的語音語義一體化技術(shù),讓機器準(zhǔn)確識別并理解人說的話,實現(xiàn)更自然的人機對話,最具挑戰(zhàn)的遠(yuǎn)場語音識別的準(zhǔn)確率提升了10個百分點。在語音合成方面,WaveNet+拼接的情感語音合成技術(shù),使得流暢度和自然度也大幅提升。
百度還實現(xiàn)了“一次喚醒連續(xù)交互”的技術(shù)突破,讓機器在語音交互中更具備“人”的特質(zhì),用戶只需喚醒一次就可以連續(xù)多輪對話,機器能夠準(zhǔn)確識別用戶說話時的猶豫停頓、能夠區(qū)分并跟隨首次喚醒的用戶等,用戶的體驗更自然、流暢。
在計算機視覺方面,“百度大腦”的視覺語義化技術(shù)可以讓機器在“看清”“看準(zhǔn)”基礎(chǔ)上,具備“看懂”的能力。三維人臉技術(shù)將活體識別正確率由95.26%提升至99.55%,還通過整合場景分類、圖像分割、SLAM等核心能力實現(xiàn)對場景的三維感知。在視頻分析方面,三維人體檢測及跟蹤的準(zhǔn)確率極大提升,可以應(yīng)用到新零售等場景中。
基于“百度大腦”的視覺語義化技術(shù),機器可以看懂視頻,并提煉出結(jié)構(gòu)化語義知識。比如:機器可以識別出世界杯比賽視頻中的球員、裁判、球,以及球門、球場線等人、物和場景,可以捕捉射門、進(jìn)球、角球、任意球、換人等事件。基于這樣的信息,既可以完成機器人自動解說,還可以進(jìn)行精彩片段集錦,以及各種數(shù)據(jù)統(tǒng)計分析等。
語言是知識和思維的載體,自然語言處理(NLP)早已成為各AI巨頭的必爭之地。王海峰表示,百度在自然語言處理領(lǐng)域經(jīng)過多年沉淀與積累,目前在對話理解和閱讀理解方面取得了突破性的進(jìn)展。以對話理解為例,通過研發(fā)最新的深層注意力匹配模型,百度大腦的對話效果比已知的最好結(jié)果又提升了4.1%。
在閱讀理解技術(shù)上,“百度大腦”已經(jīng)閱讀了千億量級的文章,相當(dāng)于6萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識,百度閱讀理解技術(shù)已經(jīng)在百度搜索和信息流中廣泛應(yīng)用,并使其越來越智能化。
“通過持續(xù)獲取和積累知識,百度大腦的理解能力不斷升級,智能水平顯著提升,進(jìn)而能夠更好地服務(wù)用戶。”王海峰說。
開放促進(jìn)百度AI落地應(yīng)用
20年前,當(dāng)互聯(lián)網(wǎng)剛剛興起的時候,“數(shù)字鴻溝”一度成為社會現(xiàn)象,并有越拉越大之勢。百度一直致力于彌補這樣的鴻溝,讓人們更平等、便捷地獲取信息。
當(dāng)前,AI是新的生產(chǎn)力,它正在變革創(chuàng)新行業(yè)。人工智能和實體經(jīng)濟深度融合,正成為這個時代的核心驅(qū)動力。但無論是AI算法所需的技術(shù)能力,還是硬件購置花費的成本,對于傳統(tǒng)企業(yè)來說都是極高的門檻。
如何避免產(chǎn)生新的智能鴻溝?“百度的答案是開放。”王海峰說,“把百度多年積累的AI能力開放出來,通過數(shù)據(jù)、算力和算法的不斷迭代,讓每一個開發(fā)者能夠接觸到全球最先進(jìn)的AI技術(shù),讓每一個公司、每一個企業(yè)都能夠很方便地使用這些最先進(jìn)的AI能力。”
據(jù)介紹,“百度大腦”每天被調(diào)用次數(shù)超過4000億次。調(diào)用的人中既有AI工程師,也有“零AI基礎(chǔ)”的入門者,還有來自各行各業(yè)希望用AI創(chuàng)新業(yè)務(wù)、為業(yè)務(wù)轉(zhuǎn)型升級的企業(yè)。他們雖然身份不同、目標(biāo)不同,但都從百度找到了最適合的AI接入方式。
百度大腦不斷進(jìn)化,積極賦能國民經(jīng)濟重點產(chǎn)業(yè),通過多元化的人工智能技術(shù)開放模式,加速AI技術(shù)落地應(yīng)用,繁榮AI技術(shù)生態(tài),逐步加速各行各業(yè)與人工智能的融合。
在工業(yè)應(yīng)用方面,借助百度AI能力打造的智能零件分揀機,實現(xiàn)零件的自動分揀,對零件的各種尺寸、外觀缺陷進(jìn)行精準(zhǔn)快速檢測,分揀精度可達(dá)到90%,預(yù)測速度較同類產(chǎn)品快20%。借助三維視覺、增強學(xué)習(xí)和邊緣計算等AI技術(shù),百度推出無人自主挖掘機,探索嚴(yán)酷環(huán)境下代替人工的自動工程機械,實現(xiàn)少人化和無人化的智能施工。制造業(yè)與AI的深度融合,不僅可以解放人力,還可以激活產(chǎn)業(yè),推動智能制造的發(fā)展。
“AI+醫(yī)療”是備受關(guān)注的領(lǐng)域。基于“百度大腦”打造的眼底AI篩查一體機,使基層醫(yī)療機構(gòu)具備眼底篩查能力,幫助人們更早發(fā)現(xiàn)和預(yù)防眼科疾病。百度AI眼底篩查系統(tǒng)可以幫助患者快速篩查包括糖網(wǎng)、青光眼、黃斑病等多種眼疾病,目前已在多個地區(qū)落地,累計服務(wù)百萬人次。
“百度大腦”還輸出全流程客服智能化解決方案,相對人工客服,人工通話接單量降低70%,人工客服通話人均時長降低50%;相對傳統(tǒng)按鍵智能客服,人工通話接單量降低20%,人工客服通話人均時長降低15%,從而提升行業(yè)效率,降低業(yè)務(wù)成本。
利用百度AI技術(shù)改造傳統(tǒng)行業(yè)的案例正在不斷涌現(xiàn),作為百度AI多年技術(shù)積累和業(yè)務(wù)實踐之集大成者的百度大腦,已經(jīng)深入交通、醫(yī)療、零售、工業(yè)等多個領(lǐng)域,且成效顯著。
王海峰表示,未來百度將繼續(xù)把自己積累多年的AI技術(shù),即數(shù)據(jù)、算力、算法開放出來,讓人們擁有平等獲取AI的能力,一起跨越“智能鴻溝”。
摘自《中國科學(xué)報》