夢想不息,創新不止。百度從成立的那一天起,就始終致力于人工智能技術(AI)的研發與應用。
百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰告訴《中國科學報》,2010年初,基于多年的技術積累,百度開始全面布局AI,涵蓋自然語言處理、語音、圖像、深度學習、個性化推薦等技術的研發和應用,這些AI技術在悄然地改變著百度內部的各個產品。而外界意識到百度從技術里“謀未來”則是在2014年2月。
彼時,“2014中國民營經濟大家談”在全國工商聯舉行,百度董事長兼首席執行官李彥宏首次對外披露,百度目前正在推進一個名為“百度大腦”的項目,利用計算機技術模擬人腦,已經可以做到2~3歲孩子的智力水平。同年7月1日,“百度大腦”亮相《人民日報》。從此“百度大腦”被外界廣為關注。
形成完整的技術體系
“百度大腦先后完成了基礎能力搭建和核心技術初步開放,形成了完整的技術體系,逐步開放AI核心能力?!蓖鹾7褰榻B,到了2018年,百度大腦已經進入“多模態深度語義理解”、并且核心AI能力豐富全面開放的階段。
“多模態深度語義理解”是指對文字、聲音、圖片、視頻等多模態的數據和信息進行深層次多維度的語義理解,包括數據語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。
在語音方面,“百度大腦”中的語音語義一體化技術,讓機器準確識別并理解人說的話,實現更自然的人機對話,最具挑戰的遠場語音識別的準確率提升了10個百分點。在語音合成方面,WaveNet+拼接的情感語音合成技術,使得流暢度和自然度也大幅提升。
百度還實現了“一次喚醒連續交互”的技術突破,讓機器在語音交互中更具備“人”的特質,用戶只需喚醒一次就可以連續多輪對話,機器能夠準確識別用戶說話時的猶豫停頓、能夠區分并跟隨首次喚醒的用戶等,用戶的體驗更自然、流暢。
在計算機視覺方面,“百度大腦”的視覺語義化技術可以讓機器在“看清”“看準”基礎上,具備“看懂”的能力。三維人臉技術將活體識別正確率由95.26%提升至99.55%,還通過整合場景分類、圖像分割、SLAM等核心能力實現對場景的三維感知。在視頻分析方面,三維人體檢測及跟蹤的準確率極大提升,可以應用到新零售等場景中。
基于“百度大腦”的視覺語義化技術,機器可以看懂視頻,并提煉出結構化語義知識。比如:機器可以識別出世界杯比賽視頻中的球員、裁判、球,以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、任意球、換人等事件。基于這樣的信息,既可以完成機器人自動解說,還可以進行精彩片段集錦,以及各種數據統計分析等。
語言是知識和思維的載體,自然語言處理(NLP)早已成為各AI巨頭的必爭之地。王海峰表示,百度在自然語言處理領域經過多年沉淀與積累,目前在對話理解和閱讀理解方面取得了突破性的進展。以對話理解為例,通過研發最新的深層注意力匹配模型,百度大腦的對話效果比已知的最好結果又提升了4.1%。
在閱讀理解技術上,“百度大腦”已經閱讀了千億量級的文章,相當于6萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識,百度閱讀理解技術已經在百度搜索和信息流中廣泛應用,并使其越來越智能化。
“通過持續獲取和積累知識,百度大腦的理解能力不斷升級,智能水平顯著提升,進而能夠更好地服務用戶?!蓖鹾7逭f。
開放促進百度AI落地應用
20年前,當互聯網剛剛興起的時候,“數字鴻溝”一度成為社會現象,并有越拉越大之勢。百度一直致力于彌補這樣的鴻溝,讓人們更平等、便捷地獲取信息。
當前,AI是新的生產力,它正在變革創新行業。人工智能和實體經濟深度融合,正成為這個時代的核心驅動力。但無論是AI算法所需的技術能力,還是硬件購置花費的成本,對于傳統企業來說都是極高的門檻。
如何避免產生新的智能鴻溝?“百度的答案是開放。”王海峰說,“把百度多年積累的AI能力開放出來,通過數據、算力和算法的不斷迭代,讓每一個開發者能夠接觸到全球最先進的AI技術,讓每一個公司、每一個企業都能夠很方便地使用這些最先進的AI能力?!?/p>
據介紹,“百度大腦”每天被調用次數超過4000億次。調用的人中既有AI工程師,也有“零AI基礎”的入門者,還有來自各行各業希望用AI創新業務、為業務轉型升級的企業。他們雖然身份不同、目標不同,但都從百度找到了最適合的AI接入方式。
百度大腦不斷進化,積極賦能國民經濟重點產業,通過多元化的人工智能技術開放模式,加速AI技術落地應用,繁榮AI技術生態,逐步加速各行各業與人工智能的融合。
在工業應用方面,借助百度AI能力打造的智能零件分揀機,實現零件的自動分揀,對零件的各種尺寸、外觀缺陷進行精準快速檢測,分揀精度可達到90%,預測速度較同類產品快20%。借助三維視覺、增強學習和邊緣計算等AI技術,百度推出無人自主挖掘機,探索嚴酷環境下代替人工的自動工程機械,實現少人化和無人化的智能施工。制造業與AI的深度融合,不僅可以解放人力,還可以激活產業,推動智能制造的發展。
“AI+醫療”是備受關注的領域。基于“百度大腦”打造的眼底AI篩查一體機,使基層醫療機構具備眼底篩查能力,幫助人們更早發現和預防眼科疾病。百度AI眼底篩查系統可以幫助患者快速篩查包括糖網、青光眼、黃斑病等多種眼疾病,目前已在多個地區落地,累計服務百萬人次。
“百度大腦”還輸出全流程客服智能化解決方案,相對人工客服,人工通話接單量降低70%,人工客服通話人均時長降低50%;相對傳統按鍵智能客服,人工通話接單量降低20%,人工客服通話人均時長降低15%,從而提升行業效率,降低業務成本。
利用百度AI技術改造傳統行業的案例正在不斷涌現,作為百度AI多年技術積累和業務實踐之集大成者的百度大腦,已經深入交通、醫療、零售、工業等多個領域,且成效顯著。
王海峰表示,未來百度將繼續把自己積累多年的AI技術,即數據、算力、算法開放出來,讓人們擁有平等獲取AI的能力,一起跨越“智能鴻溝”。
摘自《中國科學報》