今年疫情的突然暴發,將此前廣泛應用到商業場景的通用新一代信息技術,快速深入到社會治理的方方面面。在國內戰“疫”中,盤活數據之后的數字政府應用讓人們耳目一新,然而疫情期間也暴露了數字治理方面的一些短板,比如政府各業務部門數據融通不足、技術賦能不夠、場景融合不強等。
究其原因,核心是傳統技術企業在結合數字政府業務中知識積累不足,缺乏行業化落地能力。可以預見,通用的技術會越來越難以解決具體問題,由此會逐漸具備行業屬性,數據智能技術行業化是解決這些“疑難雜癥”的必然路徑。
首先,數據處理技術與行業相結合。要想掌握行業核心數據知識,就要解決多源異構的跨領域數據治理問題,將公安、民政、教育、住建等不同來源的數據匯聚拉通,形成統一的指標體系、統一標簽體系、統一ID,并引入行業專家,將其幾十年的業務經驗沉淀為顯性化的算法和模型,在不同應用場景出現時,就可以形成不同的概念模型框架對外提供服務。
同時,還要構建政務行業關鍵的數據庫,對不同行業、不同部門、不同領域的政務數據進行治理,轉換成標準數據后構成基礎庫、主題庫、專題庫、知識庫及案例庫。未來所有的這些數據庫都將遵循政務相關的國標、省標或者行業標準,最后通過政務數據資產管理系統、標簽管理系統及共享服務系統,進行各種各樣的管理及應用。
其次,人工智能技術與行業相結合。數字政府領域存在大量圖片、音頻等非結構化的數據,數據融合涉及多種技術進行處理,而傳統數據庫和大數據技術天然地用來處理結構化數據,涉及文本、圖片、音頻、視頻等,就需要運用語音識別、機器視覺、自然語言處理等技術,從這些多模態的數據里抽出語義標簽,再通過知識圖譜技術將這些語義信息融合構建在一起,并轉化為知識,進行知識分析、知識問答與知識挖掘,最終支持決策。
目前,人臉識別、語音識別等人工智能技術日漸成熟,但仍停留在感知層面,如果沒有業務知識背景,很難實現智能化。就如已經逐步行業化落地的知識圖譜技術,其天然的優勢是顯示直觀,可以梳理數據脈絡,看到數據之間的關系,但不同行業數據模式不同,業務需求也具有差異化,只有結合行業知識與規則的應急行業知識圖譜、環保行業知識圖譜、法律行業知識圖譜等,才可以保證知識庫的質量與規模、可擴張性和推理能力,從而更好地進行知識服務。
可以看出,脫離了政務業務的系統,只能是一個技術平臺。如果不能理解政府的業務和與業務有關的各種數據的含義,就難以高效地發揮數據價值。只有結合政務場景,構建結合業務的數據模型,系統才能更好地支持應用。
筆者認為,在技術與業務碰撞中,將會誕生出越來越多的新業態、新應用和新模式。尤其是在這次疫情之后,將會看到數據智能在整個的社會治理、政府決策中發揮越來越多、越來越大的作用。除了技術層面,數據智能的行業化落地,需要在以下三方面進行突破:
一是需求驅動。技術行業化滲透過程中,必須走得足夠深,根據具體業務場景需求,探索數據智能技術在行業中能做什么,基于不同領域的組合、內外部業務環節的分化、融合,最終形成新的技術服務模式,特別是在這個過程中,也會完成技術自身的變革和演進。對比來說,此前拿著通用技術找場景的模式已經不適用。
二是可感知的應用。當數據智能技術逐漸運用到各領域之中,非專業人士也需要能夠應用數據智能輔助決策,通過語音交互而不是寫代碼的方式,未來人機交互會變得更加自然。比如疫情期間,每個城市的應急中心都設有一個指揮中心,政府決策者可以基于可視化大屏實時了解防疫物資、救護車位置等情況,通過智能交互方式進行點線面布陣。
三是聯合創新。在實踐中,有必要打通上下游合作可能性,基于國家、各省和行業規范制定一系列的數據標準,再基于這之上構建數據模型,形成面向各個行業的“大腦”,繼而幫助政府更加科學地制定相關的政策,逐步實現智慧交通、智慧醫療、智慧教育等,打造更完善的智慧城市。
因此,數據智能需要行業厚度,甚至重塑數據價值鏈。數據技術服務不僅需要結合特定行業的知識和標準,還要讓人們能更好地看到數據、跟數據對話、跟數據進行交互。把業務、數據、模型、交互及技術融合在一起,才能發現規律、發現問題,真的創造價值。
來源:《光明日報》