數字經濟進入數據資源驅動新時代,培育數據要素市場、促進數據交易流通是經濟社會創新發展的必然要求。本文結合近日發布的《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》,以數字經濟的數據、模型算法與算力三個核心要素為立足點,思考和分析推動數據基礎制度落地的核心支撐技術。
數據要素流通交易是價值凸顯的動力引擎。數據作為數字經濟的關鍵要素,其流通交易過程,也是數據、模型算法和算力協同發展、持續遞進的過程,其核心是“以數據為資源,發揮信息價值”。數據環境是一個廣泛開放式環境,并處于頻繁流動與共享狀態,加劇了跨部門、跨行業的數據流動趨勢。數據具有來源廣、規模大、結構類型豐富、處理行為多樣、擁有權與使用權分離等特點,使數據在開放環境下面臨泄露安全風險。
堅持數據開發利用和有效保護兩者并重。一方面要合法流通數據、充分發揮數據潛能,另一方面要采取必要安全措施有效保護數據、確保具備保障持續安全狀態的能力。近年來,國家陸續出臺網絡安全法、密碼法、數據安全法、個人信息保護法等法律法規,構筑網絡與數據安全的基礎“合規堡壘”,以數據安全保障數據流通交易和行業數字化發展,將發揮數據要素倍增效應,推動數字經濟高質量發展。
數字經濟的核心要素包含數據、模型算法、算力等方面。數據正在成為經濟關鍵生產要素,是數字化、網絡化、智能化的基礎,已快速融入生產、分配、流通、消費和社會服務管理等各個環節,深刻改變著生產方式、生活方式和社會治理方式。我們需要研究推進數據確權和分類分級管理,暢通數據交易流動,完善數據合理定價,實現數據要素市場化配置,合理分配數據要素收益。
利用創新技術手段加快培育數據要素市場。在符合個人信息保護法、數據安全法等相關法律法規要求的前提下,利用安全多方計算技術打破“數據孤島”,實現數據要素在數據安全和隱私保護基礎上有序流通。探索開展數據質量標準化體系建設,加快推進數據采集和流通交易接口的標準化,促進數據整合互通和互操作。圍繞數字化轉型,打造“數據中臺”,在數據安全、數據隱私合規的前提下進行全面整合;同時,建設企業間的合作聯盟,打造行業級的隱私計算平臺,形成企業間的數據要素流通市場。
安全多方計算(MPC)是數據安全流通的關鍵技術。數字化轉型的最大挑戰之一是“數據孤島”問題:對于不同主體,基于數據安全、數據隱私的法律法規要求,不能將數據簡單整合;對于同一主體,數據可以通過管理行政命令有限程度整合,但是由于存在部門利益、權限管理、安全管理等障礙也無法依靠簡單的管理要求進行完全整合。
零知識證明(ZKP)是數據要素市場監管的有效支撐技術。數據要素市場需要監管與治理,這就需要在數據安全的前提下建設“監管工具”與“監管算法”,確保數據要素流通平臺上的業務活動、生產活動在監管的框架下進行,并且可以接受監督與治理。零知識證明的密碼技術可有效實現這一目標。政府部門或行業聯盟可利用零知識證明技術實現監管與隱私兼顧,在保證數據隱私前提下實現數據要素使用合規性的公開可驗證,保障個人數據隱私與企業商業機密,實現“黨管數據,央企先行”的目標。
監管與隱私兼顧實現。推進在央企間的數據要素流通市場先行先試,利用零知識證明技術實現監管與數據隱私的兼顧。參考“監管沙盒”在金融行業的成功經驗,在數據要素市場的建立過程中,利用高性能的區塊鏈技術實現數據的上鏈存證和不可篡改,同時結合零知識證明等密碼技術兼顧數據的隱私性和數據合規性的可審計和可監管。
技術助力實現數據要素市場化配置。在以安全多方計算、零知識證明、區塊鏈等技術建立的數據流動技術設施的基礎上,打造數據要素的流通市場。這些技術可以幫助實現數據確權和分類分級管理,暢通數據交易的流動。在解決了數據安全、隱私保護和數據監管等數據流通問題之后,最重要的就是形成合理的經濟分配機制,從而驅動企業內部的部門獨立核算、企業間的數據共享,以形成數據要素市場,實現數據要素市場化配置,合理分配數據要素收益。
數字經濟時代千千萬萬的生產活動催生海量智能化模型。近年來,人工智能技術取得了巨大進展,大數據與人工智能的結合使得海量模型的建立成為可能。無論是在縱深的算法研究,還是橫向的創新場景層面,人工智能技術都為數字經濟拉開了波瀾壯闊的巨幕。人工智能模型有著強大的優勢,不需要預設的邏輯、不需要專家觀點就可以實現建模,并且各類算法工具平臺可以支持快速建模。然而,人工智能模型也有不足,主要集中在模型的可解釋性、校驗方法的可靠度,模型缺陷與局限性等方面。
算法模型治理是人工智能的下一篇章。算法模型的治理,即模型的可解釋性、模型的精度與風險、算法公平性等方面。模型治理既是技術,又是制度,成熟的數字化企業會形成完整的模型治理制度。在推廣建設人工智能能力的同時,也要推廣成熟的模型治理制度建設。目前,包括對抗攻擊、因果分析與可解釋性分析的研究工作已經給這方面的工作指出了發展方向。在這些方面,我們認為應該進行以下工作內容:一是建立模型治理制度,形成模型價值評估、精度評估、風險與缺陷管理的成熟體系。二是建立模型評測中心,結合各類場景牽頭建設數據模型標準,并實踐模型評測,賦能行業發展。
模型治理的另一面是算法的合規性。在數字經濟時代,越來越多的生產活動需要依靠算法模型開展,算法與業務的深度融合會是未來的趨勢,對于業務的合規性要求也會傳導到對算法的合規性要求。同時,行業監管也在逐漸建立之中。建議各行業也應建立相應的行業規范與標準,在數據安全法等法律法規框架內,發展測評中心,對算法使用的合規性、公平性進行測試和評估。
建設數字經濟離不開算力的支持。算力在數字經濟建設過程中的必要性,主要體現在五方面:一是數據模型需要在算力平臺上實現;二是在海量數據、海量模型、實時計算的數字化時代,對算力的要求急劇提升;三是建立數據要素流通市場,多方數據共同建模使得對算力的要求更高;四是創新型軟硬件體系架構、智能芯片以及未來的量子計算技術對算力都有較大需求;五是從數據要素安全的角度來講,算法是攻防雙方的主要角力點,更高的算力支持,能夠有效增加不法分子竊取數據的成本,從而降低安全風險。
布局“優化防守效率”的安全體系。安全對抗本質是敵我雙方對資源的消耗戰,優化敵我戰損比是贏得勝利的關鍵。從安全技術角度出發,安全多方計算和零知識證明等隱私計算技術,在保障數據隱私和安全性的同時,相比無隱私保護的同類計算在計算效率和通訊復雜度上都有一定程度的犧牲。因此,為了保護數據要素安全,需要綜合考慮各類技術的優劣勢,優先融合應用“低算力成本、高敵方消耗”的密碼技術,采用免改造應用的創新數據保護技術,合理加強“防護算力”投入,以實現更低成本、更高安全的有效數據防護。
堅持關鍵核心技術自主可控。構建數據基礎制度是支持數字經濟的前提,核心技術是推動和完善數據基礎制度建立的支撐,技術深耕、模型建設、算力提升都是數字經濟發展中不可或缺的組成部分。從技術角度,我國要加強安全多方計算、商用密碼技術、人工智能等關鍵核心技術攻關,牽住自主創新這個“牛鼻子”,發揮我國社會主義制度優勢、新型舉國體制優勢、超大規模市場優勢,提高數字技術基礎研發能力,打贏關鍵核心技術攻堅戰,牢牢掌握發展數字經濟的自主權。
來源:《光明日報》