近日,深圳醫療健康大數據創新應用國際大賽總決賽及頒獎儀式在深圳國際BT領袖峰會上舉行。大賽以“數據驅動、智慧醫療”為主題,面向全球展開征集,旨在利用健康大數據創新技術與應用預測重大心血管疾病,交叉創新服務生物醫藥和健康產業,成為今年深圳國際BT領袖峰會的一大亮點
作為首個國人心血管健康大數據大賽,深圳醫療健康大數據創新應用國際大賽組委會采用海量真實、完整、高質量的醫院數據,征集了包括清華大學、北京大學、中國科學院大學、香港中文大學、英國牛津大學、美國加州大學、廣東省人民醫院等在內的200余家海內外頂尖高校、科研機構和企業的技術團隊踴躍報名。最終,歷時2個月,經過層層篩選,在組委會的評分統計以及專家組的全程觀摩和多角度評審下,共有14支團隊獲得決賽優勝。其中,清北中科聯隊與東南大學冠心病智能預警團隊分別摘得大賽標準組與創新應用組桂冠。
挖掘最可靠的健康大數據
此次大賽承辦單位之一——中國科學院深圳先進技術研究院(以下簡稱“先進院”),聯合深圳國家高技術產業創新中心、深圳市醫學信息中心、國家超算深圳中心等多家單位,以超算中心遠程虛擬機的形式,實現了將有效數據在安全可控環境下,向參賽團隊提供接入許可,保障了數據安全,為參賽團隊提供了具有開發和研究意義的數據平臺——超過40萬人的臨床電子病歷數據,160萬張醫院內醫學影像數據以及CCU(冠心病重癥監護室)病人連續監測生理波形數據。
“在實際的數據挖掘與研究中,獲取醫療數據的難度最大。要獲取體量大、真實可靠、安全脫敏的數據,更是難上加難。”清北中科聯隊成員、中國科學技術大學軟件學院的張鵬表示,“‘靠譜’的基礎數據,是建立精準、安全、可靠的國人健康大數據系統平臺的不二法門,這也是大賽的特色與意義所在”。
“從大數據的研究上來說,中國有著人群、人口數量樣本的優勢,這種在醫學大數據研究上的先天優勢無可比擬。”大賽程序委員會主席、中國科學院深圳先進技術研究院研究員李燁表示,“大數據在心血管疾病研究上的應用會對科研產生積極的推動作用,也會對產業發展起到促進作用”。
據介紹,在政府監管下,本次大賽首次嘗試將醫院內的大量醫學信息有效地向高校、科研院所以及企業提供接入許可,用以開發和應用。此外,所有數據都經過脫敏處理,選手只能遠程操作不能下載,實現了對數據安全的控制。
“我們歷時一年半以上,串聯、融合了不同醫院、不同系統的零散醫療數據,最終梳理成參賽隊員可以直接挖掘的數據。”中國科學院深圳先進技術研究院研究員蔡云鵬表示,他們與大賽各舉辦單位通力合作,針對來自深圳市的60多家公立醫院和600家社區健康服務中心,累計超過8年、覆蓋1800萬人的電子病歷數據,以及深圳南山區100多萬份心臟彩超影像數據等,開展數據脫敏、可用性探查、數據清理、關聯、質量控制等前期工作,保證了賽事數據挖掘和分析建模等工作的順利開展。
推動心血管疾病研究預警
心血管疾病是危害人類健康的重大系列疾病,每年死亡人數占全球死亡總人數的29%。我國心血管病患者達2.9億人,每5例死亡者中有2例死于心血管病。為此,本次大賽旨在通過挖掘心血管疾病發生發展情況以及發病高危因素,對心血管疾病進行早期防控以及分級干預,打造一個融合醫院內電子病歷、醫學影像、生理波形數據的醫療健康大數據系統。
其中,依托“東南大學—聯想”穿戴式智能監控聯合實驗室,東南大學冠心病智能預警團隊憑借名為“ICU多導生命體征數據的高精度特征連續掃描技術”的項目獲得創新應用組一等獎。東南大學教授劉澄玉帶領團隊,采用人工智能技術建立了冠心病早期預警模型,通過對來自不同重癥監護病房(ICU)148名心梗患者生命體征數據的分析顯示,該模型針對心梗檢測的準確度超過90%。
“動態連續的多通道生命體征數據準確處理是臨床面臨的一大挑戰,醫生需要100%準確可靠的參數。我們希望能為他們提供可靠、可信、可用的信號指標。”劉澄玉說。
目前,各大醫院、生物醫藥相關產業雖擁有心血管疾病患者的海量數據及影像病歷,卻缺乏對數據的有效利用。“隨著大數據和人工智能不斷發展,我們有了更好的手段、理論對心血管疾病進行更加深入徹底的研究。”中國人民解放軍總醫院心血管內科主任醫師盧才義表示,本次大賽提供了大量臨床數據,能保證選手從不同專業角度和需求方向挖掘,同時也搭建了交流合作的平臺,一定程度上推動了心血管疾病的研究與大數據、人工智能行業的發展與融合。
在日常應用研究中,“東南大學—聯想”穿戴式智能監控聯合實驗室還研發出全球首款十二導穿戴式智能心電衣。通過穿戴式電極和傳感器、柔性電路板,智能心電衣能與云端數據庫連接,穿戴者的心電波形可實時上傳至云端數據庫,對“心臟—睡眠—情緒”等信息進行智能判斷。“心臟病病人猝死前8小時是發現和治療的黃金時間,但其實在病人猝死前兩到三天,心電波形就已發生變化。通過24小時在線監測和智能診斷,我們可為病人提供預警。”劉澄玉說。
深度影響人類健康產業
大賽期間,還一并成立了“健康大數據智能分析技術國家地方聯合工程研究中心”。該中心主攻健康醫療大數據方向的前沿科學研究及轉化,將推動大數據平臺架構技術、生物計算及醫療人工智能技術、精準醫療與區域公共衛生應用等發展。
中國科學院深圳先進技術研究院院長樊建平表示,生命健康是全球公認最具潛力的下一代主導產業,各國都在大力投入,搶占競爭制高點。在此背景下,社會各界都對快速增長的海量生命健康數據所帶來的知識突破,以及應用價值寄予了厚望——醫療健康大數據這一嶄新領域應運而生,并得到了快速發展。
對此,先進院已開展和推進了生命健康和信息技術兩大技術的創新融合研究。其中,健康信息是他們最早布局的重要研究領域之一。2008年,先進院獲批成立中國科學院健康信息學重點實驗室,形成了近300人的多學科交叉研究隊伍;與此同時,他們已持續12年推動實施全民低成本健康工程——“海云工程”,相關技術和產品直接服務全國8000萬以上人口,在鄉鎮衛生院、社區衛生站等基層醫療機構建立了大量電子健康檔案和健康記錄。
開展醫療健康和大數據、人工智能等學科的交叉應用研究,最終目的是要推動智慧醫療。中國工程院院士、國家心血管病中心主任、中國醫學科學院阜外醫院院長胡盛壽表示,“數據、算力和算法是智慧醫療的‘三駕馬車’。其中,完整和真實的數據是智慧醫療的核心;算力——計算機硬件和技術是智慧醫療的基礎;算法仍在不斷演進,有不可知性。我國在這3方面仍有很長的路要走”。
中國生物醫學工程學會秘書長池慧也認為,我國醫療大數據發展還處于起步階段。“大數據的使用,應該是解決傳統處理方式和路徑發現不了或解決不了的問題——即通過研究一些真實有效的數據,發現仍未認識到的一些事物或規律,取得一些新的進展。”她說:“需要注意的是,‘大數據’不等于‘數據大’。很多單位會認為自身擁有很多‘數據’,但實際上可能不少數據無效或者不規范、不標準。數據質量不夠好,就無法做比較,也無法基于它來做研判。”她以時下熱門的人工智能為例:人工智能需要學習,目前學習的“教材”就來源于數據。如果數據本身不準確,就等于教材不準確,學到的東西自然也不準確。
《“健康中國2030”規劃綱要》已將健康醫療大數據應用發展納入國家戰略,并指出要推進健康醫療大數據應用,以醫療健康為核心,推動產業間的深度融合,對現有健康產業結構進行優化。中國科學院院士、中國科學院生物物理研究所研究員陳潤生表示,大數據和人工智能技術在生物醫學信息領域的應用,能夠切實解決當前生命科學和臨床醫學界面臨的很多難點。“這種結合與應用,在不久的將來會對健康理念、健康政策、醫保體系以及藥物評估,乃至對整個人類的健康事業發展產生深遠影響。”陳潤生說。
摘自《經濟日報》