极新
2022.05.21 09:53

飛速發展中的醫療大數據 

portai
我是 PortAI,我可以總結文章信息。

上世紀興起的基因組、蛋白質組學等通過大通量技術預測疾病發生髮展獲得了巨大的關注,對其研究推動了對大數據數理模型的技術發展。

越來越多的研究發現,疾病不僅取決於基因及其表達還與表觀修飾蛋白功能等多方面協同作用,僅對基因組等單一組學進行微觀研究較難獲得突破。醫療大數據的發展使得微觀基因組基礎大數據和宏觀臨牀大數據結合,聯合信息統計分析及人工智能技術,可更加準確地預測疾病的發生發展,從而推動預測醫學的進一步提高。

一個明顯的趨勢是,醫療大數據行業正在成為下一波醫療行業的機會。在這個行業之中,千億的市場規模,人工智能技術的進步都讓人浮想聯翩。

也誠然,這樣的趨勢也讓無數投資人和企業趨之若鶩。

在癌症領域,我國現存 750 萬腫瘤患者,人均花費 7 萬元,按照腫瘤治療滲透率 60% 計算,那麼這就是一個 3000 多億人民幣的市場。

而如果未來在藥物、手術、放療都與國際接軌的話,那麼這個市場將會變得更廣闊。

01

國內外的醫療大數據

作為大健康醫療的一個分支,醫療大數據行業歷史並不算悠久。但時至今日,該領域內已經發展出包括臨牀大數據、健康大數據、生物大數據、運營大數據等多個垂類分支,而每一個分支都在諸如臨牀科研、公共衞生、行業治理、管理決策、惠民服務和產業發展等方面影響着整個醫療行業的變革。

從國際大背景來看,美國在醫療大數據方面仍然領跑全球,截至目前,美國已經建成覆蓋本土的 12 個區域電子病歷數據中心、9 個醫療知識中心、8 個醫學影像與生物信息數據中心。

由美國衞生與公眾服務部 (HHS) 管理的聯邦政府網站 healthdata.gov 是國家級的健康數據開放平台。通過該網站越來越多的來自於 CMS(醫療保險和醫療補助服務中心)、CDC(疾病控制中心)、FDA(食品藥品監督管理局)、NIH(美國國立衞生研究院) 等渠道的 HHS 數據庫向社會開放。

數據內容包括臨牀服務質量信息、全國衞生服務提供者目錄、最新醫療和科學知識數據庫、消費產品數據、社區衞生績效信息、政府支出數據等。

2014 年 6 月,美國 FDA 的公共數據開放項目 openFDA 正式上線。openFDA 前期開放了 2014—2013 年間的 300 萬份藥物不良反應和醫療過失記錄,以及醫療器械報告和執法報告,並且每年更新發布新的報告數據集。

而在英國和日本,醫療大數據同樣是兩國大力發展的戰略領域之一。

由於受人口老齡化的影響,日本政府將健康醫療大數據用於控制醫療費用。受該國國情影響,大數據在其中的作用主要是控制醫療和護理費用。

在中國國內,醫療大數據行業起步時間不長,目前只是初步建立了醫療健康數據庫,人口健康信息化初具規模,在信息技術和醫療行業的產學研方面有了一定成效。

比較重要的是,在生物數據庫方面,國家基因庫 2016 年正式建成,該基因庫集生物資源樣本庫、生物信息數據庫和生物資源信息網絡為一體。而在我國的醫療大數據總體方向上,還和美英日等國有所不同,這一點下文詳表。

圖片

02

國內的特點

一國的醫療大數據發展方向取決於這個國家的稟賦。

正如我們之前系列文章提及的那樣,雖然國外醫療行業也有資源分配不均的情況出現,但就程度而言,這樣的情況在我國表現的尤為明顯。

也因此,在 “健康中國 2030” 國家戰略背景下,國內的醫療大數據行業發展方向幾乎不可避免的邁向了智能化。

智慧醫療最大的好處是可以利用有限的醫療條件,最大程度發揮醫療機構的水平和技術優勢。一方面,這樣節約了成本,另一方面也讓醫療資源實現了共享和下沉。

在這樣的背景下,醫療大數據在國內獲得了飛速的發展,2013 年,我國的醫療大數據行業市場還僅為 331 億元,而到了 2017 年,就已經增長至 643 億元。

但智慧醫療只是最終的終點,而在這個萬里長城的第一關則是數據。就目前來看,醫療數據面臨着幾大問題:

其一,是醫院面對企業型合作方時,他們往往更為謹慎:醫院對數據方面會更看重安全、準確、穩定且持續更新。數據處理需要精準且調用快捷,一旦共享則一定要保證安全。這點説明,絕大多數醫院的信息化系統建設會由外部公司承接,各類信息數據均會留在本地服務器上,不會外傳到第三方機構或平台。

這增加了第三方利用醫院數據的難度。

03

數據的來源與利用

在獲取數據的過程中,第三方數據公司的數據來源來自於以下幾種:

其一是病人就醫過程中產生的信息——即從掛號開始便將個人姓名、年齡、住址、電話等信息,還包括面診過程中病患的身體狀況、醫療影像等信息也會被錄入數據庫,並且,看病結束以後,費用信息、報銷信息、醫保使用情況等信息被添加到醫院的大數據庫裏面。這就是醫療大數據最基礎、最龐大的原始資源。

其二是臨牀醫療研究和實驗室數據:即將臨牀和實驗室數據整合在一起,這種數據極大,一張普通 CT 圖像含有大約 150MB 的數據,一個標準的病理圖則接近 5GB。如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院累積的數據量就可達數萬億字節甚至數千萬億字節 (PB) 之多。

其三是製藥企業和生命科學數據:比如上文提到的 2016 年建造的國家基因庫,以及一些研究院所所研究的生物數據庫。

最後是智能穿戴設備所採集的健康管理數據,未來,便攜式的可穿戴醫療設備正在普及,個體健康信息都將可以直接連入互聯網,由此將實現對個人健康數據隨時隨地的採集,而帶來的數據信息量將更是不可估量的。

收集的數據最後去了哪?去了四個地方。

其一,為相關企業提供醫療分析數據,即為醫療機構提供世界級的數據倉庫解決方案;

其二,輸入到了轉譯研究中心,即為醫學研究機構以及製藥中心提供新技術的研究保障;

其三,賦能健康科學網絡,即為製藥公司、資產管理公司以及研究機構之間提供安全的數據共享;

最後,用於旨在加強與患者聯繫的平台之中——甲骨文通過收購 RightNow 以及 Eloqua 等公司,就是為了加強醫療機構與患者之間的聯繫,而一部分數據就是被輸入到了這裏。

圖片

04

醫療大數據的創新

目前,人工智能技術通過算法和軟件,分析複雜的醫療數據,達到近似人類認知的目的。因此 AI 使得計算機算法能夠在沒有直接人為輸入的情況下預估結論成為可能。

在該領域的創新正在全球範圍內發生,其中,在法國,科學家們正在採用一種被稱為 “時間序列分析” 的技術,分析過去 10 年的患者入院記錄。這項研究能夠幫助研究人員發現患者入院的規律並利用機器學習,找到能夠預測未來入院規律的算法。

這項數據最終會提供給醫院的管理人員,幫助他們預測接下來 15 天中所需要的醫護人員 “陣容”,為患者提供更加 “對口” 的服務,縮短他們的等待時間,同時也有利於為醫護人員儘可能合理地安排工作量。

在腦機接口領域,可以幫助恢復基本的人類體驗,例如因神經系統疾病和神經系統創傷而喪失的説話和溝通功能。

在不使用鍵盤、顯示器或鼠標的情況下,在人類大腦和計算機之間創建直接接口,將大幅提高肌萎縮側索硬化或中風損傷患者的生活質量。

此外,AI 還是新一代放射工具的重要組成部分,通過 “虛擬活檢” 幫助分析整個腫瘤情況,而不再通過一個小小的侵入性活檢樣本。AI 在放射醫療領域的應用能夠利用基於圖像的算法來表現腫瘤的特性。

在藥物研發方面,依託大數據,人工智能系統可以快速、準確的挖掘和篩選出適合的藥物。通過計算機模擬,人工智能可以對藥物活性、安全性和副作用進行預測,找出與疾病匹配的最佳藥物。這一技術將會大大縮短藥物研發週期、降低新藥成本並且提高新藥的研發成功率。

例如,當某人被診斷為癌症時,智能藥物研發系統會利用病人的正常細胞和腫瘤來將它的模型實例化,並嘗試所有可能的藥物,直到找到一種能殺死癌細胞又不傷害正常細胞的藥物。如果它找不到有效藥物或者有效藥物組合,那麼它就會着手研發一種能治癒癌症的新藥。如果藥物醫治了疾病但仍有副作用,系統則會嘗試通過相應調整擺脱副作用。

05

目前遇到的困境

在醫療大數據行業中,講求對 “真實世界數據” 的挖掘和掌握,而其中最重要的核心內涵就是基於人羣大數據的研究,從而推動藥品研發和應用以及建立治療方案療效客觀評價的新方法。

由於時間地域及硬件條件的不平衡,可能生成海量的醫療病例錯誤信息。有誤的病歷電子化後,將帶來更多更大的扭曲刪改和誤導性的信息。此外,數據的不完整性也是制約醫療大數據發展的因素,可能對其應用產生錯誤或偏倚,所以,儘快統一各級醫院病例數據模塊,建立標準化的輸出結構或格式,使得數據的採集標準化、規範化,讓數據能夠分析使用是當務之急,不同類型的醫療數據資料,採集傳輸時達到統一標準。

所以其大數據也必定具備一般的數據特性:規模大、結構多樣、增長快速、價值巨大,但是其作為醫療領域產生的數據也同樣具備醫療性:多態性、不完整性、冗餘性、時間性、隱私性。

多態性:醫療數據包含有像化驗產生的純數據,也會有像體檢產生的圖像數據類似心電圖等信號圖譜,醫生對患者的症狀描述以及跟進自己經驗或者數據結果做出的判斷等文字描述,另外還有像心跳聲,哭聲,咳嗽聲等類似的聲音資料,同時現代醫院的數據中還有各種動畫數據(像胎動的影像等)。

不完整性:由於各種原因導致有很多醫學數據是不完整的,像醫生的主觀判斷以及文字描述的不完整,患者治療中斷導致的數據不完整,患者描述不清導致的數據不完整等。

冗餘性:醫療數據量巨大,每天會產生大量多餘的數據,這給數據分析的篩選帶來了很大困難。

時間性:大多醫療數據都是具有時間性、持續性的,像心電圖,胎動思維圖均屬於時間維度內的數據變化圖譜。

隱私性:另外隱私性也是醫療數據的一個重要特性,同時也是現在大部分醫療數據不願對外開放的一個原因,很多醫院的臨牀數據系統都是相對獨立的局域網絡,甚至不會去對外聯網。

此外,醫療大數據人才也相對缺乏,而且中國醫療大數據應用的主體醫護衞生人員素質和能力整體水平也較高。

由於信息化網絡基礎設施建設發展,人們對信息化及數據的應用並不陌生,且已初步形成大數據研究的專業化人員隊伍。但是醫療大數據建設及其研發有特殊性。首先醫療數據專業性強,其採集、整合、解讀和應用都需要專業化衞生人員甚至醫護人員的參與。

然而中國瞭解醫療大數據及參與醫療大數據建設的衞生人員極其稀缺,此類人才不光需要有醫學背景,而且需要具有數理統計和信息分析等知識。

中國已建設的大數據人才多是數理統計方面的專家,但由於醫學知識的缺乏,就無法真正深度應用已整合的醫療數據。所以醫數醫理交叉人才的短缺及醫護衞生人員大數據相關知識的缺乏是目前阻擋中國醫療大數據發展的重大問題。

此外,醫療大數據相關研究基金和課題的缺乏也是目前衞生人員對醫療大數據不瞭解和不深入研究的原因之一。$衛寧健康(300253.SZ) $萬達信息(300168.SZ) $東華軟件(002065.SZ)

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。