業務標簽:醫院資訊集成平臺、互聯網醫院、互聯網護理、慢性病隨訪
技術標簽:ESB、ETL+CDC、NLP、FaaS、SaaS、Hadoop、MicroService
技術微信群:
加微信:wonter 發送:技術Q
醫療微信群:
加微信:wonter 發送:醫療Q
—————— BEGIN ——————
怎樣從臟亂差的醫療大資料中提取價值(一)
怎樣從臟亂差的醫療大資料中提取價值(二)關注公眾號查看
導語:隨著醫療衛生資訊化建設行程的不斷加快,醫療資料的型別和規模也在以前所未有的速度迅猛增長,大資料時代,學會分析資料并且將其應用至作業中,不僅可以節省時間,提高效率,還能提取其中的價值,為醫生和患者提供便利,
一、醫療大資料的背景
迫切的需求:
-
缺乏統一整體的頂層設計:以HIS為核心的堆疊式建設,醫院整體資訊化的擴展性較差,很難適應后續的資訊化發展;
-
臨床應用深度不夠:實作醫院以臨床為中心、為患者提供優良的醫療服務,實作全面準確的臨床醫療資訊源,提高醫療質量和服務水平;
-
缺乏運營精細化的支撐:沒有形成資源的集中統一管理,未建立醫院人財物的一體化管理;
-
缺乏全院的資料整合、資料利用率較低:資料的利用率較低,沒有對臨床和管理起到支撐;
-
資訊系統間互動耦合度過高:基于HIS系統的一體化設計,耦合度較高;資料集中存盤,帶來系統升級和資料安全等問題;
-
資料標準規范性問題:缺乏全院的資料標準規范,系統間資料共享率低,
二、醫療大資料的來源
1. 病人就醫程序中產生的資料
從掛號開始便將個人姓名、年齡、住址、電話等資訊輸入系統;面診程序中病患的身體狀況、醫療影像等資訊也會被錄入系統;看病結束以后,費用資訊、報銷資訊、醫保使用情況等資訊被添加到醫院的系統里面,
這就是醫療大資料最基礎、最龐大的原始資料資源,
2. 臨床醫療研究和實驗室資料
臨床和實驗室資料整合在一起,使得醫療機構面臨的資料增長非常快,一張普通CT影像含有大約150 MB的資料,一個標準的病理圖則接近5 GB,
如果將這些資料量乘以人口數量和平均壽命,僅一個社區醫院累積的資料量就可達數萬億位元組甚至數千萬億位元組(PB)之多,
3. 制藥企業和生命科學
藥物研發所產生的資料是相當密集的,對于中小型的企業也在百億位元組(TB)以上的,
在生命科學領域,隨著計算能力和基因測序能力逐步增加,美國哈佛醫學院個人基因組專案負責人詹森·鮑比就認為,到2015年,將會有5000萬人擁有個人基因圖譜,而一個基因組序列檔案大小約為750MB,
4. 智能穿戴設備帶來的健康管理
隨著移動設備和移動互聯網的飛速發展,便攜式的可穿戴醫療設備正在普及,個體健康資訊都將可以直接連入互聯網,由此將實作對個人健康資料隨時隨地的采集,而帶來的資料資訊量將更是不可估量的,
三、醫療大資料的價值
1. 服務居民
居民健康指導服務系統,提供精準醫療、個性化健康保健指導,使居民能在醫院、社區及線上的服務保持連續性,妙健康提供了專業的醫生團隊,能夠在線幫助用戶解決各種病癥,進行健康指導,
居民也可以在其掌上藥房購買日常所需藥品,方便快捷,
2. 服務醫生
臨床決策支持,如用藥分析、藥品不良反應、疾病并發癥、治療效果相關性分析、抗生素應用分析;或是制定個性化治療方案,通過妙健康在線醫生,醫生可以在線進行相關的醫療指導,做出醫療診斷,還能夠有效減少門診量,
3. 服務科研
包括疾病診斷與預測、提高臨床試驗設計的統計工具和演算法、臨床實驗資料的分析與處理等方面,如針對重大疾病識別疾病易感基因、極端表現人群、建立個人健康醫療檔案等,
個人健康醫療檔案的建立,能夠讓個人醫療資訊共享,讓醫生能直接快捷地了解患者既往病史,避免了重復問診的現象,使患者能夠及時有效地接受治療,
4. 服務管理機構
規范性用藥評價;流行病、急病等預防干預及措施評價;公眾健康監測,臨床路徑的優化等,
5. 公眾健康服務
包括危及健康因素的監控與預警、網路平臺、社區服務等方面,通過資料采集、風險評估、健康干預等方式來為客戶提供健康管理等一系列服務服務,
四、醫療大資料的現狀
1. 資料異構
多平臺,多種介面,資料型別沒有一個標準,只能是點對點的對接大量資料,內容冗雜、程序繁復、速度緩慢,
2. 主題分散性
就診資訊分布在不同的平臺上,不能夠形成以患者為中心的所有電子化就診資訊集成,不能提供完整、全面、準確、及時的患者臨床資訊,
3. 資料量大
在大資料背景下,行業應用的資料量通常都以億級別計算,存盤通常在TB/PB級別甚至更多,
4. 資料多型
資料模型在資料出現之后才能確定,資料模型隨著資料量增長不斷演變,
五、建立醫療大資料資產目錄
依據衛生部資訊化作業領導小組辦公室衛生部統計資訊中心2011年3月發布的《基于電子病歷的醫院資訊平臺建設技術解決方案——業務部分》所示:
1. 臨床服務域
包含12個二級類目:患者標識、患者服務、入出轉、醫囑、病歷文書、護理文書、檢驗、檢查、手術麻醉、治療、輸血、健康體檢,業務子域共計26個,
2. 醫院管理域
包含4個二級類目:醫療管理、人力資源管理、財務管理、物資及后勤服務管理,共有業務子域共26個,
3. 平臺應用域
包含5個二級類目:區域醫療協同、管理決策、臨床決策、公共衛生資訊上報、患者公眾服務,共有業務子域20個,
根據臨床服務、醫院管理、平臺應用三域,梳理建設以業務活動為核心的資料資產目錄,根據業務活動主題梳理資料元識別符號,保證每一個資料元的識別符號具有唯一性(基本資料集:城鄉居民健康檔案、疾病管理、醫療服務、電子病歷等),

1)資料元識別符號“DE08.10.052.00”來源依據《TCHIA 7.3-2018 高血壓專科電子病歷資料集 第3部分:高血壓門(急)診處方》

2)資料允許值“WS218–2002”來源依據《WS 218-2002 衛生機構(組織)分類與代碼》

六、從業務系統中抽取資料
關聯映射業務系統表欄位,并創建調度任務,如圖五:

映射多表情況下,需要選擇關聯表主外鍵欄位,如圖六:

調度任務可支持針對單表、全表,歷史資料抽取,實時資料監聽抽取倆種模式,如果圖七:

七、資料質量質控
具有對資料質量進行評估的完整的指標體系,至少應該有完整性(事件、表單、記錄、表項)、一致性(主資料一致性、邏輯一致性)、唯一性(無二義冗余、指標及計算口徑)、及時性、原始性、可溯源性及可測量性,
八、資料中臺建設
根據資料資產目錄快速定位業務主題,如圖八:

根據不同業務場景,自定義勾選資料元名稱,自動生成API或新的主題庫(資料集市),

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/270936.html
標籤:架構設計
上一篇:🍖Django框架之路由層 ?
