來源:HIT專家網 作者:姜浩 龔晨
京東健康進入真實世界研究(Real-World Study,RWS),助力臨床科研?一開始接觸到這一信息,有些將信將疑。然而,當與京東健康相關業務部門進行深度交流后,頓悟京東健康這一著可謂“水到渠成”。
從最初的醫藥電商業務起步,京東健康一直在大健康領域不斷深入和擴展,目前已涉及醫療供應鏈服務、醫療健康服務、數字健康解決方案、智慧醫療解決方案等多個業務領域,同時與產業鏈上中下游各環節的企業、機構進行合作,以打造更加完整的大健康生態體系。
日前,京東健康技術產品部互聯網醫療研發總監杜寶華在接受HIT專家網訪談時確認,在持續布局大健康產業生態的征程中,京東健康推出了RWD(Real-World Data,真實世界數據)平臺。
從醫藥電商到互聯網醫療、健康管理,再到為醫學大數據科研領域提供技術和數據服務,京東健康這一步“跨界”的底層邏輯是什么?
瞄準RWS常見的兩大數據痛點
“當前階段,各醫學研究機構正在進行的RWS科研,普遍存在效率與成本問題。”杜寶華認為,其中嚴重拖累科研效率與成本的兩大關鍵痛點是:數據收集與數據處理。
根據《用于產生真實世界證據的真實世界數據指導原則(試行)》,真實世界數據(RWD)是指來源于日常所收集的各種與患者健康狀況和/或診療及保健有關的數據,是真實世界證據(Real World Evidence,RWE)的重要基礎。按功能類型分類,RWD的來源可分為醫院信息系統數據、醫保支付數據、疾病登記數據、來自移動設備的個體健康監測數據、其他特定功能數據(包括公共衛生監測數據、患者隨訪數據、患者用藥數據等)等。
沒有高質量的、適用的RWD支持,高質量的RWS也就無從談起。然而,在臨床科研實踐中,由于各種RWD來源之間相對獨立和封閉、數據存儲分散且標準未能統一、數據整合和互聯互通存在困難,造成數據碎片化和孤島現象突出,使得RWS的數據收集之路障礙叢生。
比如,在醫院信息系統數據等“院內數據”的收集過程中,臨床科研人員普遍需要花費大量時間、精力,用于各業務系統的數據提取、清洗、轉化等基礎性治理工作中。
更為棘手的問題是“院外數據”的收集。以病例隨訪數據為例,這是RWS的重要一環,包括院內數據無法涵蓋的一些重要臨床指標,如總生存期、五年生存率、不良反應信息等,需要長期追蹤。在大部分醫療機構,隨訪工作普遍存在失訪率高,隨訪內容不完整、不準確,隨訪的時間與人力成本高等問題。這些真實性、準確性欠佳,乃至大范圍缺失的隨訪數據,將在很大程度上影響RWS的研究價值。
而在數據處理階段,臨床科研人員的痛點在于“尋求工具”。為滿足不同類型的數據處理需求,他們往往需要不斷尋找、學習各種各樣的數據分析技術與軟件應用;而且這些工具之間是缺乏聯系的,因此還需要臨床科研人員的“自行集成”,才能借助多款工具完成一項數據處理任務。數據處理階段的耗時之長、效率之低,很大一部分原因在于數據分析工具“不夠好用”,臨床科研人員迫切需要一款多功能、一體化的工具,以提升整體效率。
發揮京東健康恰好具備的大數據資源和技術能力
“在健康大數據與AI應用方面,京東健康有著豐富的資源積累和相關經驗能力,而這些能力與經驗剛好可以與RWS數據收集與處理的難點問題相匹配。”杜寶華介紹,京東健康可以將這些能力“平滑適配”到RWD平臺上,為臨床科研人員提供一款“好用”的科研工具,協助其處理數據收集與處理中大量耗時費力的基礎性工作,將精力投入到更需要他們投入智慧的工作內容中去。
在數據融合方面,在京東健康互聯網醫院、京東家醫等產品線的合力支持,以及多個智慧醫院、健康城市項目的建設基礎上,京東健康RWD平臺目前已擁有完善的院外數據服務能力,可以形成一條較為完整的全周期、多維度的患者健康數據服務鏈路。
其中,京東健康自帶的C端連接能力,可以幫助RWD平臺破除“患者隨訪數據缺失”的老大難問題。RWD平臺可以與京東健康互聯網醫院的成熟診療工具與線上隨訪能力進行有效結合,實現患者智能圈定與分組,基于自定義分類標簽的能力,提取相關標簽值域,分析人群特征分布,一鍵智能分組,幫助科研人員快速建立理想的人群分組;依賴京東健康互聯網醫院在線問診資質,可實現便捷的醫患在線會話;基于智能語義邏輯設定、話術模板導入、人群圈定及動態更新等技術手段,可實現智能電話隨訪,支持面向大群體的簡單隨訪工作智能投放,極大地減少重復性工作,幫助臨床科研人員提升隨訪效率。
在與中國心血管健康聯盟的合作中,京東健康RWD平臺通過沉淀患者的診療、康復與日常行為等真實世界數據,并結合血糖儀、血壓儀、運動手環等智能設備所共享的數據,形成了患者院外多維度健康數據集。另外,通過RWD平臺的智能隨訪能力,醫生能夠全程跟蹤、全面了解患者的疾病進展,為患者提供更精準的治療方案,同時助力醫生高效積累臨床研究數據,其數據收集效率達到傳統模式的6-7倍。
在數據治理方面,京東健康RWD平臺支持兩層數據集的架構模式:底層通用字段集提供標準化字典規范,能夠統一、規范處理信息;基于通用字段集構建的專病字段集能夠滿足多方科研訴求,支持醫療機構自定義專病模型。
為解決多源數據的整合問題,京東健康RWD平臺提供開放的、可擴展的數據映射組件與清洗組件。基于京東健康知識圖譜平臺,RWD平臺可以通過自然語言處理技術進行語義識別、聚類與分類等,對在院內外采集到的非結構化醫療數據進行數據結構化與標準化處理。同時,以通用字段集為映射標準,RWD平臺可以通過數據質控組件進行數據填充,清理無效值域,保障數據質量。
在數據分析方面,京東健康RWD平臺支持靈活的科研表單配置,以自研的醫學量表系統為基礎,通過對題型規則的靈活組合,可支持20多種題型,滿足基本的科研調研需求。RWD平臺可以通過Flink實時計算引擎對數據進行預處理,利用ClickHouse列式存儲能力進行海量數據檢索與分析。基于這套數據分析引擎,RWD平臺可多維度分析調研內容的相關性,具有千萬級規模數據的實時分析能力、億級規模數據的準實時分析能力,可以提供多維圖表形式,并支持分析結果導出,能夠幫助臨床科研人員更全面地了解數據情況。
在數據隱私與安全方面,RWD平臺能提供完善的數據安全體系,對照金融行業的數據安全等級,通過建設醫療行業的數據安全管控體系,讓臨床科研人員在獲取“好用”服務的同時,更能感到“安心”。在數據存儲與傳輸方面,RWD平臺采用數據加密措施,并有嚴格的秘鑰管理機制,保障數據安全;在用戶隱私保護方面,RWD平臺將全部數據進行脫敏處理,并具有隱私計算能力,保障隱私信息安全;在信息追蹤方面,RWD平臺通過應用全路徑埋點安全日志,并依托京東安全風控系統感知異常的操作行為,來規避數據泄露、竊取問題;而在數據權限管理方面,京東健康有嚴格的權限管控體系,RWD平臺可以分角色從應用與數據多維度保障數據使用安全。此外,在登錄鑒權、安全防范、漏洞檢測等方面,RWD平臺也有京東強大的安全運維團隊支持,通過多重成熟的技術手段保障系統安全。
除此之外,京東健康RWD平臺可實現多視角項目跟蹤管理與風控能力,基于項目維度、患者維度等進行科研項目的跟蹤管理,提供智能檢測能力,及時感知滯留表單、無效表單,讓臨床科研的管理流程更“順暢”。
RWD平臺肩負“雙重使命”
杜寶華認為,RWD平臺是京東健康一款肩負“雙重使命”的新產品:
對外,京東健康RWD平臺面向醫療機構、醫療學科學會、醫療集團與藥企等用戶,旨在為其RWS科研工作賦能,幫助醫療機構降低科研投入、輔助優化治療方案、推動科研隊列快速落地;幫助醫生降低科研項目的準入門檻、快速取得成果進展;幫助藥企快速創建藥品RWD臨床研究、加速產品上市等。
“未來,京東健康將通過生態化的方式建設RWD平臺,一方面與業內垂類RWD平臺攜手共建RWD生態,另一方面,通過提供SaaS服務,滿足多方訴求,對接多種角色,最大程度地滿足不同用戶的使用需求。”杜寶華說。
據介紹,RWD平臺底層將以租戶化方式提供服務,保障租戶的數據隔離;同時通過PaaS化的方式,對各方的差異訴求進行擴展、定制。在實際應用過程中,平臺上會存在多種個性化科研隊列,無法通過標準化的方式滿足全部隊列的需求。此時,平臺可通過PaaS化的能力提供一些擴展點,用以解決個性化隊列的定制化問題,規避不同研究者或研究機構之間的影響。通過這種在線平臺化方式,臨床科研人員可以實現秒級開通服務。
為支持更多機構的“拎包入住”,京東健康正計劃打造一個標準化、規范化的數據采集平臺,并對外進行技術開放。對于新接入的機構而言,借由這個平臺,可極大程度地減少入駐RWD平臺的前期IT準備工作。
另一方面,京東健康RWD平臺的對內任務是幫助京東健康實現企業內部的數據沉淀、整合、資產化,促進京東健康在技術驅動創新領域邁上新的臺階。杜寶華坦言,早前各業務平臺之間存在信息孤島,如今京東健康正在通過RWD平臺推動不同業務形態下的數據融合,致力于將分散、無序的健康數據,轉化成多維度、有秩序、高質量、高價值的數據,對真實世界的健康業務形態進行有機結合,并由此實現數據驅動下的各類業務創新。
無論對RWS領域還是京東健康自身而言,肩負“雙重使命”的京東健康RWD平臺都將是一股新生力量,或將由此撬動數字健康產業生態的進一步重構。

精彩不容錯過!
【責任編輯:秦勉】
評論前必須登錄!
注冊