瑞金醫院牽手華爲把病理大模型開源了:診斷門檻在降低,但仍有挑戰

病理診斷是絕大部分疾病,尤其是腫瘤疾病的診斷“金標準”,是醫生的醫生。病理診斷耗時長,再加上我國病理醫生缺口大,病理醫生分佈不均,如何用AI在提高醫生工作效率的同時,又可以降低漏診、誤診的風險,成爲醫療行業關注的焦點。

6月30日,瑞金醫院聯合華爲宣佈開源RuiPath病理模型,意在醫院降低病理AI輔助診斷部署門檻,這也成爲上海醫療機構首個開源的病理模型。

此次開源的爲RuiPath病理模型的核心“視覺基礎模型”。根據官方介紹,該模型依託瑞金醫院百萬張高質量數字病理切片數據,基於華爲AI全流程工具鏈ModelEngine進行標註、訓練和模型精調而成,在業界12個主流公開數據集的14個輔助診斷任務測試中,有7個達到業界領先水平(SOTA),並已具備臨牀驗證能力。本次開源配套提供測試數據集,覆蓋了肺癌、結直腸癌、甲狀腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌等7個常見癌種。

中國工程院院士、瑞金醫院院長寧光在現場表示,病理大模型只有真正臨牀應用才能產生價值實現AI普惠。

病理診斷指通過手術切除、內鏡活檢、細針穿刺等方式獲取人體組織或細胞,藉助顯微鏡等工具對樣本進行一系列處理和觀察。通常,一個病理檢測需3天到5天,如遇較爲疑難的疾病,加做免疫組化或分子檢測,診斷時間長達7天至10天。大醫院病理科培養一位合格病理醫生需要5年至8年時間,但在縣級醫院,還無法耗費這麼長時間來培養,這可能會導致病理行業的診斷質量不統一問題。

大模型的出現,給病理科的智慧化帶來極大的想象空間。但要開發一個病理大模型,難度超出想象。

瑞金醫院病理科副主任醫師笪倩稱,在病理人工智能落地過程中仍面臨數據、算法、算力、存力四方面挑戰。數據上,切片質量差、格式不統一及數字化醫院佔比低,中國有5000家醫院具有病理科,但是不足5%的醫院將數字化診斷應用於日常的診斷過程當中,導致模型精度受影響且數據規模小;算法上,傳統標註依賴病理專業知識,成本高、耗時長且具主觀性;算力上,百萬級切片對應PB級數據與單張GPU顯存80GB的矛盾突出,易致算力浪費;存力上,三甲醫院病理數據增量大、存儲成本高,數字化的門檻是高居不下。

“以瑞金醫院爲例,我們每天的增長切片量是6000張,所以每年的數據增量是1.5個PB。”笪倩表示,儘管困難重重,但瑞金醫院不斷嘗試突破技術瓶頸。2023年3月,瑞金醫院上線了全流程的數字化病理平臺。

此次RuiPath的發佈後,瑞金醫院在數據層面擁有了百萬張的數字切片庫,數據量大,疾病的譜系全面。算力方面,首次使用了16張的國產910B的算力卡去訓練百萬數據,並且通過ModelEngineAI全流程工具鏈平臺節約了80%的數據的處理週期,縮短了70%的業務上線時間。在臨牀實戰中覆蓋19個病種、上百個診斷任務,關鍵指標超90%,診斷效率提升至秒級。

“這次開源,也可以將瑞金醫院多年積累的高質量病理數據進行訓練和精調,獲得臨牀級模型和工具,基層醫院可節省數據準備、模型訓練、應用開發的大量初始工作,促進病理AI輔助診斷廣泛應用。”華爲數據存儲產品線總裁周躍峰表示,開源RuiPath病理模型,可以降低醫院病理AI輔助診斷部署門檻,提升整體病理診斷水平。

在寧光看來,推動RuiPath病理模型開源,對於完善模型本身以及模型的可及性,有可能起到雙贏作用。他表示,該模型可以覆蓋中國每年全癌種發病人數90%的19個常見癌種,但還有10%的癌腫還無法覆蓋到,開源的話,或有望覆蓋更多的腫瘤診斷。

不過,RuiPath病理模型的開源雖然可以推動AI醫療平權,但如何推動更多的醫院加入部署病理大模型,數據方面的積累仍存在挑戰。

此前,有病理科醫生對第一財經記者表示,病理切片及其掃描的質量決定了圖像數據的好壞,不同級別醫院、不同水平病理人員製作的切片質量差別非常大。製成病理切片全流程的檢測儀器、試劑、操作等要素均會影響病理圖像質量和病理診斷結果,因此每個關鍵環節都遵循行業規範和標準,如果沒遵循好,也會影響病理圖像及病理大模型的質量。醫療數據的安全與隱私保護也是亟待解決的關鍵問題。