華爲、螞蟻等爭相搶灘AI醫療|聚焦
《科創板日報》7月1日訊(記者 黃心怡)華爲、螞蟻等大廠正在加碼佈局AI醫療健康。
6月30日,瑞金醫院宣佈與華爲開源了病理大模型“RuiPath”, 並與海內外的12家醫療機構共同啓動RuiPath病理大模型的全球多中心計劃,協同推動病理大模型持續迭代。
螞蟻集團在收購好大夫後,持續佈局AI醫療。最新推出的AI健康應用“AQ”,提供健康科普、就診諮詢、報告解讀、健康檔案等上百項AI功能。
此外,科大訊飛、百川、Kimi等也紛紛看中了AI醫療這一賽道。從落地場景來看,名醫智能體、AI診療、新藥研發等是被重點關注的方向。
弗若斯特沙利文預測,中國AI醫療市場規模將從2023年的88億元增至2033年的3157億元,年複合增長率達43.1%。
不過,《科創板日報》記者在採訪中獲悉,高質量的醫療數據缺乏,以及數字化建設成本高昂等,仍在一定程度上影響了AI在醫療領域的應用。
▍AI智能體落地:爲名醫打造數字分身
AI應用於醫療服務,已經有很長一段時間。但此前小模型由於其泛化能力有限。
螞蟻集團AI醫療總經理劉軍偉認爲,大模型時代與此前階段的區別在於,AI將成爲生產力。比如,醫生AI分身既可以幫助醫生解決問題,也可以快速響應用戶的需求。螞蟻集團的AI健康應用AQ,就整合了全國近200位名醫“AI分身”。
“偏遠地區的老百姓,如果要想掛到大專家號,甚至進行在線專家問診,是很困難的。通過AI能力打造專家醫生分身,偏遠山區的老百姓就可以享受24小時隨時溝通。在不影響工作的情況下,專家也可以收到很多用戶的反饋或者用戶的需求。”
劉軍偉介紹,爲專科名醫打造AI分身,不僅需要形象和聲音相似,關鍵環節在於大模型對醫生科室診療經驗的針對性學習,讓智能體真正接近醫生本人的問診邏輯,這是在訓練模型、安全評估等一系列深度合作中完成的。當AI涉及到診療診斷等深入問題時,AI會爲用戶匹配醫生來做二次判斷,在有必要時建議掛號就診。
“我們希望AI扮演把所有類型的服務串聯起來的角色。大模型的關鍵進化還在於改變了交互方式,不需要任何門檻,一句話就可以。AI主要做的是諮詢,可以幫你直接喚起互聯網醫院和線下的陪診。”
▍大模型能否走入臨牀應用?
華爲於今年3月組建了醫療衛生軍團。《科創板日報》記者瞭解到,華爲希望大模型不止於問答諮詢,而是能直接在醫生的診斷環節發揮作用。
此次瑞金醫院與華爲打造的RuiPath病理大模型,正是AI在診斷方面的一大探索。該模型是基於對百萬數字病理切片等數據進行訓練,能識別病理切片中的病竈區域。
中國工程院院士、上海交通大學醫學院附屬瑞金醫院院長寧光認爲,AI真正走向實際臨牀應用,是醫療行業有待跨出的、非常重要的一步。“我們爲什麼一直在發佈,臨牀總是不應用?這是所面臨的非常重要的問題。“
這是爲何瑞金醫院選擇開源RuiPath病理大模型。目前RuiPath超越傳統小模型,已覆蓋19個常見癌種,覆蓋中國每年全癌種發病人數90%的癌種。但在寧光看來,還有10%腫瘤未能覆蓋。
“我們能否通過開源的方式,真正可以覆蓋百分之百的癌種。只有這樣纔可能達到臨牀應用級的大模型,這就需要大家一起來提高和打磨。”
在寧光的期望裡,應該集上海所能、集上海所強,所有醫院一起合作攻關,這樣纔可以在上海形成垂直化大模型生態。
“在衛建委和上海申康醫院發展中心的支持和領導下,可以有更多的醫院、更多的模型。而每家醫院對別家醫院的模型,都給予更多的關心支持和率先的使用。相信這樣就真正可以看到,不是一家一家醫院在發佈、在使用,而是整個上海在使用。也只有如此,纔可能提高垂直化醫學大模型在上海乃至全國,甚至全球的應用。”
▍數據仍是最大挑戰
瑞金醫院病理科主任助理笪倩表示,在病理人工智能的落地過程當中存在多重挑戰,比如數據切片和掃描的質量不合格,會影響模型的精度,數據格式不統一就會形成數據孤島。
笪倩提到,中國約有5000家醫院具有病理科,但不足5%的醫院將數字化應用於日常的診斷過程當中,導致數據的規模很小,影響了智慧化的發展。
在算法的層面上,傳統的模式數據標註依賴於病理學的專業知識,導致非常的昂貴而費時,並且具有個人的主觀性。
笪倩稱,在算力層面上,100萬張的切片對應的是一個PB的數據,單張的主流GPU顯存僅爲80個GB,這導致投資成本很高。在存力方面,三甲醫院病理數據的增量非常大,也使得存儲的成本非常高,數字化建設的門檻高居不下。以瑞金醫院爲例,每天的增長切片量爲6000張,所以每年的數據增量達到1.5個PB。
望石智慧創始人&CEO 周杰龍認爲,醫藥創新的問題分爲水面之上和水面之下:水面之上是研發挑戰的問題,創新難度大,怎麼突破創新的過程,避免“專利撞車”;水面之下,醫藥行業作爲數據密集型產業,很多藥企有非常多數據,但今天這些數據沉積在很多數劇倉裡,沒有實現數據價值最大化。”
“相對於其他行業,醫藥領域在數字化層面可能更偏落後,面臨更大的挑戰:一方面,業務每個環節的數據記錄可能未必規範,導致很多的數據之間沒有打通,或由於保密性原因無法辦法共享,導致數據浪費,知識無法沉澱。另一方面,對於工具層面,雖然目前已經有非常多的工具,但這些工具就好像散佈在系統裡面的一個個點,沒有形成從設計目標出發,構建一條系統化的工具鏈。”周杰龍表示。
望石智慧也在與亞馬遜雲科技等廠商合作,推進數據治理方面的技術探索,包括:數據結構化治理、模型輸入/輸出安全控制策略、基礎設施和各種高性能計算平臺的支持等。
周杰龍表示,在醫藥領域裡,需要訓練和學習化學、生物、模態醫藥的垂類大模型,基於底層的垂類生成模型,再融合文本模型,最終走向智能體(Agent)之路。通過多個智能體(Multi-agents)的方式提高集體智能和決策的方式。