撰文丨王聰

編輯丨王多魚

排版丨水成文

人工智能(AI)在專業(yè)診斷方面取得了顯著進(jìn)展,但在復(fù)雜臨床場(chǎng)景中仍面臨挑戰(zhàn),例如罕見病診斷急診決策

2025 年 4 月 4 日,澳門科技大學(xué)/溫州醫(yī)科大學(xué)張康教授聯(lián)合 溫州醫(yī)科大學(xué)金勝威教授、黃曉穎教授、瞿佳教授、解放軍總醫(yī)院段煉教授,在 Cell 子刊Cell Reports Medicine上發(fā)表了題為 : MetaGP: A generative foundation model integrating electronic health records and multimodal imaging for addressing unmet clinical needs 的研究論文。

該研究開發(fā)了一個(gè)擁有 320 億參數(shù)的醫(yī)療 生成式基礎(chǔ)模型——“元全科醫(yī)生”(MetaGP),通過在超過 800 萬份電子健康記錄、 540 萬篇生物醫(yī)學(xué)文獻(xiàn),以及 1.5 萬本醫(yī)學(xué)專著等大量數(shù)據(jù)集上的訓(xùn)練,MetaGP 展示了強(qiáng)大的診斷能力,其準(zhǔn)確率可與經(jīng)驗(yàn)豐富的臨床醫(yī)生相媲美。

在罕見病診斷中, MetaGP 平均診斷得分達(dá)到 1.57 分(滿分為 2 分),超過了資深全科醫(yī)生的 1.50 分以及 GPT-4 的 0.93 分。對(duì)于急診診斷,它分別將初級(jí)醫(yī)師和主治醫(yī)師的診斷準(zhǔn)確率提高了 53% 和 46%。此外,MetaGP 還具有出色的生成醫(yī)學(xué)影像報(bào)告的能力,能夠?yàn)樾夭?X 光片和計(jì)算機(jī)斷層掃描(CT)生成高質(zhì)量的報(bào)告,其質(zhì)量往往與醫(yī)生撰寫的報(bào)告相當(dāng),甚至更優(yōu)。這些結(jié)果突顯了 MetaGP 在各種醫(yī)療情境中變革臨床決策的潛力。

打開網(wǎng)易新聞 查看精彩圖片

人工智能(AI)的出現(xiàn)開啟了醫(yī)療保健和醫(yī)學(xué)的新紀(jì)元。近期取得的突破使 AI 工具能夠成功解讀各種類型的醫(yī)療數(shù)據(jù),例如皮膚鏡圖像、視網(wǎng)膜圖像、電子健康記錄(EHR)、心電圖以及腫瘤學(xué)試驗(yàn)數(shù)據(jù)。

雖然這些 AI 模型在其專門的任務(wù)上表現(xiàn)出色,但在涉及多個(gè)學(xué)科的診斷任務(wù)方面卻常常力不從心。例如,專注于心臟病學(xué)的 AI 模型可能會(huì)忽略神經(jīng)病學(xué)中的神經(jīng)癥狀。

當(dāng)前 AI 模型的這種“管中窺豹”,有可能導(dǎo)致漏診或?qū)颊哒w健康需求的理解不全面。如果沒有廣闊的視野或知識(shí)基礎(chǔ),這些工具可能會(huì)損害對(duì)患者的全面護(hù)理。

此外,這些 AI 模型的開發(fā)需要整合大量結(jié)構(gòu)化數(shù)據(jù),而將醫(yī)療數(shù)據(jù)結(jié)構(gòu)化的過程通常依賴于豐富的專業(yè)知識(shí)和定制化的數(shù)據(jù)處理程序。例如,在將 AI 應(yīng)用于電子健康記錄(EHR)之前,通常需要將異構(gòu)的原始數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)良好的輸入,這不僅費(fèi)時(shí)費(fèi)力,而且容易造成信息丟失。此外,隨著所需數(shù)據(jù)量的增加,這種模式可能會(huì)限制構(gòu)建更高級(jí)人工智能系統(tǒng)的可擴(kuò)展性。

應(yīng)對(duì)上述挑戰(zhàn)需要一種基礎(chǔ)人工智能模型(foundation AI model),它能將專業(yè)見解與全面的概覽相結(jié)合,并且在訓(xùn)練時(shí)只需少量的人工結(jié)構(gòu)化數(shù)據(jù)。

近年來,大語言模型(large language model,LLM)在包括醫(yī)學(xué)在內(nèi)的多個(gè)領(lǐng)域展現(xiàn)出了非凡的能力。這些模型,例如GPT-4BERT,在諸如醫(yī)療問答、報(bào)告生成和臨床決策支持等任務(wù)中展現(xiàn)出了潛力。然而,這些模型中的許多主要是基于通用的互聯(lián)網(wǎng)知識(shí)進(jìn)行訓(xùn)練的,而這類知識(shí)往往缺乏高風(fēng)險(xiǎn)醫(yī)療應(yīng)用所需的專門背景。

為彌補(bǔ)這一不足,近期的研究進(jìn)展集中在諸如 PMC-LLaMA、BiomedGPT 和 GatorTronGPT 等特定領(lǐng)域的模型上,這些模型利用 PubMed 論文、電子健康記錄和教科書等醫(yī)學(xué)數(shù)據(jù)庫來增強(qiáng)其領(lǐng)域知識(shí)。

這些模型在將大語言模型(LLM)應(yīng)用于醫(yī)學(xué)方面邁出了重要的一步,但在罕見病診斷、緊急狀況識(shí)別以及多模態(tài)數(shù)據(jù)整合等領(lǐng)域仍存在挑戰(zhàn)。

在這項(xiàng)最新研究中,研究團(tuán)隊(duì)推出了一種醫(yī)學(xué)生成式基礎(chǔ)模型——“元全科醫(yī)生”(Meta General Practitioner,簡(jiǎn)稱為MetaGP),參數(shù)量高達(dá) 320 億。其訓(xùn)練數(shù)據(jù)包括來自不同醫(yī)療系統(tǒng)的 830 萬份電子健康記錄(EHR)、540 萬篇生物醫(yī)學(xué)文獻(xiàn),以及 1.5 萬本醫(yī)學(xué)專著等大量數(shù)據(jù)集,相當(dāng)于熟讀全球頂尖醫(yī)院的 50 年診療記錄,這確保了 MetaGP 對(duì)醫(yī)學(xué)理論和實(shí)踐有著廣泛而深入的理解。

MetaGP 基于開源的通義千問Qwen-1.5-32B大模型框架構(gòu)建,,兼具通用性和靈活性,所需計(jì)算資源顯著減少。在預(yù)訓(xùn)練階段,使用了 120 塊 NVIDIA A100 圖形處理單元(GPU),配備 80GB 顯存(VRAM),歷時(shí)四周,隨后在每次迭代中使用 48 塊 A100 GPU 進(jìn)行微調(diào),每次迭代耗時(shí)五天。

MetaGP 整合了罕見病專業(yè)知識(shí)庫,覆蓋了 413 種罕見病診療路徑,還內(nèi)置了 2000+ 種急診鑒別診療流程,并通過醫(yī)生反饋持續(xù)優(yōu)化診療邏輯,實(shí)現(xiàn)動(dòng)態(tài)學(xué)習(xí)。因此,其有可能在廣泛的診斷場(chǎng)景中提供準(zhǔn)確的決策支持,應(yīng)對(duì)醫(yī)療領(lǐng)域的各種挑戰(zhàn)。

作為概念驗(yàn)證,研究團(tuán)隊(duì)驗(yàn)證了 MetaGP 在應(yīng)對(duì)兩個(gè)未解決的臨床挑戰(zhàn)方面的能力:1)罕見病診斷2)緊急狀況識(shí)別。為了應(yīng)對(duì)評(píng)估生成式醫(yī)療 AI 模型預(yù)測(cè)準(zhǔn)確性的挑戰(zhàn),研究團(tuán)隊(duì)在醫(yī)療保健專家的幫助下實(shí)施了嚴(yán)格的評(píng)估方案,并進(jìn)行了全面的測(cè)試。

評(píng)估結(jié)果顯示,MetaGP 展示了強(qiáng)大的診斷能力,其準(zhǔn)確率可與經(jīng)驗(yàn)豐富的臨床醫(yī)生相媲美。

對(duì)于罕見病診斷中,MetaGP 平均診斷得分為 1.57 分(滿分為2分),超過了資深全科醫(yī)生的 1.50 分以及 GPT-4 的 0.93 分。例如,一名反復(fù)暈厥的 18 歲患者,傳統(tǒng) AI 模型給出了“心律失常”的診斷,而 MetaGP 通過分析心電圖的細(xì)微異常,以及家族史和心肌酶譜,準(zhǔn)確識(shí)別出其患有罕見的“致心律失常性右室心肌病”。

對(duì)于急診診斷,MetaGP 分別將初級(jí)醫(yī)師和主治醫(yī)師的診斷準(zhǔn)確率提高了 53% 和 46%,將危重癥漏診率降低 68%。

此外,MetaGP 在生成醫(yī)學(xué)影像報(bào)告方面也表現(xiàn)出色,能夠?yàn)樾夭?X 光片和計(jì)算機(jī)斷層掃描(CT)生成高質(zhì)量的報(bào)告,其質(zhì)量通常與醫(yī)生撰寫的報(bào)告相當(dāng),甚至更優(yōu)。

該研究的亮點(diǎn):

  • MetaGP 通過整合海量醫(yī)療數(shù)據(jù),實(shí)現(xiàn)精準(zhǔn)可靠的診斷;

  • MetaGP 在罕見病和緊急護(hù)理診斷方面表現(xiàn)出色;

  • MetaGP 提升了臨床醫(yī)生在關(guān)鍵醫(yī)療場(chǎng)景中的準(zhǔn)確性;

  • MetaGP 可為影像數(shù)據(jù)生成可靠、準(zhǔn)確的報(bào)告。

打開網(wǎng)易新聞 查看精彩圖片

這些結(jié)果突顯了 MetaGP 在各種醫(yī)療情境中變革臨床決策的潛力。MetaGP 的出現(xiàn),標(biāo)志著醫(yī)療 AI 從單科冠軍向全能選手的進(jìn)化,它不僅可以作為醫(yī)生的智能助手,更能成為醫(yī)療資源分配的均衡器。研究團(tuán)隊(duì)認(rèn)為,MetaGP 不是為了取代醫(yī)生,而是幫助放大人類醫(yī)學(xué)智慧,未來,這種人機(jī)協(xié)作的診療模式,或?qū)⒊蔀槠平饪床‰y、降低誤診率、實(shí)現(xiàn)醫(yī)療平權(quán)的新鑰匙。

論文鏈接

https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00129-6

打開網(wǎng)易新聞 查看精彩圖片