版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

基于美日627例患者的臨床數(shù)據(jù),谷歌證實 AI 輔助肺癌篩查的群體有效性

HyperAI超神經(jīng)
原創(chuàng)
人工智能說明書,了解 AI 的功效和副作用。
收藏

2024 年 2 月,國家癌癥中心基于腫瘤登記及隨訪監(jiān)測最新數(shù)據(jù),形成了《2022年中國癌癥發(fā)病率和死亡率》報告。報告顯示,在我國,肺癌仍是惡性腫瘤發(fā)病和死亡的首位原因。盡管醫(yī)學(xué)界對于肺癌的關(guān)注度與日俱增,但在肺癌診療領(lǐng)域仍存在大量診斷延誤、過度治療等臨床難題。在過去的十年中,由于算法的改進(jìn)、計算能力的增加、可用數(shù)據(jù)的擴(kuò)展和應(yīng)用范圍大幅增長,AI 正以前所未有的成長速度引領(lǐng)科技發(fā)展方向。

作為在 AI 研發(fā)領(lǐng)域最為前沿的世界級科技巨頭之一,谷歌在 AI 與醫(yī)學(xué)應(yīng)用的研究方面成就頗豐。近期,谷歌研究中心的軟件工程師 Atilla Kiraly 和產(chǎn)品經(jīng)理 Rory Pilgrim 研究了機(jī)器學(xué)習(xí)模型如何有效地將研究結(jié)果傳達(dá)給放射科醫(yī)生,評估了廣義人工智能輔助系統(tǒng)在特定工作流程環(huán)境、設(shè)備和國家特定指南和評分/管理協(xié)議下對肺癌篩查 (LCS) 工作流程的影響。研究論文已經(jīng)發(fā)表于《Radiology AI》期刊。

研究亮點:

* 開發(fā)并優(yōu)化了人工智能輔助肺癌篩查的工作流程,并在美國和日本進(jìn)行測試

* 人工智能輔助下,可將特異性提高 5%-7%,而敏感性沒有明顯下降

* 人工智能輔助下,平均每位病例篩查時間可減少 14 秒,并且大大增強(qiáng)了醫(yī)生的診斷信心

研究范圍:人工智能輔助篩查,美國和日本的回顧性跨國研究

該研究共使用了 5 個獨(dú)立的數(shù)據(jù)集 (DS_CA, DS_NLST, DS_US, DS_JPN),分析了美國和日本合計 627 例(含 141 例癌癥陽性)低劑量胸部 CT 病例。其中,美國的研究涉及 330 例患者,包含 191 名男性和 139 名女性,年齡中位數(shù)為 63 歲。日本的研究涉及 297 例患者,包含 217 名男性和 80 名女性,年齡中位數(shù)為 58 歲。陽性病例被定義為在兩年內(nèi)通過病理確診肺癌,陰性病例被定義為至少兩年內(nèi)沒有任何確診癌癥的診斷。

最終設(shè)計與讀者研究概覽

同時,該研究還邀請到了 6 位獲得美國委員會認(rèn)證的胸科放射科醫(yī)生,以及 6 位具有閱讀 CT 胸部檢查經(jīng)驗的日本委員會認(rèn)證放射科醫(yī)生。在研究中,所有病例的 CT 分別由 12 名醫(yī)生在有人工智能輔助和無人工智能輔助的情況下,各審閱 1 次,共計獲得了 7,254 次解釋。對于特定國家的評分系統(tǒng),來自美國的放射科醫(yī)生采用美國放射學(xué)會指南中的肺-rads 評分 (1.1 版),來自日本的醫(yī)生采用仙臺評分系統(tǒng)。

在 141 例癌癥陽性病例中,美國和日本分別有 124 例和 17 例。其中,美國陽性病例的結(jié)節(jié)情況顯示,共有實性結(jié)節(jié) 69 例 (56%),部分實性結(jié)節(jié) 15 例 (12%),非實性結(jié)節(jié) 20 例 (15%),未分類結(jié)節(jié) 29 例 (23%)。

類似地,日本的陽性病例中有 6 例 (35%) 為實性結(jié)節(jié)、6 例 (35%) 為部分實性結(jié)節(jié)、5 例 (29%) 為非實性結(jié)節(jié)。在癌癥陰性病例中,同樣也選取了具備不同大小的結(jié)節(jié)的數(shù)量,使有既往病例的比例與癌癥病例的比例相匹配。

模型分析:基于現(xiàn)有模型改進(jìn),大幅提升統(tǒng)計分析能力
該研究的第一步是通過額外的訓(xùn)練數(shù)據(jù)和架構(gòu)來改進(jìn)之前開發(fā)的機(jī)器學(xué)習(xí)模型。

肺癌輔助篩查系統(tǒng)由 13 個模型組成,這些模型相互協(xié)調(diào),首先會對肺部進(jìn)行分割,獲得總體評估,定位 3 個可疑區(qū)域。然后,使用該信息為每個區(qū)域分配可疑評級。該系統(tǒng)使用了部署在 Google Cloud 上的 Google Kubernetes Engine (GKE) 引擎提取圖像、運(yùn)行機(jī)器學(xué)習(xí)模型并提供結(jié)果。

簡單來講,系統(tǒng)的輸出提供懷疑 (suspicion) 評級和 ROI (Region of Interest),供醫(yī)生結(jié)合所在地區(qū)的評分指南進(jìn)行判定。

人工智能輔助篩查系統(tǒng)

第二步,研究人員使用 DS_CA、DS_US、DS_NLST 這 3 個數(shù)據(jù)集來開發(fā)和訓(xùn)練模型。

訓(xùn)練集:

* DS_CA 是來自加拿大醫(yī)院系統(tǒng)的數(shù)據(jù),該數(shù)據(jù)集由 2010 年至 2017 年間的診斷性 CT 檢查組成,用于訓(xùn)練最終分類模型。

* DS_US 患者的非篩查 CT 被用來進(jìn)行額外訓(xùn)練。

* DS_NLST 由 26,722 名患者數(shù)據(jù)組成,對患者水平進(jìn)行隨機(jī)分割所得到的子集被用于開發(fā) AI 系統(tǒng)。

測試集:

* 第一個測試數(shù)據(jù)集是DS_NLST 總病例隨機(jī)分割的 15%。

* 第二個測試數(shù)據(jù)集篩選了來自 DS_US 的 CT 病例,該數(shù)據(jù)集來自美國伊利諾伊州的一家醫(yī)院系統(tǒng),從 5,055 名患者中分離出 1,1792 例未識別的病例。

* 第三個數(shù)據(jù)集 DS_JPN 來自日本仙臺 Kousei 醫(yī)院,由 2006-2018 年間接受 LDCT 篩查的 301 名患者組成。

為了提高人工智能系統(tǒng)在早期發(fā)現(xiàn)癌癥的能力,該研究納入了在診斷前長達(dá)兩年的癌癥陽性病例 cancer_in_2。在 cancer_in_2 中,所有陰性病例至少進(jìn)行了兩年的隨訪,以確保沒有癌癥確診病例,陽性病例均為 2 年內(nèi)影像學(xué)診斷出的病例。

該研究的主要目標(biāo)是,通過整合醫(yī)生們對癌癥的懷疑程度 (LoS) 評分,該研究掃描所有可能的數(shù)值閾值來計算靈敏度和特異性,得出了 LoS 的接收器工作特性曲線,并計算得出了 AUC。次要目標(biāo)則是,探索醫(yī)生使用當(dāng)?shù)卦u分系統(tǒng)和病例管理決策閾值的敏感性/特異性,這些都是基于緊急程度的二值化閾值進(jìn)行計算。

例如,「6 個月隨訪 CT」被認(rèn)為比「3 個月隨訪 CT」更不緊急,而「3 個月隨訪 CT」又比「疑似惡性腫瘤」更不緊急。類似的,該研究也對評分系統(tǒng)反應(yīng)和 AI 系統(tǒng)反應(yīng)進(jìn)行了相同的分析,并用 ORH 分析比較 AUC 差異。

在結(jié)果中,p 值 < 0.05 表示 AUC 差異比較具有統(tǒng)計學(xué)意義,p值 < 0.0125 或 < 0.01 分別表示經(jīng) Bonferroni 校正后具有統(tǒng)計學(xué)意義。

研究結(jié)果:AI 確實有效,但仍然可能錯過病變
在美國和日本的研究中,相對于無輔助方式,人工智能輔助提高了評分系統(tǒng)和病例管理選項中所有醫(yī)生的敏感性。其中,美國和日本病例的研究顯示 LoS 和 AUC 均改善了 0.023,人工智能輔助在所有 Lung-RADS 評分中都獲得了更高的敏感性和特異性。

美國(左)和日本(右)的病例在有和沒有人工智能幫助的情況下的表現(xiàn)

在 AI 輔助下,所有病例管理類別的敏感性和特異性評分都更高,美國病例和日本病例的 AI 輔助特異性分別提高了 5.5% 和 6.7%,但陽性篩查中的活檢建議特異性下降了 1.1%。

該研究還重點對美國國家肺癌篩查實驗中的患者群體進(jìn)行分析,結(jié)果顯示特異性仍然提高了 3.4%。日本病例的研究結(jié)果還表明,在有人工智能輔助的情況下,平均每位病例篩查可減少 14 秒的時間,并且大大增強(qiáng)了醫(yī)生的診斷信心。

日本醫(yī)生在有無人工智能輔助下的篩查時間

在輔助定位方面,AI 系統(tǒng)在美國和日本的研究中分別標(biāo)記了 89% 和 75% 的癌癥病例最應(yīng)關(guān)注的結(jié)節(jié),但在其他案例中 AI 可能會遺漏掉一些最應(yīng)關(guān)注的結(jié)節(jié)。

例如,在一個案例中,醫(yī)生將病例標(biāo)記為可疑,而 AI 系統(tǒng)標(biāo)記為陰性,通過進(jìn)一步比較,識別出了較小的亞實性結(jié)節(jié),這些結(jié)節(jié)在至少兩年的陰性隨訪中沒有被診斷為癌癥;在進(jìn)一步的放射科醫(yī)生審查中,它們似乎可被認(rèn)證為微創(chuàng)腺癌,正在進(jìn)行進(jìn)一步觀察。

總之,該系統(tǒng)在兩個國家、PACS 系統(tǒng)和患者群體的回顧性研究中證明了有效性,因為在 AI 輔助下解釋具有挑戰(zhàn)性的肺癌篩查病例時減少了不必要的隨訪,并有可能減少隨訪成像的過度使用、避免頻繁進(jìn)行肺活檢,并減少衛(wèi)生保健系統(tǒng)的負(fù)擔(dān)。

團(tuán)隊接棒,谷歌的肺癌研究持之以恒

事實上,谷歌對于肺癌的研究由來已久。

早在 2019 年 5 月 7 日,谷歌就曾在 2019 年開發(fā)者大會上宣布,其研發(fā)的人工智能技術(shù)可以比醫(yī)生早一年查出肺癌,使患者存活的概率提升 40%,谷歌還將致力于將這些技術(shù)轉(zhuǎn)化為實際的醫(yī)療解決方案,以改善肺癌患者的治療和預(yù)后過程。

僅僅在 2019 年開發(fā)者大會落幕十多天后,Google AI 的研究人員 Daniel Tse 又與斯坦福、紐約大學(xué)等機(jī)構(gòu)的研究人員合作,在 Nature Medicine 雜志上發(fā)布了他們最新設(shè)計的深度學(xué)習(xí)模型,測試表明,該 AI 程序判斷人類患病情況的準(zhǔn)確率高達(dá)到 94%,比一同參與測試的 6 名放射科醫(yī)生表現(xiàn)更好,而這些人類醫(yī)生已經(jīng)有 8 年左右的臨床經(jīng)驗。

此后,谷歌對于肺癌的探索并未止步?;趯ι鲜鰴C(jī)器學(xué)習(xí)模型的不斷開發(fā),谷歌如今終于在多國家、多專家、多病患的情況下進(jìn)一步驗證了模型的有效性。而這,或許也意味著人工智能在肺癌領(lǐng)域的實際應(yīng)用速度也將加快,不遠(yuǎn)的將來也將真正造福人類。

評論
新風(fēng)科普????
少傅級
我國科技發(fā)展迅速,證實了AI輔助肺癌篩查的有效性。AI輔助肺癌篩查可以提高篩查的特異性和效率,同時減少醫(yī)生的工作負(fù)擔(dān),并可能改善患者的診斷體驗。
2024-04-22
科普中國俄體鎮(zhèn)023
大學(xué)士級
2024-04-22
祥和123
學(xué)士級
AI的應(yīng)用技術(shù)在不遠(yuǎn)的將來也將真正造福人類。
2024-04-22