據(jù)世界衛(wèi)生組織統(tǒng)計,2020 年全球新發(fā)乳腺癌病例 230 萬例,在所有癌癥中居首位,超越肺癌成為第一大癌。
然而,如果能夠早期發(fā)現(xiàn)并加以及時治療,在腫瘤轉(zhuǎn)移之前殺死癌細(xì)胞,乳腺癌的致死率就可以大大降低。目前乳腺癌初篩的常用手段是乳腺 X 光,隨后醫(yī)生通過分析復(fù)核 X 光片對乳腺健康情況進(jìn)行判斷。但復(fù)核過程會消耗大量時間,影響其他患者的就診。
為此,英國諾丁漢大學(xué)的研究者對比了商用 AI 與醫(yī)生閱讀乳腺 X 光片的能力,為 AI 在臨床醫(yī)療的應(yīng)用提供了新思路。
作者 | 雪菜
編輯 | 三羊、鐵塔
本文首發(fā)于 HyperAI 超神經(jīng)微信公眾平臺~
據(jù)美國癌癥協(xié)會統(tǒng)計,2022 年美國女性新發(fā)癌癥病例數(shù)約 93 萬例,其中新增乳腺癌患者約 29 萬人,占比 31%。同時,癌癥死亡病例中乳腺癌患者占比 15%,僅次于肺癌。
圖 1:美國 2022 年新發(fā)癌癥病例數(shù)(上)及癌癥死亡數(shù)(下)
在中國,乳腺癌是 21 世紀(jì)女性患者中占比最高的癌癥,且每年新增患者數(shù)量在不斷增加。
圖 2:2000-2016 年我國女性新增癌癥病例數(shù),灰色為乳腺癌病例數(shù)
乳腺癌是異常乳腺細(xì)胞生長失控并形成腫瘤引起的疾病。如果不及時干涉,腫瘤會轉(zhuǎn)移擴(kuò)散,最終危及性命。但如果能在癌癥初期發(fā)現(xiàn)局部腫瘤,并開始治療,癌癥的五年存活率可達(dá) 99%。
目前,醫(yī)院一般通過乳腺 X 光進(jìn)行乳腺癌初篩。然而,在初篩過程中可能會出現(xiàn)假陽性,使得沒有癌癥的患者進(jìn)行不必要的檢測。還會出現(xiàn)遺漏,延誤患者最佳治療時間。
因此,許多歐洲國家會對乳腺 X 光片進(jìn)行復(fù)查,盡可能排除掉假陽性的病例。這一方法行之有效,在降低假陽性的同時,還將癌癥的檢測率提高了 6%-15%。
但是,對 X 光片進(jìn)行閱讀評估需要耗費(fèi)相當(dāng)?shù)臅r間。在醫(yī)患比偏低的地區(qū),X 光片的復(fù)查不僅占用了醫(yī)生的時間,而且會影響到其他患者的早期篩查。
AI 的應(yīng)用部分緩解了醫(yī)生的工作壓力,然而將生命健康交給 AI 去評價似乎有些不太穩(wěn)妥。對此,英國諾丁漢大學(xué)的 Yan Chen 教授表示,「將 AI 應(yīng)用于臨床醫(yī)療面臨著很大的壓力,但我們需要將這件事做好,以保護(hù)女性的健康」。
為此,Yan Chen 團(tuán)隊對比了商用 AI Lunit 與醫(yī)生閱讀乳腺 X 光片的準(zhǔn)確率。**結(jié)果顯示,Lunit 分析乳腺 X 光片的能力與人類醫(yī)師相當(dāng)。**這一成果已發(fā)表于「Radiology」。
論文鏈接:
https://pubs.rsna.org/doi/10.1148/radiol.223299#_i13
實驗過程
數(shù)據(jù)集:PERFORMS 數(shù)據(jù)集
本研究選用兩組 PERFORMS 數(shù)據(jù)集作為模型的測試集。每組 PERFORMS 數(shù)據(jù)集由 60 張具有挑戰(zhàn)性的 X 光片組成,包括惡性腫瘤 (約占 35%)、良性腫瘤和正常結(jié)果。過去 30 年間,PERFORMS 數(shù)據(jù)集用于英國國家衛(wèi)生服務(wù)乳腺篩查計劃 (NHSBSP) 醫(yī)生的入門測試和常規(guī)考核。
評價標(biāo)準(zhǔn):標(biāo)注 + 評分
在對 X 光片進(jìn)行分析時,醫(yī)生會在可疑的位置做出標(biāo)注,最后做出 1-5 的評級,對應(yīng)正常、良性、不確定、可疑及惡性。
AI 會對 X 光片的各個特征的可疑程度進(jìn)行 1-100 的評分,最高分視為對整個 X 光片的評分。如果沒有可疑特征,則視為 0 分。
圖 3:醫(yī)生與 AI 對乳腺 X 光片的分析結(jié)果
A:藍(lán)色箭頭為直徑 8 mm 的不明腫塊,后鑒定為組織學(xué) 2 級導(dǎo)管癌;
B:紅色十字是 AI 發(fā)現(xiàn)的異常特征,藍(lán)點是醫(yī)生在分析時標(biāo)注出的可疑區(qū)域。
對比結(jié)果:特異性 + 靈敏度
共有 552 名醫(yī)生參與了這場比賽,占 NHSBSP 總?cè)藬?shù)的 68%,其中有 315 名放射科醫(yī)生、206 名放射技師和 31 名臨床醫(yī)生。
在對兩組 PERFORMS 數(shù)據(jù)集進(jìn)行分析后,他們認(rèn)為 161 個乳腺 X 光片結(jié)果是正常的,70 個乳腺中有惡性腫瘤,還有 9 個為良性腫瘤。惡性腫瘤的常見特征包括腫塊 (64.3%)、鈣化 (12.9%)、不對稱 (11.4%) 和結(jié)構(gòu)扭曲 (11.4%),平均病變大小為 15.5 ± 9.2 mm。
表 1:PERFORMS 數(shù)據(jù)集結(jié)果
人類組的平均 AUC 為 0.88。AI 組的 AUC 為 0.93,對應(yīng)人類組 96.8 百分位數(shù),但兩組的 AUC 沒有明顯差異。
圖 4:醫(yī)生組 AUC 直方圖與 AI 的 AUC(黃線)
人類組的平均靈敏度和特異性分別為 90% 和 76%。在開發(fā)者推薦的閾值下,AI 的敏感性和特異性分別為 84% 和 89%。
表 2:醫(yī)生組與不同閾值 AI 的判斷結(jié)果
TP:真陽性;
FP:假陽性;
TN:真陰性;
FN:假陰性;
靈敏度 = TP / 總陽性數(shù);
特異性 = TN / 總陰性數(shù)。
在 AI 的 ROC 曲線中,52% 的醫(yī)生表現(xiàn)在曲線之上,36% 在曲線下方,12% 的表現(xiàn)與 ROC 曲線一致。
圖 5:AI 的 ROC 曲線,其中藍(lán)點是不同醫(yī)生的表現(xiàn)
當(dāng) AI 的閾值為 3.06 時,AI 的靈敏度與醫(yī)生一致,檢測出了 63 例惡性腫瘤,僅遺漏了 7 例。此時 AI 的特異性與醫(yī)生沒有顯著差異。
當(dāng)閾值設(shè)置為 2.91 時,AI 與醫(yī)生組的特異性一致,靈敏度為 91%。上述結(jié)果顯示,Lunit 的 AI 分析乳腺 X 光片的靈敏度和特異性與人類醫(yī)生相當(dāng)。
圖 6:不同閾值對 AI 判斷結(jié)果的影響
A:藍(lán)色箭頭為不對稱區(qū)域,后鑒定為組織學(xué) 2 級導(dǎo)管癌;
B:AI 閾值為 2.91 時的檢測結(jié)果,紅色十字最終鑒定為真陽性;
C:AI 閾值為 3.06 時的檢測結(jié)果,沒有發(fā)現(xiàn)明顯異常特征。
Yan Chen 教授表示,「這一研究的結(jié)果為 AI 篩查提供了有力證據(jù),說明 AI 對乳腺 X 光片的分析水平與人類醫(yī)生相當(dāng)」。
乳腺癌:隱匿的粉紅殺手
2021 年 2 月 4 日世界癌癥日上,世界衛(wèi)生組織 (WHO) 屬下的國際癌癥研究所稱,上一年新增 230 萬例乳腺癌病例,占比 11.7%,首次超過了肺癌新增病例數(shù),儼然成為「隱匿的粉紅殺手」。
同時,乳腺癌發(fā)病率最高的群體是高收入國家的婦女,中低收入國家的女性發(fā)病率明顯更低。而且,還有約 0.5-1% 的乳腺癌來自于男性。
不過,乳腺癌本身的致死率并不高。2016-2020 年診斷出乳腺癌并存活的女性達(dá) 800 萬人,高于其他癌癥。
目前 WHO 正在全世界推廣全球乳腺癌行動,希望通過早發(fā)現(xiàn)、及時診斷和全面的乳腺癌管理來降低全球因乳腺癌死亡的人數(shù)。
圖 7:AI 輔助的乳腺癌篩查
作為乳腺癌初篩的有力工具,AI 能夠及時發(fā)現(xiàn)乳腺癌早期的特征,有望將「粉紅殺手」扼殺于預(yù)備階段。但現(xiàn)在大規(guī)模在臨床中推廣 AI 可能為時過早,因為環(huán)境和算法本身的變化會不斷影響,導(dǎo)致 AI 的靈敏度和特異性隨時間而下降。
Yan Chen 教授也認(rèn)為,「一旦 AI 進(jìn)入臨床應(yīng)用,我們就必須有一個機(jī)制對其進(jìn)行持續(xù)的評價和監(jiān)測」?,F(xiàn)在,世界各國的研究團(tuán)隊正在對 AI 的檢測結(jié)果進(jìn)行評價,已經(jīng)取得了令人滿意的結(jié)果。未來在高效的 AI 和完善的監(jiān)管機(jī)制的幫助下,各類疾病將「無處可藏」,我們的健康將得到更穩(wěn)定的保障。
參考鏈接:
[1]https://acsjournals.onlinelibrary.wiley.com/doi/10.3322/caac.21708
[2]https://www.sciencedirect.com/science/article/pii/S2667005422000047
本文首發(fā)于 HyperAI 超神經(jīng)微信公眾平臺~