版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

30分鐘內(nèi)輸出結(jié)果,新加坡國(guó)立大學(xué)/MIT等基于SVM構(gòu)建微生物污染檢測(cè)模型

HyperAI超神經(jīng)
原創(chuàng)
人工智能說(shuō)明書(shū),了解 AI 的功效和副作用。
收藏

細(xì)胞治療產(chǎn)品 (CTP) 作為先進(jìn)治療藥物 (ATMPs) 的重要組成部分,正為罕見(jiàn)病和疑難雜癥患者帶來(lái)希望。然而,其生產(chǎn)過(guò)程極易受到微生物的侵?jǐn)_,微生物污染始終如陰霾般籠罩著這束希望之光。傳統(tǒng)的無(wú)菌檢測(cè)方法,如沿用半個(gè)世紀(jì)的 USP <71>(美國(guó)藥典第 71 章記錄的無(wú)菌檢測(cè)法),在面對(duì)精準(zhǔn)醫(yī)療的新需求時(shí)顯得力不從心:長(zhǎng)達(dá)兩周的培養(yǎng)周期、繁瑣的預(yù)處理步驟、依賴(lài)主觀(guān)判斷的渾濁度觀(guān)察,不僅嚴(yán)重滯后于細(xì)胞制劑的短保質(zhì)期,更可能因誤判讓患者暴露于感染風(fēng)險(xiǎn)之中。

隨著細(xì)胞治療產(chǎn)品的蓬勃發(fā)展,快速、準(zhǔn)確地檢測(cè)微生物污染變得愈發(fā)迫切。一種創(chuàng)新的檢測(cè)方法 —— 機(jī)器學(xué)習(xí)輔助的紫外吸收光譜法應(yīng)運(yùn)而生,它將光學(xué)技術(shù)與強(qiáng)大的機(jī)器學(xué)習(xí)方法相結(jié)合,無(wú)需大量的訓(xùn)練數(shù)據(jù),也不需要生長(zhǎng)富集步驟,僅需少量樣本就能在短短 30 分鐘內(nèi)輸出檢測(cè)結(jié)果,為細(xì)胞治療產(chǎn)品的安全性提供了有力保障。

近日,新加坡-麻省理工學(xué)院研究聯(lián)盟、新加坡 A*SRL 實(shí)驗(yàn)室、新加坡國(guó)立大學(xué)、美國(guó)麻省理工學(xué)院的聯(lián)合研究團(tuán)隊(duì),提出了一種結(jié)合紫外吸收光譜與機(jī)器學(xué)習(xí)的檢測(cè)方法,能在 30 分鐘內(nèi)完成細(xì)胞培養(yǎng)上清液的微生物污染檢測(cè)。該方法利用單類(lèi)支持向量機(jī) (one-class SVM) 解析紫外光譜中煙酰胺與煙酸的特征差異,在測(cè)試 7 種常見(jiàn)污染微生物時(shí)展現(xiàn)出 92.7% 的平均真陽(yáng)性率,即便在排除煙酸代謝異常的供體樣本后,真陰性率仍達(dá)到 92%,遠(yuǎn)超傳統(tǒng)依賴(lài)經(jīng)驗(yàn)判斷的準(zhǔn)確率。

相關(guān)研究成果以「Machine learning aided UV absorbance spectroscopy for microbial contamination in cell therapy products」為題,已發(fā)表于 Nature 旗下期刊 Scientific Reports。

論文地址:
https://doi.org/10.1038/s41598-024-83114-y

關(guān)注「HyperAI超神經(jīng)」公眾號(hào),后臺(tái)回復(fù)「微生物污染監(jiān)測(cè)」獲取完整 PDF

開(kāi)源項(xiàng)目「awesome-ai4s」匯集了 200 余篇 AI4S 論文解讀,并提供海量數(shù)據(jù)集與工具:
https://github.com/hyperai/awesome-ai4s

利用商業(yè)光譜儀采集無(wú)菌 MSC 培養(yǎng)樣本數(shù)據(jù)

在本次研究中,數(shù)據(jù)集的構(gòu)建與分析緊密?chē)@間充質(zhì)基質(zhì)細(xì)胞 (MSC) 培養(yǎng)展開(kāi)。鑒于 MSC 療法在急性組織損傷、炎癥性疾病及慢性退行性疾病治療領(lǐng)域的廣泛應(yīng)用,研究團(tuán)隊(duì)選取其作為示范對(duì)象,利用商業(yè)光譜儀采集無(wú)菌 MSC 培養(yǎng)樣本的吸收光譜,以此作為訓(xùn)練單類(lèi)支持向量機(jī) (one-class SVM) 模型的基礎(chǔ)數(shù)據(jù)。研究采用異常檢測(cè)策略,通過(guò)捕捉光譜特征差異,實(shí)現(xiàn)對(duì)細(xì)胞培養(yǎng)樣本污染狀態(tài)的預(yù)測(cè),并基于煙酸 (NA) 與煙酰胺 (NAM) 代謝物光譜差異假設(shè),探索 SVM 模型識(shí)別污染的潛在機(jī)制。

實(shí)驗(yàn)過(guò)程中,研究人員向供體 A 的 MSC 培養(yǎng)體系接種 10 CFU 大腸桿菌,成功在 21 小時(shí)檢測(cè)到污染信號(hào)。經(jīng)對(duì)比 7 家商業(yè)供體樣本的檢測(cè)性能,供體 A 在識(shí)別其他供體無(wú)菌樣本時(shí)表現(xiàn)優(yōu)異,因此被選定為初始訓(xùn)練數(shù)據(jù)來(lái)源。后續(xù)研究中,該方法不僅實(shí)現(xiàn)對(duì) 7 種微生物、低至 10 CFU 污染量的有效檢測(cè),還通過(guò)跨供體測(cè)試,驗(yàn)證了技術(shù)的穩(wěn)健性。

為深入解析 SVM 模型性能,研究引入主成分分析 (PCA) 技術(shù)。以銅綠假單胞菌接種樣本為研究對(duì)象——因其在液相色譜-質(zhì)譜 (LC-MS) 檢測(cè)中呈現(xiàn)最高 NA 濃度,通過(guò) PCA 可視化訓(xùn)練數(shù)據(jù)集與污染樣本分布,結(jié)果顯示污染樣本與滅菌樣本在空間上顯著分離,有效區(qū)分了無(wú)菌與污染狀態(tài)。進(jìn)一步分析主成分 1 (PC 1) 和主成分 2 (PC 2) 的載荷向量,并結(jié)合 100μg/mL NA 和 NAM 在 PBS 中的紫外吸收光譜歸一化處理,直觀(guān)呈現(xiàn)光譜特征與主成分的關(guān)聯(lián)。

在模型穩(wěn)健性驗(yàn)證環(huán)節(jié),研究收集 6 位商業(yè)供體 (供體 B-G) 的廢棄培養(yǎng)基及 PBS 滅菌樣本,構(gòu)建跨供體測(cè)試數(shù)據(jù)集。通過(guò)訓(xùn)練不同供體來(lái)源的 SVM 模型并交叉驗(yàn)證,發(fā)現(xiàn)基于供體 A 和 B 訓(xùn)練的模型預(yù)測(cè)準(zhǔn)確率較高。對(duì) 418 個(gè)測(cè)試樣本的分析顯示,模型真正陽(yáng)性率達(dá) 92.7%,檢測(cè)限穩(wěn)定維持在 10 CFU;但 77.7% 的真陰性率表明仍存在改進(jìn)空間,其中供體 F 樣本因 NA 水平異常導(dǎo)致的假陽(yáng)性問(wèn)題尤為突出,為后續(xù)優(yōu)化模型對(duì)供體間代謝差異的適應(yīng)性指明了方向。

機(jī)器學(xué)習(xí)輔助紫外吸收光譜法:以支持向量機(jī)為核心算法

為了讓機(jī)器學(xué)習(xí)更好地助力微生物污染檢測(cè),該研究創(chuàng)新性地將其與紫外吸收光譜法相結(jié)合,提出了一種快速、靈敏且經(jīng)濟(jì)高效的微生物污染檢測(cè)方法。該方法以支持向量機(jī) (SVM) 為核心算法,通過(guò)分析細(xì)胞培養(yǎng)基的紫外吸收光譜特征,實(shí)現(xiàn)對(duì)微生物污染的精準(zhǔn)識(shí)別。

在模型構(gòu)建方面,研究人員采用了單類(lèi)支持向量機(jī),并選擇了徑向基函數(shù) (Radial Basis Function, RBF) 作為核函數(shù),設(shè)定 γ 值為 0.002,ν 值為 0.2。訓(xùn)練數(shù)據(jù)集由第 2、4、6 代的第 2 至第 7 天的供體 5,以及供體 8 的 PBS 摻入無(wú)菌樣本組成,這些樣本均被標(biāo)記為 1,代表無(wú)菌狀態(tài)。每個(gè)樣本的吸光度值數(shù)據(jù)涵蓋的波長(zhǎng)范圍是 237 nm 至 300 nm,以聚焦于煙酸 (NA) 和煙酰胺 (NAM) 的顯著光譜特征,避免其他波段噪聲干擾。所有樣本在模型訓(xùn)練前均進(jìn)行了均值中心化處理,以校正因儀器漂移等因素導(dǎo)致的光譜偏差,從而提高模型的準(zhǔn)確性。

在模型驗(yàn)證與應(yīng)用方面,機(jī)器學(xué)習(xí)輔助紫外吸收光譜法通過(guò)在供體 A 的 MSC 培養(yǎng)中加入 10 CFU 的大腸桿菌,在 9 小時(shí)到 24 小時(shí)之間,每隔 3 小時(shí)提取 3 次上清液樣本,以展示該方法對(duì)低濃度污染物的檢測(cè)能力。結(jié)果如下圖所示,SVM 模型能夠在 21 小時(shí)后準(zhǔn)確預(yù)測(cè)樣本受污染,總檢測(cè)時(shí)間約為 21.5 小時(shí)

大腸桿菌加標(biāo)樣品的平均吸光度光譜

進(jìn)一步地,研究將機(jī)器學(xué)習(xí)輔助紫外吸收光譜法與現(xiàn)有方法進(jìn)行了比較。結(jié)果表明,機(jī)器學(xué)習(xí)輔助紫外吸收光譜法的檢測(cè)時(shí)間 (TTD) 為 21 小時(shí),與 USP <71> 測(cè)試(觀(guān)察到渾濁需要 24 小時(shí))和通過(guò) LC-MS 計(jì)算 NA/NAM 比值的方法 (18 小時(shí)) 相當(dāng)。但是,BacT/Alert? 3D 和 USP <71> 都需要訓(xùn)練有素的操作人員從細(xì)胞培養(yǎng)中提取樣本并接種到各種生長(zhǎng)富集培養(yǎng)基中。而紫外吸收光譜法的工作流程則相對(duì)簡(jiǎn)單,不需要額外接種到生長(zhǎng)富集培養(yǎng)基中,也不需要額外的培養(yǎng)時(shí)間和樣本制備,從而消除了觀(guān)察到的生長(zhǎng)富集接種步驟所需的額外資源和成本。

SVM 模型對(duì)供體 A 的 80 個(gè)測(cè)量樣本的預(yù)測(cè)準(zhǔn)確率評(píng)估

為了確定所提出的機(jī)器學(xué)習(xí)輔助紫外吸收光譜法是否可以應(yīng)用于其他微生物,研究人員使用供體 A 的 PBS 滅菌樣本,將該方法應(yīng)用于金黃色葡萄球菌 (S. aureus)、銅綠假單胞菌 (P. paraeruginosa)、枯草芽孢桿菌 (B. spizizenii)、產(chǎn)氣莢膜梭菌 (C. sporogenes)、酵母如白色念珠菌 (C. albicans)、大腸桿菌 K-12 (E. coli) 以及痤瘡丙酸桿菌 (C. acnes) 等其他微生長(zhǎng)緩慢的生物種類(lèi)的檢測(cè),檢測(cè)限 (LoD) 低至 10 CFU。此外,研究還通過(guò)主成分分析 (PCA) 對(duì) SVM 模型的性能進(jìn)行了可視化分析,發(fā)現(xiàn)銅綠假單胞菌接種樣本在 PCA 圖中與 PBS 滅菌樣本明顯區(qū)分,表明模型能夠有效捕捉光譜特征差異。

供體 A 感染不同微生物種類(lèi)的液相色譜-質(zhì)譜研究

在模型穩(wěn)健性研究方面,考慮到供體間的差異可能影響模型性能,研究人員收集了 6 位商業(yè)供體(供體 B-G)的廢棄培養(yǎng)基樣本,并制備了 PBS 滅菌樣本。通過(guò)訓(xùn)練基于不同供體的 SVM 模型并評(píng)估其對(duì)其他供體樣本的預(yù)測(cè)準(zhǔn)確性,發(fā)現(xiàn)供體 A 和 B 的模型具有較高的平均預(yù)測(cè)率。因此,該研究后續(xù)基于供體 A 和 B 訓(xùn)練的 SVM 模型應(yīng)用于其他 6 位供體的樣本。研究結(jié)果表明,機(jī)器學(xué)習(xí)輔助紫外吸收光譜法實(shí)現(xiàn)了 92.7% 的真正陽(yáng)性率,并且對(duì)于所測(cè)試的7種微生物,檢測(cè)限 (LoD) 始終保持在 10 CFU。然而,模型的真正陰性率為 77.7%,假陽(yáng)性樣本主要來(lái)自供體 F,分析發(fā)現(xiàn)供體 F 樣本中 NA 水平較高,這提示未來(lái)需要進(jìn)一步優(yōu)化模型以提高其對(duì)供體間差異的適應(yīng)性。

SVM 模型對(duì)不同供體的預(yù)測(cè)準(zhǔn)確率評(píng)估

AI4S 賦能細(xì)胞治療:科研、產(chǎn)業(yè)與政策協(xié)同并進(jìn)

近年來(lái),從科研到商業(yè)界,從實(shí)驗(yàn)室到產(chǎn)業(yè)化,細(xì)胞治療產(chǎn)品 (CTP) 捷報(bào)頻傳。

在基礎(chǔ)研究領(lǐng)域,同濟(jì)大學(xué) TJ-AI4S 團(tuán)隊(duì)在全球 AI 藥物研發(fā)算法大賽中奪冠,其提出的分子特征延拓策略提升了模型的泛化能力,為 CTP 污染物分子指紋庫(kù)的構(gòu)建提供了新思路。北京郵電大學(xué)與北京大學(xué)合作開(kāi)發(fā)的 UniBind 框架,通過(guò)多尺度圖神經(jīng)網(wǎng)絡(luò)解析蛋白質(zhì)相互作用,為研究 CTP 中細(xì)胞因子與微生物代謝物的動(dòng)態(tài)關(guān)聯(lián)提供了計(jì)算基礎(chǔ)。

論文鏈接:https://www.nature.com/articles/s41591-023-02483-5

此外,上??萍即髮W(xué)的團(tuán)隊(duì)開(kāi)發(fā)了 CAR-Toner 平臺(tái),該平臺(tái)利用 AI 算法優(yōu)化 CAR 分子電荷分布,成功提升了細(xì)胞擴(kuò)增效率并減少了批次差異。這一創(chuàng)新不僅提高了生產(chǎn)效率,還為 CTP 的標(biāo)準(zhǔn)化生產(chǎn)提供了新的技術(shù)支撐。

論文鏈接:https://www.nature.com/articles/s41422-024-00936-1

產(chǎn)業(yè)界也捷報(bào)頻傳,復(fù)星凱瑞(上海)生物科技有限公司的 CAR-T 藥物「奕凱達(dá)」在 2025 年實(shí)現(xiàn)了國(guó)內(nèi)首次跨境供應(yīng),這背后是 AI 驅(qū)動(dòng)的冷鏈物流管理系統(tǒng),確保了細(xì)胞在極低溫運(yùn)輸中的活性。此外,美國(guó)生物技術(shù)公司 A2 Bio 通過(guò) AI 篩選通用供體細(xì)胞,實(shí)現(xiàn)了 CAR-T 藥物的規(guī)?;A(yù)制,大幅降低了生產(chǎn)成本并縮短了治療等待周期,為患者帶來(lái)了更多的希望。

海外研究機(jī)構(gòu)在 AI 賦能細(xì)胞治療領(lǐng)域同樣成果豐碩。2025 年,杜克大學(xué)生物醫(yī)學(xué)工程團(tuán)隊(duì)開(kāi)發(fā)了 PepPrCLIP 技術(shù),基于 ESM-2 蛋白語(yǔ)言模型設(shè)計(jì)功能性短肽,為癌癥精準(zhǔn)治療提供了新策略。IBM Watson Health 與斯坦福大學(xué)合作構(gòu)建的 AI 預(yù)測(cè)模型,通過(guò)整合患者基因組、蛋白質(zhì)組及臨床多維度數(shù)據(jù),將 CAR-T 治療中細(xì)胞因子釋放綜合征 (CRS) 的預(yù)測(cè)準(zhǔn)確率提升至 89%,助力臨床提前干預(yù)高危患者。這些都為全球細(xì)胞治療領(lǐng)域的發(fā)展注入了新的活力。

當(dāng)前,AI4S 在 CTP 領(lǐng)域已經(jīng)構(gòu)建起從基礎(chǔ)研究到臨床應(yīng)用的完整鏈條,但在數(shù)據(jù)標(biāo)準(zhǔn)化和跨機(jī)構(gòu)協(xié)作機(jī)制等方面仍需進(jìn)一步完善。展望未來(lái),隨著政策支持力度的加大和產(chǎn)學(xué)研的深度融合,AI4S 有望在 CTP 個(gè)性化制備、實(shí)時(shí)質(zhì)量追溯、跨境物流優(yōu)化等領(lǐng)域取得更大突破。

參考文章:

1.https://mp.weixin.qq.com/s/VZI7pm-kO7CxNJyrn9-qQw

2.https://mp.weixin.qq.com/s/0AoP5XSLOLzcTChQoIIfmw

3.https://mp.weixin.qq.com/s/Avu5SbLetCFBVUwnDybfsw

4.https://mp.weixin.qq.com/s/WoruStfCdYNDskAn_iFYtQ

5.https://www.nsfc.gov.cn/publish/portal0/tab1128/info90687.htm