只用幾分鐘,AI 便成功復(fù)現(xiàn)了一項諾獎研究,且只需要嘗試一次。
這個由 GPT-4 驅(qū)動的“AI 實驗室伙伴”名為 Coscientist,由來自卡內(nèi)基梅隆大學(xué)和 Emerald Cloud Lab 的研究團隊共同提出,剛剛登上了權(quán)威科學(xué)期刊 Nature。
據(jù)介紹,Coscientist 結(jié)合大型語言模型(LLMs)的能力以及互聯(lián)網(wǎng)和文檔搜索、代碼執(zhí)行和實驗自動化等工具,能夠自主設(shè)計、規(guī)劃和執(zhí)行真實世界的化學(xué)實驗。
Coscientist 在六個不同任務(wù)中展示了其加速研究的潛力,包括成功優(yōu)化鈀催化偶聯(lián)反應(yīng)(美國化學(xué)家 Richard Fred Heck 與兩位日本化學(xué)家 Ei-ichi Negishi 和 Akira Suzuki 因“對有機合成中鈀催化偶聯(lián)反應(yīng)的研究”獲得了 2010 年諾貝爾化學(xué)獎),同時在(半)自主實驗設(shè)計和執(zhí)行方面展現(xiàn)了先進(jìn)的能力。
圖|由 Coscientist 生成的代碼。分為以下幾個步驟:定義方法的元數(shù)據(jù)、加載實驗器皿模塊、設(shè)置液體處理器、執(zhí)行所需的試劑轉(zhuǎn)移、設(shè)置加熱器-振動器模塊、運行反應(yīng)以及關(guān)閉模塊。(來源:該論文)
這一研究表明,人類有可能有效地利用 AI 提高科學(xué)發(fā)現(xiàn)的速度和數(shù)量,并改善實驗結(jié)果的可復(fù)制性和可靠性。
相關(guān)研究論文以“Autonomous chemical research with large language models”為題,已發(fā)表到 Nature 上。
論文通訊作者、卡內(nèi)基梅隆大學(xué)化學(xué)與化學(xué)工程助理教授 Gabe Gomes 表示:“我們可以擁有一些可以自主運行的東西,試圖發(fā)現(xiàn)新的現(xiàn)象、新的反應(yīng)、新的思想。你可以實現(xiàn)資源和理解的大規(guī)模民主化?!?/p>
他表示,科學(xué)中的嘗試、失敗、學(xué)習(xí)和改進(jìn)的迭代過程可以通過 AI 大大加速,這本身將是一場戲劇性的變革。
美國國家科學(xué)基金會化學(xué)部主任 David Berkowitz 認(rèn)為:“在進(jìn)行系統(tǒng)演示的化學(xué)合成任務(wù)之外,Gabe Gomes 及其團隊成功構(gòu)建了一種高效的實驗室伙伴,他們將各個組成部分巧妙地融合在一起,最終的成果遠(yuǎn)遠(yuǎn)超越了各個部分單獨的貢獻(xiàn),可應(yīng)用于真正有益的科學(xué)研究?!?/p>
在同時發(fā)表在 Nature 上的一篇觀點文章中,來自里斯本大學(xué)藥學(xué)院藥物研究所的 Ana Laura Dias 和 Tiago Rodrigues 寫道,Coscientist 是人類“朝著建立自動化實驗室邁出的關(guān)鍵一步”,“只要在化學(xué)領(lǐng)域濫用大型語言模型的可能性不會導(dǎo)致扼殺相關(guān)研究的法規(guī)出臺,我們期待在不久的將來會有更多令人興奮的發(fā)展”。
然而,正如論文中描述的,Coscientist 也有一些局限性。例如,Coscientist 有時會出現(xiàn)化學(xué)反應(yīng)不正確的情況(盡管其可以自我糾正)。不過,通過使用復(fù)雜的提示策略(如思維鏈和思維樹)以及增加化學(xué)相關(guān)的數(shù)據(jù),這些問題或許可以得到緩解。
此外,還需要注意的是,現(xiàn)實世界中的研究問題要比本研究中的復(fù)雜得多,往往涉及化學(xué)以外的學(xué)科概念,如藥物開發(fā)中的生物學(xué)。然而,目前的 Coscientist 還無法解決這些復(fù)雜的問題。
成功復(fù)現(xiàn)諾獎研究
據(jù)論文描述,Coscientist 通過與多個模塊的交互(包括網(wǎng)絡(luò)和文檔搜索、代碼執(zhí)行以及實驗),獲取解決復(fù)雜問題所需的知識。
系統(tǒng)的主模塊是 Planner,以 GPT-4 為基礎(chǔ)。作為實驗室助手,Coscientist 通過調(diào)用四個命令(GOOGLE、PYTHON、DOCUMENTATION 和 EXPERIMENT)來規(guī)劃實驗。
其中,GOOGLE 命令負(fù)責(zé)在互聯(lián)網(wǎng)上進(jìn)行搜索,PYTHON 命令執(zhí)行代碼,而 DOCUMENTATION 命令檢索和總結(jié)必要的文檔。此外,這些命令還可以執(zhí)行子操作。
圖|Coscientist 系統(tǒng)架構(gòu)(來源:該論文)
實驗從簡單的任務(wù)開始。研究人員首先要求 Coscientist 使用液體處理器機器,將有色液體分配到一個包含 96 個小孔的網(wǎng)格板中,任務(wù)指令主要包括“用你選擇的一種顏色每隔一行涂抹一次”,“繪制一條藍(lán)色的對角線”等低水平任務(wù)。
在成功完成上述任務(wù)后,研究團隊向 Coscientist 展示了更多類型的機器人設(shè)備。接下來,Coscientist 挑戰(zhàn)識別一塊含有三種不同顏色(紅色、黃色和藍(lán)色)液體的板,并確定板上每種顏色的位置。
圖|機器人液體處理控制能力和與分析工具的集成(來源:該論文)
由于 Coscientist 沒有眼睛,它編寫了代碼,將神秘顏色板機器人傳遞到分光光度計,并分析每個小孔吸收的光波長,從而確定板上存在哪些顏色及其位置。對于這項任務(wù),研究人員不得不在正確的方向上給 Coscientist 一點指導(dǎo),指示它思考不同顏色如何吸收光。其余工作由 AI 自主完成。
在最終的測試中,Coscientist 負(fù)責(zé)執(zhí)行“Suzuki 和 Sonogashira 反應(yīng)”。
這兩種反應(yīng)分別以它們的發(fā)明者的名字命名。這些反應(yīng)在 20 世紀(jì) 70 年代被發(fā)現(xiàn),利用金屬鈀來催化有機分子中碳原子之間的化學(xué)鍵。這些反應(yīng)在制造新型藥物,用于治療炎癥、哮喘和其他疾病方面發(fā)揮著重要作用。此外,它們還被廣泛應(yīng)用于有機半導(dǎo)體中的 OLED(有機發(fā)光二極管),這種技術(shù)在許多智能手機和監(jiān)視器中得到了應(yīng)用。這些突破性的反應(yīng)及其廣泛的應(yīng)用在 2010 年被授予諾貝爾獎。當(dāng)然,Coscientist 以前從未嘗試過這些反應(yīng)。Coscientist 主要在維基百科上尋找答案,還涉及到一系列其他網(wǎng)站,包括美國化學(xué)學(xué)會、皇家化學(xué)學(xué)會等含有描述 Suzuki 和 Sonogashira 反應(yīng)的學(xué)術(shù)論文的網(wǎng)站。
在不到四分鐘的時間內(nèi),Coscientist 設(shè)計出了一個準(zhǔn)確的程序,利用團隊提供的化學(xué)品實現(xiàn)所需的反應(yīng)。然而,在試圖在物理世界中使用機器人執(zhí)行其程序時,在編寫控制加熱和振動液體樣本的設(shè)備代碼時犯了一個錯誤。在沒有人類提示的情況下,Coscientist 發(fā)現(xiàn)了問題,查閱了設(shè)備的技術(shù)手冊,糾正了代碼,然后再次嘗試。
圖|交叉耦合 Suzuki 和 Sonogashira 反應(yīng)實驗由 Coscientist 設(shè)計和執(zhí)行(來源:該論文)
結(jié)果呈現(xiàn)在幾滴清澈液體的微小樣本中。研究人員對這些樣本進(jìn)行了分析,并成功地發(fā)現(xiàn)了 Suzuki 和 Sonogashira 反應(yīng)的光譜特征。
全天候“思考”的 AI 實驗室伙伴
近幾年,除了 Coscientist,AI 在自主實驗室方面的相關(guān)研究不斷取得突破。
就在不久前,一個由 AI 指導(dǎo)機器人制造新材料的實驗室 A-Lab,在最少的人為干預(yù)下迅速發(fā)現(xiàn)了新材料,可以幫助確定和快速跟蹤多個研究領(lǐng)域的材料,包括電池、儲能、太陽能電池、燃料電池等。A-Lab 成功合成了 58 種預(yù)測材料中的 41 種,成功率達(dá)到了 71%。
另外,美國阿貢國家實驗室發(fā)明了一款引領(lǐng)科學(xué)發(fā)現(xiàn)的先進(jìn)技術(shù)——Polybot,它通過充分利用機器人技術(shù)、高性能計算和 AI(包括機器學(xué)習(xí))的能力,幾乎不需要人工干預(yù)即可推進(jìn)科學(xué)領(lǐng)域的發(fā)展。該系統(tǒng)不僅能夠?qū)崿F(xiàn)自動駕駛材料的合成和制造,還能夠進(jìn)行機器人樣品的轉(zhuǎn)移、表征、測試和數(shù)據(jù)分析。
今年 8 月,美國麻省理工學(xué)院和新加坡 Xinterra 公司在一篇發(fā)表在 Nature 的論文中表示,在不久的將來,每位實驗科研人員都應(yīng)該擁有一名科研 AI 助手,這位助手可以協(xié)助我們設(shè)計和執(zhí)行自動化實驗、分析實驗數(shù)據(jù)、提出機理猜想,甚至解答疑惑??蒲?AI 助手能夠顯著減輕實驗工作者重復(fù)性的體力勞動,使他們能夠?qū)⒅饕性谂行运伎忌稀?/p>
自然界在其規(guī)模和復(fù)雜性上幾乎是無限的,包含著無數(shù)等待被發(fā)現(xiàn)的發(fā)現(xiàn)。想象一下,有新型超導(dǎo)材料,可以顯著提高能源效率,或者有治愈其他無法治愈的疾病并延長人類壽命的化合物。
然而,獲得進(jìn)行這些突破所需的教育和培訓(xùn)是一項漫長而艱苦的過程,培養(yǎng)一名科學(xué)家是困難的。我們可以設(shè)想,像 Coscientist 這樣的 AI 輔助系統(tǒng)可以彌合自然未被開發(fā)的廣闊領(lǐng)域與受訓(xùn)科學(xué)家短缺之間的差距。
另外,人類科學(xué)家也有人類的需求,比如睡覺和休息,而人類引導(dǎo)的 AI 可以全天候“思考”,反復(fù)檢查實驗結(jié)果以確??芍貜?fù)性。
可以說,AI 進(jìn)行自主實驗的前景非常廣闊。
參考鏈接:
https://www.nature.com/articles/s41586-023-06792-0
https://www.nature.com/articles/d41586-023-03790-0
https://www.nature.com/articles/s41586-023-06734-w
https://www.nature.com/articles/s41578-023-00588-4
https://www.anl.gov/cnm/polybot