叢樂與DeepMind開發CRISPR-GPT,爲基因編輯提供專家級智能決策

由 DeepTech深科技 發佈於 科技

'25-07-30

近期,美國斯坦福大學叢樂教授、美國普林斯頓大學王夢迪教授與谷歌 DeepMind 團隊合作,首次將大語言模型(LLM,Large Language Model)用於基因編輯實驗,成功開發出一種名爲 CRISPR-GPT 的智能體系統。


值得關注的是,它能夠綜合利用 LLM 的計算效率和特定領域的知識,實現爲研究人員解決 CRISPR 基因編輯實驗“量身定製”的自動化設計與分析。



圖丨斯坦福大學叢樂實驗室,後排中間爲叢樂,前排左二爲屈元昊(來源:屈元昊)


該系統爲研究人員提供智能化的基因編輯方案設計,在確保編輯精準性的同時,顯著降低了實驗操作的複雜性。具體包括:基因編輯實驗設計、CRISPR 系統的選擇、設計指導 gRNA 序列、推薦細胞遞送方法、預測脫靶效應、推薦實驗程序和設計驗證修改、實驗的數據分析、確認編輯結果的過程。


該研究顯示出 CRISPR-GPT 在促進複雜生物發現任務方面的潛力,有望加速生物、醫學、農業等領域的發現和應用。


近日,相關論文以《CRISPR-GPT: 基因編輯實驗的智能體自動化》(CRISPR-GPT for agentic automation of gene-editing experiment)爲題發表在 Nature Biomedical Engineering 上 [1]。斯坦福大學博士研究生屈元昊和普林斯頓大學博士研究生黃凱旋是共同第一作者,斯坦福大學叢樂教授和普林斯頓大學王夢迪教授擔任共同通訊作者。



圖丨相關論文(來源:Nature Biomedical Engineering)




首次將大模型應用於基因編輯實驗設計


當下,基因編輯技術讓人們對基因信息的精確改變成爲可能。2012 年,基因編輯系統 CRISPR-Cas9 的問世,標誌着該領域取得重大突破。


2013 年,基因編輯先驅、美國國家科學院院士張鋒教授與叢樂等人(後者爲第一作者),在 Science 發表 CPISPR 基因編輯的突破性論文《利用 CRISPR/Cas 系統的多重基因組工程》(Multiplex Genome Engineering Using CRISPR/Cas Systems)[2]。


2020 年,美國加州大學伯克利分校教授詹妮弗·杜德納(Jennifer Doudna)以及德國馬克斯普朗克感染生物學研究所教授埃馬紐爾·夏彭蒂耶(Emmanuelle Charpentier),因在 CRISPR-Cas9 的貢獻而獲得諾貝爾化學獎。


隨着基因編輯技術的進步和發展,其在研究基因功能、治療遺傳病、製備基因修飾模型和治療癌症、增強農作物恢復力等方面發揮着愈發重要的作用。


然而,創建一個高效的基因編輯系統,不僅需要對 CRISPR 深入瞭解,還要經過複雜的實驗,這需要投入大量的時間和進行專業的科研訓練。


近年來,LLM 在日常對話、世界知識、圖像生成等方面展現出巨大的應用潛力。LLM 技術的發展爲解決科學問題提供了新的契機的同時,AI for Science 應用也日益增多。此前,已有化學家通過 LLM 構建智能體,輔助科研人員進行實驗設計和化學合成方案制定。


基於其他領域的成功應用案例,結合以基因編輯作爲工具解決生物學問題的實際需求,該團隊提出了一個關鍵問題:能否將 LLM 應用於基因編輯領域,通過智能體爲研究人員提供專業輔助?


理論上雖然可行,但實際應用中面臨諸多挑戰:通用 LLM 存在幻覺等固有問題,且由於缺乏專業領域知識,無法爲研究人員提供精準、具體的基因編輯設計方案。該團隊發現,通用 LLM 的輸出結果缺乏一致性,往往會提供衆多不同的選擇方案,導致研究人員難以確定最適合的基因編輯系統。



圖丨CRISPR-GPT 智能體概述(來源:Nature Biomedical Engineering)


爲解決這些問題,CRISPR-GPT 的每個模塊都通過將 LLM 與特定領域的生物數據進行微調來優化,以確保基因編輯工作的準確性和效率,用戶可以根據特定研究需求靈活調整設計方案。


這一創新的人工智能工具採用思維鏈推理模型和狀態機架構,確保即使是基因編輯領域的“新手”生物學家,也能夠迭代優化實驗設計。該系統可完成多種基因編輯任務,包括 CRISPR 基因敲除、表觀遺傳編輯、先導編輯、鹼基編輯等。


CRISPR-GPT 的核心優勢在於,充分利用 LLM 的推理能力來處理自然語言交互。用戶無需按照固定模式輸入需求,而是像諮詢專家一樣自然提問,系統便能協助解決基因編輯實驗設計中的各類問題。


斯坦福大學叢樂課題組博士研究生屈元昊的主要研究方向包括基因編輯、單細胞測序以及人工智能在生物醫學中的應用。他對 DeepTech 表示:“據我瞭解,這是首次將大模型應用於基因編輯實驗設計的研究。我們的核心創新在於讓 AI 真正理解基因編輯的專業知識,並能像領域專家一樣進行推理和決策。”



三種模式:通過智能交互“量身定製” CRISPR 基因編輯實驗


目前,CRISPR-GPT 共有三種交互模式,分別適用於不同背景的研究人員,真正實現個性化的基因編輯實驗設計。


第一,預設模式。該模式適用於對基因編輯不太熟悉的研究人員(初學者),通過該模式能夠從最初的 CRISPR 系統選擇,一直到最後的數據分析,完整地做完基因編輯實驗。


第二,自動模式。這種模式比較適合具有基因編輯領域基礎的科研人員,以幫助他們解決某一個或某幾個問題,而不需要從頭開始基因編輯實驗。


例如,研究人員可以用自然語言的方式對該系統說:我想設計一個靶向於某基因的 gRNA。在自動模式中,通過 LLM 的推理能力,讓它能夠具體地分析每個用戶不同的需求。


第三,問答模式。在研究人員對一些不熟悉的 CRISPR 系統進行實驗時,可採用問答模式,自由地諮詢與 CRISPR 基因編輯實驗相關的問題。



(來源:Nature Biomedical Engineering)


基於叢樂實驗室在基因編輯領域多年的技術積累,經常會收到來自世界各地的學者諮詢關於 CRISPR 的各種問題。目前,研究人員正在將關於 CRISPR 問題和回答的數據集,與在網絡中提取關於 CRISPR 數據集整合到 CRISPR-GPT 中。


屈元昊表示:“我們將實驗室多年積累的 CRISPR 問答數據集整合到系統中,通過 LLM 進行專門訓練和微調。這樣 CRISPR-GPT 就能基於真實的專家知識爲用戶提供更準確、可靠的答案,進而真正解決實際研究中遇到的問題。”


“專家級”智能決策:模擬專家思維提供精準解決方案


CRISPR-GPT 採用“專家思維”模式,通過逐步推理爲用戶提供各類基因編輯實驗的智能化解決方案。


以遞送系統選擇爲例,這是基因編輯領域一個關鍵且複雜的技術難題。在幹細胞或免疫細胞的體內編輯中,實驗成功與否很大程度上取決於遞送系統和 CRISPR-Cas 系統的匹配選擇。


傳統上,這個過程需要研究人員具備深厚的生物學背景,查閱大量文獻,並憑藉經驗進行判斷,既耗時又依賴個人專業水平。


CRISPR-GPT 通過智能化方式解決這一難題。當系統識別到特定生物學關鍵詞(如“A-375 細胞”)時,會自動關聯到其細胞類型特徵(腫瘤細胞系)。


基於預設的專家知識,系統首先提出幾個可能的備選遞送方案(如逆轉錄病毒遞送系統)。接下來,系統會進行實時文獻搜索,參考學術引用數據等指標對備選方案進行綜合評估,最終爲用戶提供 1-2 個最優的遞送系統選擇。


屈元昊表示:“我們的核心理念是讓 AI 像專家一樣思考問題。系統不僅具備專業知識,還配備了實時文獻搜索等工具,能夠智能化地爲用戶推薦最適合的遞送系統。這完全改變了傳統依賴個人經驗和手工查閱文獻的研究模式,讓基因編輯實驗設計變得更高效、更精準。”



(來源:Nature Biomedical Engineering)


在一項針對人類肺癌細胞系的實驗中,CRISPR-GPT 成功設計了針對 TGFβR1、SNAI1、BAX 和 BCL2L1 四個關鍵基因的敲除實驗,並通過 CRISPR-Cas12a 系統進行高效的基因編輯。根據實驗結果,這些基因的編輯效率高達 80%。


在另一項針對人類黑色素瘤細胞系的實驗中,CRISPR-GPT 成功設計並實施了對 NCR3LG1 和 CEACAM1 兩個基因的表觀遺傳激活實驗。結果證明,這兩個基因的表達水平得到了明顯提高。上述兩項實驗不僅表現優異,並且均一次成功。


爲評估 CRISPR-GPT 智能體的性能,該團隊邀請了 8 名具有 CRISPR 和基因編輯專業知識的研究人員設計一系列任務,測試 CRISPR-GPT 協助實驗設計的能力。


他們從準確性、推理能力、完整性和簡潔性四個維度,將 CRISPR-GPT 與 ChatGPT-3.5 和 ChatGPT-4o 進行對比評估。專家評估結果顯示,CRISPR-GPT 在基因編輯實驗設計的上述四個方面以及綜合評分均優於通用 LLM。



爲自動化生物科研開闢新道路


研發 CRISPR-GPT 是爲了更好地促進科研的發展,但是這也是一把“雙刃劍”,不能忽視可能帶來的倫理道德和基因編輯安全等相關問題。


爲此,該團隊通過與倫理道德專家和基因編輯安全專家交流和討論,採取了一系列預防措施。比如,通過設計關鍵詞過濾和指導原則等,對人類受試者的應用限制、保護遺傳信息的隱私以及對可能出現的意外結果(例如編輯更強大的病毒)的警告。


總體來說,CRISPR-GPT 實現了簡化、自動化複雜生物學研究的基因編輯實驗的設計過程。由於該系統集成了 LLM 與學科專業知識、外部工具和模塊化任務執行系統,研究人員可以更簡易、更準確、更高效地計劃和開展基因編輯的相關實驗。


“這項研究爲自動化生物科研開闢了新道路。目前我們正在不斷優化技術,解決實際應用中的各種挑戰。我相信未來會有更多生物學研究能夠藉助 AI 和機器學習技術來完成,這將徹底改變科研的工作方式。”屈元昊說。


用機器幫助和替代人類執行實驗任務,能夠減輕科研人員的工作負擔,並極大地加速探索科學的進展;而人類的最主要工作是思考、判斷、設計實驗,以及發現需要解決的科學問題。


該團隊希望未來可以通過所開發的智能體控制機器人或自動化實驗平臺,真正地實現用先進的工具幫科研人員全自動地做實驗,或生產基因編輯的細胞等模式。


隨着基因編輯工程領域的不斷髮展,CRISPR-GPT 與自動化實驗室的集成平臺和機器人技術的進步,爲加速科學發現和研究相關疾病帶來了新的希望。


目前,該課題組還有一系列基於生物醫學智能體研發的相關工作正在進行中。感興趣的讀者可以訪問 genomics.stanford.edu 瞭解最新進展,並參與 CRISPR-GPT 智能體的 beta 測試。


參考資料:

1.Qu,Y. et al. CRISPR-GPT for agentic automation of gene-editing experiments. Nature Biomedical Engineering (2025).

https://www.nature.com/articles/s41551-025-01463-z

2.Cong,L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339,6121,819-823(2013).

https://www.science.org/doi/abs/10.1126/science.1231143


運營/排版:何晨龍

Scroll to Top