
人工智能的飛速發展爲生物學研究帶來了深遠影響,其中,AlphaFold2在蛋白質結構預測領域引發了革命性的突破。本文評估了AlphaFold2對GPCR結構預測的可靠性,發現其雖能準確捕捉GPCR整體骨架的主要特徵,但在胞外域與跨膜域的組裝、配體結合口袋的形狀以及信號傳導界面的構象等方面,與實驗解析的高分辨率結構存在顯著差異。這些差異限制了其在GPCR功能研究和基於結構的藥物設計中的應用能力。因此,AI結構預測尚不能完全取代實驗結構生物學,需要聯合使用以輔助藥理學研究和藥物設計。
AlphaFold是由DeepMind開發的AI模型,能夠根據蛋白質的氨基酸序列預測其三維結構。蛋白質就像是生命體內的小機器,它們的結構決定了功能。瞭解蛋白質的結構對於藥物研發和理解生命過程非常重要。AlphaFold的出現,讓人們看到了快速預測蛋白質結構的可能性。
截至目前,AlphaFold的3個主要版本分別是AlphaFold1、AlphaFold2和AlphaFold3,各自代表了從基礎探索,到高精度預測和複合體建模的逐步演進(表1)。
表1 3代AlphaFold的核心差異對比

傳統上,結構生物學使用實驗手段來解析蛋白質的三維結構,主要的方法有以下幾種:
X射線晶體學:是最早且最常用的方法。研究者需要首先讓蛋白質形成晶體,然後用X射線照射這些晶體,得到衍射圖樣。通過解析這些圖樣計算出蛋白質的三維結構。但這一過程非常複雜,需要大量的時間和精力,尤其是培養出合適的蛋白質晶體並不容易,並且某些蛋白質無法在任何條件下結晶,這限制了晶體學對蛋白結構的研究。
核磁共振(NMR):這種方法利用了原子核在磁場中的特性。研究者將蛋白質溶解在溶液中,放入強大的磁場中,然後測量原子核的信號。通過這些信號,可以推斷出蛋白質的結構和動態信息。但NMR適用於研究小型蛋白質,對於分子量較大的蛋白複合體並不適用。
冷凍電子顯微學(Cryo-EM):這是近年來迅速發展的技術,將蛋白質快速冷凍保持天然狀態,在電子顯微鏡下觀察。總體上精度不如晶體學研究,僅部分結構達到近原子分辨率。適合研究大型蛋白質複合物,不過設備昂貴,操作要求高。
這些傳統方法雖精確可靠,但過程繁瑣、耗時耗力,需要豐富經驗和技術支持。AlphaFold出現後,有人思考傳統實驗方法是否還有必要。實際上,AlphaFold存在侷限性,如對蛋白質動態變化預測能力有限,預測複合物結構仍面臨挑戰,其預測結果常需實驗確認。
儘管GPCR的重要性不言而喻,但由於其高度複雜的結構和在激活時產生的顯著動態變化(圖1),解析GPCR的高分辨率結構一直是生物學上的重大挑戰。傳統的X射線晶體學技術和近年來興起的Cryo-EM技術雖然取得了一些突破,但獲得高分辨率的GPCR結構仍然是一個耗時且成本高昂的過程。這一技術瓶頸限制了我們對GPCR功能的深入理解,也在新藥開發中形成了障礙。

不過,當GPCR帶上大型細胞外結構(ECD)時,AlphaFold2的預測誤差通常會增大。因爲ECD和跨膜區域(TMD)之間的相對位置預測不夠準確,如結合了semaglutide的胰高血糖素樣肽-1受體(GLP1R),整體誤差達3.92Å。在甲狀旁腺激素2受體(PTH2R)和激活態的黃體生成素/絨毛膜促性腺激素受體(LHCGR)中,也出現整體RMSD大於分開計算的RMSD的情況。對於在訓練集中不常見的失活態LHCGR,整體RMSD竟然達到了6.08Å,差異極大(見圖2)。

本文評估的29個GPCR結構中有4個是與小分子配體結合的受體。結果顯示,AlphaFold2預測的GPCR主鏈結構與實驗數據相似(平均主鏈RMSD僅爲0.89Å),但關鍵殘基側鏈差異顯著,側鏈RMSD高達1.90Å,整體原子RMSD爲1.52Å。使用基於AlphaFold2預測結構的分子對接評估發現,大部分對接不能重現結果(見圖3)。

在GPCR的世界中,TM6和TM7這2段跨膜螺旋就像是細胞信號傳遞中的關鍵“交通樞紐”,會根據需要進行動態調整,爲重要的下游信號分子(如G蛋白等)提供暢通的“通行路徑”。然而,實驗結構和預測模型在這些關鍵“路段”上往往存在顯著差異,AlphaFold2在預測這些變化時也確實面臨挑戰,相關結果在圖4中展示。
研究發現,有些GPCR在預測模型中的TM6-TM7構象與實驗結果有較大出入,誤差超過了2Å。例如,在ghrelin受體和抗利尿激素受體(V2R)的“地圖”中,這些關鍵“路段”的偏差分別達到了3.08Å和2.83Å。在GLP1R和PTH2R的模型中,TM6和TM7被預測爲“向上抬升”,影響小分子無法正確“到達”結合位點。
同樣地,細胞內區域的情況也值得關注(圖5)。通過測量TM6的開啓程度,我們可以瞭解這些GPCR在細胞內側爲蛋白結合夥伴預留的“通行空間”有多大。有趣的是,不同類型的GPCR在預測模型中預留的“空間”差異明顯。對於沒有結合G蛋白的A類GPCR,預測結構中預留的“空間”比實驗結構更多。而對於已經結合了G蛋白的A類GPCR,預測結構中預留的“空間”卻更少。B1類GPCR的預測模型與實驗結構幾乎一致,可能是訓練數據中激活態B類GPCR結構較多。此外,某些A類GPCR的胞內環區3(ICL3)在預測模型中與實驗結構差異大,如5HT1FR和膽囊收縮素受體1(CCKAR)。

圖5 AlphaFold2預測模型和電鏡結構在胞內關鍵激活螺旋(TM6)上的對比
預測與小分子結合的GPCR結構時,雖主鏈預測準確度約1Å左右,但預測與配體相互作用的“結合口袋”結構時仍面臨挑戰。更糟糕的是,在LHCGR案例中,預測模型甚至未形成適合小分子對接的“停靠點”。

白名單回覆後臺「轉載」
《科技導報》創刊於1980年,中國科協學術會刊,主要刊登科學前沿和技術熱點領域突破性的成果報道、權威性的科學評論、引領性的高端綜述,發表促進經濟社會發展、完善科技管理、優化科研環境、培育科學文化、促進科技創新和科技成果轉化的決策諮詢建議。常設欄目有院士卷首語、智庫觀點、科技評論、熱點專題、綜述、論文、學術聚焦、科學人文等。