酶是生命引擎,機器學習助力科學家設計新酶

酶是執行維持所有生命的化學反應的分子機器,這種能力引起了像我這樣的科學家的關注。

想想肌肉運動。你的身體釋放一種叫做乙酰膽鹼的分子來觸發肌肉細胞收縮。如果乙酰膽鹼停留時間過長,它會使你的肌肉癱瘓——包括你的心肌細胞——然後,就會這樣(生命終結)。這時候酶(乙酰膽鹼酯酶)就起作用了。這種酶每秒能分解數千個乙酰膽鹼分子,以確保肌肉收縮停止、避免癱瘓並延續生命。沒有這種酶,一個乙酰膽鹼分子自行分解需要一個月的時間——大約慢100億倍。

你可以想象爲什麼酶對尋求解決現代問題的科學家特別有吸引力。如果有一種方法能像乙酰膽鹼酯酶分解乙酰膽鹼一樣快速分解塑料、捕獲二氧化碳或者消滅癌細胞會怎樣呢?如果世界需要迅速採取行動,酶是這項工作的有力候選者——只要研究人員能按需設計它們來應對這些挑戰就好了。

不幸的是,設計酶非常困難。這就像擺弄一套原子大小的樂高積木,但說明書丟了,而且除非完美組裝,否則東西就拼不起來。我們團隊新發表的研究表明,機器學習可以充當這套樂高積木的建築師,幫助科學家(準確構建這些複雜的分子結構)。

讓我們更仔細地看看酶是由什麼組成的。

(酶是蛋白質)——執行幕後工作以維持所有生物生存的大分子。這些蛋白質由氨基酸組成,氨基酸是一組構建模塊,可以拼接在一起形成長鏈,這些長鏈又纏繞成特定的形狀。

蛋白質的特定結構對其功能至關重要,這就如同日常物品的形狀一樣。例如,很像勺子被設計用來盛裝液體,而刀根本做不到這一點,參與肌肉運動的酶並不適合植物的光合作用。

爲了使一種酶發揮作用,它會呈現出一種與它所處理的分子完美匹配的形狀,就像< a href="#">鎖與鑰匙相匹配一樣。酶中獨特的凹槽——鎖——與目標分子——鑰匙——相互作用,這些凹槽位於酶的一個被稱爲活性位點的區域。

當目標分子進入時,酶的活性位點精確地定向氨基酸與目標分子相互作用。這使得分子更容易發生化學反應轉化爲另一種分子,從而使這個過程進行得更快。化學反應完成後,新分子被釋放,酶就可以準備處理另一個分子了。

科學家們花費了數十年的時間試圖設計他們自己的酶來製造新的分子、材料或治療藥物。但是製造出看起來像自然界中的酶並且速度一樣快的酶是極其困難的。

酶具有由數百個氨基酸組成的複雜、不規則的形狀。這些構建模塊中的每一個都需要被完美地放置,否則酶的速度就會減慢或者完全停止工作。快速酶和慢速酶之間的差異可能小於單個原子的寬度。

最初,科學家們專注於修改現有酶的氨基酸序列以提高其速度或穩定性。這種方法早期的成功主要是提高了酶的穩定性,使它們能夠在更高的溫度範圍內催化化學反應。但這種方法在提高酶的速度方面用處不大。直到今天,通過修改單個氨基酸來設計新酶通常不是改進天然酶的有效方法。

研究人員發現,使用一種名爲定向進化的過程(在這個過程中,酶的氨基酸序列被隨機改變,直到它能夠執行所需的功能)被證明更有成效。例如,研究表明定向進化可以提高化學反應速度、熱穩定性,甚至能產生具有自然界中未見過的特性的酶。然而,這種方法通常是勞動密集型的:你必須篩選許多突變體才能找到一個符合你要求的。在某些情況下,如果沒有合適的酶作爲起始點,這種方法可能根本不起作用。

這兩種方法都因其對天然酶的依賴而受到限制。也就是說,將你的設計侷限於天然蛋白質的形狀可能會限制酶所能促進的化學反應類型。記住,你不能用刀喝湯。

是否有可能從頭開始製造酶,而不是修改自然的配方呢?是的,藉助計算機。

最初通過計算機設計酶的嘗試在很大程度上仍然以天然酶爲起點,重點是將酶活性位點植入天然蛋白質。

這種方法類似於在舊貨店試圖找到一套合適的西裝:你不太可能找到完全合身的,因爲酶的活性位點(在這個類比中相當於你的身體)的幾何形狀具有高度特異性,所以具有剛性固定結構的隨機蛋白質(尺寸隨機的西裝)不太可能完美地與之適配。通過這些努力得到的酶,其作用速度比自然界中發現的酶要慢得多,需要通過定向進化進一步優化才能達到天然酶常見的速度。

深度學習的最新進展極大地改變了計算機設計酶的格局。現在可以用與ChatGPT和DALL - E等人工智能模型生成文本或圖像非常相似的方式來生成酶,而且不需要使用天然蛋白質結構來支撐活性位點。

我們的團隊表明,當我們向一個人工智能模型(名爲RFdiffusion)提供活性位點的結構和氨基酸序列作爲提示時,它能夠生成能完美支撐該活性位點的酶結構的其餘部分。這就相當於提示ChatGPT根據僅要求包含“遺憾的是,雞蛋從未出現。”這句話的提示來創作一整篇短篇小說。

我們專門使用這個人工智能模型來生成被稱爲絲氨酸水解酶的酶,這是一組在醫學和塑料回收方面有潛在應用的蛋白質。在設計出這些酶之後,我們將它們與預期的分子目標混合,以觀察它們是否能夠催化其分解。令人鼓舞的是,我們測試的許多設計都能夠分解該分子,而且比之前爲相同反應設計的酶效果更好。

爲了瞭解我們的計算設計有多精確,我們使用了一種名爲X射線晶體學的方法來確定這些酶的形狀。我們發現其中許多酶與我們數字設計的幾乎完全匹配(近乎完美匹配)。

我們的研究結果標誌着酶設計方面的一個關鍵進展,突顯了人工智能如何能夠幫助科學家着手解決複雜問題。機器學習工具可以幫助更多研究人員涉足酶設計領域,並充分挖掘酶在解決現代問題方面的潛力。

本文依據知識共享(Creative Commons)許可協議從《對話》重新發布。

由《對話》提供

這篇報道最初發表於物理組織網站。訂閱我們的時事通訊以獲取最新的科技新聞動態。