Google 旗下的 DeepMind,一夜之間讓學(xué)術(shù)界炸了鍋。
5 月 8 日,DeepMind 官宣了一個(gè)新的 AI 模型:AlphaFold 3。
相關(guān)的研究論文,發(fā)表在權(quán)威的《自然》雜志上,一來(lái)就占據(jù)了頭版。
ChatGPT 之后,AI 模型不計(jì)其數(shù),但最有資格自稱(chēng)改變世界的,可能只有 AlphaFold 3。
AlphaFold 超級(jí)進(jìn)化,讓生物世界更加「高清」
我們?cè)谥袑W(xué)生物課上學(xué)過(guò),蛋白質(zhì)是由氨基酸通過(guò)肽鍵連接形成的長(zhǎng)鏈分子,在空間中折疊成復(fù)雜的三維結(jié)構(gòu)。
三維結(jié)構(gòu)決定了蛋白質(zhì)的功能,直接影響了藥物設(shè)計(jì)和疾病治療。
可以說(shuō),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),是生物學(xué)最重要的命題之一。
但預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),是一件難事,往往需要復(fù)雜的實(shí)驗(yàn),甚至被形容為「困擾了生物學(xué)家 50 年的問(wèn)題」。
2016 年,DeepMind 的 AlphaGo,戰(zhàn)勝了職業(yè)九段棋手,重寫(xiě)了圍棋這門(mén)古老的技藝。
DeepMind 的 AlphaFold,則要探聽(tīng)生物學(xué)的密碼,窺探生命本身的堂奧。

2018 年,AlphaFold 1 發(fā)布。
2020 年,AlphaFold 2 面世,已經(jīng)可以在幾分鐘內(nèi)大規(guī)模地準(zhǔn)確預(yù)測(cè)蛋白質(zhì)的形狀,并精確到原子級(jí)別。
現(xiàn)在,我們迎來(lái)了 AlphaFold 3,一個(gè)野心更大的 AI:超越蛋白質(zhì),探索所有的生物分子。
生物分子,即構(gòu)成生物體的分子,包括蛋白質(zhì)、DNA、RNA 等。
DeepMind 認(rèn)為,只有了解生物分子如何在數(shù)百萬(wàn)種組合中相互作用,才能開(kāi)始真正理解生命的過(guò)程。

一言以蔽之,AlphaFold 3 比起前代,覆蓋的范圍更廣了,可以準(zhǔn)確預(yù)測(cè)蛋白質(zhì)、DNA、RNA、配體等生物分子的結(jié)構(gòu),以及它們?nèi)绾蜗嗷プ饔谩?/p>
先來(lái)看一些 AlphaFold 3 的預(yù)測(cè)結(jié)果。
7PNM,是一種普通感冒病毒的刺突蛋白。
如圖所示,AlphaFold 3 對(duì) 7PNM(藍(lán)色部分)與抗體(綠色部分)、單糖(黃色部分)相互作用時(shí)的結(jié)構(gòu)預(yù)測(cè),與真實(shí)結(jié)構(gòu)(灰色部分)吻合。

預(yù)測(cè)背后有其意義,把這類(lèi)蛋白質(zhì)研究清楚,科學(xué)家便能更了解免疫系統(tǒng)和包括新冠在內(nèi)的冠狀病毒,甚至提出更好的治療方案。
除了蛋白質(zhì)的結(jié)構(gòu),AlphaFold 還能預(yù)測(cè)分子復(fù)合物,即多個(gè)分子組成的復(fù)雜結(jié)構(gòu)。
下圖的酶,來(lái)自一種對(duì)植物有害的土壤真菌。
AlphaFold 的預(yù)測(cè)結(jié)果,包含一個(gè)酶蛋白(藍(lán)色部分)、一個(gè)離子(黃色球體)和一些單糖(黃色部分),契合了真實(shí)結(jié)構(gòu)(灰色部分)。

深入了解這種酶與植物細(xì)胞如何相互作用,可以幫助研究人員開(kāi)發(fā)更健康、抵抗力更強(qiáng)的作物,給農(nóng)業(yè)生產(chǎn)帶來(lái)實(shí)際的好處。
類(lèi)似地,AlphaFold 3 預(yù)測(cè)了一個(gè)由蛋白質(zhì)(藍(lán)色部分)、RNA 鏈(紫色部分)和兩個(gè)離子(黃色部分)組成的分子復(fù)合物,同樣和真實(shí)結(jié)構(gòu)(灰色部分)高度匹配。
這種復(fù)合物參與蛋白質(zhì)的合成,即細(xì)胞生命活動(dòng)和健康的基本過(guò)程之一,研究意義同樣深遠(yuǎn)。

展現(xiàn)預(yù)測(cè)結(jié)果的準(zhǔn)確性,再?gòu)?qiáng)調(diào)相關(guān)的用途,DeepMind 想要告訴世界,AlphaFold 3 是一種「革命性的模型」。
一方面,研究范圍更廣了。把視野擴(kuò)充到蛋白質(zhì)之外,特別是配體等小分子,可以涵蓋更多的藥物。
另一方面,準(zhǔn)確度也提高了。對(duì)于蛋白質(zhì)與其他分子類(lèi)型的相互作用,與現(xiàn)有的預(yù)測(cè)方法相比,AlphaFold 3 的精度至少進(jìn)步了 50%。其中一些重要的相互作用,提升甚至達(dá)到了 100%。
這樣一來(lái),AlphaFold 3 可以造福更多的研究,加速藥物設(shè)計(jì)、推動(dòng)基因組學(xué)、研發(fā)更健康的作物、開(kāi)發(fā)生物可再生材料……
說(shuō)到技術(shù)原理,AlphaFold 3 基于 AlphaFold 2 改進(jìn),核心是 Evoformer 深度學(xué)習(xí)架構(gòu),并使用了類(lèi)似 Midjourney 的擴(kuò)散網(wǎng)絡(luò)。

使用 AlphaFold 3 的過(guò)程,有些像我們和大語(yǔ)言模型聊天。輸入對(duì)生物分子的描述,AlphaFold 3 生成這些分子的三維結(jié)構(gòu),并研究它們?nèi)绾蜗嗷プ饔谩?/p>
AlphaFold 3 給出預(yù)測(cè)結(jié)果的過(guò)程,類(lèi)似逐步去噪的 AI 文生圖擴(kuò)散模型,從模糊的原子云開(kāi)始,逐步匯聚成準(zhǔn)確的分子結(jié)構(gòu)。
講人話(huà)的生成式 AI,增強(qiáng)了格子間打工人的生產(chǎn)力。AlphaFold 對(duì)科學(xué)家們的意義,也不外如是。

在實(shí)驗(yàn)室進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),可能要花掉攻讀一個(gè)博士學(xué)位的時(shí)間,以及數(shù)十萬(wàn)美元。上億個(gè)預(yù)測(cè),怕是窮盡幾百萬(wàn)人的一生也無(wú)法完成。
但有了 AlphaFold,科學(xué)家們可以提出大膽的問(wèn)題、創(chuàng)新的假設(shè),然后在實(shí)驗(yàn)室進(jìn)行測(cè)試,加速研究的進(jìn)程。
DeepMind 的一句話(huà),足以向普通人概括 AlphaFold 3 的意義:
AlphaFold 3 將生物世界帶入高清。
將 AlphaFold 交給世界,等待科學(xué)發(fā)現(xiàn)的新文藝復(fù)興
之前為了嘲諷 OpenAI 的閉源,馬斯克給它起了個(gè)綽號(hào):CloseAI。
投喂了 OpenAI 好幾篇論文的 Google,在某些方面更有開(kāi)源的精神。
2021 年 7 月,AlphaFold 2 在 Nature 發(fā)布了論文,也開(kāi)源了代碼。
截至目前,AlphaFold 2 已用于預(yù)測(cè)數(shù)億個(gè)結(jié)構(gòu)。全球數(shù)百萬(wàn)研究人員,將 AlphaFold 2 用于瘧疾疫苗、癌癥治療和酶設(shè)計(jì)等領(lǐng)域。
也是在 2021 年 7 月,DeepMind 和歐洲生物信息研究所(EMBL-EBI)合作,發(fā)布了 AlphaFold 蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù),提供了迄今為止最完整、最準(zhǔn)確的人類(lèi)蛋白質(zhì)組圖景。

DeepMind 在官宣的博客里提到,這是自人類(lèi)基因組繪圖以來(lái)最重要的數(shù)據(jù)集之一,現(xiàn)在他們將 AlphaFold 的力量,免費(fèi)交到全世界科研人員的手中。
一年之內(nèi),超過(guò) 50 萬(wàn)研究人員使用了 AlphaFold 數(shù)據(jù)庫(kù),查看了超過(guò) 200 萬(wàn)個(gè)結(jié)構(gòu),加速解決塑料污染、抗生素耐藥性等現(xiàn)實(shí)問(wèn)題。
自那以后,數(shù)據(jù)庫(kù)還在不斷地?cái)U(kuò)充。

2022 年 7 月,DeepMind 發(fā)布了幾乎所有科學(xué)已知的蛋白質(zhì)預(yù)測(cè)結(jié)構(gòu),總共超過(guò) 2 億個(gè),除了人類(lèi),其中還包括了植物、細(xì)菌、動(dòng)物和其他生物體的預(yù)測(cè)結(jié)構(gòu)。
AlphaFold 數(shù)據(jù)庫(kù),就像蛋白質(zhì)結(jié)構(gòu)的「Google 搜索」,也像一個(gè)繁星閃爍的蛋白質(zhì)宇宙。蛋白質(zhì)的三維結(jié)構(gòu)是生命的基石,看起來(lái)又精致美觀,讓人感嘆大自然造物的神奇。

不過(guò),這次發(fā)布的 AlphaFold 3,相比 AlphaFold 2,態(tài)度稍微顯得保守,招致了一些批評(píng)的聲音。
AlphaFold 3 目前沒(méi)有開(kāi)源,不能在本地部署,研究人員只能通過(guò) DeepMind 最新推出的研究平臺(tái) AlphaFold Server,免費(fèi)訪(fǎng)問(wèn)大部分功能,且用途是非商業(yè)的。
最阻礙科學(xué)進(jìn)步的是服務(wù)的訪(fǎng)問(wèn)次數(shù):每天只能進(jìn)行 10 次預(yù)測(cè)。
摳門(mén)行為的背后,DeepMind 可能有自己的商業(yè)考量——子公司 Isomorphic Labs 已經(jīng)與制藥公司合作,將 AlphaFold 3 應(yīng)用于藥物設(shè)計(jì)。
Google DeepMind 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 樂(lè)觀地表示,首批 AI 設(shè)計(jì)的藥物可能會(huì)在未來(lái)幾年內(nèi)準(zhǔn)備好進(jìn)行測(cè)試。
