-
上海交大發(fā)布蛋白質(zhì)設(shè)計模型“Venus”,用AI訓(xùn)練“六邊形戰(zhàn)士”
以去年諾貝爾化學(xué)獎授予AlphaFold開發(fā)者為標志,蛋白質(zhì)設(shè)計,已成為當今AI for Science最熱門的交叉研究領(lǐng)域。然而預(yù)測結(jié)構(gòu),只是一款功能過硬的蛋白質(zhì)產(chǎn)品誕生的起點,其后通常還需要豐富的專家經(jīng)驗配合數(shù)以萬計的實驗試錯,長期以來,蛋白質(zhì)設(shè)計改造的時間長、成本高、試錯密集問題,一直是業(yè)界難題。
3月22日,上海交通大學(xué)洪亮教授團隊發(fā)布最新成果,使這些問題迎刃而解。團隊將AI與蛋白質(zhì)設(shè)計與改造相結(jié)合,建立了全球最大的蛋白質(zhì)數(shù)據(jù)集,基于該數(shù)據(jù)集訓(xùn)練的模型,可以精準、高效地預(yù)測、設(shè)計蛋白質(zhì)的功能,把蛋白質(zhì)生產(chǎn)由“緩慢的試錯”變?yōu)椤案咝实木珳试O(shè)計”。該成果配合行業(yè)領(lǐng)先的自動化設(shè)備,已經(jīng)進行產(chǎn)業(yè)化落地,把蛋白質(zhì)設(shè)計從原先的“復(fù)雜科學(xué)”變?yōu)槿缃竦摹昂唵喂こ獭薄?
建立全球最大的蛋白質(zhì)序列數(shù)據(jù)集
蛋白質(zhì)是由氨基酸序列構(gòu)成的,氨基酸序列的長度從數(shù)百個到上千個不等。AI時代,數(shù)據(jù)是推動技術(shù)進步的核心資源,龐大的蛋白質(zhì)序列數(shù)據(jù)集為AI模型提供了豐富的“學(xué)習(xí)材料”,能幫助模型更好地理解蛋白質(zhì)的序列、結(jié)構(gòu)和功能關(guān)系。洪亮團隊建立的蛋白質(zhì)序列數(shù)據(jù)集Venus-Pod(Venus-Protein Outsize Dataset)含有近90億條蛋白質(zhì)序列,包含數(shù)億個功能標簽,是全球數(shù)據(jù)規(guī)模最大、功能批注標簽最多的數(shù)據(jù)集,也是另一行業(yè)知名模型——美國ESM-C模型訓(xùn)練用的21億蛋白質(zhì)序列的4倍體量。
該數(shù)據(jù)集包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列、0.6億條病毒蛋白質(zhì)序列,覆蓋從常規(guī)地表生物到極端環(huán)境微生物的蛋白質(zhì)序列信息,尤其是配備的數(shù)億功能標簽(蛋白質(zhì)工作的溫度、酸堿度、壓強等)。
這些數(shù)據(jù)意味著什么?洪亮表示,首先該數(shù)據(jù)集構(gòu)成了巨大的“蛋白質(zhì)礦藏”,使得人類有可能挖掘新的蛋白或者生物催化劑,助力我們生物醫(yī)藥和合成生物學(xué)的快速發(fā)展;其次,AI大模型有望通過海量數(shù)據(jù)的學(xué)習(xí)和掌握自然界蛋白質(zhì)的進化模式,為AI設(shè)計優(yōu)異的蛋白質(zhì)產(chǎn)品提供了寶貴的學(xué)習(xí)資料。
瞄準蛋白質(zhì)“功能預(yù)測”,用AI訓(xùn)練“六邊形戰(zhàn)士”
蛋白質(zhì)是由20種氨基酸組成的一條高分子鏈,這個高分子鏈會扭曲并折疊成獨特的三維結(jié)構(gòu),正是這種獨特結(jié)構(gòu)賦予了特定蛋白質(zhì)的生物功能。2024年,諾貝爾化學(xué)獎頒發(fā)給谷歌DeepMind團隊,該團隊利用AI技術(shù)精準解析了蛋白質(zhì)序列到三維結(jié)構(gòu)的關(guān)系,解決了困擾生物學(xué)家長達50年的基本難題。然而,一個現(xiàn)實的問題是:如果我們稍微改動蛋白質(zhì)的氨基酸序列,哪怕只是1%的微小改變,蛋白質(zhì)的整體結(jié)構(gòu)看似沒有發(fā)生明顯變化,但它的功能大概率會變差,甚至完全喪失。換言之,要設(shè)計出一款成功的蛋白質(zhì)產(chǎn)品,不能只關(guān)注它的三維結(jié)構(gòu),而是要能成功預(yù)測和設(shè)計它的功能。因此,洪亮教授團隊“另辟蹊徑”,不再執(zhí)著于蛋白質(zhì)的結(jié)構(gòu),而是直接瞄準“功能預(yù)測”這一終極目標,將復(fù)雜的蛋白質(zhì)設(shè)計變成以需求為導(dǎo)向,配合少量實驗輸出結(jié)果的簡單過程。
“我們訓(xùn)練了Venus(啟明星)系列模型,與DeepMind團隊的AlphaFold預(yù)測蛋白質(zhì)結(jié)構(gòu)不同,這個模型學(xué)習(xí)自然界蛋白質(zhì)序列的組織規(guī)則以及它與功能之間的關(guān)系,其預(yù)測蛋白質(zhì)突變功能的精度位居行業(yè)榜單之首?!焙榱帘硎?,Venus系列模型具備兩大核心功能:“AI定向進化”與“AI挖酶”。所謂“AI定向進化”是指 Venus系列模型可以對一個不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進行優(yōu)化,讓它成為一個“六邊形戰(zhàn)士”滿足應(yīng)用需求。而“AI挖酶”則是指 Venus 系列模型基于其海量的未知功能蛋白質(zhì)數(shù)據(jù)集,可以“海選超能力戰(zhàn)士”,去精準發(fā)掘滿足苛刻應(yīng)用需求的具備超常規(guī)功能的蛋白質(zhì),比如極度耐熱、極度耐酸、極度耐堿、極度耐胃腸消化等。這些超常規(guī)功能的蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有巨大的應(yīng)用潛力,能夠為相關(guān)領(lǐng)域帶來創(chuàng)新和突破。
與此同時,配合Venus系列模型的全球首款低通量大體積蛋白質(zhì)表達、純化與功能檢測自動化一體機,可在24小時內(nèi)不間斷地完成100余個蛋白質(zhì)的表達、純化與檢測任務(wù),較人力效率提高近10倍,將大大減少研發(fā)過程中的人力、物力和時間成本投入,顯著提高蛋白質(zhì)工程與合成生物學(xué)研究的效率。其宗旨就是“設(shè)計AI化,實驗自動化”,讓科研人員從繁瑣的設(shè)計和實驗中解放出來,他們只需要提出問題,AI和自動化來解決問題,最終將復(fù)雜的蛋白質(zhì)科學(xué)發(fā)現(xiàn)變成“傻瓜相機式”的簡單過程。
已有多款產(chǎn)品落地,助力阿爾茲海默等疾病的診斷
從基礎(chǔ)科研到產(chǎn)業(yè)應(yīng)用,在任何科學(xué)領(lǐng)域都是一項從0到100的挑戰(zhàn),AI蛋白質(zhì)設(shè)計也不例外:經(jīng)AI設(shè)計出的蛋白質(zhì)在實驗室環(huán)境中表現(xiàn)出色,并不能保證它在中試階段或大規(guī)模生產(chǎn)中同樣能夠維持優(yōu)異的性能,這是因為產(chǎn)業(yè)化生產(chǎn)涉及更大規(guī)模的原料處理、更復(fù)雜的工藝控制以及更嚴格的質(zhì)量標準,這些因素都可能對蛋白質(zhì)的性能產(chǎn)生影響,而經(jīng)過Venus系列模型設(shè)計的多款蛋白質(zhì)已經(jīng)實現(xiàn)了落地產(chǎn)業(yè)化。
以國內(nèi)生長激素龍頭金賽藥業(yè)的單域抗體耐堿性改造為例。提升蛋白質(zhì)的耐堿性歷來是一項極具挑戰(zhàn)性的工作,洪亮團隊借助該模型結(jié)合少量濕實驗閉環(huán)迭代驗證,不到 1 年將普通單域抗體耐堿性提升 4 倍,每年為金賽藥業(yè)節(jié)約上千萬元成本。該成果已實現(xiàn)多個批次 5000 升放大生產(chǎn),成為全球首款由大模型設(shè)計并規(guī)?;a(chǎn)的蛋白質(zhì)產(chǎn)品。
另一項Venus系列模型的創(chuàng)新應(yīng)用則是對某體外診斷頭部公司堿性磷酸酶(ALP)的改造項目。ALP 因高穩(wěn)定性和靈敏度被廣泛用作標記酶,其活性越高,檢測靈敏度越高,從而能夠檢測到極低的生物標志物,但提升ALP的活性一直是一個挑戰(zhàn)。Venus 系列模型成功優(yōu)化 ALP,使其分子活性超國際頭部公司產(chǎn)品 3 倍,為超敏檢測診斷(如心肌梗塞、阿爾茲海默癥)帶來巨大價值。目前,改造后的 ALP 已進入 200L 規(guī)模放大生產(chǎn)階段,標志著 Venus 系列模型成功實現(xiàn)產(chǎn)業(yè)轉(zhuǎn)化。
- 責(zé)任編輯: 李沛 
-
全球首例!我國成功幫助漸凍癥失語患者重建交流能力
2025-03-22 13:59 科技前沿 -
火星取樣返回,美國能追上中國嗎?
2025-03-22 09:12 -
我國第二代“飛天”艙外服超額完成任務(wù)
2025-03-21 23:09 航空航天 -
神十九乘組圓滿完成第三次出艙,將于1個多月后返回地球
2025-03-21 23:07 航空航天 -
全球首例!我國腦機接口領(lǐng)域取得新突破
2025-03-21 22:55 -
我國新添一項世界之最
2025-03-21 14:13 科技前沿 -
月壤研究,重大突破!
2025-03-21 13:39 -
最小僅90納米!這一領(lǐng)域我國再獲突破
2025-03-21 09:57 科技前沿 -
巴拿馬港口風(fēng)波說明,我們需要一部自己的《IEEPA》
2025-03-20 13:44 心智觀察所 -
我國實現(xiàn)星地量子密鑰分發(fā)新突破
2025-03-20 06:42 科技前沿 -
官方公示:王興興,擬獲表彰
2025-03-19 14:06 -
大逆轉(zhuǎn)!國產(chǎn)MCU進入“反向傳教”時代
2025-03-19 13:40 心智觀察所 -
三大運營商的難言之隱
2025-03-18 15:15 心智觀察所 -
高調(diào)展示的“美國雄心”,竟是中國制造
2025-03-18 09:56 心智觀察所 -
中國科學(xué)家提出全新太空太陽能電站設(shè)計,有望根本解決全球能源問題
2025-03-17 10:20 心智觀察所 -
這場標準之戰(zhàn),中國準備好了嗎?
2025-03-17 08:15 心智觀察所 -
5%恐懼癥:美國對華半導(dǎo)體301調(diào)查真正的“故事背景”
2025-03-16 08:40 心智觀察所 -
這一技術(shù)僅五個國家掌握!我國刷新紀錄
2025-03-14 09:34 科技前沿 -
我國在三維世界造出二維金屬材料
2025-03-13 10:16 科技前沿 -
相關(guān)推薦 -
“特朗普此舉,是怕好萊塢沒涼透啊” 評論 169特朗普蔫了:俄烏和平協(xié)議“也許達不成” 評論 143最新聞 Hot
-
特朗普又開新戰(zhàn)線,“只會鼓勵各國像中國一樣反制”
-
“美國買家缺席,結(jié)果很意外!”
-
日本想“跪”,被警告:政府將垮臺
-
特朗普:最初是我“炸”了它
-
“關(guān)稅將抹掉15億美元利潤”,福特撤回了一個預(yù)期
-
縣長張漢坤官宣被查,公安局長落馬后“消失”4個月
-
今年第三次議息,美聯(lián)儲“將無視特朗普,維持不變”
-
在他嘴里,加拿大都成了“靠美國養(yǎng)活的社會主義政權(quán)”
-
越南總理:越美首輪談判本周三舉行,維持全年8%增長目標
-
“最美教師”鄧瀅,履新職
-
五一出游哪里人最多?河南接待游客6450.3萬人次
-
美防長“動刀”美軍高層,至少砍20%
-
以色列要全面占領(lǐng)加沙?“等特朗普結(jié)束中東之行……”
-
特朗普“殺得興起”,歐洲想“刀下?lián)屓恕?/a>
-
特朗普:我老婆覺得可愛
-
多地多層級啟動“高校領(lǐng)域突出問題系統(tǒng)整治”,集中在這5個方面
-