近日米间,AI領(lǐng)域新銳公司EvolutionaryScale推出了一款能夠生成新型蛋白質(zhì)的里程碑AI模型——ESM3乘碑。利用ESM3蛮粮,研究團(tuán)隊(duì)生成了一種新型綠色熒光蛋白(GFP)溢棱,這一過程需要5億年的進(jìn)化才能自然發(fā)生腊拍。
EvolutionaryScale成立于2023年7月,目前公司已完成超1.42億美元的種子輪融資疮肿,領(lǐng)投方包括Nat Friedman港赂、Daniel Gross、 Lux Capital家么,參投方包括Amazon涉功、NVentures(英偉達(dá)的風(fēng)險(xiǎn)投資部門)等。EvolutionaryScale的創(chuàng)始團(tuán)隊(duì)來自Meta的FAIR (Fundamental AI Research)部門裕照,是將AI應(yīng)用于生物學(xué)的先驅(qū)攒发。該創(chuàng)始團(tuán)隊(duì)于2019年構(gòu)建了ESM1——被廣泛認(rèn)為是第一個(gè)用于蛋白質(zhì)的大型語言模型(LLM)调塌。之后晋南,他們曾使用ESM-2模型創(chuàng)建了一個(gè)包含6億個(gè)預(yù)測蛋白質(zhì)結(jié)構(gòu)的免費(fèi)數(shù)據(jù)庫。2023年4月羔砾,相關(guān)科學(xué)家離開Meta负间,創(chuàng)辦EvolutionaryScale,開發(fā)下一代生成模式——ESM3姜凄。
來源:biorxivESM3
在地球自然多樣性的27.8億種蛋白質(zhì)的數(shù)據(jù)集上進(jìn)行每秒1萬億次浮點(diǎn)運(yùn)算的訓(xùn)練(比任何其他已知的生物學(xué)模型計(jì)算能力更強(qiáng))政溃。據(jù)稱趾访,這是首個(gè)同時(shí)對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理的生成式模型董虱。ESM3有望加速廣泛的應(yīng)用扼鞋,包括開發(fā)新的抗癌療法。
ESM3可以聯(lián)合推理蛋白質(zhì)的序列愤诱、結(jié)構(gòu)和功能(來源:EvolutionaryScale)
ESM3是一種生成式語言模型云头,可以對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理(來源:biorxiv)
綠色熒光蛋白是唯一發(fā)光的蛋白質(zhì)晋粱,已經(jīng)成為分子生物學(xué)的重要工具锁澡,幫助科學(xué)家觀察細(xì)胞內(nèi)的分子。分析表明馁惨,在自然進(jìn)化過程中神翁,這種不同的蛋白質(zhì)可能需要5億年以上的時(shí)間才能進(jìn)化出來。ESM3跨越了5億年的進(jìn)化业弊,創(chuàng)造了一種新的熒光蛋白誓贝。ESM3在生成新的綠色熒光蛋白方面的成功凸顯了該模型推動生物研究和生命科學(xué)領(lǐng)域取得進(jìn)步的潛力。
ESM3先產(chǎn)生了B8誓籽,一種與自然界已知的所有GFP都不同的“暗淡版”GFP镣逃。從B8開始,ESM3生成了esmGFP洪业,亮度與其他天然GFP相似(來源:EvolutionaryScale)
由ESM3產(chǎn)生的一種新的綠色熒光蛋白撼遵,與自然界中發(fā)現(xiàn)的其他熒光蛋白不同(來源:EvolutionaryScale)
EvolutionaryScale已經(jīng)與Amazon Web Services (AWS)和英偉達(dá)(NVIDIA)達(dá)成了合作,加速AI在藥物發(fā)現(xiàn)峭桅、合成生物學(xué)等領(lǐng)域的應(yīng)用甜杰。通過與AWS合作,Evolutionary Scale使全球數(shù)十萬研究人員和全球十大制藥公司中的九家能夠輕松訪問全部的ESM3模型家族吵护。通過與英偉達(dá)(NVIDIA)的持續(xù)合作盒音,ESM3的所有版本都將針對訓(xùn)練和推理性能進(jìn)行優(yōu)化∠诙“我們的目標(biāo)是祥诽,創(chuàng)造出可以讓生物學(xué)程序化的工具。ESM3向生物學(xué)的未來邁出了重要一步瓮恭⌒燮海”EvolutionaryScale的首席科學(xué)家Alex Rive說道。