斯坦福登Nature:AI凭空造出前所未有蛋白质新智元
AI创造生命的一大步!斯坦福团队用AI造出从零写出16种噬菌体,内含地球前所未有的蛋白,Anthropic CEO预警:6到12个月,傻子也能造超级病毒。
迈向AI创造生命的重要一步!
正值深夜,斯坦福那间被精密仪器塞满的实验室,屏幕前的研究员没有像往常那样去操作移液管,而是屏住呼吸,按下了一个决定性的回车键。
几小时后,湿实验室的培养皿里,原本如地毯般均匀铺开的大肠杆菌群落中,突然浮现出一块又一块触目惊心的空白区。
显微镜下,这是一场微观世界的屠杀:细菌的细胞壁被刺穿,生命物质如熔岩般流出,成片成片的菌落倒下,仿佛被一台看不见的、凶猛的收割机扫过。
AI生成的解释性图像
放在过去,这没什么稀奇。噬菌体——一种专门吃细菌的病毒——干这种事干了几十亿年了。
但这一次,完全不一样。
这片培养皿里的「杀手」,不是来自任何沼泽、泥土、海洋或污水池——它从未在地球上活过哪怕一秒钟。它的「祖籍」不在大自然,而在硅片之间。
它是被一个叫Evo的AI模型从零开始,一行行代码「敲」出来的全套基因组。
人类把这段AI写出来的DNA合成出来,塞进大肠杆菌里,然后,它就活了,还杀得比真病毒更凶、更快、更狠。
斯坦福大学和Arc Institute的科学家们使用AI大模型,成功创造了世界上首批「AI设计」的噬菌体。
这些并非自然界病毒的简单变种,而是拥有全新蛋白质结构的合成生命形式。
研究人员合成了302个AI设计的基因组,把它们扔进大肠杆菌培养液,结果有16个直接「原地起飞」,成了能感染、能复制、能裂解细菌的真实病毒。
去年,预印本发布时,那周的头条都被GPT占据了,以至于没多少人注意到这一突破。
预印本地址:https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
那时,MIT科技评论形容那个夜晚是「AI is here」的觉醒时刻——
这代表了「首个完整基因组的生成式设计」。
纽约大学朗格尼医学中心的生物学家Jef Boeke表示,这同时也是向着AI设计的生命形式迈出的「令人印象深刻的第一步」。
而最让生物安全圈瑟瑟发抖的细节藏在论文最后:其中一个AI设计的噬菌体,它装DNA的「包装盒」蛋白——
这玩意儿,地球已知所有生物里都查不到亲戚。
曼彻斯特大学的基因组工程师Patrick Yizhi Cai描述了这类技术的潜在影响:
这些AI模型就像是合成基因组学领域的「ChatGPT时刻」。你可以开始编写自然界从未存在过的东西。
当ChatGPT遇见DNA
要理解这件事,得先认识主角——一个叫Evo的「幽灵」。
简单粗暴的类比:Evo就是DNA版的ChatGPT。
ChatGPT读的是人类几千年来留下的小说、博客、论文、贴吧水帖,学会了怎么「接龙」出像人话的句子。
Evo读的呢?
是270万个原核生物和噬菌体的基因组(Evo 1),以及横跨生命之树的9.3万亿核苷酸数据(Evo 2)——这是迄今最大的开源生物AI模型。
Evo 2是SOTA的DNA语言模型,专为长上下文建模与设计而打造。Evo 2采用 StripedHyena 2架构,能以单核苷酸分辨率对DNA序列进行建模,上下文长度可达100万个碱基对。Evo 2使用Savanna平台进行预训练,并在OpenGenome2数据集上以自回归方式进行训练,该数据集包含来自生命所有领域的8.8万亿个token。
它学的不是「今天天气怎么样」,而是「A后面接什么碱基,这个生物才能活下去」
在它眼里,DNA序列(A、T、C、G)不再是神秘的生命天书,而是一套可以预测、可以接龙、甚至可以「文学创作」的底层代码。
在不依赖特定任务微调的情况下,Evo 2能够准确预测遗传变异对功能的影响——从非编码致病突变到具有临床意义的BRCA1基因变异
它读取基因组的方式,就像Claude读取代码一样,但Evo 2开源了!
论文地址:https://www.nature.com/articles/s41586-026-10176-5
开放权重:https://huggingface.co/collections/arcinstitute/evo
开源项目:https://github.com/arcinstitute/evo2


