OpenAI生命科学模型出世:超越95%专家新智元
OpenAI直接杀进万亿美元的制药赛道,最新发布的首款生命科学模型系列GPT-Rosalind,RNA预测任务碾压95%人类专家,不卷AlphaFold,要做科学家的AI搭挡。
这一次,OpenAI瞄准了一个10到15年的生意。
就在昨天,OpenAI扔出了一个跟以往画风完全不同的模型:GPT-Rosalind。
这个名字取自Rosalind Franklin,就是那位用X射线晶体学揭示了DNA双螺旋结构的科学家。
Rosalind Franklin(1920-1958),英国物理化学家,其X射线晶体学研究为揭示DNA双螺旋结构奠定了关键基础。OpenAI以她命名首款生命科学模型。
OpenAI用自己首个生命科学专用推理模型,直接冲进了生物学、药物发现和转化医学的腹地。
在与基因治疗公司Dyno Therapeutics的合作测试中,这个模型在RNA序列功能预测任务上,超过了95%的人类领域专家。
在美国,一款新药从靶点发现到拿到监管批准,平均要10到15年。
OpenAI想用AI把这个流程的早期阶段大幅压缩。
靶点发现、假设生成、实验规划、文献合成,这些传统上科学家需要在海量论文、数据库和实验数据之间反复横跳的工作,Rosalind想通过AI一手串起来。
不是聊天机器人
是实验室搭档
GPT-Rosalind不是GPT-5.4的升级版。
它是OpenAI「生命科学模型系列」的首款产品,专门针对科研工作流做了优化,核心能力覆盖五个方向:
化学反应机理推理、蛋白质结构与突变效应理解、基因组学解读、实验规划,以及海量文献的综合分析。
但模型本身只是一半。
OpenAI还同步推出了一个Life Sciences Research插件。
插件代码/包已在GitHub公开,能连接50多个公共多组学数据库和科学工具,覆盖人体遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等领域。
这样一来,查PubMed、跑BLAST序列比对、调AlphaFold看蛋白结构、搜临床试验数据,都可能在一个对话窗口里完成。
想象一下一个药物研发科学家的日常:
早上打开PubMed查文献,切到UniProt看蛋白质数据,再跳到NCBI比对基因序列,中间还要在Excel里整理实验数据,下午开组会汇报假设进展。一天下来,真正用于「思考」的时间可能不到三分之一。
GPT-Rosalind要做的事,是把这些散落在十几个平台上的工作流,压缩到一个界面里完成。它不替你做实验,但它能帮你在动手之前,把方向想得更清楚。
首批合作方都是清一色的业内巨头:Amgen、Moderna、Allen Institute、Thermo Fisher Scientific。
不止如此,OpenAI还拉了麦肯锡、BCG、贝恩三大咨询公司做落地伙伴,帮药企识别场景、集成模型。
这架势,已经不是在卖模型了,是在卖整套解决方案。
95%人类专家排在它后面
GPT-Rosalind到底有多强?
OpenAI拉了一个硬核外部合作方来验证:Dyno Therapeutics,一家做AI基因治疗的公司。
双方用一批未公开、未被训练数据污染的RNA序列做了两项测试,对比基准是57位AI生物领域人类专家的历史成绩,结果显示:
在RNA序列功能预测任务上,模型提交10次取最佳,成绩超越了95%的人类领域专家;在序列生成任务上,约在84%的人类专家之上。
给一段RNA序列让它判断功能,它可能比绝大多数人类专家都要准;但让它自己设计一段新序列,表现就稍逊一档。
这恰好是当前AI在生命科学领域的真实边界:理解分析强于创造设计。
当然,需要注意的是,这只是一个特定的RNA预测任务,不等于「AI已经全面超越生物学家」。
即便如此,这个成绩在AI+生命科学领域仍然是最亮眼的数据之一。
从图示结果看,GPT-Rosalind在五项生物与化学基准上均取得最高分,其中实验设计与分析的提升幅度最大。
基准测试也同样出色。
在BixBench这个围绕真实生物信息学任务设计的基准上,Rosalind在已公开成绩的模型中处于领先。
在LABBench2的11项任务中,有6项优于GPT-5.4,其中提升最大的是CloningQA,要求模型从零设计一个完整的分子克隆方案。
注意对比对象:GPT-5.4,在这些专业任务上被自家垂直模型反超。
这说明,通用模型在专业领域确实有天花板,可能不如一些专门优化的垂直模型好使。
所有这些成绩都来自特定基准测试,并非来自真实的临床管线。从跑分到真正缩短10到15年的新药周期,中间还有一条巨大的鸿沟。
显微镜和研究助手
说到生命科学AI,很多人第一个想到的名字是Google DeepMind的AlphaFold。
这是一个绕不开的问题,熟悉这一领域的人很容易拿两者比。
那Rosalind和AlphaFold什么关系?两者完全不同层级的工具。
AlphaFold是一个计算引擎。
它只把一件事做到极致:输入氨基酸序列,输出蛋白质3D结构,它解决的是困扰结构生物学几十年的「蛋白质折叠问题」。
AlphaFold数据库里已经有超过2亿个结构预测,AlphaFold 3进一步扩展到蛋白-配体、蛋白-核酸等复合物的相互作用预测。
GPT-Rosalind则更像是一个研究伙伴。


