Claude Science几周干完两年活新智元
这一回,Anthropic没有推更聪明的科研模型,而是动了科研的根:第一次把科研拆成了一条能被逐步审计的流水线。
两年的活,如今几周干完。
最近,Allen Institute的一位神经科学家Jérôme Lecoq和他的团队,把一篇长篇综述的写作时间,从将近2年压到了几周。
Jérôme Lecoq手头上积攒了约10篇综述,不少超过100页,每一条引用都被一个智能体逐句核对过。
帮他干活的,是Anthropic刚推出的新应用,Claude Science。
2026年6月30日,Anthropic发布Claude Science,定位为面向科学家的AI工作台。(图源:Anthropic官方博客)
据Anthropic介绍,这套活儿过去这位科学家和他的团队要干两年。
Anthropic给Claude Science的定位,并非一个更聪明的科研模型,而是一个面向科学家的AI工作台。
它真正的突破在于:第一次把科研这件事,拆成了一条能被逐步审计的流水线。
如今,Claude Science已在macOS和Linux上开启beta,对Pro、Max、Team、Enterprise用户开放。
是整条科研工具链
做过科研的人,都懂那种繁琐:
一个项目要在几十个数据库之间来回跳,每个库都有自己的schema和查询语言;
文件格式五花八门,每种都得现搭管线、现找查看器;
手边还摆着一排工具,PubMed查文献,Jupyter跑代码,R做统计,集群终端提交任务……
不停转场,真正用来思考科学问题的时间,经常被这些搬运、拼接、调试工作耗费殆尽。
而Claude Science干的事,正是将这些碎片场景打包「收纳」进同一个执行环境:
文献分析、多步计算、图表打磨、论文成稿,全部阶段在同一个环境里走完,你不必再为换一个工具而中断思路。
它能跑在你本地的macOS或Linux上,也能通过SSH连到远程机器,或者挂在高性能计算(HPC)的登录节点上。
就像你平时用Jupyter那样,数据在哪,它就去哪。
就连算力调度这块,它也包了。
折叠一个蛋白质,或者在海量数据上跑一条基因组管线,这种大活过去要研究者亲自伺候,搭计算任务、排队等集群、盯着成功还是失败、再把结果拉回来,一来一回半天就没了。
Claude Science把这套流程接管了:先起草计划,碰新资源前先问你一声,写任务、提交任务之前都让你能审查或撤销,把分析从1个GPU一路扩到数百个。
Claude Science把一次8组scVI超参扫描派到实验室A100集群运行,右侧Notebook与智能体共用同一个实时内核,变量和状态实时同步。(图源:Anthropic官方博客)
更重要的一点,敏感数据不离开原系统,只有每一步真正需要的上下文才会发给Claude。
都自带可追溯代码
科研这行天生就跟图打交道,蛋白质三维结构、基因组浏览器轨道、化学结构式,这些本就是图。
Claude Science顺着这一点,在出图、出稿的同时,把生成它们的代码一并交出来,还能把它们原生渲染出来。
更关键的在可复现性(reproducibility)。
每当Claude Science生成一张图,它都会把生成这张图的确切代码、运行环境、纯语言说明和完整对话历史,一并打包「钉」在图上。
左侧一张跨138个物种的细胞图,右侧同屏挂着生成它的确切代码,圈注一句就能让智能体改图。每个结果都可复现、可追溯到代码。(图源:Anthropic官方博客)
一篇论文从投稿到见刊,常常隔着大半年;几个月后,等审稿人要你重跑某张图,你可以很轻松地把输入、过程、结果整条链当场复现出来。
想改图?直接说话就行——「把网格线去掉」「纵轴换成对数」,智能体直接去改自己写的代码。
你还能在任意节点把会话fork出去,同时试两条思路,原来那条线程一点不乱。
一句话,科研第一次被整合成一份可审计(auditable)的工作流,code、env、history都被放进一个闭环中。
一个智能体写
另一个专门挑错
Claude Science背后,并非一个智能体在单打独斗。
你面对的是一个会统筹的协调智能体,它手里握着60多个为基因组、单细胞、蛋白质组、结构生物学、化学信息学预配好的技能和连接器。
活一多,它自己就能派生出更多智能体来分工,也能随时调用你亲手创建的专家智能体。
最妙的是那个审查智能体(reviewer agent)。
它专门核查引用和计算,揪出错误的引用、追不到出处的数字、对不上代码的图,发现了就标出来、自己改掉。
在Allen Institute那个案例里,团队用的正是actor-critic配对,一个智能体负责写,另一个专门评它的准确性和引用真不真。
这套结构,已经有点「AI内部同行评审」的雏形了。
但有一条边界必须说清楚,全程是人在回路(human-in-the-loop)。
在需要动用新资源前,它会先征求授权,每个决策你都能复核、能撤销。它自动化的是流程,而并非自动替你做科学发现。
它还接了NVIDIA的BioNeMo Agent Toolkit,能原生连上Evo 2、Boltz-2、OpenFold3这些生命科学模型。
你实验室自己信得过的模型、数据、管线,也能存成可复用的技能挂进来,往后的会话自动继承。
Claude Science第一站
Claude Science的第一个落点,选在了生命科学。
基因组、单细胞、蛋白质组、结构生物学、化学信息学,开箱即用。
它能读文献,能查询60+科学数据库,UniProt、PDB、Ensembl、ClinVar、ChEMBL、GEO这些规格不一的库,你不用再一个个去学着用。
Claude Science为基因组、单细胞、蛋白质组、化学信息学预配好环境,背靠60+科学数据库。(图源:Anthropic官方博客)
Manifold Bio做的是组织靶向药物。
他们用Claude Science来提名最新实验的靶点,对每个组织和靶点,逐一评估表面表达、运输和安全性,再按公司从自有数据里学到的标准给候选排序。
Manifold说,普通编程助手做不到这一点,Claude Science能端到端地干完,拿对数据,下对判断,还带着过往项目的上下文。
还有更硬核的例子。
UCSF脑瘤中心的一位流行病学副教授,用它做脑胶质瘤的分子流行病学研究,分析数千个微效种系(germline)变异如何叠加、塑造个体易感性。
据Anthropic介绍,这套种系分析,Claude Science用了过去约1/10的时间就跑完了,他的团队还独立复核过结果,确认既快又稳。


