豆包2.1,编程追平Claude Opus 4.7智东西
豆包大模型2.1 Pro在FORCE原动力大会上正式发布,编程能力追平Claude Opus 4.7,综合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%。同时,视频生成模型Seedance 2.5预告支持30秒单条生成,音频、图像模型同步亮相,全模态能力全面升级,产业落地与商业化步伐明显提速。
6月23日,在FORCE原动力大会上,火山引擎推出豆包大模型2.1,同时预告了视频生成模型Seedance 2.5、图像创作模型Seedream 5.0 Pro以及豆包音频生成模型1.0的发布。
豆包大模型2.1在通用Agent、编程能力以及多模态水平上有所提升,包括豆包大模型2.1 Pro和豆包大模型2.1 Turbo,其中豆包大模型2.1 Pro在编程能力上接近Opus 4.7。
价格方面,豆包大模型2.1 Pro统一定价为输入6元、输出30元,缓存命中1.2元,综合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%。同时,面向高频调用场景的豆包2.1 Turbo同步上线,价格仅为2.1 Pro的一半。
此外,火山引擎还推出了Doubao-Seed-Evolving,面向Coding与Agent的重度用户,将会以每月2至4次的频率快速进行迭代,让开发者可以明显感受到模型的变化。
大会还预告了即将发布的Seedance 2.5、Seedream 5.0 Pro以及豆包音频生成模型1.0,其中,Seedance 2.5将单条视频生成拉长至30秒,Seedream 5.0 Pro新增了圈选编辑和多图层分离能力,豆包音频生成模型1.0则实现了角色音色自动推理和影视级音效一次性生成。Seedance 2.0也做了升级,支持原生4k视频直出。
大会上,火山引擎总裁谭待公布了一组数据:截至今年6月,豆包大模型日均Tokens调用量达180万亿,相比两年前发布时增长超过1500倍,过去一年增速超过10倍。
在公有云市场,火山引擎份额升至49.5%,同时,年消费超1万亿Tokens的企业客户从去年12月的100家翻倍到了200家。
除了模型发布,火山引擎还展示了在智能体开发、产业落地、AI安全、商用拓展等方面的综合进展。
Coding能力追平Opus 4.7 成本低80%
豆包大模型2.1 Pro是本场发布会的第一颗重磅炸弹。
编程评测中,豆包大模型2.1 Pro与Claude Opus 4.7基本持平,在SciCode科学计算评测中拿到59.8分,超过Opus 4.7和GPT-5.5,在NL2Repo仓库级代码生成评测中,豆包大模型2.1 Pro得分47,明显领先GPT-5.5和Gemini 3.1。
现场演示了一个芯片设计场景的硬核案例:豆包大模型2.1 Pro围绕一个16×16 PE的Tile TPU,连续运行18小时、经历9轮迭代,完成了6个核心模块、1300多行RTL代码,并跑通了仿真测试和检测流程,最终通过了手写数字识别验证。这类任务通常需要3到5名资深工程师数周的努力。
Agent能力方面,豆包大模型2.1 Pro在MCP Atlas评测(覆盖36个真实MCP Server、220个工具、1000多个任务)得分超过Opus 4.7和GPT-5.5。
在检验Agent与多模态能力的OS World和Mobile World等评测中,豆包大模型2.1 Pro也位居全球前列。
在Agent能力演示环节,火山引擎展示了一段多Agent协同构建3D虚拟城市的案例。
开发者结合豆包大模型2.1 Pro的多模态能力,让500多个Agent协同作业,在跨工具的完整链路中依次调用建模、渲染、贴图等11种工具,累计触发工具调用上千次,最终在一张大地图上完成了100多栋造型、材质、颜色均不相同的建筑的搭建,并通过多轮自我迭代生成全景成片。
目前,豆包大模型2.1已在火山引擎开放API服务,火山方舟体验中心同步上线,豆包、TRAE、扣子等产品同步接入。
视频、音频、图像模型齐发 Seedance 2.5预计7月上线
视频生成是火山引擎声量最大的赛道,今年2月发布的Seedance 2.0被该团队称为“全球第一个跨过生产质变点的视频生成模型”,这次预告的Seedance 2.5在多个维度上做了升级:单条视频最长30秒,目前市场同类产品最多15到20秒,全球第一。多参考输入支持最多50个全模态素材联合输入,同样是全球最高。


