国产「3D版Anthropic」:卡住全球3D脖子新智元

6/24/2026

影眸科技数亿元融资到账,全球首个「会思考」的3D大模型发布,这家「中国版Anthropic」的公司太亮眼了。在AI卷生卷死的2026,这家中国公司却把最难啃的3D生成做成了一门好生意。

最近,一则消息在硬科技投资圈引起震动。

3D生成大模型公司影眸科技宣布,完成数亿元人民币的新一轮融资!

这已是影眸在一年多时间内完成的第三轮融资。

2025年1月,美团龙珠与字节跳动领投数千万美元A轮;同年8月,蓝驰创投再次领投。

国资战略资本、国际产业资本、顶级财务机构同时押注,清晰地表明:市场已看清,3D生成不再是「有没有用」的问题,而是「谁先用好」的竞赛。

几乎与融资同步,影眸发布了被业界视为「规则改变者」的最新模型Hyper3D Rodin Gen-2.5。

全球首个具备千万面级生成能力、且引入类大语言模型「先思考、再生成」运行逻辑的3D大模型,就此登场!

使用起来也非常简单,例如只需要几张多角度模型图给到模型,不到一分钟就能生成。

比如,这把蓝色单椅的生成质量很见功底,整体就是能直接进电商展示或家居场景的生产级资产。

更值得说的是右侧的可控与导出能力,.obj/.fbx/.glb/.usdz/.stl 全格式和 PBR 贴图导出——从生成到落地一条龙,电商和家居设计团队拿来就能用。

不得不感叹,Hyper3D让制作可用3D模型变得太简单了。

当文本、图像、视频的生成卷成红海,难度最高、落地最慢的3D赛道,为何偏偏跑出了一家国人公司?

影眸用一组硬核数据给出了答案:新模型上线首月,订阅用户和ARR环比增速双双突破400%,全球用户近千万,B端客户营收超过同赛道其他所有公司总和。

为什么是这家公司?让我们仔细剖析。

为什么「原生3D」是唯一正解?

在理解Rodin Gen-2.5的断代优势前,有必要回顾3D生成史上那次关键路线分野。

早期玩家普遍选择「捷径」——2D升维3D。利用成熟的2D扩散模型生成多视角图像,再通过NeRF或高斯泼溅重建出3D模型。逻辑看似顺畅,影眸团队却从一开始就看到了致命缺陷。

创始人兼CEO吴迪回忆:「公司账上只剩两三百万时,我们面临抉择:跟风做2D升维,快速出个好看产品;还是死磕原生3D,走那条最难的路?」

答案是后者,源于对工业可用性的敬畏。

2D升维有三大先天硬伤:信息降维丢失,多视角的不一致,以及无法满足工业管线。

2024年,影眸发布原生3D大模型框架CLAY,一举拿下图形学顶会SIGGRAPH最佳论文提名,后续还被MIT何恺明教授收录进课程。

论文链接:https://arxiv.org/abs/2406.13897

他们证明:即使在全行业仅几十万高质量3D数据的限制下,原生3D的平滑度和结构精度,也能碾压2D升维一个量级。

如今,原生3D已成行业主流技术共识。影眸不仅定义了3D生成的可用性拐点,更让此赛道成为中国AI极少数真正全面领先全球的方向之一。

让3D模型学会「思考」:五档深度重构生产力

如果说CLAY是地基,那Rodin Gen-2.5就是这座地基上生长出的宫殿。

CTO张启煊揭示了核心创新:「过去的模型,生成方块和生成龙头雕塑,算力分配一样,就像让画家画速写和油画给相同时间。」

Rodin Gen-2.5做了一件看似简单却具有颠覆性的事:把表征长度从固定参数变成可伸缩变量。像大语言模型推理那样,按对象复杂度自适应分配计算预算,把「先思考、再生成」变成了工业级能力。

落到用户手里,就是五档可调「思考深度」。

Extreme-Low(约4秒) :百万面级初稿。适合快速原型验证、UGC场景。以前《蛋仔派对》那样实时生成要70秒,现在十几秒搞定,完全是不同量级的体验。

Low(约9秒) :结构干净,适合简约风和小型硬表面量产。

Medium(约20秒) :结构与细节均衡,综合表现最优。张启煊给了直观对比:Rodin Gen-2.5的20秒质量,全面追平上一代40秒水平。

Scroll for more