OpenClaw 创始人对模型的最新排名秦翟翟的编程笔记

4/19/2026

OpenClaw 创始人 Peter Steinberger 几个小时前更新了一份非常有价值的榜单:他从 成功率、速度、费用 三个维度,对 32 个模型做了排名。

这份榜单对我们选择自动化/Agent 模型非常有参考意义。

下面是核心结论整理:

成功率前五(最稳)

google/gemini-3-flash-preview

minimax/minimax-m2.1

moonshotai/kimi-k2.5

anthropic/claude-sonnet-4.5

google/gemini-3-pro-preview

其中 m2.5 反而垫底,成功率只有 35.5%,属于意外。

我们熟悉的模型也上榜

openai/gpt-5-nano 排第 9

qwen/qwen3-coder-next 排第 10

z-ai/glm-4.5-air 排第 11

deepseek/deepseek-v3.2 排第 15

如果你买了 OpenClaw 的 Coding Plan,可以直接切换对应模型试一试。

速度前五(最快)

minimax/minimax-m2.5

google/gemini-2.0-flash

meta-llama/llama-3.1-70b

google/gemini-1.5-pro

mistral/mistral-large

不过,这几个模型的成功率并不高,所以创始人也给「成功率前五」的速度排了序:

gemini-3-pro-preview:第 21

minimax-m2.1:第 22

gemini-3-flash-preview:第 25

kimi-k2.5:第 27

claude-sonnet-4.5:第 28

费用最省前五

openai/gpt-5-nano

google/gemini-2.5-flash-lite

mistralai/devstral-2512

openai/gpt-4o-mini

minimax/minimax-m2.1

最后结论(创始人亲口)

他看到排行榜后就已经知道第一顺位要选哪个:minimax/m2.1 比想象中更能打!

同时成功率前五里排名较靠前的其他模型,也值得考虑:

kimi-k2.5(总榜第 8)

gemini-3-flash-preview(第 13)

gemini-3-pro-preview(第 16)

claude-sonnet-4.5(第 18)

如果你追求 稳定 + 费用适中,m2.1 是非常值得首选的模型。

如果你希望更强的上限,kimi-k2.5 也会是不错的补位选择。

Scroll for more