OpenClaw 创始人对模型的最新排名秦翟翟的编程笔记

OpenClaw 创始人 Peter Steinberger 几个小时前更新了一份非常有价值的榜单：他从成功率、速度、费用三个维度，对 32 个模型做了排名。

这份榜单对我们选择自动化/Agent 模型非常有参考意义。

下面是核心结论整理：

成功率前五（最稳）

google/gemini-3-flash-preview

minimax/minimax-m2.1

moonshotai/kimi-k2.5

anthropic/claude-sonnet-4.5

google/gemini-3-pro-preview

其中 m2.5 反而垫底，成功率只有 35.5%，属于意外。

我们熟悉的模型也上榜

openai/gpt-5-nano 排第 9

qwen/qwen3-coder-next 排第 10

z-ai/glm-4.5-air 排第 11

deepseek/deepseek-v3.2 排第 15

如果你买了 OpenClaw 的 Coding Plan，可以直接切换对应模型试一试。

速度前五（最快）

minimax/minimax-m2.5

google/gemini-2.0-flash

meta-llama/llama-3.1-70b

google/gemini-1.5-pro

mistral/mistral-large

不过，这几个模型的成功率并不高，所以创始人也给「成功率前五」的速度排了序：

gemini-3-pro-preview：第 21

minimax-m2.1：第 22

gemini-3-flash-preview：第 25

kimi-k2.5：第 27

claude-sonnet-4.5：第 28

费用最省前五

openai/gpt-5-nano

google/gemini-2.5-flash-lite

mistralai/devstral-2512

openai/gpt-4o-mini

minimax/minimax-m2.1

最后结论（创始人亲口）

他看到排行榜后就已经知道第一顺位要选哪个：minimax/m2.1 比想象中更能打！

同时成功率前五里排名较靠前的其他模型，也值得考虑：

kimi-k2.5（总榜第 8）

gemini-3-flash-preview（第 13）

gemini-3-pro-preview（第 16）

claude-sonnet-4.5（第 18）

如果你追求稳定 + 费用适中，m2.1 是非常值得首选的模型。

如果你希望更强的上限，kimi-k2.5 也会是不错的补位选择。