OpenClaw 创始人对模型的最新排名秦翟翟的编程笔记
OpenClaw 创始人 Peter Steinberger 几个小时前更新了一份非常有价值的榜单:他从 成功率、速度、费用 三个维度,对 32 个模型做了排名。
这份榜单对我们选择自动化/Agent 模型非常有参考意义。
下面是核心结论整理:
成功率前五(最稳)
google/gemini-3-flash-preview
minimax/minimax-m2.1
moonshotai/kimi-k2.5
anthropic/claude-sonnet-4.5
google/gemini-3-pro-preview
其中 m2.5 反而垫底,成功率只有 35.5%,属于意外。
我们熟悉的模型也上榜
openai/gpt-5-nano 排第 9
qwen/qwen3-coder-next 排第 10
z-ai/glm-4.5-air 排第 11
deepseek/deepseek-v3.2 排第 15
如果你买了 OpenClaw 的 Coding Plan,可以直接切换对应模型试一试。
速度前五(最快)
minimax/minimax-m2.5
google/gemini-2.0-flash
meta-llama/llama-3.1-70b
google/gemini-1.5-pro
mistral/mistral-large
不过,这几个模型的成功率并不高,所以创始人也给「成功率前五」的速度排了序:
gemini-3-pro-preview:第 21
minimax-m2.1:第 22
gemini-3-flash-preview:第 25
kimi-k2.5:第 27
claude-sonnet-4.5:第 28
费用最省前五
openai/gpt-5-nano
google/gemini-2.5-flash-lite
mistralai/devstral-2512
openai/gpt-4o-mini
minimax/minimax-m2.1
最后结论(创始人亲口)
他看到排行榜后就已经知道第一顺位要选哪个:minimax/m2.1 比想象中更能打!
同时成功率前五里排名较靠前的其他模型,也值得考虑:
kimi-k2.5(总榜第 8)
gemini-3-flash-preview(第 13)
gemini-3-pro-preview(第 16)
claude-sonnet-4.5(第 18)
如果你追求 稳定 + 费用适中,m2.1 是非常值得首选的模型。
如果你希望更强的上限,kimi-k2.5 也会是不错的补位选择。


