马斯克的Grok 4.3悄悄上线新智元
Grok 4.3 是 xAI 一次务实升级:更便宜、更快、更像能干活的助手。但它在硬推理、稳定性和可信度上,仍落后 GPT-5.5 与 Claude Opus 4.7。
xAI 发布 Grok 4.3,没有把声量拉到最大,马斯克甚至没单独发推,看起来只是个过渡版本。
它更像一次安静的产品换挡:把模型放进 API,把价格打下来,把工具能力补上,再告诉开发者可以从旧版 Grok 迁移过来。
没有 AGI 宏大叙事,也少了马斯克式的「即将改变一切」。这反而让 Grok 4.3 看起来更真实。
对普通消费者来说,Grok 4.3 最重要的变化并非某个榜单分数涨了几分,而是 AI 助手正在变得更便宜、更快,也更像一个能替人完成文件、表格、演示文稿的合格助手。
然而,Grok 4.3 的聪明程度仍然没追上 GPT-5.5 和 Claude Opus 4.7。
它是一款性价比很强的新模型,也是一款仍有明显天花板的模型。
消费者真正需要关心的,是它在哪些场景能省钱省时间,在哪些场景会因为判断不准、想太久或说太多,反而增加成本。
它确实变强了
尤其像一个更会干活的助手
Artificial Analysis 给 Grok 4.3 的 Intelligence Index 打到 53 分,比 Grok 4.20 0309 v2 高 4 分,也超过 Claude Sonnet 4.6 和 Muse Spark。
这个提升不算小,尤其在 xAI 自家模型线里,Grok 4.3 已经是目前最强的一档。
更值得看的是代理任务表现。
Grok 4.3 在 GDPval-AA 上拿到 1500 Elo,相比 Grok 4.20 0309 v2 的 1179,提升了 321 分。
这个榜单更接近日常「让 AI 做事」的场景,比如整理资料、执行复杂步骤、处理真实工作流。这对普通用户有实际意义。
让 AI 帮忙写周报、搭表格、做方案、拆会议纪要、生成 PPT,Grok 4.3 的体验会比前代更完整。
Grok 可以创建演示文稿、文档和电子表格,可以在一个计算机环境里写代码、运行代码、安装依赖并产出文件。
对不懂代码的用户来说,这意味着很多原本需要在 Excel、PowerPoint、浏览器之间来回切换的操作,可能会被压缩成一句指令。
这也是 AI 消费级产品真正该竞争的地方——用户更在意它能不能把一个报销表做完,把一份旅行计划排清楚,把一封语气得体的邮件写好。
Grok 4.3 在这部分的进步,是真进步。
是这次最直接的产品卖点
Grok 4.3 的价格很有侵略性。
它的 API 价格为每百万输入 Tokens 1.25 美元、每百万输出 Tokens 2.50 美元,相比 Grok 4.20 输入价格低约 40%,输出价格低约 60%。
Artificial Analysis 测算,运行整套 Intelligence Index 评测成本约为 395 美元,比 Grok 4.20 0309 v2 低约 20%。
这会影响消费者,只是方式没那么直观。
大多数普通人不会直接调用 API,但他们会用到基于 API 构建的产品。
AI 写作工具、客服机器人、语音助理、教育应用、办公插件,背后都要为模型调用付费。
当底层模型价格下降,应用厂商有空间降低订阅费,或者在同样价格下提供更多次数、更长上下文、更复杂任务。
Grok 4.3 还有一个优势是速度。
Artificial Analysis 的 xAI 模型页显示,它是 xAI 当前输出速度最快的模型之一,约 196 Tokens/s,属于很快的一档。
对语音聊天、实时客服、长文生成和批量内容处理来说,等待时间会直接影响体验。
但速度有一个细节容易被忽略:Grok 4.3 的首 Token 延迟并不低。
它会先「想一会儿」,然后快速输出。
长答案里,这种速度优势明显;短对话里,用户可能先感受到停顿,再感受到快。
用于客服、语音助手、移动端聊天时,这个差异会被放大。
它更会说人话
这是 Grok 的隐藏优势
Grok 一直有一个微妙优势:语气更像真人。
Hacker News 上有人提到,一些英语非母语用户认为 Grok 在把握文本语气、正式程度和微妙人际表达上,比其他模型更自然。
有人拿它和 ChatGPT、Claude 比,认为 Grok 在非正式朋友语气、同事沟通、语音输入识别上表现更贴近真实交流。
https://news.ycombinator.com/item?id=47972447
Grok 可能受益于 X 平台海量口语化表达训练。
它更容易捕捉社交网络里的语气、节奏、松弛感等;它也可能因此继承社交网络的噪音、偏见和表达习惯。


