网民票选AI王者:LMArena一夜17亿新智元
一场AI界的《创造101》火了!LMArena让你盲投选出最强AI,三年从校园项目逆袭,刚刚融1.5亿美元,估值飙到17亿美元。众包投票挑战专家权威,争议四起,却已成行业标杆。你的票,就能决定下一个AI顶流!
一场AI界的《创造101》火了!
ChatGPT、Claude、Gemini、Grok等一众AI「练习生」整齐站好,紧张等待公演。
这不是选秀节目,而是真实发生在lmarena.ai上的AI大乱斗。
这个曾经的校园开源小项目,最近刚融到1.5亿美元,估值17亿美元。
顶级AI实验室如OpenAI、Google、xAI、Microsoft,都抢着把自家模型送来「试镜」。
现在,AI强弱不再是大公司自己说了算,决定权掌握在全球网民手上。
这场「AI创造营」到底怎么玩?谁会成为下一个出道顶流?让我们一起揭秘。
LMArena的「选秀起源」
从校园项目到硅谷舞台
一切要从2023年说起。当时,加州大学伯克利分校Sky Computing Lab里,一群研究生和教授搞了个开源小项目,叫Chatbot Arena。
创始人包括伯克利计算机科学教授Ion Stoica(Databricks联合创始人)、研究生Anastasios Angelopoulos(现CEO)和Wei-Lin Chiang(现CTO)。
他们最初只是想做一个简单实验:让网友匿名比拼不同AI聊天机器人,看哪个回答更好。
没想到,这个项目一上线就火了,迅速变成AI圈最受欢迎的众包基准平台。
短短三年时间,Chatbot Arena就积累了海量用户。2025年5月,它正式转为营利性公司,更名为LMArena,并完成1亿美元种子轮融资,估值6亿美元。
转折点发生在2026年1月6日——就在昨天!
LMArena宣布完成1.5亿美元新一轮融资,由Felicis和加州大学投资臂联合领投,Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners等明星机构跟投。
公司估值直接飙升到17亿美元,总融资额超过2.5亿美元!
如今,LMArena已经拥有超过500万月活跃用户,覆盖150个国家,每月产生超过6000万次对话。
这些用户像是投票的「全民制作人」。连最顶级AI实验室,都把自家最新模型悄悄送来PK。
从一个学术小实验,到硅谷新贵,LMArena用三年时间完成了许多选秀冠军都羡慕的逆袭。
但真正让它火起来的秘密武器,正是那个简单却上瘾的「盲盒PK」投票机制。
盲盒PK与网民投票
「全民制作人」的权利游戏
选秀节目的高潮,是舞台公演和现场打投。LMArena的「公演舞台」也一样刺激:它叫Arena模式,核心就是一个字——盲!
打开lmarena.ai,进入战斗模式,随便输入一个问题,系统开始随机匹配两个匿名AI模型,同时给出答案。
你不知道是谁生成的,只能凭感觉投票。投完票,网站才会揭晓:哦,原来左边是Gemini-3-Pro,右边是Grok-4.1!
这种形式很像拆盲盒——公平又上瘾。
总得票数也算入评分体系。LMArena用Elo评分系统实时计算,每赢一次加分,输了扣分。
7天前的总分榜单,Gemini-3-pro稳居榜首
总得分汇总之后,还会公开不同类别的榜单:文本对话、网页开发、视觉理解文本生成图像、图像编辑、搜索、甚至文本/图像生成视频。
在热门类别里,Gemini-3-Pro在文本和视觉领域遥遥领先,Grok-4.1-thinking紧追不舍,而图像编辑里GPT-Image-1.5和Gemini的变种轮流霸榜。
怎么一场「选秀比赛」能引得这些顶级模型下场?CEO Anastasios Angelopoulos揭开真相:
领先的AI公司用我们,是因为他们自己都很难判断模型到底好不好。
还没公开发布的新模型,都会偷偷托管到LMArena先测试一下,拿网友反馈快速更新迭代。
网友也不只是实验的小白鼠,甚至还有点爽——不用懂技术,上手几分钟就能当「全民制作人」,把喜欢的AI投上C位。
数百万张票汇成热搜排行,谁上谁下,全看网友心情。
「黑幕」质疑与「付费导师」的对决
选秀节目再火,也逃不过「黑幕」质疑和粉丝撕X。LMArena同样不例外——它一出道就卷入各种争议,有人喊「太民主了」,有人骂「太乱了」。
吐槽最多的,是众包投票容易被操纵。
2025年,一篇论文直接曝出黑幕:Meta在Llama 4发布前,偷偷提交了36个私有变体模型,反复测试「刷分」,成功gaming 排行榜。
研究者来自Cohere、Stanford、MIT等机构,直指顶级实验室能通过多次私测优化,中小玩家根本玩不起。
类似指控还有:某些大公司被怀疑刷票或优先托管新模型,让排行榜看起来「偏心」。


