低调霸榜超两月,国产AI这次选择高调开源量子位
12/14/2025
没想到一个低调霸榜了全球最权威SQL榜单超过两个月的国产AI,这一次选择了高调开源。
如此反差剧情的主角正是蚂蚁数科,在第二届CCF中国数据大会上,它正式宣布:
开源旗下数据智能体关键技术——Agentar-SQL系列。
此次开源不仅包含实时文本转SQL(Text-to-SQL)框架的全套论文、代码、模型和使用指南,后期还将陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。
如果你关注AI数据分析领域,大概率听说过BIRD-Bench。这是目前全球公认最具权威性的NL2SQL评测基准。
就在今年9月,蚂蚁数科的Agentar-Scale-SQL在BIRD榜单上以执行准确率(81.67%)和执行效率(77%),双料第一的成绩登顶一举超越了谷歌、亚马逊等国际科技巨头。
自然语言转SQL(NL2SQL)在实际落地中面临四大严峻挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。这些挑战意味着,简单的模型“套壳”远不足以满足企业级应用的可靠性与准确性要求。


