DeepSeek发表新模型,打破美国AI封锁纽约时报
去年,中国人工智能初创企业深度求索(DeepSeek)发布了旗下一款人工智能模型的详细资料,一举震惊全球科技行业。
该公司宣称,其研发该系统所耗费的芯片成本远低于OpenAI和Anthropic等美国竞品。这一事件催生了所谓中国的“DeepSeek时刻”,代表着业界普遍认为中国人工智能企业已然准备好向全球展示技术实力。
“DeepSeek时刻”折射出全球人工智能格局的转变。这场变革不仅体现在成本的降低,还体现在技术共享模式的开放性。
DeepSeek将旗下模型以开源形式发布,意味着他人可自由使用和修改这些模型。OpenAI与Anthropic则将其领先模型作为专有技术保留。此次事件印证:开源系统的性能水准已接近封闭自研模型。此后数月,多家中国企业陆续推出数十款开源模型。截至2025年末,这些模型已占据全球人工智能应用相当大的份额。
2025年1月,中国初创公司DeepSeek宣称,其研发的先进人工智能系统耗资仅为美国竞争对手的零头,这一消息震惊了业界。 Kelsey McClellan for The New York Times
上周五,DeepSeek发布了备受期待的新一代模型V4的预览版本,该模型同样计划全面开源。这款新模型在代码编写领域表现突出,代码能力已成为顶尖人工智能系统日益重要的技能。人工智能测评机构ValsAI的测试结果显示,深度求索V4的代码生成能力显著优于其他所有开源AI模型。
就在DeepSeek发布新款模型的短短数日前,中国另一家AI初创企业月之暗面推出了最新开源模型Kimi2.6。尽管这类系统在代码编写能力方面仍略逊于Anthropic和OpenAI等美国领先模型,但差距正持续缩小。
这一趋势意义深远。人工智能自动编写代码不仅速度更快,还能让程序员腾出时间专注于更重要的问题。同时,依托DeepSeek的最新模型,开发者可构建人工智能agent,这种个人数字助手能够代表办公室职员自主操作其他软件应用程序,包括电子表格、在线日历、邮件系统等服务。
随着人工智能在编写代码方面的能力不断提升,人工智能在挖掘软件安全漏洞方面的能力也增强,正彻底颠覆网络安全领域的格局。这意味着,DeepSeek等开源工具既可用于网络攻击,也可服务于网络安全防护。
在各项任务中,DeepSeek V4与月之暗面的最新模型性能持平。ValsAI首席执行官瑞安·克里奇南表示:“它们基本上旗鼓相当。”
月之暗面联合创始人杨植麟上月在北京参加会议。 Tingshu Wang/Reuters
在DeepSeek发布新款模型前几个月,国外竞争对手已采取行动,试图抢先一步,试图压制其热度。硅谷两大人工智能企业Anthropic与OpenAI表示,DeepSeek利用蒸馏技术,不公平地借用了他们的技术——“蒸馏”是指工程师通过向竞品模型发出成百上千万次查询并复制其行为,从而模仿该模型。
顶尖人工技术的研发竞争已然演变为一场地缘政治博弈。Anthropic和OpenAI等硅谷领军企业警告称,高端AI技术落入专制国家手中将带来巨大风险;而中国已投入数百亿资金,以期成为人工智能超级大国,并将该技术视为经济增长的关键引擎。
DeepSeek的开源模型是中国战略的核心。尽管许多西方公司严守自己最有价值的模型,中国却拥抱开源,几乎所有性能顶尖的中国系统都已广泛开放。
尽管如此,中国人工智能企业仍面临重大障碍。三届美国政府相继出台芯片出口管制政策,严格限制中国获取尖端人工智能系统所需的高端芯片;而在争夺顶尖人工智能人才的竞赛中,硅谷企业的投入仍持续超过中国竞争对手。
美国国会一个咨询机构发布的最新研究表明,国产开源人工智能已成为中国发展的重要优势。开源模型门槛较低,广泛应用于机器人、物流、制造业等各大行业。该研究发现,工业场景产生的实际数据又被用于改进人工智能系统。
这种模式使中国科技企业得以在全球范围内扩大影响力,世界各地的程序员和工程师纷纷采用其系统开发新产品。
从拉各斯到吉隆坡,众多预算有限的开发者转向中国开源人工智能模型。这类模型运行成本低廉,便于研发试验。去年5月,马来西亚通讯部副部长曾公开表示,该国国家级人工智能基础设施将依托DeepSeek技术搭建。
据人工智能模型交易平台OpenRouter的一项研究显示,去年,中国开源人工智能模型占据全球人工智能应用总量的三分之一,其中DeepSeek使用率最高,其次是阿里巴巴旗下的模型。
这反映了一种更广泛的战略。随着中国企业向海外扩张,将其系统开源,有助于它们通过提供更便宜、更易获取的工具来赢得开发者的青睐。
“开源是未来科技的软实力,”总部位于美国的对冲基金InterconnectedCapital创始人凯文·徐(音)表示。该基金专注于人工智能技术投资。凯文·徐及其基金并未投资DeepSeek。
北京CounterpointResearch的人工智能首席分析师孙伟(音)表示,DeepSeek的成功为中国科技巨头开放人工智能技术铺平了道路,各使它们能够公开发布人工智能系统,而非将其严格保密。
此后,阿里巴巴跃居行业领军地位,它旗下的通义千问系列模型累计下载量突破10亿次;TikTok母公司字节跳动2024年投入约800亿元布局人工智能基础设施后,也分享了部分技术细节。
“来自中国的人工智能开源开发者群体可以说就是2025年最大的人工智能故事,”凯文·徐说。“这些模型的进步、发布的节奏、以及那些既相互竞争又似乎互相鼓励的人工智能实验室数量都呈现出迅猛发展的态势,且丝毫没有放缓的迹象。”


