DeepSeek推出新版AI模型法广

4/24/2026

距离美国总统特朗普预定访华日程还有三周的时间。一年多前曾引发全球科技市场大地震的中国产生成式人工智能软件DeepSeek, 也就是深度求索于4月24日发布新版模型,再次引发业界广泛关注。而就在此前一天,美国白宫刚刚指责中国实体大规模抄袭美国人工智能模型,并引来北京方面的反驳,凸显出中美两国在高科技领域的紧张关系。

资料图片:中国生成式人工智能模型“深度求索”图标。设于2025年1月29日。 REUTERS - Dado Ruvic

的确,2025年1月总部设在杭州的一家初创企业推出““深度求索”“生成式人工智能软件。其功能之强、官宣成本之低引发全球股市震荡,美国科技股一度连日暴跌。也由此引发它是否是又一个如同苏联1957年先于美国成功发射人造卫星一样的斯普特尼克式震撼的讨论。一年多之后,业界期待的升级版”“深度求索”“终于在24日正式发布预览版。按照其发行人的说法,新版”“深度求索”“软件拥有百万字超长上下文记忆,其智能体能力、世界知识和推理性能均有大幅提高,实现”国内与开源领域的领先“。

从目前消息来看,新版““深度求索”“最突出的特点是可以处理百万字的超长内容的超强能力。也就是说,用户可以提交相当于好几部小说的内容量,该软件有能力就这些数百页的全部内容,准确回答提问,没有遗漏。法新社24日发自北京的报道指出,这样的内容处理功能已经与科技巨头谷歌旗下的人工智能助手Gemini 的能力相当。““深度求索””开发公司24日也称这款最新版本是当前最好的模型之一。

一如一年前的版本,“深度求索”再次凸出它的低成本优势。称它是“更快捷高效的经济之选“。事实上,24日推出的是两个”“深度求索”“版本。其中一个版本在世界知识储备方面略显欠缺,但因为模型参数和激活更小,因此计算需求相对减少,使得推理过程因此更快捷也成本更低。

法新社24日发自北京的报道引述一名人工智能领域公认的刘姓(Max Liu)专家指出,倘若新模型确实达到西方最先进模型的功能,那么新版““深度求索”“会引发与一年前首次推出时一样的震荡。

目前尚难评论市场对这款中国据称低成本的新版生成式人工智能软件的反应。“深度求索”的出现本身不仅标志着中国要在在高科技领域的引领全球的雄心,也意味着中国对曾长期在该领域占据霸主地位的美国的挑战。一年前,“深度求索”一鸣惊人激励了中国人工智能产业的快速发展。尽管美国近年不断在高科技领域推出防堵措施(尤其是限制先进制程芯片对华出口),尽管人工智能风潮有出现泡沫破灭的风险,但中国人工智能初创企业诸如智谱华章科技、稀宁科技等大模型人工智能公司今年在香港股市上市仍然取得成功,凸显中国企业的实力,也意味着中美竞争的加剧。

但“深度求索”在市场上的成功自一开始就伴随着争议。它尤其被怀疑抄袭美国人工智能模型。就在新版““深度求索”“公布的前一天,美国白宫科技事务顾问就在社交媒体X也就是前推特平台上,指责一些外国实体,主要是中国实体,正以“工业化”的规模使用蒸馏技术,盗窃美国的人工智能技术。他并表示美国掌握这些指控的证据。但他并没有提供这些证据。

蒸馏是一项利用先进模型训练新模型并复制同样功能的技术,通常是某个模型的所有者利用现有模型训练新模型。如果是竞争对手未经允许秘密使用这种技术,当然就被视作剽窃。

中国外交部发言人24日就白宫日前的指控做出反驳,称这些指控“毫无根据”,是“污蔑抹黑”。

不过,在此之前,美国三大人工智能软件开发商谷歌、OpenAI 和 Anthropic 曾在今年2月底宣布,要联手应对中国人工智能软件的剽窃行为。这三家本是竞争对手的企业联手行动在一定程度上反映出他们对中国企业利用美国软件训练自己的模型的担忧。

美国一家高科技专业媒体(The information)去年12月也引述六名知情人,称新版“深度求索”开发使用了数千枚自其他国家拆解下来的芯片,以绕开美国对先进制程芯片的出口限制。美国半导体业龙头企业辉达向这家专业媒体表示,不掌握任何相关证据,并认为这样的走私作为似乎“不太可能”。““深度求索”则没有回应法新社的置评请求。

Scroll for more