滴滴与清华走出一条技术新路新智元

4/22/2026

从STAPO算法到Robotaxi落地,滴滴与清华这次联手,押注的不是一时热度,而是自动驾驶下一个十年的底层胜负手。

2026年4月,全球自动驾驶竞赛已经进入白热化。

一边是Waymo高歌猛进:每周完成50万次付费出行,一年翻了一番,业务扩展到10座城市。

另一边,特斯拉的Austin Robotaxi车队活跃车辆只有44辆,马斯克去年许下的「年底500辆」并没有兑现,NHTSA的调查也始终悬在头顶。

更有意思的是,在海外听证会上,Waymo和特斯拉的高管罕见地说了同一句话:如果本国不尽快加速立法,中国将主导自动驾驶的未来。

这个「中国」,当然不是一个抽象概念。

就在全球巨头正面缠斗的同时,北京清华园里,一件看起来不算喧哗、却可能影响深远的事,正在悄悄发生。

滴滴自动驾驶成立「深穹远航实验室」,与清华大学李升波教授课题组达成产学研深度融合专项合作,双方联合提出的STAPO算法论文正式发布,大模型强化学习微调领域取得了令人瞩目的突破。

这背后是一家积累近十年的出行科技公司,和中国最顶尖的智能驾驶学术团队之间,一次关于底层能力的深度握手。

一位「隐形冠军」教授

要理解这次合作的分量,先要看看李升波教授背后站着的那所学院。

清华大学车辆与运载学院,是中国车辆工程领域最重要的学术高地之一。

它的历史可以追溯到上世纪三十年代,在国内车辆工程人才培养、汽车前沿研究、产业协同创新等方面,长期处在第一梯队。

而李升波,正是这块高地上最活跃、也最能打的一位实战派学者。

他是清华大学车辆与运载学院、人工智能学院长聘教授,曾在斯坦福、密歇根、伯克利等世界名校学习和工作,发表论文200余篇,引用超过22600次,连续4年入选爱思唯尔中国高被引学者。

但这些头衔和数字,还不是最关键的。

真正让业内看重他的,是他既懂理论,又能落地。

一方面,他主导研发的DSAC系列强化学习算法,在国际上做到了领先水平;另一方面,他还参与推动了国内首个全神经网络端到端自动驾驶系统IDrive,让算法不只停留在论文里,而是能真正跑上真实道路、进入真实车辆。

滴滴自动驾驶选择和清华合作,看中的其实正是这一点:不是单纯借高校的名头,而是要把学术能力真正转化成工程能力。

STAPO:给大模型训练「拔毒刺」

双方合作后拿出的第一个标志性成果,就是STAPO。

这个名字听上去很技术,但它解决的问题,其实并不难理解。

打个比方:一个学生考试得了高分,但解题过程里夹杂了几行莫名其妙的乱码。

你如果拿这份卷子去教别的学生,这些乱码也可能被当成「正确步骤」学进去。

大模型强化学习训练里,恰恰就存在类似问题。STAPO做的事情,就是把这些「坏信号」揪出来。

这些被剔除的虚假Token只占极少一部分,大约只有0.01%。

也就是说,不需要大刀阔斧重构训练体系,只要精准处理掉极少量的噪声,就能显著改善训练效果。

研究团队已经明确,要把STAPO进一步用于自动驾驶端到端模型的微调训练,帮助无人车在遇到陌生复杂路况时,也能保持更稳定的判断和更强的泛化能力。

这就是它真正让人兴奋的地方:它不是停在纸面上的算法技巧,而是可能从推理任务走向物理世界,真正进入自动驾驶和机器人系统的大脑。

从论文到道路,从算法到车轮,这正是滴滴与清华这次合作最有分量的意义。

产学研融合的「中国范式」

纵观全球,企业与顶尖高校深度绑定从来不是新鲜事。

Waymo的根,连着斯坦福大学DARPA挑战赛时代的积累;特斯拉前AI负责人Karpathy也出身斯坦福AI实验室。

福特、通用、丰田、大众等传统车企,也都长期和高校研究机构保持深度合作。

这背后其实只有一个朴素规律:自动驾驶不是只靠工程堆出来的行业,它必须持续吸收最前沿的理论、算法和人才。

没有顶尖学术力量的支撑,企业很难长期领先。

滴滴与清华的合作,正是中国企业在这条规律上的一次深度实践。

2026年1月16日,程维率队访问清华大学,双方签署了产学研深度融合专项合作协议,以及未来出行联合研究中心二期合作协议。

清华看重的是滴滴的真实场景和产业能力,滴滴看重的是清华的学术实力和人才资源。

双方想做的,不是简单「联合发论文」,而是搭一条真正贯通的链路:从研究、到工程、再到商业落地。

深穹远航实验室,就是这条链路的载体。

它采用「实体运营+资源共用+联合攻关」的方式,把高校的原创研究与企业的真实场景、工业级算力和工程体系对接起来。

这样一来,论文不再只是论文,代码也不再只停在实验室里,而是能尽快进入车辆、进入道路、接受真实世界的检验。

这就是它更高一层的意义——它指向的不是一次合作,而是一种中国式产学研融合的新范式。

十年埋头拉车的低调务实派

滴滴自动驾驶的故事,要从2016年说起。

那一年,滴滴刚刚在网约车大战中突破重围。

时任滴滴联合创始人兼CTO的张博,用整整一年时间去看全球自动驾驶产业,最后得出了一个判断:L4自动驾驶真正进入人们生活,大概需要十年。

它不会在两三年内突然量产,也不会遥遥无期。

从2016到2026,正好十年。

这十年里,滴滴自动驾驶其实一直在往前走,只是风格始终偏低调。

2019年业务独立运营,2020年在上海推出L4级载人测试并完成超5亿美元融资,2021年发布连续5小时无接管路测视频,2023年开启商业化运营并发布Robotaxi概念车和多项核心硬件,2024年与广汽埃安推进合资合作,2026年1月首款Robotaxi量产车R2正式交付。

放在整个行业里看,这条轨迹并不慢,甚至相当扎实。

只是过去很多年,外界对滴滴的关注更多集中在网约车平台本身,而忽略了它其实是国内最早系统布局L4自动驾驶的一批企业之一,而且从未真正停下研发的脚步。

不像很多主营自动驾驶的公司频繁对外发布技术和运营数据,滴滴自动驾驶更像是一个「埋头拉车、抬头看路」的低调务实派。

张博曾坦言,我们认为还需要进一步专注地打磨技术、打磨产品,把它打磨得更好以后,再推出到用户那里。

如今,随着国内自动驾驶政策法规逐步明晰,行业环境持续改善,滴滴自动驾驶也开始显露出厚积薄发的实力。

在技术层面,它已经掌握感知、预测、决策、控制、大规模仿真系统、大规模机器学习平台在内的L4级自动驾驶全栈核心技术,实现了自主可控,关键零部件国产化率超过90%。

在运营层面,滴滴自动驾驶已连续安全运行2100天,北京和广州的全无人载客测试,保持安全稳定的运行表现。

而在量产层面,滴滴和广汽埃安建立起深厚的合作关系,新款Robotaxi已经交付,具备全球化能力,今年也将陆续在广州、北京等城市逐步示范应用。

就在4月11日,智能电动汽车发展高层论坛(2026)在北京国家会议中心举办,滴滴联合创始人、滴滴自动驾驶公司CEO张博登台演讲,系统性阐述了滴滴自动驾驶的核心理念与全球化路径。

张博在演讲中强调:安全与体验是自动驾驶行稳致远的根基。

他指出,L4级自动驾驶不仅可有效降低事故风险、提升交通安全,还将革新汽车体验形态,打造智能移动出行空间。

经过十年积累,滴滴自动驾驶在AI核心技术、车规级硬件体系、海量真实场景三大层面实现了关键突破与深度融合。

活动现场,与广汽埃安联合打造的新一代Robotaxi车型R2同步亮相。

这款车搭载满足中欧双五星安全标准的车身平台与多重安全冗余体系。

Scroll for more