清华本科特奖候选人:AI具身00后光盐Tech
又强又卷,他们都还是本科生,但是有的已经发过不止一篇论文了。
先来讲讲李忆唐。
李忆唐高中毕业于杭州二中树兰实验学校,她曾作为中国代表队成员参加第22届亚洲物理奥林匹克竞赛,获得理论单项第一名和最佳女选手奖。来到清华大学读本科之后,在CVPR和CoRL这样的顶会发过两篇一作论文,同时在简历中其写着自己曾经多次担任ICLR、CoRL、ICRA等会议的审稿人。
在第一篇一作论文中,她做了一个具身智能的成果。具体来说,她提出了一个框架,基于这一框架只需使用简短的行走动作捕捉数据,即可生成多样化的、物理上可行的全身人体抓取运动。这一方法采用了主动数据生成测量,能够让生成动作的效用实现最大化。此外,结合局部特征对齐机制,可以将自然运动模式从行走数据迁移到合成动作之中,从而提升动作成功率和自然度,这一框架在多个场景以及物体未知的情况下,均能展现出较强性能。(论文链接https://arxiv.org/abs/2503.07481)
在第二篇一作论文中,她提出了一种名为SoFTA的慢-快双智能体框架,这个框架能将机器人的上半身和下半身的控制解耦,交给两个独立的智能体处理,这两个智能体运行在不同频率之上,并具有不同的奖励函数。这种时间和目标上的分离缓解了策略干扰,并能实现比较协调的全身行为。它能以100Hz去执行上半身动作,借此可以实现精确的末端执行器控制,还能以50Hz执行下半身动作来实现稳健步态,表现出更加接近人类的稳定性,也能够完成一些精细任务,比如端着近乎满杯的液体行走、在运动中能够拍摄稳定的视频等。(论文链接https:/arxiv.org/abs/2505.24198)
再来讲讲罗长盛。
他和李忆唐都在学习和研究具身智能,所以他们俩在海报人物图上都不约而同地使用了和机器人在一起的照片。网上关于罗长盛的报道也有不少,而且既有实操成绩、也有亮眼论文。
在2025年世界人形机器人运动会5v5机器人足球赛中,他作为清华火神队队长,带领团队集体拿下了世界首个5v5机器人足球赛冠军。同时,也在其他两场机器人比赛中分别作为队长和主力拿到过冠军。
就他此次在海报上展示的三篇论文来说,前两篇我目前都没能搜到,只搜到了第三篇。
在这篇论文中,他和其他作者介绍了一个多阶段课程学习框架HiFAR。这一框架采用分阶段学习方式,通过引入一个会逐渐变得复杂的高维恢复任务,能够促进机器人学习到高效稳定的摔倒恢复策略,并能让机器人通过调整其策略,以便能够有效处理现实世界的摔倒事件。这一成果已经在真实类人机器人得到了有效验证,比如可以让机器人从容应对多种摔倒姿态等。(论文链接https://arxiv.org/abs/2502.20061)
接下来说说陈博远。
陈博远发表的顶会论文相对比较多,在同一个顶会上不止发过一篇。篇幅有限,那就介绍其中一篇,他研发了一款名为PhysGen3D的框架,它能将静态图像转化为不受视角限制、以相机为中心的可交互三维场景。通过与Pika、Kling、Gen-3等闭源前沿图生视频模型做对比,其证明PhysGen3D在生成符合真实物理规律的视频上有着较强能力。(论文链接https://arxiv.org/abs/2503.20746)
值得注意的是,陈博远的导师是清华大学助理教授赵昊,赵昊老师本人在知乎也有账号,同时赵昊老师也在创业。这个课题组发论文较多,创业也在搞。未来估计陈博远还能从组里学到更多东西。
最后说说吕博涵。
吕博涵研究的是金融+AI,在其中一篇论文中,他推出了一个名为OpenAct的基准测试,这个基准基于人类专家咨询和GitHub代码库构建而来,涵盖7个不同领域的339个需要领域特定方法解决的问题。同时,他还提出了OpenAgent,这是一种基于大模型的智能体系统,能够通过自主集成GitHub上的专业工具来处理开放领域的动态查询。(论文链接https://arxiv.org/abs/2312.17294)
以上,我介绍了15位候选人中和具身智能以及AI有着强相关的几位,他们分布在清华的不同学院之中。这一奖项也遵循当前科技领域的最新趋势,至于最终谁能真正入选,不久即可见分晓。


