18岁高中生用AI挖出150万未知天体新智元
18岁高中生挖出约150万个未知天体,25岁博士生给1.4亿张星系图装上自然语言搜索……OpenAI发布了首届「ChatGPT Futures Class of 2026」,26位入选者来自从大一就用上ChatGPT的年轻群体,他们正在用AI改写「优秀年轻人」的定义。
刚刚,OpenAI上线了一个叫「ChatGPT Futures」的页面。
一共26个年轻人(或团队),每人(或团队)1万美元奖金,外加前沿模型访问权限。
其中,最引人瞩目的一个名字叫Matteo Paz。
去年3月,他还是一位18岁的高中生,他开发机器学习算法,处理了NEOWISE十余年红外巡天攒下的近200TB数据、约2000亿行记录,从中标记并分类出190万个红外变源天体,其中约150万个为此前未记录的潜在新发现。
他的论文发在《Astronomical Journal》(《天文学杂志》)。
今年3月又拿下Regeneron Science Talent Search(雷杰纳隆科学天才奖)头奖。
按Caltech(加州理工学院)的描述,这是「一个本地高中生在Caltech实现了突破」。
而Paz只是26位入选者里的一个。
2025年3月11日,18岁的Matteo Paz在颁奖典礼上手持Regeneron Science Talent Search头奖奖杯,他因凭借AI算法发现150万个未知天体获奖。
同一份名单上,还有——
18岁的Crystal Yang:她为20万视障学生开发了「以听代看」的学习游戏;
19岁的Anshi Bhatt:她做的反诈系统已经帮1.8万人避开网络骗局;
25岁的Amrita Bhasin:她搭建的物流系统让超过500万磅滞销库存绕开了垃圾填埋场
26个项目,从天文到救灾、从医疗到农业、从盲童教育到南美街头小贩的财务管理,没有一个是「用ChatGPT写论文」,他们把目光投向的,全是过去要靠资历、靠机构、靠资金才能碰的硬命题。
AI让他们敢想、能做,这是上一代年轻人难以想象的。
「第一代ChatGPT原住民」毕业了
2026届毕业生,是第一届在整个大学经历中都能「随时使用」ChatGPT的毕业生。
虽然「随时可用」并不意味着「全程依赖」,但已足以让AI重塑一代人学习和生活方式。
大约三年半以前,2022年秋季,2026届新生入学。两个多月后的11月30日,ChatGPT横空出世。他们的大学生涯,从此和ChatGPT绑在了一起,「第一代ChatGPT原住民」诞生。
大一第一学期还没结束,他们的书桌上就多出了一个能写代码、能找文献、能聊任何话题的AI。
在这26名个人(或团队)里,有18岁的高中生,也有跨校组队的研究小组,并非清一色的「应届毕业生」标签,但都是这一代年轻人的样本。
OpenAI这次推出的「ChatGPT Futures」,不仅是在发奖金,还想为「AI时代的优秀年轻人」打个样。
他们「用AI看见人类看不见的东西」
「第一代ChatGPT原住民」在用AI做什么?
先看三个最具代表性的项目。
第一个是Matteo Paz的项目。
他面对的是NEOWISE:一台NASA退役红外巡天望远镜十年扫天攒下的全部数据。
用Paz导师Davy Kirkpatrick的话说:「这张表已经逼近2000亿行,记录了我们过去十年的每一次探测。」
2000亿行、近200TB的数据,单纯依靠人力根本翻不动,这是AI能做但人类很难做的那类工作。
2023年,Matteo Paz在Caltech暑期研究项目(Summer Research Connection)研讨会上展示其AI天文项目的初期成果。
Paz写了一个叫VARnet的机器学习算法,把整张表过了一遍,标出190万个红外变源天体,其中150万是此前没人记录过的全新发现:超大质量黑洞、新生恒星、超新星……
这一项工作,Kirkpatrick原本只指望「找几颗变星出来,告诉天文界这数据里还有宝」。
结果Paz给整个数据集出了一份完整目录:190万个变源天体,分十大类,全部归档。
第二个项目叫AION-Search,主理人Nolan Koblischke。
他的目标是让1.4亿张星系图变得「可被自然语言搜索」。
传统的天文图像检索,要么靠图像相似度,要么靠预定义类别。想找「具有并合迹象的螺旋星系」或「疑似引力透镜」?对不起,得先训一个专门分类器。
AION-Search公开Demo界面,支持自然语言检索,论文称系统可扩展到1.4亿张星系图像。https://huggingface.co/spaces/astronolan/AION-Search
Koblischke的做法是:先让GPT-4.1-mini给27.5万张星系图自动写文字描述(成本150美元);再用对比学习训练一个图文共享检索空间;最后,扩展到1.4亿张图。
结果有多硬核?
引力透镜是星系数据里最稀有的目标,只占整个数据库的0.1%:相当于在1000张照片里找1张。
让传统的图像相似度算法去找,前10个结果里几乎全是错的。换成AION-Search,前10个里有相当一部分是对的。
行业用一个叫nDCG@10的指标衡量「前10个结果排得有多准」。
AION-Search拿到0.180,传统方法只有0.015:这是10倍以上检索效果的提升。
原本要让天文学家从几十万张图里手动一张张翻找的稀有现象,现在用自然语言就能搜到。
第三个项目叫WiFind。
该项目是Nayel Rehman、Arhan Menta、Rushil Kukreja、Aayush Tendulkar做的WiFind,用AI处理WiFi信号,试图穿墙、穿瓦砾,在灾区找到幸存者。
WiFind项目团队成员
WiFind目前是Springer会议论文加Conrad Challenge获奖项目,还在原型阶段,不是已经部署的救灾系统。
但它的思路非常新奇:WiFi路由器全世界遍地都是,每一台都是潜在的「生命探测器」。
还有Zeyneb Kaya在用AI保护濒危语言;Amrita Bhasin的项目让超过500万磅未售库存从填埋场转向再利用……
这26个项目的共同点,不是「用AI写论文」,而是「用AI去碰人类碰不动的事」。


