18岁高中生用AI挖出150万未知天体新智元

5/8/2026

18岁高中生挖出约150万个未知天体,25岁博士生给1.4亿张星系图装上自然语言搜索……OpenAI发布了首届「ChatGPT Futures Class of 2026」,26位入选者来自从大一就用上ChatGPT的年轻群体,他们正在用AI改写「优秀年轻人」的定义。

刚刚,OpenAI上线了一个叫「ChatGPT Futures」的页面。

一共26个年轻人(或团队),每人(或团队)1万美元奖金,外加前沿模型访问权限。

其中,最引人瞩目的一个名字叫Matteo Paz。

去年3月,他还是一位18岁的高中生,他开发机器学习算法,处理了NEOWISE十余年红外巡天攒下的近200TB数据、约2000亿行记录,从中标记并分类出190万个红外变源天体,其中约150万个为此前未记录的潜在新发现。

他的论文发在《Astronomical Journal》(《天文学杂志》)。

今年3月又拿下Regeneron Science Talent Search(雷杰纳隆科学天才奖)头奖。

按Caltech(加州理工学院)的描述,这是「一个本地高中生在Caltech实现了突破」。

而Paz只是26位入选者里的一个。

2025年3月11日,18岁的Matteo Paz在颁奖典礼上手持Regeneron Science Talent Search头奖奖杯,他因凭借AI算法发现150万个未知天体获奖。

同一份名单上,还有——

18岁的Crystal Yang:她为20万视障学生开发了「以听代看」的学习游戏;

19岁的Anshi Bhatt:她做的反诈系统已经帮1.8万人避开网络骗局;

25岁的Amrita Bhasin:她搭建的物流系统让超过500万磅滞销库存绕开了垃圾填埋场

26个项目,从天文到救灾、从医疗到农业、从盲童教育到南美街头小贩的财务管理,没有一个是「用ChatGPT写论文」,他们把目光投向的,全是过去要靠资历、靠机构、靠资金才能碰的硬命题。

AI让他们敢想、能做,这是上一代年轻人难以想象的。

「第一代ChatGPT原住民」毕业了

2026届毕业生,是第一届在整个大学经历中都能「随时使用」ChatGPT的毕业生。

虽然「随时可用」并不意味着「全程依赖」,但已足以让AI重塑一代人学习和生活方式。

大约三年半以前,2022年秋季,2026届新生入学。两个多月后的11月30日,ChatGPT横空出世。他们的大学生涯,从此和ChatGPT绑在了一起,「第一代ChatGPT原住民」诞生。

大一第一学期还没结束,他们的书桌上就多出了一个能写代码、能找文献、能聊任何话题的AI。

在这26名个人(或团队)里,有18岁的高中生,也有跨校组队的研究小组,并非清一色的「应届毕业生」标签,但都是这一代年轻人的样本。

OpenAI这次推出的「ChatGPT Futures」,不仅是在发奖金,还想为「AI时代的优秀年轻人」打个样。

他们「用AI看见人类看不见的东西」

「第一代ChatGPT原住民」在用AI做什么?

先看三个最具代表性的项目。

第一个是Matteo Paz的项目。

他面对的是NEOWISE:一台NASA退役红外巡天望远镜十年扫天攒下的全部数据。

用Paz导师Davy Kirkpatrick的话说:「这张表已经逼近2000亿行,记录了我们过去十年的每一次探测。」

2000亿行、近200TB的数据,单纯依靠人力根本翻不动,这是AI能做但人类很难做的那类工作。

2023年,Matteo Paz在Caltech暑期研究项目(Summer Research Connection)研讨会上展示其AI天文项目的初期成果。

Paz写了一个叫VARnet的机器学习算法,把整张表过了一遍,标出190万个红外变源天体,其中150万是此前没人记录过的全新发现:超大质量黑洞、新生恒星、超新星……

这一项工作,Kirkpatrick原本只指望「找几颗变星出来,告诉天文界这数据里还有宝」。

结果Paz给整个数据集出了一份完整目录:190万个变源天体,分十大类,全部归档。

第二个项目叫AION-Search,主理人Nolan Koblischke。

他的目标是让1.4亿张星系图变得「可被自然语言搜索」。

传统的天文图像检索,要么靠图像相似度,要么靠预定义类别。想找「具有并合迹象的螺旋星系」或「疑似引力透镜」?对不起,得先训一个专门分类器。

AION-Search公开Demo界面,支持自然语言检索,论文称系统可扩展到1.4亿张星系图像。https://huggingface.co/spaces/astronolan/AION-Search

Koblischke的做法是:先让GPT-4.1-mini给27.5万张星系图自动写文字描述(成本150美元);再用对比学习训练一个图文共享检索空间;最后,扩展到1.4亿张图。

结果有多硬核?

引力透镜是星系数据里最稀有的目标,只占整个数据库的0.1%:相当于在1000张照片里找1张。

让传统的图像相似度算法去找,前10个结果里几乎全是错的。换成AION-Search,前10个里有相当一部分是对的。

行业用一个叫nDCG@10的指标衡量「前10个结果排得有多准」。

AION-Search拿到0.180,传统方法只有0.015:这是10倍以上检索效果的提升。

原本要让天文学家从几十万张图里手动一张张翻找的稀有现象,现在用自然语言就能搜到。

第三个项目叫WiFind。

该项目是Nayel Rehman、Arhan Menta、Rushil Kukreja、Aayush Tendulkar做的WiFind,用AI处理WiFi信号,试图穿墙、穿瓦砾,在灾区找到幸存者。

WiFind项目团队成员

WiFind目前是Springer会议论文加Conrad Challenge获奖项目,还在原型阶段,不是已经部署的救灾系统。

但它的思路非常新奇:WiFi路由器全世界遍地都是,每一台都是潜在的「生命探测器」。

还有Zeyneb Kaya在用AI保护濒危语言;Amrita Bhasin的项目让超过500万磅未售库存从填埋场转向再利用……

这26个项目的共同点,不是「用AI写论文」,而是「用AI去碰人类碰不动的事」。

Scroll for more