你看到的那张脸,根本没活过情报分析师
你们有没有收到过陌生人的好友请求,看了一眼头像,觉得"这人挺正常的",然后就通过了?
几乎所有人都举手。
对。这就是问题所在。
问题已经换了一张脸
去年在油管上有一个案例,一名芝加哥男子叫Grant,在Facebook Dating上遇到了一个"女性"。
两个人聊了好几个月,视频通话都有过,对方的声音、表情、笑容,一切看起来都很真实。
最后Grant损失了7万美元----不对,应该说,他把7万美元转进了一个根本不存在的投资平台,而跟他谈了几个月恋爱的那个"人",是一套运行在服务器上的AI系统。
这不是科幻。这是2025年以后的日常诈骗作业。
以前识别假账号很简单:头像是从某个库存图片网站截的,个人简介两句话,好友列表里全是机器账号,发帖记录要么是空白要么全是转发。
2015年前后,在情报培训课上学的"怎么识别假账号",讲的就是这套方法,基本上十分钟能搞定一个。
现在这套方法几乎全部失效了。
新一代的AI生成身份长这样:一张清晰自然的人脸照片,在谷歌和百度里反向搜索不到任何结果,因为这张脸根本不存在,是AI凭空生成的;个人简介写得连贯有温度,读起来像是一个真实的人在认真介绍自己;社交记录从两三年前就开始积累,有时间跨度,有情绪变化,有"生活细节"。
一个研究人员做过一个测试:一台五年前的旧电脑,零图像编辑技能,从零开始搭建一个完整的假身份,包括文件、照片、社交历史----总共花了70分钟。
这就是你现在面对的对手。
先从那张脸开始
任何人拿到一个可疑账号,第一步都应该看头像。不是因为头像最重要,而是因为它最直接,可以最快给出信号。
AI生成的人脸,主要来自两类技术。
一类是GAN(生成对抗网络),典型代表是StyleGAN,thispersondoesnotexist.com用的就是这个,每次刷新就生成一张新的人脸,而这张脸永远不会出现在任何身份证上。
另一类是扩散模型(Diffusion Model),是Midjourney、DALL-E、Stable Diffusion背后的技术。这两类生成的人脸在视觉上非常不同,检测方法也略有差异。
怎么说呢,理论上最好用的视觉判断方法,其实是看眼睛。
人的双眼在真实光照环境下,角膜上会有光点反射,也叫角膜镜面高光。这个反射的形状、角度和位置,在左右两眼上应该是基本一致的,因为两只眼睛看的是同一个空间,接受的是同一个光源。
GAN在生成人脸的时候,它的训练目标是"让这张脸看起来真实",而不是"遵守物理光学规律",所以它根本不在乎角膜反射是否对称。结果就是:AI生成的人脸,两眼的高光点形状往往不一致,有时候一个圆润有时候一个扭曲,有时候干脆缺失其中一个。
布法罗大学的研究团队开发了一套自动化工具,专门通过分析双眼角膜反射的一致性来识别GAN人脸,测试中准确率达到了94%。[buffalo]
上图这些人哪些是假的?答:全部都是假的。
当然,你在看一张头像的时候,不可能用肉眼去分辨角膜反射。但有几个肉眼可见的特征可以作为初步筛查:
这是GAN的经典盲区。如果一张AI脸戴了耳环,你会发现左耳和右耳的耳环往往形状不一样,甚至一个有一个没有。眼镜也是----AI很难让两片镜片完美对称,经常出现一边倾斜或者形状扭曲的情况。
GAN在训练时重点学习的是人脸,对背景的处理能力相对弱。背景部分经常出现奇怪的扭曲、撕裂感,或者颜色异常渗透到头发边缘----行话叫"荧光渗透"(bleed-through),就是背景的亮色倒进头发里,形成一圈光晕。这在标准摄影里是不会出现的。
这是AI的另一个弱点。面带笑容的照片里,牙齿往往渲染异常,形状相近、颜色均一,缺乏真实牙齿的不对称细节,有时还会出现"三颗门牙"这种匪夷所思的情况。
真实照片里头发的边缘是自然散乱的。AI生成的头发有时看起来过于均匀、过于顺滑,或者在头发与背景的交界处出现一层模糊的发光层,像是剪切蒙版没做干净。
算了,说了这么多视觉特征,其实有一个更实际的做法:直接上工具。
Hive Moderation(thehive.ai)提供免费的图片AI检测,可以直接上传头像,它会给出一个0到1的置信分数,分数越高说明AI生成的可能性越大,测试准确率据称高达99.9%。
FotoForensics(fotoforensics.com)则用的是ELA(错误级别分析)技术,原理是检测图片里不同区域的压缩噪声差异----如果一张图片某些区域的噪声和周围不匹配,通常意味着这个区域被单独处理或合成过。
还有一个更基础的操作:反向图片搜索。
把头像图片上传到Google Images、Yandex Image Search或者TinEye,看看这张脸有没有出现在别的地方。
老式假账号经常用库存照片,会被搜出来。但AI生成的人脸恰恰不会----因为这张脸是独一无二的,之前从未存在过,自然也找不到匹配结果。
注意,"搜不到"不等于"真实"。
这个逻辑要倒过来想:搜到了同一张脸出现在别处,那肯定有问题;搜不到,只能说排除了库存照片这条路,不代表排除了AI生成。
一张脸只是入场券,真正的验证从这里开始
大多数人用反向图搜索没搜到,就觉得"这人应该是真的"。
这个逻辑漏洞可以害死人。
图片核查只是第一关。通过之后,要开始做身份考古。
账号创建时间与内容密度的关系
真实的人在网上积累存在感,是一个自然的、非线性的过程。他们可能某一年发了很多帖子,某一年几乎消失,可能因为换工作、搬家、生了孩子。
AI构建的假身份,如果要制造"历史感",通常会批量生成内容,时间线看起来均匀----一周发几条,每条间隔差不多,内容风格高度统一,没有"人生起伏"。
打开那个账号,滚到最底部,看最早的帖子是什么时候。如果账号号称已经有六七年历史,那么它六七年前的帖子应该反映出当时的语境----当时的热门话题、当时流行的表情包、当时用的网络流行语。
如果一个声称2018年就开始活跃的账号,它最早期的帖子用的是2024年才流行的网络梗,那就有问题了。
数字足迹的跨平台一致性
真实的人会在多个平台上留下互相印证的记录。一个人的LinkedIn说他2019年在某个公司工作,那他那段时间可能在Instagram晒过办公室咖啡,在Twitter/X上转发过行业新闻,说不定还在某个论坛里回答过相关领域的问题。这些痕迹是自发的、分散的、语境各异的。
假身份很难做到这一点。因为构建这些痕迹需要大量时间和资源,哪怕AI能帮忙生成内容,跨平台痕迹的时间戳一致性依然很难伪造。


