SBTI火遍全网，不靠谱的测试为何让人上瘾？环球科学

这两天SBTI火遍了我的朋友圈。它是B站up主Q肉儿串儿为劝朋友戒酒制作的人格测试，起名很明显借鉴了比较流行的MBTI。

SBTI测试本身免费，不要被骗。图片来源：SBTI

不管“MBTI已经过时，SBTI来了。”的标语，还是SBTI的名字，都透露着一股整活儿的气息。里面的问题也都不怎么正经，一些问题比较冒犯，某些问题甚至可能越过道德边界，触碰社会底限。

这也不是人格测试的第一次流行了，在SBTI之前，MBTI、星座、塔罗牌、算命等不同形式的人格测试已经流行了很多轮了。它们都在做一件事情：给复杂的人贴上一个简单的标签。这正好契合了人们“了解自己”或者想要“一个模糊的确定性”的需求。并且这些测试的结果也都足够简单，便于分享传播。比如在星座测试里，一句话、一个截图就能让别人知道“我是谁”的结果。

小编的测试结果。图片来源：SBTI

在科学上，这些测试大部分都站不住脚。例如，一篇1985年发表在《自然》（Nature）上的论文，就对占星术（astrology）进行了严格的双盲测试。研究人员让普通参与者在多份人格报告中选出最符合自己的那一份，同时让占星师根据星盘匹配参与者的人格报告。结果发现，不论是普通参与者还是职业占星师，在统计学的意义上，选择准确率都和随机选择没有显著差异。

就算是看似合理的MBTI测试，其效果在心理学上也一直面临着巨大的争议。

伊莎贝尔·布里格斯·迈尔斯（Isabel Briggs Myers）及其母亲凯瑟琳·布里格斯（Katharine Briggs）。图片来源：Courtesy of Katharine Myers - Katharine Myers

MBTI测试是由伊莎贝尔·布里格斯·迈尔斯（Isabel Briggs Myers）及其母亲凯瑟琳·布里格斯（Katharine Briggs）在20世纪中期开发的人格测试，基础理论来自卡尔·荣格（Carl Jung）在1921年提出的心理类型学说。最初，这种测试被设计用于职业匹配，并不是在现代心理测量学框架下发展出来的标准化工具。在后续传播过程中，它逐渐被简化为16个人格类型，并被广泛传播。1993年，美国佐治亚大学的心理学教授戴维·J.皮滕杰（David J. Pittenger）就曾发表综述论文，质疑MBTI测试的效用。他在综述中指出，多项研究发现，仅仅间隔数周重新测试，就有39%到76%的受试者会改变MBTI类型；9个月后重新测试，约有50%的人MBTI类型会发生变化。

但这并没能阻止MBTI测试的大范围传播，甚至有不少企业将其用于人才筛选。2005年，皮滕杰再次发表论文，指出MBTI的关键问题在于，人格特质本质上是连续分布的，将其强行划分成16个离散的标签会导致误判和大量信息损失。人们可以用这种测试进行自我反思，甚至用它来降低沟通成本，但它绝不适用于人才选拔和能力评估，更不是科学研究中的严格测量。

星座、MBTI、SBTI 的共同点不是“测得准”，而是“说得像”。这背后一个经典的心理学解释是“巴纳姆效应”（Barnum effect）。

1949年，美国心理学家伯特伦·福勒（Bertram Forer）发表了一项经典的心理学实验。他让39名心理学学生填写了一项心理测试问卷，并表示会根据测试结果给每个人撰写量身定制的心理学报告。

专业的心理学专业的学生似乎也难以区分占星术的性格描述，普通人就更不用说了。图片来源：unsplash

一周后，福勒完全不管问卷结果，给每位学生都发放了完全相同的报告，并让他们评价这份报告的契合度。满分5分，结果这份报告拿到了平均分4.3分的好成绩。这份报告的内容是福勒从路边摊的占星书上随便摘录的，里面充满了大量模糊、普适的性格描述，比如“你非常渴望得到他人的喜爱与敬佩”，“你的一些抱负往往相当不切实际”，“你有时外向，有时内向”。这些描述几乎适用于所有人，却常常能让人产生“被说中了”的感觉。这种现象被命名为巴纳姆效应，其名称来源于19世纪美国著名马戏团团长P.T.巴纳姆（P. T. Barnum），人们常用一句话来概括他的经营策略：“给每个人都准备一些对号入座的东西”（A little something for everybody）。

相比之下，当代心理学中更被广泛接受的人格模型，是大五人格模型（Big Five），或者叫五因素人格模型。它并不会给人贴标签，而是用开放性（Openness）、尽责性（Conscientiousness）、外向性（Extraversion）、宜人性（Agreeableness）、神经质（Neuroticism）这5个维度评价一个人的人格。

大五人格模型。图片来源：Anna Tunikova/wikipedia

最关键的区别在于，大五人格模型不会给某种人格贴上容易理解的标签，而是在上述五个维度中，用一组连续坐标定位一个人的人格。在这个模型里，一个人不会是简单的外向或内向，而是在某个区间内波动。2014年，一篇发表在《人格研究杂志》（Journal of Research in Personality）的荟萃研究分析了大五人格模型的重测信度。论文统计了74个研究，总样本量达到14 923人，结果发现在1天到2个月的重测间隔内，大五人格模型的中位重测相关系数达到了0.816，在心理测量学中属于较高的稳定性水平。

但是，大五人格模型给出的结果更像一组坐标，它看起来太复杂，有些难以理解。你没有办法用一句话或一个标签向朋友分享自己的测试结果，因此这一评判标准也就没有从心理学领域内破圈。

其实，MBTI内部也有一套连续的评分维度（E–I、S–N、T–F、J–P）。2025年一篇发表在《科学报告》（Scientific Reports）上的论文发现，如果用这套连续数据测量MBTI测试的可靠性，它的重测信度也能达到0.74～0.83之间。但关键的问题在于，MBTI测试最终输出的是一个标签，小幅度的波动，很可能会被放大为类型变化。