SBTI为何还能在朋友圈风靡？赛先生

从MBTI到最新爆红的荒诞SBTI，这些测试究竟能告诉我们什么，又如何让我们痴迷？

图源：SBTI测试封面

2026年4月，刷屏的风又吹到了性格测试。一夜之间，一款名为SBTI的中文人格测试在社交媒体爆红。

三十一道选择题，没有一道看起来像是正经测试：

“对象超过5小时没回消息，说自己窜稀了，你会怎么想？”

A 拉稀不可能5小时，也许ta朝我隐瞒了什么。

B 在信任和怀疑之间摇摆。

C 也许今天ta真的不太舒服。

朋友们晒出来的测试结果，无论是中文名称，还是英文名称，都堪称画风清奇：

送钱者（ATM-er）、哦不人（OH-NO！）、感恩者（THAN-K）、思考者（THIN-K）、拿捏者（CTRL）、僧人（MONK）、行者（GOGO）……

你也忍不住测试，不禁想吐槽：这是啥玩意儿？如此明显荒诞的测试，为啥还能如此风靡？

测试告诉我们什么？

作为工具，人格测试的历史可以追溯到一战时期，而且最早是用来希望了解他人的。1919年，美国心理学家罗伯特·伍德沃斯（Robert Woodworth）开发了“个人数据表”（Personal Data Sheet），用于批量筛查士兵中可能存在心理问题的人员。这被普遍认为是现代标准化人格测量的起点。[1] 这被普遍认为是现代标准化人格测量的开端。

如今，这一工具广泛应用于心理咨询、教育、招聘乃至客户管理等多个场景。从MBTI到各种在线测试，广受欢迎，也让人格标签成为现代人一种流行的自我表达方式。

在心理学研究中，最受认可的主流框架之一是“大五人格模型”（Big Five）。它将人格描述为五个连续维度上的分布：开放性（Openness）、尽责性（Conscientiousness）、外向性（Extraversion）、宜人性（Agreeableness）和神经质（Neuroticism），简称OCEAN。[2]

这一模型并不试图将人归入固定类别，而是承认人格特质在程度上的连续变化和差异。例如，一个人可以在外向性上被测定为“较高”或“中等”，而不是简单定义为“外向”或“内向”。这种细粒度的描述方式更接近心理学对人格复杂性的理解。

大众更为熟悉的，是MBTI（Myers-Briggs Type Indicator，迈尔斯-布里格斯性格类型指标）。它将人格压缩为四个二元维度的组合，输出十六种类型标签，如INTJ（内向、直觉、思考、判断）或ENFP（外向、直觉、情感、感知）。

这种分类方式简洁、易记，极适合传播，因此被全球众多企业、政府机构和高校广泛采用，也是现实中人们用于描述自我、理解他人的常用工具。

除了上述两种之外，常见的人格测试还有九型人格（Enneagram）、明尼苏达多项人格测验（MNPI）等。

这些测试究竟有多可靠？学术界的评价相当谨慎。

大五人格模型在研究中表现出较好的跨文化稳定性，也与部分现实行为指标存在统计相关。但它同样面临一个根本性局限：测量主要依赖受试者的自我报告。人们在填写问卷时，可能无意识地夸大正面特质，或向社会期待靠拢，这会系统性地扭曲结果。[3]

MBTI受到的批评则更为集中。有研究指出，MBTI测试除了依赖自我报告、缺乏客观性，还以积极因素为中心来定义性格，这必然会忽略众多负面特质，例如神经质或缺乏责任心。[4]

另有心理学家还认为，MBTI缺乏预测能力：测试结果难以有效预测个体在工作、幸福感或人际关系等方面的实际表现[5]。

即便如此，上述批评并不意味着这些工具毫无价值。部分研究者认为，人格测试可以提供一个初步的参照框架，帮助个体思考自身的行为模式，并在与他人比较中找到定位。问题不在于工具本身，而在于我们如何使用它，以及为何如此容易相信它。

为什么我们会觉得好准

1949年，美国心理学家伯特伦·福勒（Bertram R. Forer）做了一项实验：他让学生完成一份所谓的人格测试，随后向每人提供一份“个性化分析”。学生们仔细阅读自己的报告，并被要求评估其准确程度。结果，大多数学生认为结果很准确，并对这次测试给出了很高的评分。

但实际上，所有人收到的是一份完全相同的报告，其中的描述是福勒从一本占星书中抄录拼凑而成的，内容包括诸如“你有强烈的被他人喜爱的需要”“你有时外向、亲和，有时则内向和谨慎”之类的表述。[6]这样的表述几乎适用于所有人，却容易被很多人解读为对自己的精准洞察。

这一现象后来被称为“福勒效应”，也称“巴纳姆效应”（Barnum effect）。人们倾向于认为，那些模糊而笼统的描述准确揭示了自己的人格特点。

福勒认为，人们之所以相信这类测试分析，一是因为他们缺少可以用来比较的参照系，也就是说，只会判断描述是否符合自己，而不会拿这些描述去和其他人对照；其二，人们往往会对测试中明显正确的内容印象深刻，而对那些不确之处视而不见。

此外，测试情境通常带有权威色彩，例如由教师或心理学家主持，就更会增加人们对结果的信任。

福勒效应在此后数十年间被反复复现，在不同文化背景下均得到验证，稳定性相当高。它不仅解释了为什么人们会相信星座、塔罗和各类人格测试，也提示我们，感觉好准的主观体验，与测试是否真的准确，是两个相互独立的问题。

人格测试的动机

1990年代，发表在《人格与社会心理学杂志》上的一项经典研究发现[7]，人们在自我评价的多种动机中，最强烈的动机就是自我提升（self-enhancement），即追求有利的自我认知。这意味着，人们最想追求的并非最准确的信息。而人格测试提供的宽泛而又积极的描述，恰好契合这一动机。测试结果让人感到被理解、被肯定，而这种感受本身就有内在价值。

从这个角度看，人格测试的流行有其合理的心理基础。

社会心理学研究还显示，人格测试这类工具在特定情境下确实有其作用。例如，它们可以提供一个初步的参照框架，帮助个体思考自身的行为模式，并让人们在与他人比较时找到自己的定位。[4]当然，这种作用往往是有限的。

研究表明，个体的人格特质在一生中并非完全稳定，许多人会随着年龄增长在责任心等维度上有所提升。因此，有的学者认为不定期地重复测试对个体发展是有益的。[4]

心理学界普遍强调，一个好的人格测试应具备信度和效度，即结果稳定（测试结果可重复），并且确实能够测量其所声称的内容，而许多流行测试恰恰在这两方面存在不足。[8]

还需注意的是，过度依赖测试结果可能带来风险。比如，如果将人格标签当作固定身份，可能限制个体的行为选择，甚至影响职业决策[4]。而招聘方不当使用人格测试，不仅可能错失优秀人才，还可能涉及侵犯隐私和歧视问题[9]。

这些提醒都很有道理，但问题是，既然人格测试有这么多不足和风险，我们要怎么对待它呢？

SBTI的意外价值

人格测试究竟是自我麻痹的手段，还是通往自我提升的途径，科学界长期以来一直都有争议。可以确认的是，目前没有任何单一的测试能够捕捉到足以定义一个人的所有细微特征[4]。

因此，没必要太在意性格测试的结果。

回到最初那款引发刷屏的测试。SBTI的开发者在结果页面留下了一行小字：“本测试仅供娱乐，别拿它当诊断、面试、相亲、分手、招魂、算命或人生判决书。”

正如周星驰的无厘头是对正经、崇高、权威的假大空话语的解构，SBTI在给人们带来欢乐的同时，若让大家认识到许多人格测试的荒诞之处，减少大家对测试结果的过度认同与片面解读，可谓功莫大焉。

“你可以笑，但别太当真。”