你是i人还是e人?
最近,MBTI人格测试再度翻红,内敛i人和外向e人两大类型成了讨论的重心。i人和e人的特质被极尽差异化,并在各种流行的社交实验中得到验证。人们喜欢看i人e人扎堆聚会,更喜欢看他们互相交锋。
b站up主@累渠_ 的i人KTV实验
i人e人各自为政,看似贴标签的行为背后,折射出当代年轻人的社交困境。在看理想主讲人、心理学教授王芳看来,人格测试只是工具,不能变成桎梏。
与其把自己面目模糊地藏在几个字母之下,不如对自己和他人都保持开放。去听鲜活的故事,看具象的生活,爱真实的个体。
有朋友问:为什么测MBTI,今天测和明天测,会得到不一样的结果?MBTI科学吗?测试结果对于专业、职业的选择指导意义大吗?不一定每个人都知道MBTI是什么,我先简单解释一下:MBTI全名叫“迈尔斯-布里格斯类型指标(Myers-Briggs Type Indicator)”,也就是说,MBTI里的M和B是两个人,是编制这个测验的一对母女,而这个测验是用以将人划分类型的。MBTI是基于荣格的心理类型理论发展出来的一个人格测验,初版编制于1944年,依据测验的结果会把人分到16种人格类型中去。MBTI可以说是当前“世界上最流行的性格测验”,大量应用于企业培训、职业咨询以及个人成长等领域,全球每年约有超过200万人参与测试,它在商业推广上相当成功,相关出版社领导着心理测验市场,年价值高达20亿美元(Forbes, 2018)。但是与之形成鲜明对比的是,心理学学术界对于这个测验的争议很大,各种批评声不绝于耳。批评主要集中在两个方面:一是测验的理论基础,二是测验的心理测量学质量。要评价MBTI,需要先说说心理测量的一些基本知识。编制这种基于自我报告的问卷式的测验,首先要对要测量的对象(专业术语叫“心理构念”)进行定义。对于人格测验来说,这个心理构念就是人格,可以定义为思想、情感、行为模式上稳定存在的个体差异。之后要确定要测量的这个对象的结构维度,也就是这个心理构念到底表现在哪里,只有搞清楚了这一点,才有地方下手去进行测量,才知道要测量哪些方面。这是在测验编制过程中最难的一步。我们如何知道这个心理构念有几个以及哪些维度呢?这里有两种方法,一种是我在前面讲过的大五人格词汇学研究的模式,自下而上,根据对词汇进行因素分析得到五个特质,再进一步根据这五个特质的特征去编制相应的测验题目;另一种则是自上而下,基于某种理论已经提示好的结构维度来编制题目,MBTI就是这一种。荣格在他的理论中提出了两种生活态度(内向I-外向E)和四种心理功能,包括两种感知功能(感觉S-直觉N:偏好感知事实和细节还是感知整体与可能性)和两种判断功能(思维T-情感F:偏好依据逻辑来做判断还是依据情感及和谐来做判断)。方便理解的话,可以想成是三个维度吧,其中每一个都由相反的两极组成,每个人都在每个维度上属于其中的一端,组合起来一共八种类型。后来,布里格斯和迈尔斯母女又在荣格三个维度的基础上加了一个维度“判断J-知觉P:偏好标准可控的生活方式还是灵活开放的生活方式”,于是再乘以2,就构成了16种类型,每一种类型都可以用四个字母标示,比如ISTJ或者ENFP。一个测验具有理论基础是值得赞赏的,在这一点上MBTI比“九型人格”强多了。但是可能存在的问题是,荣格的这一理论已经比较久远了,而且是基于临床观察和内省提出来的,主要目的也是用于临床治疗。虽然我个人对荣格理论十分欣赏,并且认为他对于人类精神实质的阐释时至今日仍然闪闪发光,但确实,“心理类型说”是没有经过实证检验的。换句话说,并没有可靠的证据证实荣格一开始提的8种或后来扩展到的16种类型真实存在,以及它们到底代表着什么。1989年的时候,有研究者将大五人格测验和MBTI放在一起施测,发现二者在维度层面存在关联,比如MBTI的“内向-外向”和大五的“外向性”之间、“感觉-直觉”和“开放性”之间、“思维-情感”与“宜人性”之间、“判断-知觉”与“尽责性”之间存在显著相关,但MBTI没有涉及到和神经质有关的内容(McCrae & Costa, 1989)。这一结果说明,在维度层面上,MBTI测量的内容可以为大五所覆盖,同时这个研究也专门提到,没有证据证明16种类型的划分是合理的,因为维度与维度之间的交互作用几乎都不显著,也就是说它们之间不会发生共变。“定义心理构念”是知道测什么,“厘清结构维度”是搞清楚从哪些方面去测,接下来,是到底要测些什么,也就是测量的具体指标。这涉及到的是编题。人格测验的题项(item)一般包括两个部分,一部分是题干,通常是一句描述你行为或感受的话,就像你在大五测验里看到的那样。它的原理是,虽然心理构念是无形的,但它一定会表现在行为、观念或应对与解决问题的过程中,而这些我们是可以基于对自己的观察报告出来的。还有一部分叫“反应方式”,比如大家做的大五测验,就是看完那句描述的话之后你要在一个从“非常不同意”到“非常同意”的7点量尺上打分。在这种方式里,反应是一个等距的连续体,因为多数人都不是极端的是或否、同意或不同意,用这种方式就可以细分出差异,允许受测者比较精细地表达出自己的状态。而常用的MBTI测验,用的是另一种反应方式,叫做迫选,也就是二选一。比如问:“当你和一群人在一起时,你通常会:A. 加入大家的讨论;B. 在一个时间只和一个人谈话”。这就会出现一个问题,比如有些人在大多数这种情况下会和很多人聊天,于是ta会选A,而另一些人则可能两种情况差不多,但必须只能选一个,所以ta也选了A,但其实这两个人是不一样的。当然,MBTI的支持者会说,MBTI测量的是偏好(preferences),即在这种情况下你会更偏好于怎么做,于是要尽量区分出方向其实无可厚非。但是,这么做会忽略掉很多人可能就是没有明显的偏好,而事实上,这种处于中间的人才是大多数。最近,我也有看到一些MBTI的改进版测验,也选用了和大五测验一样的先描述一个行为,然后在是不是同意的连续体上打分而非迫选的反应方式—— 我个人觉得这是一个进步,但是问题就在于,到了下一个步骤上,它又回去了。下一个步骤,就是等所有题目都做完、该计分了,一般是分维度进行加和,这里大五和MBTI是一样的。只不过,如果是连续的反应方式,每一题的分值范围就是1~7;而如果是迫选的反应方式,就是计0或1,比如刚才那题,如果选了“A.加入大家讨论”就在“外向”上计1分,选了“B.一个时间只和一个人谈话”就在“内向”上计1分,然后分别加总。大五测验到这里就结束了,根据你在五个特质上的得分出一个雷达图,分别给予解释。但MBTI在这之后还有一步,就是最后的分类。如果是迫选的,只要你外向的总分超过内向的总分,就会被归为外向——注意,这里只要超过就可以,不管超过了10分还是只多了1分,结果都是一样的。而如果是连续的那种反应方式,本来挺好的,因为受测者在作答的时候不用非此即彼,是可以选择中间没有明显偏向的。但是最后的分类又“一夜回到解放前”,它会把所有测量某一个维度题目的分数加总之后,再以中值为切分点,只要你得分超过中值就归为一类,否则为另一类。以“内向-外向”为例,它可能会呈现给你“你是60%的外向者、40%的内向者”,然后给你一个字母E,也就是归于外向这一类。这时,问题就来了:事实上,不管你是90%还是51%的外向者都会领到字母E,但能说这两个人是一样的吗?而那个“49%的外向者”则会被归于内向,虽然ta的分数和那个“51%的外向者”相差无几,他们才是更像的人。这就像如果MBTI也测量身高的话,那么你只有两个归宿——大高个或者小矮个,而事实上大多数人不算高也不太矮,依据正态分布,68%的人都包含在平均值的1个标准差之内。这就是我们一直在说的类型论的问题所在,分类是互斥的,那些处于中间的多数人就被“强行站队”了,而且只要被归于一类,所有的差异就被抹平了,但是事实上,同一类型内的人还是相当不同。一个被接受的、科学的人格测验,还需要通过心理测量学的质量检验,我们说的很多“坊间测验”,之所以“坊间”,就是因为它们没有接受过检验。一个测验的质量怎么样,关键是看两个指标:信度(reliability)和效度(validity),只有拿出过硬的信度和效度证据,一个测验才是可以被接受的。信度里最常用的是重测信度(test-retest reliability),也就是说一段时间内多次测量的结果得要比较一致。MBTI的重测信度的确经常受到质疑(e.g., Harvey, 1996),原因主要还是因为它是强行把人分类的,那么下次做的时候只要有几个题你改了下答案,从A换成B了,最后结果就可能被归到另外一类去了,特别是那些本来就处于中间的人。这是信度,光可靠还不够,还要看测的究竟是不是想要测的东西。比如你站到体重秤上去测颜值,可能每次显示出来的数字都一样,说明重测信度很高,但没意义,因为完全无效。效度也分很多指标,比如结构效度(construct validity)就是检验你找到的那个结构维度是不是对的,可以通过找一部分人来施测,然后对结果做因素分析来检验;还有所谓效标关联效度(criterion-related validity),就是拿你测量出来的这个构念和其他已知与它有关的构念做关联,或者去预测一个在理论上你测的这个构念能够预测的东西。目前来说,MBTI的效度证据是不够明确的(e.g., Boyle, 1995; Nowack, 1996)。说到这,其实对于第二个问题你可能也已经有答案了。关于一个人格测试的结果对于专业、职业的选择指导意义有多大,我想所有的人格测验(当然前提是科学的)都可以帮助你了解自己,但是要在多大程度上依赖其来指导生活,我的建议都是“仅供参考”。每个行业里都有各式各样的人,拿MBTI来说,和那个在16种类型里号称最适合做心理学家的类型相比,四个字母里我有三个不符合,倒也没妨碍我在这一行做得还算凑合。有研究者分析了不同职业中每种MBTI类型的占比,发现全都接近于随机抽样人口中的类型占比(Pittenger, 1993),也就是说,特定职业里的类型分布和一般人群中的类型分布是基本一样的,并没有发生哪个类型的人更多进入到哪个职业的现象。另外,MBTI类型与各种工作表现之间的关联非常微弱(Gardner & Martinko, 1996),而在MBTI的使用手册中,也明确不鼓励将其作为工作绩效的预测指标,并且由于它测量的是偏好而不是能力。也就是说,一个人偏好于思考并不等于善于思考,因此它对于专业和职业选择的意义,可能也只在于提示你:可以去寻求一个与偏好相一致的环境,而至于能做得怎么样、开不开心等等,则是另外一回事。我们在做生涯规划和选择时,人格只是考量的一个方面。你对这个职业有没有兴趣(也就是喜不喜欢),你的能力是不是适配(也就是能不能做),以及你的价值观是不是和这份工作在做的事情相匹配(也就是你愿不愿意做);甚至这个职业的典型从业者他们的生活状态是什么样子的,他们在做什么事情、会遇到什么样的人、在思考什么问题、几点上班几点下班、工作的自主性和灵活度有多大等等,这些都很重要。选择一个职业或一份工作,其实是在选择一种生活方式,你各方面的需求需要被均衡满足,人格只是其中一个方面而已,它重要,但也没那么重要。人格测验得出的只是此时此刻的你,不代表未来的你,而且工作本身就会在一定程度上改变人格。所以,如果你着意改变,什么都不会也不必是阻碍。之前,我在本科生的人格课上都会讲这个测验,也会让学生做,然后客观地进行评价。但是近几年,我慢慢发现好像有点不对了。一个是关于MBTI的各种培训越来越多,而且收取很高的费用;另一个是我发现这个测验有粉丝了,类似于星座那种的。“粉丝心态”的典型表现,就是把偶像或者在这里就是测验和自我勾连在一起,视对它们的批评为对自我的威胁,进而做出防御反应,比如全面否定提出批评的人。其实,测验的更新换代很正常,大概十几年前还有一个常用的人格测验叫16PF,全名是“卡特尔16种人格因素”测验(这里的16种人格因素是16个人格特质,不是16种类型),但现在已经全面被大五取代了。因为理论和方法都在演进,16PF的16种因素经分析发现可以提取出五个高阶因素,正是大五。如果继续发展,有一天大五也可能被什么“大二”甚至“大一”取代,如果发生了也都很正常,这就是科学的进步。但是,如果一个测验像一个商业项目一样被推广和经营,并且不愿意接受挑战、经不起批评,其科学性一定大打折扣。另外,近几年我也越来越常会在别人递过来的名片上,甚至报考硕博士学生的简历上看到四个字母,代表着他们的MBTI类型,就像盖章一样。这个测验会如此流行并不难理解,我在前面讲过的,分类与我们大脑的工作方式一致,而且,叫自己做“守护者”或者“思想家”很有趣不是吗?不过,潜在的风险也在这。比如,我经常在网络的某些群组里看到,某一类型的人会热烈地聚在一起,不停讨论“我们这个类型的人怎样怎样”。这个过程会导致群体极化,即让本来可能只有一点相似的人,在不断交换类似观点之后变得更相似,这反过来又会让个体把自己身上的那个标签贴得更紧更深。但你知道吗?荣格主张,如果你是某一种类型,只不过意味着这一种在你的外显行为表现上占据了上风,而跟它对立的另一种则潜藏在潜意识中,没有得到充分发展;而要达到他所说的“自性化”,就要去了解和发展另一面,以让二者获得平衡。这一点很像心理学界这几年提出来的所谓“中间性格优势(ambivert advantage)”(Grant, 2013),也就是说,不极端的性格特征可以让人灵活地在不同情境下采取与之相适宜的行为方式,反而可以获得更优的结果。然而现在的情况是,分类让人们形成不同的群体,对于标签的深信不疑让人们自我固化,这又要如何去接触和发展另一面呢?于是,这个基于荣格理论发展出来的测验最终,是不是有点违背了荣格的初衷?总之,MBTI也好,大五也好,人格测验不是水晶球。尽管人们总是期待经由探索自己的人格,引导自己在特定的职业或者生活领域中获益,但接受人格测验并不能替代自我体验与反省。人格测验作为工具,它的职责是为我们所用,而非指挥我们所为,不必让工具变成桎梏,与其把自己面目模糊地藏在几个字母之下,不如对自己和他人都保持开放,去认识真实的个体,去爱具体的人吧!听鲜活的故事,看具象的生活,类别束缚不了独一无二的你。*本文摘选自看理想App节目《致独特的你:人格心理学40讲》,内容有删减和调整,小标题由编辑添加。完整观点和讲述请移步至相关节目收听。
封面图:《浪漫的体质》
转载:请微信后台回复“转载”
商业合作或投稿:[email protected]