新研究否认棉花糖测试的预测能力

2022-02-22 06:32:52

如果你4岁的孩子在她面前忍不住要吃棉花糖,即使你承诺如果她等待,会有更多的食物,她会一辈子挣扎吗?如果你这么想,你并不孤单。

大约30年来,家长和科学家们一直在通过棉花糖测试来收集关于孩子未来的线索。该实验的创造者、心理学家沃尔特·米谢尔(Walter Mischel)在1967年至1973年间开始发表对斯坦福·宾幼儿园学龄前儿童的后续研究报告后,受到了广泛欢迎。他对每个4岁和5岁的孩子说,你现在可以吃这个,或者我回到房间后吃两个。根据几十年来广为宣传的研究,那些坚持不了多久的孩子通常在十几岁时就长大了,20多岁和30多岁时挫折感更快,学业和社交能力较弱,吸毒、心理健康和体重问题也更多。

但包括米谢尔在内的一组研究人员对必应的最新后续研究提出了质疑,即学龄前儿童对棉花糖测试的反应是否可以预测她的未来。

在孩子们40多岁之后,这项新的研究发现,迅速屈服于棉花糖诱惑的孩子通常不会比他们更有耐心的同龄人有更多或更少的经济保障、受教育程度或身体健康。研究人员测试的孩子等待吃零食的时间无法预测大约十几个成年人的结果,包括净资产、社会地位、高利率债务、饮食和锻炼习惯、吸烟、拖延倾向和预防性牙齿护理,这项研究发表在《经济行为与组织》杂志上。

加州大学洛杉矶分校安德森分校(UCLA Anderson)的丹尼尔·本杰明(Daniel Benjamin)在一次采访中表示:“在棉花糖等待时间方面,我们发现与我们研究的任何结果都没有统计学意义的关系。”本杰明为这项研究带来了包括行为经济学和统计方法学在内的专业知识。

这项研究的合作者包括米契尔和他的前研究生,来自华盛顿大学的Yuichi Shoda和史密斯学院的Philip K. Peake,他与他合作了几十年的后续项目。来自哈佛大学的David Laibson、来自加利福尼亚大学的Alexandra Steiny Wellsjo、伯克利以及俄勒冈大学的Nicole L. Wilson也是JeBo研究的合著者。

本杰明说,这些结果与一些早期的研究结果不同,比如从20世纪90年代开始的那些广为宣传的研究表明,棉花糖等待时间短与肥胖有关。在这项新的研究中,与之前的研究相比,学龄前儿童的比例更小,也有所不同,“我们没有看到其他研究确实发现的与BMI(体重指数)的关系,”他说。

最新的后续研究首次聚焦于对每个必应毕业生资本形成的广泛分析,其中考虑了财富、债务和信贷习惯,以及一些非金融指标。资本形成反映了一个人在教育和锻炼等方面的投资能力,以产生收入或健康等后续收益。

研究人员发现,他们可以从受试者的父母那里,以及受试者自己随着年龄增长对自控能力的评估中,收集到有关必应学龄前儿童未来的线索。该研究发现,一个自我调节能力指数由86个对父母在17岁左右为子女和毕业生在27岁和37岁左右为自己回答的调查问题的回答组成,适度地预测了许多个人结果。

研究发现,将棉花糖检测结果添加到该指数中对预后几乎没有任何影响。研究人员认为,一个5岁孩子在棉花糖测试中的表现,与该指数中的任何单一成分一样,可以预测他的成年行为;i、 不太好。

这项新研究可能是对棉花糖测试研究中形成的命运暗示的最后一击。棉花糖测试研究与早期心理学研究的许多发现一样,近年来受到了质疑。

米谢尔花了大约十年的时间来研究Bing的最新后续产品。他帮助制定并预先登记了(2014年)该研究的多项假设,包括那些似乎与他之前研究结论相矛盾的假设。他在2018年癌症确诊后不久,在研究完成前去世。

棉花糖测试仍然受到家长和教育工作者的欢迎,部分原因是孩子们在受到诱惑时会做一些可爱的事情。他们闻一闻,尝一尝,把脸贴得非常非常近。他们扭开或紧闭双眼。他们在椅子上跳舞、唱歌、摇滚。当然,有时他们只是吃。他们的反应在YouTube上的业余棉花糖实验中得到了展示,看起来很像50年前Mischel团队在Bing上记录的那些反应。

起初,米谢尔更感兴趣的是孩子们不吃棉花糖的应对策略,而不是通过测量他们等待的时间而产生的潜在预测能力。为了实现大大小小的目标,需要有自制力来延迟满足感,也就是现在能够抵制诱惑,以后才能得到想要的东西。早上早点上床休息;今天学习,来年选择更多的大学;现在就开始工作,争取下周的薪水;这个月不要吃甜点,这样下个月衣服就更合身了。米谢尔想找出有效的策略,因为与他之前的著名心理学家不同,他认为延迟满足技能是可以教授的。

然而,米谢尔的后续研究使棉花糖测试出名的原因完全不同。在一项又一项的研究中,他和他的研究伙伴记录了他最不耐心的5岁就餐者在成长为青少年、27岁和37岁时落后于服务员的多种方式。

家长、政策制定者和教育工作者接受了这项研究的不成文信息:为了培养成功、负责任的孩子,我们必须教会他们抵制第一个棉花糖。

父母设计了自己的棉花糖测试。成功大师向TED讲述了这一点。《芝麻街》(Sesame Street)臭名昭著的失控饼干怪兽(Cookie Monster)主演了一系列视频,展示了他从米谢尔(Mischel)那里学到的延迟满足技能。

2015年,必应项目的科学家获得了2015年金鹅奖,该奖项由一群国会议员授予,因为政府资助的研究带来了重大的公共利益。

后续研究存在一些问题,米谢尔的团队早就指出了其中的许多问题。他们强调,Bing队列是一个小样本(第一次随访约550名原始考生中约有185人),是一个异常同质的群体。米谢尔告诉采访者,他们主要是斯坦福大学教职员工的后代,只有少数人没有完成大学学业,他们“可能后来创办了微软或其他什么公司”。

将受试者分成实验治疗组会进一步缩小样本,并影响后续结果。例如,研究人员有时会建议孩子们帮助他们等待:假装棉花糖是云,或者闭上眼睛。

由于保密协议,只有米谢尔和最初的研究团队及其同事可以完全访问Bing受试者及其数据。虽然其他项目可以(而且确实)模仿实验得出类似的结果,但他们无法尝试直接复制原始研究。其他任何受试者都会更年轻,很可能在米谢尔的孩子出生几十年后,就进行了不同版本的棉花糖测试。

2018年,一项大型棉花糖测试研究因未能在等待时间和青少年结果之间找到强相关性而出名。这项研究发表在《心理科学》杂志上,由泰勒·W·瓦茨(Tyler W.Watts,现就职于哥伦比亚大学)领导,对900名学龄前儿童进行了更为多样化的跟踪调查,直到他们十几岁。控制家庭收入和认知能力等差异后,他们发现与学业成绩的关系较弱,与后来的行为(如反社会倾向)没有显著相关性。

瓦茨的研究结果支持了对棉花糖测试的一个常见批评:等待诱惑以获得更高回报主要是中产阶级或上层阶级的行为。如果你来自一个短缺和承诺不兑现的地方,那么现在吃面前的食物可能比相信以后会有更多更好的选择。

但瓦茨的研究与必应项目在很多方面都有所不同,包括学龄前儿童等待奖励的时间更短。一些科学家认为,通过控制孩子背景的差异——米谢尔的团队预期的差异会影响等待时间——这项研究不能被视为Bing项目的失败复制。

换句话说,瓦茨的研究有助于解释为什么有些孩子等待的时间更长。它并没有完全驳斥这样一个观点,即吃了第一个棉花糖的孩子更有可能经历与延迟满足相关的成年困难。

杰博团队没有开始质疑之前的后续行动。本杰明说:“当我们在2006-07年左右开始这个项目时,我认为我们都从表面上看了等待时间和其他结果之间关系的早期发现。”。“我们想研究等待时间和经济结果之间的关系。”

然而,到2011年,心理学统计研究的标准开始转向复杂的统计分析和更严格的研究方案。“我们都想采用最先进的统计和方法,”本杰明说。

在分析开始之前,研究团队在开放科学框架中预先注册了这项研究,这一步骤旨在防止研究人员的偏见影响研究重点和结果。

“这样,所有关于如何分析数据的决定,你都必须提前做出,”本杰明解释道。“它让世界上的其他人看到你在做你说过要做的事。”

他们使用先进的统计模型来解决小样本和其他可能夸大了早期发现的问题。他们创建了一个新的测量方法,测量每个原始学龄前儿童在咬一口(或获得奖励)之前等待的时间,以调整年龄、性别和实验条件等变量。在某些分析中,他们将结果从自发设计出自己抵制治疗策略的学龄前儿童和获得研究人员想法帮助的儿童中分离出来。

对于113名中年受试者中的每一位,研究人员根据受试者及其父母在作为三项后续研究一部分的长期调查中的回答,建立了一个自我调节指数。指数问题侧重于自我控制问题,要求对诸如“有计划、超前思考”、“冷静放松;随和”和“坚持活动;不轻易放弃”等陈述进行自我评价学龄前的棉花糖等待时间是自我调节指数的第四个组成部分。

他们确定了11项资本形成指标,包括信用卡滥用、高利率债务、收入、社会地位和财务保障,以及饮食、吸烟和饮酒习惯、体重和拖延倾向。

正如研究人员预测的那样,研究发现棉花糖测试时间与中年资本形成之间只有很小的相关性。然而,研究发现,毕业生在自我监管指数上的得分对他们的中年资本形成具有适度的预测作用。

在二次分析中,研究人员重新检查了早期研究的结果,如SAT分数、吸烟和BMI。最近的研究并没有发现等待时间和结果之间存在同样强烈的关系。Benjamin将这些次要发现描述为“有趣的,但有不同的解释”,因为样本和方案之间存在多种差异。

在一项分析中,研究人员进行了更深入的挖掘,以揭示为什么他们的结果与2013年的后续研究结果不同。这项研究著名地将迅速食用第一颗棉花糖的必应儿童与36岁时更高的体重指数和可能的肥胖联系起来。在2013年的164名参与者中,超过一半的人在最新的调查中报告了他们大约46岁的身高和体重。在新研究的样本中,JEBO团队发现他们的学龄前棉花糖测试结果与36岁或46岁时的BMI没有相关性。

研究小组假设,没有从成年人那里得到关于如何等待的建议的孩子之间存在更高的相关性。但是,尽管这些棉花糖测试的结果在统计学上可能更具预测性,但根据研究结果,预测能力(如果有)非常小。

本杰明说,自我控制指数更大的预测能力可能来自其更广泛的信息库。作者指出,该指数是根据每个受试者在30年不同生活中的86个回答编制而成,而棉花糖测试是在学龄前一天测量的单一变量。

在2014年出版的《棉花糖测试:掌握自我控制》一书中,米谢尔重申了他早期的发现,即学前等待时间与SAT分数、BMI、自我价值感、吸毒和其他成人结果有关。同年,他毫不含糊地最终确定并预先登记了研究假设,预测必应儿童学龄前的棉花糖等待时间不会很好地反映他们的成年生活。与此同时,在当时的多次采访中,他驳斥了一种流行的观点,即棉花糖考试不及格意味着一生成绩不佳。

2015年,米谢尔在PBS新闻时段的一段节目中接受了这些看似不一致的信念。他说,如果你在很小的时候就表现出自控能力,“你就有更好的机会考虑未来,并可能取得更好的经济成果。”。“但是,如果你的孩子选择不等待棉花糖,那么她就注定要失败的想法实际上只是一种严重的误解。”

在吃棉花糖之前,米谢尔已经在他的人格和评估专业(1968年)中广为人知,这是当时流行的心理学理论的翻版,在该理论中,广泛的人格特征(例如外向、神经质或乐观)决定了一生的行为。在这本书中,米谢尔证明了一个人的行为因环境和性格的不同而不同;i、 例如,即使外向的人有时也会表现得害羞。

本杰明解释说,棉花糖测试符合米切尔的整个心理学观。米谢尔认为,这项测试让研究人员能够看到人们在真实情况下的行为,它比问卷调查的答案更能衡量人们的行为。

后续研究将测试与晚年的行为联系起来,这些研究的流行带来了一个难题。

本杰明说:“虽然他几十年来一直是一名顶尖的心理学研究人员,但他在公众中出名是因为人们认为棉花糖测试很神奇。”。“让人们关注棉花糖测试是很有价值的,因为他和我一样认为,它的目的是衡量自我控制,这是理解人类心理和行为的核心。”

但说到他早期的理论?“米谢尔也不认为任何简单的个体差异测量都能很好地预测行为,”本杰明继续说。“尽管人们普遍认为棉花糖测试是一个水晶球,”本杰明说,他显然只希望在最新的研究中看到棉花糖测试结果的微弱相关性。

关于棉花糖测试的真正可预测性的问题,从来没有削弱米谢尔教授孩子延迟满足技能的支持。他亲自与特许学校合作,在每一天的课程中不断灌输抵制立即诱惑的重要性,以便在以后取得更好的成绩。他认为,任何人都可以学会这种意志力,即使是那些无法抗拒第一颗棉花糖的人。

Mischel,W.和Ebbesen,E.(1970年)。延迟满足的注意力。人格与社会心理学杂志。

Benjamin,D.J.,Laibson,D.,W.Mischel,Peake,P.K.,Shoda,Y.,Wellsjo,A.&;威尔逊,N.(2020)。通过学前满足延迟和自我调节、经济行为和组织的生命历程测量预测中年资本形成。

Doebel,S.,Michaelson,L.E.,和;Y.Munakata(2020年)。等待的人会得到好的结果:延迟满足可能对以后的成就很重要。瓦茨、邓肯和;全:“重温棉花糖测试:一个概念复制,研究早期延迟满足和后期结果之间的联系。”心理科学。

施拉姆,T.R.,威尔森,N.L.,肖达,Y.,米谢尔,W.&;Ayduk,O.(2013)。学龄前儿童延迟满足可以预测他们30年后的体重。儿科杂志。