“未来主义者”、“预测者”和情景咨询师保罗·萨弗(Paul Saffo)有一个著名的思维框架,叫做“强观点,弱观点”。这个短语本身在2010年代在科技界变得流行起来-我记得在那个时期,我在黑客新闻(Hacker News)、a16z.com或其他有思想的科技博客上读到过它。它今天仍然很受欢迎。
萨福的框架--他在2008年最初的博客文章中提出--是这样的:
我发现,实现有效预测的最快方法往往是通过一系列糟糕的预测。我不会等到对数据的彻底搜索完成后才做出判断,而是强迫自己根据现有的信息做出试探性的预测,然后系统地拆解它,使用获得的洞察力来指导我寻找更多的指标和信息。重复这个过程几次,你会惊讶地发现一个人可以如此之快地做出有用的预测。自20世纪80年代中期以来,我对这一过程的口头禅是“强烈的意见,软弱的坚持”。让你的直觉引导你得出一个结论,不管它有多不完美--这是“强烈的意见”部分。然后--这是“薄弱环节”--证明自己错了。进行创造性的怀疑。查找不符合的信息,或指向完全不同方向的指示器。最终,你的直觉会发挥作用,一个新的假设将从瓦砾中浮现出来,准备再次被无情地撕裂。你会惊讶于一系列错误的预测会以如此之快的速度带给你一个有用的结果。面对新的信息,这个过程对于评估已经最终的预测同样有用。它让人对即将到来的变化的微弱信号敏感起来,并防止倒霉的预测者过于执着于他们的模型,以至于现实来得太晚,无法产生影响。更广泛地说,在面对任何充满高度不确定性的问题时,无论你是否冒险进行预测,“强势观点”往往是一个有用的默认视角。下次出现有争议的话题时,在鸡尾酒会上试试吧;这是一个发现新见解的优雅方式--避开那些大声什么都不知道,但不会改变主意的乏味乏味的人!
从表面上看,这一切听起来都很合理和明智。而“观点强烈、观点薄弱”是一个如此朗朗上口的短语--这可能就是为什么它很受欢迎的原因。
唯一的问题是,它似乎工作得不是很好。
我怎么知道它不太管用呢?我知道这一点是因为我试过了。在2013年至2016年之间的几年里,我试图使用Saffo的框架,当我经营上一家公司时,每当我们开会讨论公司战略时,我都会尝试与我的老板一起尝试。
最后,我读了菲利普·泰洛克(Phillip Tetlock)的“超级预测”(SuperForecast),然后我放弃了“强烈的观点,软弱的观点”。
为甚麽这个架构运作得不太好呢?从经验来看,Saffo的方法在两个方面失败了。
第一种方式是如果这个人没有读过萨福的原始帖子。这是,公平地说,我们大多数人-萨福的原始想法是如此容易被引用,以至于变成了一种迷因现象,我看到它在远离科技的领域被引用。在这种情况下,失败的模式是‘强势意见,弱者持有’变成‘强势意见,大声辩护,直到有证据表明不是这样,这时你援引它来保护你的屁股。“。
简而言之,“强势观点,弱势持有”有时会成为强烈持有负面观点的许可证,带有负面保护,与Saffo最初框架的精神和意图背道而驰。
现在,你可能会说,这不是Saffo的错,而是人气的问题。但我的回答是,如果一个想法有一定的承受能力,而人们似乎总是抓住这些承受能力,以完全相同的方式滥用这个想法,那么也许你一开始就不应该使用这个想法。正如我们即将看到的那样,如果有更好的想法,这一点尤其正确。
失败的第二种形式是,如果这个人花了时间去查这个短语的原意。在这种情况下,失败模式是当您试图将新信息整合到您的判断中时。Saffo的框架没有为我们提供这样做的方法。
这里有一个例子。比方说,您和您的老板一起决定为自助结账市场的特定细分市场开发一种特定类型的产品。你们都认为这个部分是进入这个行业的最佳切入点:它相对有利可图,而你们认为这是最容易服务的客户群。
当你慢慢发现这个细分市场人满为患时,你的意见会发生什么变化?当然,你不会立即发现--相反,你会发现一些迹象,在几个月的时间里,许多竞争对手正在同时进入这个市场。这些都是微小的东西,比如客户办公室角落桌子上的竞争对手宣传册,或者行业组织的声明“他们正在寻求与供应商进行大规模部署”,然后很久之后,以交易竞争加剧的形式出现更明确的证据。
“嗯,”我能听到你说,“‘强势观点弱持有’的意思是,当你遇到这些细微的暗示时,你应该改变你的观点!”
但是在什么时候你会改变主意呢?在哪一点上,你会改变你的强硬观点?在什么情况下,您认为是时候重新考虑您的方法了?
故障模式1和故障模式2都源于相同的张力。很容易就会有强烈的观点,并牢牢抓住它们不放。人们很容易有软弱的观点,并软弱无力地坚持下去。但是,人类的头脑很难在一种强烈的意见和另一种强烈的意见之间摇摆不定。
我并不是说人们不能做到这一点,只是说做到这一点非常困难。例如,史蒂夫·乔布斯(Steve Jobs)以反对某一立场而闻名,结果认为你是对的,一个月后又带着你的观点回来,就好像这一直是他的观点一样。
但大多数人都不像乔布斯。心理学家阿莫斯·特沃斯基(Amos Tversky)曾开玩笑说,在默认情况下,人类的大脑会退回到“是的,我相信,不,我不相信,也许”--当涉及到不确定性时,这是一个三分盘设置。然后,只要内心的叙述允许,人们就会坚持自己的观点。萨佛的思维框架暗示,你坐在“是的,我相信”的范围内,然后根据你收到的信息,迅速切换到“可能”或“否”。
也许你可能--喜欢乔布斯!--能够做到这一点。但是如果你和大多数人一样,这种尝试会让你感觉很像鞭子。
更温和的答案在于超级预测。在这本书中,Tetlock提出了一个分析框架,它比Saffo的更容易使用,同时实现了许多相同的目标。
在形成意见时,用一种非常清楚的方式表达,并可能在特定的日期得到证实。
例如,你可能会说“我相信特斯拉将在2021年12月31日之前破产,我大约76%的信心是这样的。”或者你可以在技术上稍微马虎一点--对我的老板,我会说:“我认为这个细分市场是一个很好的进入市场,我想我们会在四个月内知道这是不是真的。我相信这大约是70%左右。让我们9月份再来看看吧。“。
(我的老板是一位前投资银行家,所以他对这件事了如指掌。)
泰洛克陈述的技术是在一项名为“良好判断项目”的地缘政治预测锦标赛的背景下发展起来的。2016年,当我第一次阅读SuperForecast时,我记得我认为地缘政治预测与我在越南经营一家工程办公室的工作并不是特别相关。但我也仔细研究了这本书关于分析的观点,因为它太吸引人了,不容忽视。
事实是,泰洛克的想法并不是他的研究小组独有的。安妮·杜克(Annie Duke)在下注中的想法也提出了同样的方法,但它来自扑克,而“理性主义”社区LessWrong在陈述自己观点的信心方面有着长期持有的规范。
更重要的是,Duke和LessWrong都发现,激发这种微妙思维的最快方式是问:“你愿意打赌吗?你的赔率是多少,又有多少呢?“。
为什么它如此有效呢?为什么它成功了,而“强烈的意见,软弱的观点”却没有呢?
答案就在这句话的“强烈意见”部分。首先:通过强迫你陈述你的观点作为概率判断--也就是一个百分比--你被迫校准你的信仰的强度。这使得远离它变得更容易。换句话说,你被迫放弃头脑中的“是、不、可能”。
第二:通过把它定为赌注,你突然对这个游戏有了兴趣,并且有动力把事情做好。
当然,你实际上不必打赌--你只需提出打赌作为一种思维框架即可。稍后,随着新信息的陆续涌入,您可以更新您对自己信仰的信心百分比。这可以让你以灰色的方式看待世界,也可以让你向周围的人传达这种自信。
这个博客的长期读者会知道,我的拿手好戏是“在几个月的时间里,把一种技术应用到我的事业或生活中,并报告它的效果。”随着时间的推移,我注意到,当技术来自可信的实践者时,它们更有可能是有效的。这就是导致我的实际证据层级的原因。
萨福和泰洛克的观点来自于预测领域。但这篇文章是关于思考的,而不是预测的;我只有信心推荐一种而不是另一种,因为我对这两种工具作为分析工具都有足够的经验。
但值得注意的是,萨福作为一名预测者也不是特别可信。
在“超级预测”的大部分时间里,Tetlock都会抨击专业的“预测者”,他们会发表含糊的空话,并发布关于未来的长篇大论。这些预测者总是能够从糟糕的预测中脱颖而出,因为他们的声明措辞谨慎,提供了似是而非的否认。
在我写这篇文章的时候,我浏览了一下这本书,惊讶地得知泰洛克在“良好判断项目”中与萨福会面,并写下了这次会面。在这篇文章中,萨福对泰洛克的研究不屑一顾:
2013年春天,我会见了硅谷未来学家兼情景顾问保罗·萨福(Paul Saffo)。朝鲜半岛正在酝酿另一场令人不安的危机,所以当我为Saffo勾画预报锦标赛的草图时,我提到了IARPA问过的一个问题:朝鲜会不会“试图在2013年1月7日至2013年9月1日之间发射一枚多级火箭?”萨福认为这是微不足道的。他说,五角大楼的一些上校可能会感兴趣,但这不是大多数人会问的问题。“更根本的问题是‘这一切结果如何?’ 说。“这是一个更具挑战性的问题。”所以我们面临一个进退两难的境地。重要的是大问题,但大问题不能得分。这个小问题无关紧要,但它是可以得分的,所以IARPA锦标赛就这样进行了。你可以说,我们如此执着于看起来科学,以至于我们计算了不算数的东西。
这是不公平的。锦标赛中的问题经过专家筛选,既困难,又与情报分析师办公桌上的活跃问题相关。但公平地说,这些问题的关注点比我们都想回答的大问题更狭隘,比如“这一切会变成什么样子?”我们真的必须在提出不能得分的大而重要的问题和可以得分的小而不重要的问题之间做出选择吗?那是不令人满意的。但是,有一种方法可以走出盒子。隐含在保罗·萨福的“这一切是如何演变的?”问题是最近发生的事件加剧了朝鲜半岛的冲突。朝鲜发射了一枚火箭,违反了联合国安理会的一项决议。它进行了一次新的核试验。它放弃了1953年与韩国的停战协议。它对韩国发动了网络攻击,切断了两国政府之间的热线,并威胁要对美国进行核攻击。这样看来,很明显,大问题是由许多小问题组成的。一个是“朝鲜会不会试射火箭?”如果是这样的话,冲突会稍微升级一点。如果不是这样,它可能会让事情降温一点。这个小问题并不能明确大问题,但它确实提供了一点洞察力。如果我们问很多细微但中肯的问题,我们就能接近大问题的答案。朝鲜是否会再次进行核试验?它会拒绝就其核计划进行外交谈判吗?它会向韩国发射炮火吗?朝鲜船只会向韩国船只开火吗?答案是累积的。赞成的人越多,这个大问题的答案就越有可能是“这将是一个糟糕的结局。”我称之为贝叶斯问题聚类,因为它与第7章中讨论的贝叶斯更新有相似之处。另一种思考它的方式是想象一个画家使用一种称为点画的技术。它只包括在画布上轻拍一些小点,仅此而已。每个点单独添加的内容很少。但随着斑点的聚集,图案就出现了。有了足够的点,艺术家可以画出从生动的肖像画到一幅幅风景画的任何东西。在IARPA锦标赛中有问题群,但它们更多地是事件的结果,而不是诊断策略。在未来的研究中,我想发展这一概念,看看我们如何有效地用一簇簇的小问题来回答无法评分的“大问题”。
Saffo的业务是向企业和组织出售关于未来的故事。他向商科学生传授他的方法,这些学生大概会继续做同样的事情。Tetlock的工作是将预测者的表现固定在他们的表现上,并使用一种名为Brier评分的东西对他们进行定量评估。他的技术现在被情报界使用。
根据我的经验,‘强势,弱势’很难付诸实践。大多数尝试的人会选择:
它之所以困难,是因为它违背了人类思维的脉络。
所以别费心了。下次当你发现自己在做判断时,不要引用“强烈的意见,软弱的观点”。相反,你可以问:“你愿意在这上面下多少赌注?”这样做会让人们进入你想要鼓励的思考类型。
你是否真的付钱是无关紧要的;无论你采取哪种方式,这仍然比在多种强烈观点之间摇摆不定容易得多。