琐事人群的智慧:手段或。 中位数和。 200k响应的模式

2021-04-01 19:33:49

1906年秋季,英国的人们向普利茅斯进行了一年一度的西英格兰脂肪股和家禽展,一个乡村展会专注于农场动物的评估。在出席的是统计名的弗朗西斯加尔顿,查理达尔文的堂兄,以及“自然与培育”这句话的加剧。随着85岁的漫步过去,他对猜测特定牛重量的竞争感兴趣。近800名游客对其规模提出了猜测,奖品将被授予最佳估算。

当中间人猜测最终仅为1,197的真正重量时,Galton惊讶于11磅。 (后来的分析实际上表明,平均估计恰好是1,197磅,但是Galton被偏见赞成报告中间人 - 他毕竟也是“中位数”的术语。)他的观察到稍后的现象感兴趣被称为人群的智慧。今天,您可以在预测市场中或在您当地的图书馆的比赛中看到它,以猜测罐子里的口香糖数量。另一个观察其效果的地方?水冷却器Trivia Witebreaker问题。

每次水冷却器琐事Quiz都以纠结者的问题结束,我们不希望任何人知道精确的答案。例如:

“平均人体头部有大约100,000个毛囊。关于每个卵泡会在一个人的繁殖中生长多少个毛发?“

想出猜测。除非你是一名庇护者,否则毛孔过于皮肤科教科书,否则你可能没有记住这样的特殊事实。对于多个人在剩下的测验中获得相同的分数,获胜者由世卫组织提出最接近的纠纷。以下是我们的卫生破坏者的一些快速统计数据:

让我们深入了解成千上万的WCT参与者的集体智慧。 P.S.不,我们不使用价格是正确的评分;我们考虑高估并低估同样低估。

正如我们与Galton的牛(好的,从技术上看,这不是他的牛......),平均水平的不同定义会比其他人更好。我们看了四种不同的中央趋势措施:

意思是=我们如何在日常演讲中使用“平均”。总结每个人的猜测,并通过猜测总数分开。

中位数=“Middlemost”猜测。按降序排列猜测,并在列表中间选择一个。

几何平均值=将所有猜测乘以一起拍摄产品的第n个根,其中n =猜测的数量。是的,这个是最复杂的,通常与具有呈指数性质的价值观。

作为一个Snappy的评论,想象一下我们猜测有多少家庭成员实际上是在杰克逊5中,猜测是{2,3,3,4,5,6,7}。

好的,所以回到那些200岁的纠结者。对于每个卫生问题,我们在最接近真实答案的方面排名这些指标。这是他们的比较方式:

首先,束的失败者是平均值。除了最糟糕的平均排名外,它绝对占据了最后一个地方的位置(在211个决手问题中,这是四个措施中最糟糕的51%的时间)。几个极端的异常值响应可靠地猛拉于真实值的均值。这真的不应该是一个惊喜 - 低估的地板是零,而对于高估,天空是极限。一些水冷却器琐事参与者与猜测冒险进入平流层。

有时,这显然是因为他们撤回了“9”的辞职。但是对于某些问题,只需预测正确答案的大小就会真的很难,更不用说确切的价值。通常很难讲述“我放弃”答案和认真的差异,但真正可怕的尝试。在某些情况下,我们专门要求参与者“回答成千上万”,不可避免地,有些人会忽略我们的要求。

根据一些问题要求,一名被访者甚至明确拒绝在帝国单位中回答。虽然他们对公制系统的坚定效忠可能是令人钦佩的,但从数据清洁角度来看,它是UHH的,而不是希望。

我们决定忽略所有响应超过850倍的实际答案对此有所控制,但在这里绝对有一些不可避免的分类错误。这些极端的猜测达到了我们总答复的1%以上。删除这些和其他侮辱(非数字响应等)后,我们留下了211个问题的总猜测。

在平均排名方面,中位数在平均排名方面刚刚脱颖而出,声称最佳度量标准。但是,您会注意到该模式在第一个位置时清除。再一次,不令人惊讶。这只是代表了实际上了解我们期望他们必须猜到的确切答案的参与者的块。虽然这很令人印象深刻,但它确实有点反对“人群智慧”的精神。

主要包括几何平均值,以使分析一下。由于它如此沮丧地进行,因此可以随意忘记我们曾向您解释过。

现在我们已经确定了中位数来成为衡量琐事人群智慧的最佳指标,让我们按类别缩小。

图表上的上下文您即将看到:我们正在查看这里每个类别中每个问题的中位数错误的平均值。荟萃平均值!

通常的水冷却器琐事具有9种不同的类别。你会注意到其中两个,Word播放和当前事件,不要在任何领域出现。在7个剩余的类别中,唯一一个参与者倾向于高估正确价值的倾向是美术。

这应该得到一点星号。这是我们在每个类别中查找的问题数量的计数。

只有5个艺术艺术的决手问题,我们的结果可能是虚假的。我们倾向于说,大多数琐事受访者都低估了任何类别的纠结者答案。这与平均值的鲜明对比,基本上每个问题都是由于异常值大量高估,如前所述。

有些令人惊讶的是我们的参与者在个性化类别中回答问题的困难。毕竟,此类别只是它听起来的样子。当一个团体签署水冷却器琐事时,他们可以选择一个类别,其中包含符合他们组织的问题。这些通常与其行业或地理位置有关,但它可以是您要求的任何东西!个性化问题的中位响响应误差的平均值是一个惊人的21.1%,低于真实答案 - 比任何其他类别更糟糕。现在这就是你所谓的房屋庭院! * BA-DUM-TSS *

这是一个有趣的人物,送你回家:每一个水冷却器琐事纠正仪的中位数错误。一些最终观察/事实:

现在,您可能会想知道那种巨大的尖峰耸立在其他人身上。还记得毛发卵泡问题吗?