Nassim Taleb的Yuuuuuge错误误解了丹麦面具研究

2020-12-15 05:12:47

丹麦研究小组最近发表了有关控制SARS-CoV-2感染的口罩有效性的大型随机研究。无法得出口罩是增加还是减少感染率的结论，结论复制如下。

戴口罩以补充其他公共卫生措施的建议并未在感染率适中，有一定程度的社会疏远和不常见的一般口罩使用的社区中使佩戴者的SARS-CoV-2感染率降低50％以上。数据与较小程度的自我保护兼容。

最近，面具的支持者Nassim Taleb花了一些时间来证明这项研究的结果对于证明面具的有效性有多么不可思议的意义。在这篇文章中，我将研究他的工作中的一些缺陷，并表明尚不清楚Nassim是实际阅读论文还是只是看结果表。

在深入探讨更详细的信息之前，我想介绍一下Nassim分析中最明显的错误（遗漏）。丹麦口罩研究的主要目的是测量治疗（口罩）和对照组（无口罩）之间的SARS-CoV-2感染率。

但是，还有一个次要目标，那就是测量其他11种呼吸道病毒的感染率。对于这些其他呼吸道病毒，面罩组发生9例（0.5％），对照组中发生11例（0.6％），这表明两组均无优势。即使Taleb表明口罩在限制SARS-CoV-2感染方面是有效的，他也必须得出结论，口罩对其他呼吸道病毒没有影响。

在本节中，我将总结研究结果。这篇论文很短，并且没有太多的技术术语，因此大多数感兴趣的读者都可以使用。如前所述，主要目的是比较两组之间的SARS-CoV-2感染率。

日期-两个（大约相等）重叠的队列-2020年4月14日至5月15日以及2020年4月24日至6月2日。

附着力-建议的口罩比例为46％，推荐的口罩比例为47％，不推荐的口罩比例为7％

SARS-CoV-2感染率-面罩和对照的感染率分别为42（1.8％）和53（2.1％）-差异无统计学意义

“完全按照指示”戴口罩的人员的SARS-CoV-2感染率— 1100名参与者完全按照建议戴口罩，但感染率略高，为2％

其他呼吸道病毒-测试了其他11种呼吸道病毒。面罩vs对照分别为9（0.5％）和11（0.6％）

PCR-在大多数国家/地区，使用鼻拭子样本进行的最常用测试

对我来说还不是很清楚，但是似乎所有参与者都在没有监督的情况下自己进行了抗体测试。抗体测试结果通过每种抗体的单行存在（或不存在）来显示。参与者自己进行了鼻拭子，并送去进行PCR测试。这种自我测试和自我报告本身对我来说可能是错误的根源，但这还另当别论。

据报道，面罩组共感染42例，对照组53例。识别这些感染的测试如下：

请注意，总的阳性测试结果之和不等于42和53。例如，在面膜组中，我们的值为31 + 33 + 0 + 5 =69。这是因为可以同时检测两种抗体的阳性结果。除去PCR（0）和医院诊断（5），我们得到37位独特的人的抗体检测呈阳性。一些基本的集合属性显示，有27个人对这两项检测均为阳性，仅IgM检测为4，IgG仅检测为6。

在对照组中，有38个独特的个体对抗体均呈阳性，其中31个对两者均呈阳性，仅6个IgM呈阳性，仅1个IgG呈阳性。 Taleb误读了表格，认为总数（42和53）全部来自抗体测试。我们将很快看到此错误如何影响结果的重要性。

没有任何测试可以肯定地报告阳性结果确实是阳性结果。测试制造商通常会提供敏感性（测试阳性的感染者比例）和特异性（测试阴性的未感染者比例）。

研究作者为抗体测试的特异性提供了两个值：制造商的99.2％和他们自己的内部验证的99.5％。反转这些百分比可以使您衡量误报的程度，即测试为阳性但实际上并未感染的人。平均这两个特异性，我们得到约0.65％的假阳性率。

尽管此假阳性率似乎很低，但必须根据疾病的实际潜在患病率提出。例如，如果已知在100万人中有1人患有某种疾病，那么假阳性率为0.65％的测试将导致6,500例阳性。假设实际感染的个体在这些阳性中，假设您检测为阳性，那么您是该人的可能性极低（6500分之一）。

在研究的同一时期对献血者进行研究，作者发现约1.9％的丹麦人口被感染。使用这个数字，我们可以估计在抗体测试呈阳性结果的情况下被感染的概率为1.9 /（1.9 + .65）或75％。

我们可以将此概率独立应用于每个抗体测试。仅对于IgM，掩码组中有31个，对照组中有37个。乘以0.75，得出的数字分别为23（1％）和28（1.1％）。对于IgG，我们得到了相似的非显着差异。

Taleb使用1％作为“误报”百分比来计算误报。然后，他从报告的阳性结果中减去对假阳性结果的估计，然后将其加到PCR和医院诊断出的阳性结果中。他还为家庭感染创建了一个变量，因为没有指示在家中戴口罩。他为面具和对照组制作了以下更新的比例。

首先，让我们从上开始注意表的误读。当这些都是所有阳性的数字时，Taleb错误地使用42和53作为抗体阳性。他应该使用37和38（或略去5和15）。使用这些数字（并丢弃家庭感染）可获得18/2392（0.75％）与29/2470（1.2％）的差异，使用卡方检验在统计学上无显着性。使用较小的误报率（例如上方的0.65％）只会使比率更接近。

随意使用1％作为误报率比第一次出现时更容易破坏。如果记录的感染率每组低于24，那么我们将得到阴性感染。此外，如果他使用2.5％的假阳性率，则两组的感染率均为阴性。

更好的估计误报率是使用估计的潜在发生率与误报率的比率，如上一节所述（1.9％至0.65％）。像塔莱布（Taleb）一样，减去假阳性可以导致阴性感染。

塔勒布（Taleb）使用错误率为1％的方程式来获得具有统计意义的结果，但是正如我们刚刚看到的那样，使用正确的计数会使他的结果无效。

让我们看一下PCR引起的感染，这对于面罩组来说是非常低的，而在对照组中是5。 Taleb试图证明这是最强的结果。使用他的假设，由于偶然性，获得此结果不太可能，而且意义重大。

但是，塔莱布（Taleb）假定PCR测试具有100％的特异性，但事实并非如此。使用Taleb减去假阳性方法的假阳性率仅为0.3％会导致对照组5的阴性感染率– 2470 * 0.03。

没有为PCR比较计算任何假阳性，但是对于总病例计算却是错误的。

两组中总共有75名参与者使用抗体测试呈阳性，而PCR仅为5名。 15倍的差异怎么可能？

我不清楚是否每个参与者都接受了抗体和PCR测试，尽管研究中的语言表明确实如此。如果所有参与者都都接受了这两项测试，那么至少其中一项测试必须存在缺陷。考虑到研究人员当时估计有1.9％的人口被感染，应该对抗体测试给予更大的重视，因为75/4862约为1.5％，而5/4862则低于0.1％。

PCR阳性结果的微不足道的数量对我来说非常可疑，表明存在大量假阴性。如果确实所有参与者都经过PCR测试，我想不出为什么人数如此之少的原因。考虑到PCR检测在识别个体不太可能感染他人的死病毒链方面的敏感性，这一点尤其正确。

塔勒布从不解释自己作品中的假阴性。您只需要大约0.2％的假阴性率（每组增加5个案例）就可以消除之前计算的任何显着性。

该研究的次要结果是使用PCR试验测量两组之间其他11种呼吸道病毒的感染率。这导致面罩组出现9例阳性病例，而对照组则为11例，这一明显无意义的结果甚至是Taleb也无法消失。

从我对塔勒布的著作的阅读中，还不清楚他是否真正阅读了完整的研究报告。他的方法似乎与单方面的任务无关紧要，因为他要出去证明这项研究是错误的，并且显然对他有利。下面，我总结了他的工作中发现的所有缺陷：

https://medium.com/dunder-data/nassim-talebs-yuuuuuge-mistakes-interpreting-the-danish-mask-study-849651dd4012

tags users