只有十分之一的医疗方法有高质量的证据支持。

2020-09-06 22:20:49

当你去看医生时,你可能会认为他们开的治疗有确凿的证据支持。但你就大错特错了。我们的最新研究表明,只有十分之一的医疗治疗得到了高质量证据的支持。

这项发表在临床流行病学杂志上的分析包括2015年至2019年发表的154篇Cochrane系统综述。只有15人(9.9%)有高质量的证据,按照确定他们提供高质量或低质量证据的金标准方法,称为等级(建议、评估、发展和评估的分级)。在这些研究中,只有两个有统计意义的结果-这意味着结果不太可能是由于随机错误而产生的-并且被综述的作者认为在临床实践中是有用的。使用相同的系统,37%的证据为中度,31%为低,22%的证据质量非常低。

评分系统关注的是偏见风险等问题。例如,“盲法”研究--患者不知道他们正在接受的是实际治疗还是安慰剂--提供了比“非盲法”研究更高质量的证据。致盲很重要,因为知道自己正在接受什么治疗的人比那些不知道正在接受什么治疗的人可以体验到更大的安慰剂效果。

除其他因素外,GRADE还考虑这些研究是否因为治疗方式的不同而不精确。在2016年的综述中,研究人员发现,13.5%-约七分之一-报告治疗得到了高质量证据的支持。根据年级的说法,缺乏高质量的证据意味着未来的研究可能会推翻这一结果。

之所以选择154项研究,是因为它们是对2016年进行的608项系统审查的更新。这使我们可以检查使用新证据更新的评论是否具有更高质量的证据。他们没有。在2016年的研究中,13.5%的人报告说治疗得到了高质量证据的支持,所以随着收集的证据越来越多,治疗质量有降低的趋势。

这项研究有一些局限性。首先,这项研究的样本量可能没有代表性,其他研究发现,超过40%的药物治疗可能有效。此外,研究中的样本还不够大,不足以检查是否有某些类型的医疗(药理学、外科、心理学)比其他类型的治疗更好。也有可能是证据(等级)排名的“黄金标准”过于严格。

许多质量不佳的试验正在发表,我们的研究只是反映了这一点。由于学术界面临着“要么发表要么灭亡”的生存压力,越来越多的研究正在进行。仅在PubMed-一个已发表医学论文的数据库-每年就发表了12000多项新的临床试验。那就是每天发表的30项试验。系统的评论是为了综合这些而设计的,但现在也出现了太多的这样的评论:仅在PubMed上每年就发表了2000多篇文章。

30多年来,循证医学运动一直在鼓吹提高研究质量的必要性,但自相矛盾的是,尽管指南和指导方针激增,但没有证据表明情况有所改善。

1994年,牛津大学(Oxford University)医学统计学教授道格·奥特曼(Doug Altman)恳请减少但更好的研究。这本来是件好事,但却发生了相反的事情。不可避免的是,每年发表试验的海啸,加上为了在学术界生存而需要发表的需要,导致了大量的垃圾被发表,这一点并没有随着时间的推移而改变。

低质量的证据是严重的:没有好的证据,我们根本不能确定我们使用的治疗方法是否有效。

木匠应该只怪他们的工具是最后的手段,所以等级不起作用的借口应该只是谨慎使用。然而,评分制度在某些情况下可能过于苛刻,这可能是真的。例如,任何评估特定运动方案的试验都几乎不可能达到高质量。

锻炼试验不能是“盲目的”:任何正在锻炼的人都会知道他们在运动组,而对照组的人会知道他们不是在锻炼。此外,很难让大群人做完全相同的运动,而让每个人都服用相同的药丸则更容易。这些固有的问题使运动试验被认为是质量较低的,无论安全运动有多有用。

而且我们的方法也很严格。虽然系统评审有许多结果(每个结果都可以是高质量的),但我们关注的是主要结果。例如,止痛药综述的主要结果将是减轻疼痛。然后,他们还可能衡量一系列次要结果,从焦虑减轻到患者满意度。

把重点放在主要结果上可以防止错误的发现。如果我们看一下许多结果,就有可能其中一个只是偶然的高质量。为了缓解这种情况,我们观察了是否有任何结果-即使它不是主要结果。我们发现,五分之一的治疗方法对任何结果都有高质量的证据。

平均而言,大多数在系统评价中经过有效性测试的医疗方法都没有高质量的证据支持。我们需要更少但更好的研究来解决不确定性,这样我们就可以更有信心地相信我们所采取的治疗方法是有效的。