自人类基因组计划启动30年以来,下一步是什么?

2021-01-05 02:12:07

1987年,当研究人员首次使用基因组学这个词来描述新兴的DNA绘图学科时,埃里克·格林(Eric Green)刚完成医学院。几年后,他发现自己从事年轻领域的字幕月球拍摄的前线工作:人类基因组计划。为了领导美国参与全球努力,国会于1989年成立了国家人类基因组学研究所(NHGRI)。

整个人类基因组的测序于次年开始,历时13年完成。不久之后,格林于2009年掌管了该研究所。到那时,NHGRI的任务已经发展到将基因组学领域扩展到医学领域。这意味着要资助和协调旨在查明导致遗传疾病的突变的项目,然后开发测试方法以诊断它们并治疗它们。甚至从更广泛的意义上讲,这意味着产生证据证明DNA数据可以有效地改善结果,即使对于那些没有罕见疾病的人也是如此。

为了帮助规划该路线图,格林的任务之一是定期制定该领域的战略构想。为了庆祝进步,发现技术差距并激发科学家们进行最具影响力的研究领域,他的团队于10月发布了最新的预测。格林和他的同事们首次概述了关于到2030年人类基因组学将会实现的十项大胆预测。其中包括:高中生将在科学博览会上展示基因分析,并在医生实验室展示基因组测试。办公室将变得像基本的血液检查一样常规。

测序竞赛开始后的三十年,我们也许已经到达了早期基因组学时代的终结,这段时期是爆炸性的技术发展时期,它带来了诸如首只狗,鸡和癌细胞的测序以及廉价住房出现的突破。 DNA测试。该领域已经成熟到基因组学几乎在所有生物学领域中都无处不在-从对抗入侵的大黄蜂到酿造更美味的啤酒。基因组医学不再是理论上的。但这也并不普遍。尽管科学家已经绘制了人类基因组图谱,但他们尚未完全了解它。 Green向WIRED谈到了未来十年以及基因组学的下一个时代可能会发生的事情。这次采访经过了长度和清晰度的编辑。

连线:10月是人类基因组计划30周年。当您环顾今天的现状时,它如何符合您对项目对医学的影响的期望?

埃里克·格林(Eric Green):从第一天起我就进入了人类基因组计划,而当时我还不怎么强调我们当时不知道自己在做什么。我们的宏伟目标是读取人类教学手册中的30亿个字母,但我们没有技术来做到这一点。我们没有方法。我们甚至没有功能正常的互联网。没有剧本。因此,作为一名年轻的医生,我可以想象有一天基因组学可能是临床护理的一部分。但是我真的不认为这会在我的一生中发生。

如果我们回溯仅仅十年,就没有人真正在医疗保健中使用基因组学。然后,我们幻想了一个让病人在我们面前的想法,在那里我们不知道他们出了什么问题,并能够对其基因组进行测序并弄清楚。那是2011年的假设。现在已经成为常规。至少对于怀疑患有罕见遗传病的人来说。

太棒了。但是,与人类基因组计划即将完成的一些宣传相距甚远。当时,NHGRI主任弗朗西斯·柯林斯(Francis Collins)在2000年于白宫发表讲话时说,“治疗药物的彻底转变”可能需要15或20年才能实现,并承诺从癌症到精神疾病的所有治疗都应进行个性化治疗。显然,这还没有完全实现。为什么不?

部分原因是基因组信息的复杂性。如果医生准备好使用这些信息,并且患者准备对其采取行动,那么在我们终生医疗的宏伟计划中,投资1,000美元(现行商业化价格)对我们的任何基因组进行测序将是微不足道的。所以我认为这不是问题。问题在于,目前,对于一个健康的人来说,我们不知道该如何处理这些信息。这就是为什么我尚未对基因组进行测序。

不会。因为我们具有生成序列的技术能力,并且质量很高。但是在将数据摆在我们面前与了解数据的含义之间存在巨大的差距。这就是为什么我们的大胆预测之一就是到达一个我们了解每个人类基因的生物学功能的地方。我们正在取得进步,但是数十年而不是几年来衡量进步的可能性更大。

您是否可以指出任何新兴技术,这些技术正在加速缩小差距?

除了今年的诺贝尔化学奖之外,我别无他求。很多时候人们听到Crispr并为人们想到疗法。但是到目前为止,更大的用途是坐在板凳上。借助Crispr,我们可以对从未进入人体内的小片段DNA进行编辑,即进入细胞系或细菌,然后对其进行测试,以查看这些编辑是否具有功能性后果。不断完善的基因组编辑和基因组合成方法的组合,再加上越来越好的计算工具,确实将改变生物学发现的步伐。现在,我们依靠发表的一篇关于一种基因组变异的论文,一次给我们一滴信息。那没有规模。

因此,我们必须达到要进行数百万次更改,生成大量数据的地步,然后希望我们可以使用AI训练计算机来寻找模式。到那时,我们甚至都不需要做实验,因为我们可以根据最近执行的1000次预测突变的含义。展望未来,这些工具可能会有所作为。

在数字化和分析所有生物学数据方面,这听起来像是一大进步。

在我们面临的重大挑战中,至少有一半是计算方面的。这是一个好问题。在某些方面,我们是自己成功的受害者,因为我们消除了测序方面的众多技术障碍,现在最大的障碍是如何处理所有数据。即使在像NIH这样的地方,科学的发展速度也远远超过了我们为其中一些事情做计划的能力。如果我今天能挥动魔杖重组NIH,那将是一家领导数据科学的研究所。目前,我们还没有一个。

好吧,我们现在要反对的是,并不是所有的保险公司都愿意为基因组序列付费。对于患有罕见疾病的人们来说,这是一个问题。在基因检测真正成为主流的癌症世界和产前检测方面,我们取得了更好的成功。今年将有大约600或700万孕妇进行血液检查,以筛查胎儿的遗传缺陷。

另一个是技术吸收不均衡。在斯坦福大学,哈佛大学和贝勒大学,患有罕见遗传病的患者得到测序和诊断的确非常有效。但这在蒙大拿州农村根本无法正常工作。因此,面临的障碍是越来越多的医生不在主要的学术医学中心工作,他们在美国的农村中心地带执业,受过教育并且对基因组医学感到满意。因为我们面临的风险是现有健康差距的进一步加剧。如果只有最富有和最杰出的人才能获得基因组学知识,那将是一场悲剧。这些挑战曾经是假设的,现在已经变得十分现实。

嗯,当然很复杂。这些问题涉及社会的许多方面。但是我们要在2021年做的一件事情是公布一项行动计划,以在研究和临床方面建立一支更多样化的基因组学人才队伍。如果劳动力更加多样化,那么基因组学将在医学中得到更统一的应用。这样就来了。

我们正在支持的其他项目之一是努力获得能够捕获人类全方位多维多样性的参考基因组。我们现在所没有的。如果我们从亚洲中部捕获某个人并对其基因组进行测序,我们希望将其变异与适当匹配的对照组进行比较,以便我们可以评估健康问题背后可能发生的任何罕见变化,或助长患此病的风险。如果我们所要进行的比较只是一个标准参考,就像我们现在所参考的那样,恰好是由欧洲DNA制成的,那确实会产生误导。因此,这种全基因组研究的目标是始终提供可用于医学解释的适当祖先匹配的数据集。实现这一目标也是我们大胆的预测之一。

您提到了基因组学已经成为主流医疗保健的一部分的地方。您认为最难到达哪个角落?

最困难的类别将是预防常见疾病-高血压,糖尿病,心血管疾病,哮喘,自闭症,阿尔茨海默氏病等。我们正在为这些疾病制定多基因风险评分,但我们仍不知道它们的真实预测力如何。即将成为。

因此,这是一种汇总数千分钟遗传变异的微小影响的方法,您可以用来估计某人罹患这些常见疾病的风险。

对。我们有大型计划投资于大型研究,以获取多基因风险评分以进行测试,以了解它们的预测能力以及医疗保健专业人员和患者对获得此类信息的反应。因为另一个大问题是他们是否会移动针头。如果您获得的遗传评分可以告诉您您患高血压的风险更高,而且患有早发性心脏病,例如,这是否会让您注意饮食和运动并少吃盐分?您的医生可能会使用该信息从35岁开始每年为您带来心电图检查,但是您会预约并出现吗?因为这是真正的考验-基因组学是否真的可以改变人们的行为。

基因组学和传染病呢?我已经写过有关国内外努力挖掘基因数据的文章,以更好地理解冠状病毒为何在不同人群中引起如此广泛的症状。您如何看待这个领域,使我们摆脱这一大流行?

这些重大研究确实说明了如今在生物医学中几乎没有问题的地方,基因组学不在其中发挥作用。对于帮助破译人们的遗传遗传对其Covid反应的贡献程度而言,它们将非常重要。

但是我认为人类基因组计划最重要的遗产之一就是它永远改变了科学家共享基因数据的方式。如果您遵循这种大流行的时间表,则该病毒的首次报告是在12月下旬。在此之后的两周内,该病毒的序列已公开发布。

我记得,那实际上是我写的关于冠状病毒的第一个故事-关于它如何真正赢得公共卫生。

是!该序列立即用于测试病毒。这是开发疫苗的第一步,现已证明是有效的。如果您回到人类基因组计划之前的时间,那将是闻所未闻的。研究人员将对病毒进行测序,撰写论文,将其提交发表,几个月后,当论文发表时,他们将释放该序列。

直到我们提出来之前,就是这样做的。他认为,让人们尽早访问不完善的数据比以后再访问完美的数据更好。 许多科学家担心这会破坏他们获得东西信誉的能力。 因此,我们还必须召集期刊编辑和资助人,以使他们创建并执行新的礼节。 这对我们很重要,因为“人类基因组计划”不是传统的科学计划。 我们正在创建社区资源。 因此,我认为基因组学在改变其他一些领域的文化规范(如传染病)方面值得一提。 它最持久的遗产之一是它真正改变了研究规则的方式。