研究人员产生完整的人类X染色体序列

2020-07-16 06:49:06

美国国立卫生研究院(NIH)下属的国家人类基因组研究所(NHGRI)的研究人员已经制造出第一个人类染色体的端到端DNA序列。今天发表在“自然”(Nature)杂志上的这项研究结果表明,现在可以精确地产生人类染色体的逐个碱基序列,这将使研究人员能够产生人类基因组的完整序列。

“这一成就开启了基因组研究的新纪元,”NHGRI主任、医学博士、博士埃里克·格林(Eric Green)说。产生真正完整的染色体和基因组序列的能力是一项技术壮举,它将帮助我们全面了解基因组功能,并为在医疗中使用基因组信息提供信息。“。

经过近二十年的改进,人类基因组的参考序列是有史以来产生的最准确、最完整的脊椎动物基因组序列。然而,有数百个空白或缺失的DNA序列是未知的。

这些缺口通常包含重复的DNA片段,这些片段很难测序。然而,这些重复的片段包括可能与人类健康和疾病相关的基因和其他功能元件。

因为人类基因组长得令人难以置信,由大约60亿个碱基组成,所以DNA测序仪不可能一次读取所有的碱基。取而代之的是,研究人员将基因组切成更小的片段,然后对每一片段进行分析,一次产生数百个碱基的序列。然后,这些较短的DNA序列必须重新组合在一起。

国家人类基因组研究所(NHGRI)资深作者亚当·菲利皮博士将这个问题比作解决难题。

“想象一下,必须重建一个拼图游戏。如果你处理的是较小的碎片,每一块都包含较少的上下文,以找出它是从哪里来的,特别是在没有任何独特线索的拼图部分,比如蓝天,“他说。“人类基因组测序也是如此。到目前为止,这些碎片太小了,没有办法将基因组拼图中最难的部分拼凑在一起。“。

想象一下,你必须重建一个拼图游戏。如果你在处理较小的碎片,每一块都包含较少的上下文,以找出它来自哪里,特别是在拼图中没有任何独特线索的部分,比如蓝天,人类基因组测序也是如此。到目前为止,这些片段太小了,没有办法将基因组拼图中最难的部分拼凑在一起。

在24条人类染色体(包括X和Y染色体)中,研究作者、加州大学圣克鲁斯分校的Phillippy和Karen Miga博士选择首先完成X染色体序列,因为它与包括血友病、慢性肉芽肿疾病和Duchenne肌营养不良在内的无数疾病有关。

人类有两组染色体,父母各有一组。例如,从生物学上讲,女性人类遗传了两条X染色体,一条来自她们的母亲,另一条来自她们的父亲。然而,这两条X染色体并不完全相同,它们的DNA序列会有很多不同之处。

在这项研究中,研究人员没有对正常人类细胞的X染色体进行测序。取而代之的是,他们使用了一种特殊的细胞类型-一种具有两条完全相同的X染色体的细胞。这样的细胞比雄性细胞提供更多的DNA用于测序,雄性细胞只有一个X染色体拷贝。它还避免了在分析典型女性细胞的两条X染色体时遇到的序列差异。

作者和他们的同事们利用了可以对DNA长片段进行测序的新技术。他们没有准备和分析小片段的DNA,而是使用了一种让DNA分子基本完好无损的方法。然后用两种不同的仪器对这些大的DNA分子进行分析。它们中的每一个都会产生非常长的DNA序列-这是以前的仪器无法完成的。

在以这种方式分析人类X染色体后,菲利皮和他的团队使用他们最新开发的计算机程序来组装产生的序列的许多片段。MIGA的团队领导了填补X染色体上剩余的最大序列缺口的努力,X染色体上大约有300万个碱基的重复DNA,位于染色体的中间部分,称为着丝粒。

对于研究人员来说,没有“黄金标准”来批判性地评估组装这种高度重复的DNA序列的准确性。为了帮助确认生成的序列的有效性,Miga和她的合作者执行了几个验证步骤。

“我们以前从未在我们的基因组中实际看到过这些序列,也没有太多的工具来测试我们所做的预测是否正确。这就是为什么让基因组学界的专家参与进来,确保最终产品是高质量的,这一点很重要。“Miga说。

这项努力是端粒到端粒(T2T)联盟更广泛倡议的一部分,该联盟由NHGRI提供部分资金。该联盟的目标是生成一个完整的人类基因组参考序列。

T2T联盟正在继续努力研究剩余的人类染色体,目标是在2020年产生完整的人类基因组序列。

“我们还不知道我们会在新发现的序列中发现什么。这是令人兴奋的未知发现。这是一个全基因组测序的时代,我们正全心全意地拥抱它。“菲利皮说。

潜在的挑战依然存在。例如,1号和9号染色体有重复的DNA片段,这些片段比X染色体上遇到的片段要大得多。

Miga说:“我们知道我们基因组中这些以前未知的位点在不同的个体之间有很大的不同,但重要的是开始弄清楚这些差异是如何对人类生物学和疾病做出贡献的。”菲利普和米加都同意,增强测序方法将继续在人类遗传学和基因组学领域创造新的机会。

国家人类基因组研究所(NHGRI)是卫生与公众服务部下属的NIH的27个研究所和中心之一。NHGRI内部研究部开发和实施了解、诊断和治疗基因组和遗传疾病的技术。有关NHGRI的更多信息可在www.genome.gov上找到。

美国国立卫生研究院(NIH)是美国的医学研究机构,包括27个研究所和中心,是美国卫生与公众服务部的一个组成部分。NIH是进行和支持基础、临床和转化医学研究的主要联邦机构,正在调查常见和罕见疾病的病因、治疗和治疗。有关NIH及其项目的更多信息,请访问www.nih.gov。