新的非洲基因组:复杂的迁移和强大的选择

2020-10-29 09:53:02

人类起源于非洲,并在那里存在了数万年。要了解我们共同的遗传史,我们必须把目光投向非洲,这是不可避免的。然而,与地球上的其他地方不同的是,非洲人在我们的整个历史上都存在-他们不会像人口扩张到无人居住的地区那样受到同样的创始人效应的影响。取而代之的是,随着群体迁移到非洲大陆的新地区,这些人口被扰乱了。

整理所有这些都将是一项挑战,但由于大多数基因组数据来自工业化世界的人,使得非洲广大人口的样本很少,这一挑战变得更加困难。这种情况正在开始改变,一篇新的论文报道了一个刚刚分析了400多个非洲基因组的小组所做的努力,其中许多来自以前从未参与过基因组研究的人群。

新的基因变异一直在涌现。因此,最古老的人口-非洲的人口-应该有最新的变异。但在人数如此之多的情况下,识别这些人群可能很困难;研究提到,撒哈拉以南非洲有2000多个民族语言群体,其中只有一小部分进行了抽样。这项新的研究是向前迈出的一大步,从地理上分散的人群中获得了400多个完整的基因组序列。但即使在那里,它也是有限的,只增加了50个新的民族语言群体和非洲大陆两个广阔的地区,由来自一个国家的人代表(赞比亚代表中部非洲,博茨瓦纳代表南部非洲)。

也就是说,这项研究仍然发现了大约340万个以前没有描述过的基因变异。这些都是基因组中带有碱基(A、T、C或G)的单一位点,这在其他种群中是没有发现的。

客观地说,我们中的大多数人都携带着大量的基因变异。在这项新研究中的典型个体中,这些新发现的变异只占他们基因组总变异的2-5%,其余的都是以前见过的。此外,绝大多数(88%)只在单个个体中出现,因此可能只代表了在过去几代人中通过突变发生的变异。因此,虽然这里可能有一些新的变种可以帮助我们理清非洲的人口历史,但我们发现的大多数东西都是你在其他地方观察随机人类时所期待的那种东西。

如果我们接近于很好地掌握非洲现有的基因变异,那么当我们在分析中添加新的基因组序列时,我们预计会看到新变异的数量减少,因为每一个新的变异都会增加越来越少的未被发现的变异。因此,研究人员一次分析一个基因组,没有发现这种情况发生的证据--我们仍远未完全对人类多样性进行分类。然而,他们确实发现,将目光投向西非以外的人口,会给我们带来之前未描述的变异的最大增长。

为了试图确定基因组告诉我们关于种群历史的信息,研究人员求助于主成分分析,它在大量数据中确定了差异的主要来源。最大的区别是说尼日尔-刚果语言的人与所有其他语言的人不同。第二大差异反映了西非说尼日尔-刚果语的人与南部非洲人之间的地理距离。这很可能是班图人迁徙的产物,班图人从中西部非洲传播了混合的技术、语言和DNA,把它们带到了非洲大陆的其他地方。

研究人员利用这些数据来辩称,班图移民在前往南部和东非的途中途经赞比亚,但他们的数据包括很多来自赞比亚的人,因此尚不清楚这是否会影响他们的结果。

这项工作还确定了一些民族语言群体,这些群体可能值得更详细地研究。其中一个在基因上看起来像东非人,但位于西非。另外两个群体显然与已知的语言群体有关联,但并不属于大多数其他说该语言的人所属的紧密遗传集群的一部分。

地球上几乎每一个人口都是多种来源的混合体--例如,美洲原住民很大程度上是东亚和古代西伯利亚人的混合体。非洲人当然也没有什么不同,但事实是,他们在同一块大陆呆了这么长时间,增加了这些互动的复杂性。当对不同DNA片段的起源进行分析时,新数据确实让人明白了这一点。

来自非洲最西部的人的大部分DNA来自你所说的西非来源。但是,随着你向东进入中非,你不得不称之为西非-中非DNA的数量在不断增加,这些DNA随后被中非人加入,后来又被中非人取代,然后是少量的南部和东非人。当你离开中非向东移动时,会突然从东非地区转变为多数地区,如果你稍微向南转,南部非洲的贡献就会越来越大。

虽然地理似乎推动了大部分差异,但在所有人口中,都有来自非洲大陆偏远地区的贡献。因此,虽然班图移民可能是非洲近代史上最大的事件,但它是建立在漫长的人口互动历史之上的。

人类基因组中的大多数变异是完全沉默的,因为它们不影响基因或其他功能,因此在种群中随机漂浮。然而,少数基因提供了进化优势,而且有可能检测到选择支持或反对特定变异的信号。

在搜索这些信号时,作者根据过去对人类群体的研究发现了你所期望的东西。人类进化面临的最大压力是疾病,而承受压力最大的基因涉及免疫功能。疾病之后是饮食,同样,非洲人是相当典型的,有强烈的迹象表明选择了少数与碳水化合物和脂肪新陈代谢有关的基因。然而,也有一些奇怪的结果,比如选择了与DNA修复、肾脏疾病和子宫肌瘤相关的基因变体。显然,我们必须更详细地检查这些信息,然后才能从中找出任何意义,或者看看它是否只是假冒的。

免疫功能并不是处理疾病的唯一方法,正如镰状细胞特性对疟疾的影响所表明的那样。而且,这些都是非洲人,有证据表明他们中的一些人选择了这一点。但是血红蛋白并不是抵抗疟疾的唯一途径,一些人群显示出选择了另一种基因(G6PD)的证据。在某些情况下,具有高频率镰状细胞特征的群体最终与其他具有高水平G6PD选择的群体紧挨着,这可能是移民的结果。

除了有明确的选择信号的情况外,还有一些情况是基因因突变而失效,但在这个数据集中的多个个体中仍然存在。这是以前已经多次看到的事情,也遇到了一些困惑。在许多情况下,我们不知道基因的功能,所以不知道我们是否应该对它的丢失感到惊讶。在另一些研究中,根据对其在老鼠身上丢失的研究,该基因实际上似乎是必不可少的。随着时间的推移,我们可能会更接近于了解到底发生了什么,但为了做到这一点,我们必须对这些基因中的每一个进行单独研究。

虽然这代表着理解人类共同的遗传史的一项重大努力,但它更多的是一个序幕,而不是一个完整的故事。我们已经接近捕捉非洲人口的全部多样性,但显然还没有完成。而且,我们已经能够拼凑出更多关于非洲境内一些我们知道但不知道的移民的信息,在这一点上,我们可以推断出我们不知道的任何移民。

后一点相当关键。在这个阶段,我们可以检查一段DNA,并确定它可能起源于,比如说,西非人口。但我们不能太多地谈论它最初是如何在西非结束的。有证据表明,就像欧亚人从尼安德特人那里获得了古老的DNA一样,非洲人也从人类家谱的早期分支中获得了DNA。但是,如果没有对这些分支的化石或基于DNA的描述,它们仍然是我们看不见的幽灵血统。我们目前分配给非洲地区的序列中,有可能有一小部分属于这些分支中的一个,而我们还没有工具来识别它。