构建人类血液的化学蓝图

2020-11-13 15:01:43

除了氧气和二氧化碳外,我们的血液还运输许多化学物质。其中一些分子为我们的健康状况提供了有用的指标。事实上,测量这些生物标志物是临床血液检测的一个共同特征。其他存在的分子,如荷尔蒙和药物,通过调节新陈代谢和免疫反应等过程直接影响健康。巴尔等人在《自然》杂志上撰文。1阐明了影响人类血液化学酿造配方的因素。

大多数血液传播分子的来源,以及为什么它们在不同个体之间的浓度不同,目前尚不清楚。可能的调控因素清单很长:对于任何给定的分子、饮食、药物、医疗条件和病史,基因变异和肠道微生物都可能起作用。此外,这些因素可以相互作用,就像三甲胺氧化物一样。这种促进动脉狭窄疾病动脉粥样硬化的分子是微生物及其宿主代谢红肉中富含的某些饮食化合物的结果。对于这样直接影响健康的分子,了解它们的代谢调节可能有助于产生新的临床治疗方法。

巴尔等人。描述他们在解决什么因素支配血液中存在的分子这一问题上所做的努力。这项工作不仅需要测量许多可能涉及的变量,还需要使用能够捕捉复杂性的分析方法-例如变量之间的相互作用-同时仍然确保可以对研究人群以外的个人做出有效的预测。

作者首先对一组491名健康人的血液样本进行了非常详细的分析。他们量化了血清中的分子-血液中的液体成分,在凝血所需的蛋白质被去除后仍然存在。研究参与者提供了详细的健康信息,并回答了关于饮食和生活方式的问卷。他们还提供了粪便样本,用于DNA测序,以确定存在的肠道微生物(也称为微生物组)的遗传特征。

正如作者承认的那样,按照全基因组关联研究的标准,这只是一个小研究小组,旨在寻找基因和疾病之间的联系。巴尔等人。也不是第一个将血清分子与遗传变异或微生物组3、4联系起来的人。然而,作者对这组个体的分析在系统收集数据类型以调查血清成分的数量上是独一无二的。

接下来,巴尔等人。使用机器学习方法将人类遗传学和微生物组信息等因素与血液中的分子联系起来。通过忽略不同的数据子集进行了许多分析,作者发现饮食、微生物群和临床变量(如处方药使用和血压)与血清分子的相关性最大。尽管作者发现了一些遗传关联,证实了之前报道的46个基因-代谢物关联,但他们得出的结论是,遗传因素的关联效应小于饮食、临床变量和微生物组的关联效应。这些不同的数据类型并不完全具有可比性,但作者对遗传效应的估计与之前的工作结果是一致的,这为他们的结论提供了支持,即饮食和微生物群对血清成分的影响比遗传因素更大、更普遍。

考虑到饮食会影响微生物群的组成,饮食和微生物群可以预测某些分子的数据,其准确度与预期相似。但巴尔和他的同事表明,这些数据类型也提供了不重叠的信息。例如,饮食信息唯一地预测了与柑橘类水果消费相关的特定代谢物,而属于乳螺科的一种微生物的存在强烈地预测了硫代吲哚的存在,这是一种氨基酸色氨酸的细菌分解产物,以前与肾脏和血管系统疾病有关。

为了预测血液样本中存在的分子浓度,Bar等人进行了研究。使用了一种名为梯度增强决策树的机器学习方法,这种方法可以捕捉复杂的互动。决策树学习简单的“如果-然后”规则来进行预测(图1)。这种方法对单个决策树进行分层,通过训练专门专注于减少旧决策树预测误差的新模型来不断改进它们。

巴尔和他的同事用一种叫做特征-属性分析的方法解释了这些模型。这就产生了关于单个因素(如微生物、食物和基因变异)如何影响特定预测的具体假设,这里指的是血液的分子组成。更复杂的模型可能容易“过度拟合”--根据噪音或不相关的细节做出错误的预测。因此,作者对他们的模型进行了保守的拟合和评估,但更重要的是,他们在两个独立的大型研究小组中证实了他们预测的许多微生物与代谢物之间的联系。最后,巴尔等人。他们在一项规模较小的研究中测试了他们的一组预测,确定了与全麦面包消费相关的分子(胞嘧啶和甜菜碱),然后显示随机分配到吃面包的个体在这些代谢物中有预期的变化。

这项研究是全面的,但仍有很大的探索空间。作者使用经过充分验证和标准化的代谢平台来测量血清代谢物,但没有这样的代谢组学分析方法可以覆盖全范围的血液传播化合物。因此,与其他类型的分子相比,某些类型的分子,如血脂,可能会采样不足。这可能解释了为什么作者大多只检测到与肠道细菌6、7这两个最丰富的谱系中的一个有关的代谢物。代谢组学可以检测到那些分子的特性超出了它们的分子量之外是未知的,实际上,作者报告了与这些未知代谢物的几种关联。尽管这些可能指向以前未知的生物学方面(有趣的是,其中一个关联与参与者的年龄有关),但如果没有代谢物鉴定,我们只能得出有限的结论。

作者的微生物组数据为粪便提取物中存在的所有基因组提供了DNA信息。然而,Bar等人。将这些数据提炼到细菌物种丰度的水平,不包括非细菌,如酵母或原生动物生物体。将分析局限于物种水平也掩盖了这样一个事实,即同一细菌物种的菌株在基因含量上可能不同。例如,Lenta Eggerthella lenta细菌体内药物地高辛的新陈代谢需要一个只存在于某些Eggerthella lenta 8菌株中的基因。最后,作者无法将血清代谢物与负责它们产生的特定细菌酶联系起来,这将有助于将相关联系与潜在的分子机制联系起来。

这些限制不应减损本文最有用的方面。通过向研究界提供完整的数据集,Bar和他的同事可以帮助开发未来的计算方法,潜在地解决其中的一些限制,甚至提供回答新问题的方法。他们的数据可能会为科学家提供丰富而有价值的资源,让他们对饮食、微生物群和遗传学影响我们的生化和生理机制感兴趣。