男女脑差异:深度学习的证据

2021-05-16 13:09:13

Warning: Can only detect less than 5000 characters

Warning: Can only detect less than 5000 characters

在活化层之后加入汇集层。 CNN中的汇集层总结了相同内核地图中邻近神经元组的输出(Krizhevsky等,2012)。在该层中使用最大池方法。

每个隐藏层的输出是特征映射,其是从输入图像提取到隐藏层的功能。来自上一个隐藏层的输出是下一层的输入。在我们的模型中,第一个隐藏层生成32个特征映射,第二个隐藏层生成了64个特征映射,第三个隐藏层产生了128个特征映射。最后,我们通过线性层将最后128个特征映射到Softmax层的输入,然后从SoftMax层获得最终分类结果。

在我们的模型中,输入x∈{x(1),x(2),...,x(n)},x(i)是第i' s fa值。 Y∈{y(1),y(2),...,y(n)},y(i)是被加工到一个热载体的ITH主题的标签,其中[1 0]代表男人和[0 1]女人。我们使用H(θ,x)来表示所提出的3D PCNN模型。然后我们有:

其中ŷ表示使用样本x上的3D pcnn获得的预测值。

卷积核的权重的初始值是从截短的正态分布中选择的随机值,标准偏差为0.1。我们定义了基于SoftMax Cross熵(Dunne和Campbell,1997)调整这些权重的成本函数:

因此,调整权重值的任务与J(θ,x)作为优化目标成为优化问题,如果分类结果正确,则给出小额惩罚,反之亦然。我们使用亚当梯度下降(Kingma和Ba,2015)优化算法在模型训练中实现这一目标。 ADAM算法中的所有参数都设定为kingma和Ba(2015)推荐的经验值,即,学习率为α= 0.001,对于瞬间估计的指数衰减率均为β1= 0.9,β1= 0.999,ε= 10 -8。

确保在交叉验证中独立培训和测试。交叉验证过程如图2所示。我们实现了一个双环嵌套交叉验证方案(Varoquaux等,2017)。我们将数据集分为三个部分,即80%的数据作为模型训练的培训设置,作为参数选择的验证设置为10%,以及10%作为评估模型泛化能力的测试集。为了消除模型训练的随机误差,我们运行10倍的交叉验证,然后将分类准确性的平均值作为最终结果。

图2.模型培训和嵌套交叉验证。 (a)概述。 (b)10倍交叉验证。

CNN具有优势,它可以自行提取关键特征(Zeng等人,2018C)。然而,这些特征可能难以解释,因为它们是高度抽象的特征。因此,在本研究中,我们仅分析了在第一隐藏层中获得的特征,因为它们是来自灰度FA图像上的卷积的直接输出。在这种情况下,第一层的卷积操作等同于在FA图像上应用基于卷积的内核的空间滤波器。所获得的特征比来自第二个和三个隐藏层的特征不那么抽象。第一个隐藏层中有32个功能。这些特征是最低级别的特征,其可以代表FA图像的结构特征。我们首先计算了每个特征的每个组(MAN与女性)的所有主题的体素值的平均值,然后使用两个样本T检验评估其组级别差异。此外,我们还计算每个功能的熵:

其中P i表示具有I中出现的值的像素的频率。每个特征的熵可能表明在该特征中编码的脑结构的复杂性。我们还对熵结果进行了两个样本的T检验,以探讨男女之间的差异。施加严格的Bonferroni校正对于多个比较,阈值为0.05 / 32 = 1.56×10 -3,以消除杂散的意义。

为了确定哪些脑区可能在与性别相关的脑结构差异中发挥重要作用,我们对每个特定脑区域重复了基于3D PCNN的分类。根据人类脑血钙肿地图集(Fan等人,2016)和48个白质Rois,将每个FA图像分段为246个灰质地区(ROIS),根据ICBM-DTI-81白品标签阿特拉斯(Mori Et) Al。,2005)。然后针对每个ROI获得分类准确性。更高的准确性表明该ROI在性别相关差异中的更重要作用。然后基于不同ROI的分类精度来获得地图,以显示其在大脑中的分布。

为了证明我们方法的有效性,基于基于的空间统计(TBS)和支持向量机(SVM)被应用于我们的数据集作为比较,因为这些是神经影像学研究中的两种流行的数据分析方法(Bach et al。,2014 ; Zeng等人。,2018b)。我们将结果与以下两个条件进行了比较:(1)我们使用SVM作为分类器,同时保持相同的预处理过程,以便将其结果与我们的3D PCNN方法进行比较。我们将每个样本从3D FA矩阵施加到向量中,然后用向量馈送SVM。 (2)我们使用了TBS来识别脑区,其中显示了统计学上有关的性别相关差异。

使用我们的3D PCNN方法在全大脑上的图像中,我们可以通过93.3%的分类准确度进行详细分辨男人和女性。该结果比使用SVM更好,其分类准确性仅为78.2%。

作为比较,我们还使用MD,AD和RD重复相同的分析。 MD的分类准确性为65.8%,广告为69.9%,RD为67.8%。所有这些都低于使用FA获得的分类准确性。

22个男性和女性特征的两个样本T检验的结果表明,有25个功能具有显着性别差异,包括13个功能,女性具有更大的值和12个特征,男人有更大的值(见图3)。有趣的是,男性的熵显着高于女性所有特征(见图4)。

图3. Voxel值中的32个功能之间的组间差异。对每个特征评估每个组中所有受试者的体素值的平均值(条高)和标准偏差(误差条)。使用两个样本T检验检查它们的组级差异。为多个比较校正Bonferroni校正,阈值等于0.05 / 32 = 1.56×10 -3以消除杂散的意义。具有明显较大的男性的平均体值的特征是标有*的,而+的女性的平均体素值具有明显较大的平均体值的特征是指的。

图4.在熵值中的32个功能之间的组间差异。熵值的平均(条高)和标准偏差(误差条)在每个特征中的每个组中都计算在所有主题中计算。它们的群体级别差异是使用双样本T检验推进的。为多个比较校正Bonferroni校正,阈值等于0.05 / 32 = 1.56×10 -3以消除杂散的意义。男性的熵值比女性在特征中显着更大。

TBS在该数据集中无法检测到任何统计上显着的性别相关差异。然而,使用3D PCNN,我们确实在灰色和白数的所有ROI中发现了与所有ROIS的性别相关的差异,因为分类准确性(> 75%)远高于所有ROI的机会水平(50%)。不同ROI的分类精度图如图5所示。补充剂中提供了详细的分类结果(参见白质的灰质和表S2的表S1)。在灰质中,最高分类精度的前5个区域是左翼前(Broadman Area,Ba 31,87.2%),左侧中间体回谱(Ba 1/2/3躯干区域,87.2%),左铰接回物(BA 32个子面积,87.2%),右侧轨道

......