回到斯托姆维尔

2020-09-30 16:27:44

不久前,我抱怨英特尔DX79SR Stormville主板行为异常。简单地说,主板简单地拒绝接受第四个内存通道中的任何内存。从那时起,这个故事有了非常有趣的新发展。

我发现另一个关于这些板子的投诉与我的症状完全一致。一开始我错过了,因为它没有提到DX79SR板(它是关于DX79SI/TO的)。简而言之,2011年,英特尔推出了两款基于X79芯片组的主板,DX79SI(Siler)和略微精简且更便宜的DX79TO(Toler)。2012年,DX79SI被具有更多USB 3.0端口和更多6Gbps SATA端口的DX79SR取代。这三个主板都使用相同的PCB、相同的BIOS,并且在大多数目的和目的上都是相同的。因此,他们也会有同样的问题也就不足为奇了。

值得注意的是,在讨论接近尾声时,一位用户声称已经通过拉直CPU插座中弯曲的针脚解决了这样的问题。因为内存控制器在CPU上,所以这不是不可能的,尽管我在Stormville板上找不到任何弯曲的针脚的迹象。

在此期间,我得到了一个相对便宜的DX79TO电路板。这块木板完好无损,看起来像新的一样。它可以毫不费力地使用四个内存通道,具有完全相同的内存和完全相同的CPU,而这些内存和CPU不能在DX79SR板上的第四个通道上运行。

这证明了内存没有问题(这或多或少已成定局),也证明了CPU没有问题(委婉地说,三个或四个随机的LGA2011 CPU以完全相同的方式损坏的可能性并不高)。所以斯托姆维尔董事会一定有什么过错。但怎么做呢?

因为我不能单独呆着,所以我也买了一块便宜的DX79SI(银板)。这块木板被当做破损出售。在它到达后,我没有发现电路板上有任何重大损坏,但它确实有几个针脚在CPU插座上弯曲了。我尽可能地拉直了针脚,插上i7-3820CPU,给电路板加电,它启动得很好。

除了银板和暴风板有完全相同的问题!在第四个记忆通道中没有记忆起作用,再多的恳求也无济于事。在阅读了可能导致第四个内存通道故障的弯曲针脚后,我当然反复检查了CPU插座,但没有发现任何进一步的问题。

所以在这一点上,我有两个几乎相同的电路板,有完全相同的问题,而第三个电路板没有任何问题。在…之前,我已经有两块木板以完全相同的方式被折断。同样的事情再次发生在我身上,我能如此幸运吗?如果是这样的话,我可能应该开始买彩票了。

出于无关的原因,我决定购买几个低功耗的LGA2011 CPU。当一台至强E5-2637(只有80W的TDP处理器)到达时,我把它插到了银板上。它工作得很好。这是一个有趣的CPU,有3.0 GHz的基频,3.5 GHz的涡轮增压,但只有两个内核。

开玩笑的是,我试着把“备用”DIMM插入第四个内存插座。机器启动得很好。它的四个内存通道(4x8 GB RAM)突然没有问题。那件事怎么可能?我所做的就是更换CPU。

但是等等!事情变得更奇怪了。接下来,我将i7-3820CPU放回原位,将内存留在原位。但它还是起作用了。简单地说:i7-3820,第四个内存通道不工作;E5-2637 CPU,第四个内存通道工作;同样的i7-3820 CPU返回,第四个内存通道仍然工作。

事实上,我尝试做了各种事情(包括CMOS存储器重置),试图将DX79SI板恢复到其原始的怪异状态,但失败了。插入随机CPU不太可能神奇地修复电路板上的某种硬件缺陷;但是,如果存在由电路板固件管理的某种状态,那么它隐藏在哪里呢?

如果某些CPU在某些情况下无法与第四个内存通道一起工作,这可能解释了用户尝试各种不同的内存模块,甚至更换一两次主板都无济于事的老故事-因为CPU通常是唯一没有改变的东西。这可能是因为用户尝试了各种不同的内存模块,甚至更换了一两次主板,但都无济于事-因为CPU通常是唯一没有改变的东西。

几天前,我回到了我原来的Stormville冲浪板上。我尝试重复我对银板所做的操作-安装至强E5-2637,将内存放入第四个通道,然后看看发生了什么。

这没什么大不了的。也就是说,机器的行为仍然完全相同,在第四个通道中没有工作(包括在DX79TO和DX79SI板上工作的完全相同的四个内存模块)。

就在那时,我又开始看着Stormville板上的插座。我注意到插座边缘的一根插针终究弯曲了。虽然阵列中间弯曲的针脚很容易被发现,因为它们打乱了规则的图案,但边缘损坏的针脚一点也不突出(边缘不是直线)。这是我在修理DX79SI插座时学到的,它的中间和边缘都有几个弯曲的针脚。

弯曲的针脚几乎肯定是LGA2011插槽上的A37,对应于CPU上的DDR3_DQ[07]接地。注意,这里的DDR3不代表DDR3技术,而是代表第四个DDR内存通道(其他是DDR0、DDR1和DDR2)。

弯曲的A37针脚可能接触到了CPU上标记为VSS(接地)的B36针脚。如果两个管脚真的接触了,这也许可以解释为什么电路板对第三个记忆通道中的任何东西都做出了愤怒的反应。即使引脚没有接触,第三个存储器通道也无法在有效丢失一个数据位的情况下工作。

用精细的镊子,我拉直了Stormville板插座上的针脚,并重新安装了CPU,看看它是否还能用;它确实还能用。然后我添加了第四个内存模块…。看哪,董事会开机了,四个人都开机了!因此,我又添加了4个模块,总共64 GB(支持的最大容量),但DX79SR板仍然正常工作。谜团解开了!

我99%确定DX79SR Stormville板上的问题是由弯曲的针脚引起的。我不太确定的是什么导致了DX79SI银线板上的问题。仅仅凭运气换掉CPU就能修复弯曲的针脚吗?根据DX79SR的经验,我认为这比CPU更改引发一些固件设置副作用更可信。

或者更准确地说,更改CPU会更改BIOS设置是完全可信的(因为确实会更改),但完全清除BIOS设置不太可能不会恢复原来的行为。

此外,随机找到两个症状完全相同但根本原因完全不同的近乎相同的主板似乎不太可能。更可信的是,它们的两个针脚都弯曲在同一区域,而这些针脚恰好连接到第四个存储通道。

那么,2012-2013年间最初的英特尔DX79内存投诉是否全部或大部分是由针脚弯曲引起的?据报道,至少有一人是这样的。如果是这样的话,那么LGA2011插槽肯定比人们想象的更容易受到这个问题的影响。很可能有些人真的有不兼容内存的问题,但我发现了几个用户遇到与我完全相同的问题的情况,而且不是内存(或CPU),而是特定的主板插槽造成了问题。

无论如何,我非常肯定我的DX79SR Stormville问题是由一个弯曲的针脚引起的,它“只是”导致第四个内存通道变得不可用,但并没有以其他方式阻止电路板工作,实际上运行得相当快和稳定,正常运行时间可达数周。

对LGA插座的轻微损坏真的很鬼鬼祟祟的。我没有让LGA775插座发生这种情况(至少不是故意的),很可能是因为LGA775的物理尺寸要小得多,因此损坏的可能性较小。LGA2011的插座要大得多,因此,即使小心操作,损坏插座也更容易。

我也更习惯于基于管脚的CPU,它们根本没有这个问题。CPU引脚很容易目视检查,如果超过非常轻微的弯曲,则根本无法安装CPU。如果CPU可以插入插座,那么引脚就是定义良好的。在LGA情况下,弯曲的针脚不会阻止CPU插入插槽,也可能不会阻止系统启动和大部分工作。

此外,无法正常工作的内存插槽可能是CPU插槽中的电路板损坏造成的,而不是更明显的内存插槽。但我很高兴我的冲浪板现在工作正常!