英特尔推出10nm'ick Lake'数据中心CPU,最多可核心40个核心

2021-04-07 01:29:28

等待已经结束。今天,英特尔正式推出了其10nm数据中心CPU,这是第三代英特尔可升级处理器,代号为冰湖。根据英特尔的说法,通过每个处理器,内置加速和新指令,内置加速和新指令,为AI,HPC,网络和云工作负载提供了重要的性能提升。

除了在上一个Gen Cascade Lake的28到40的核心计数增加外,Ice Lake还提供8个DDR4-3200内存通道(与DDR4-2933的6个通道),最多可支持64个PCIe Gen4每插槽(与48 pcie gen3车道)。通过这些增强功能,以及AVX-512进行计算加速和AI加速度的DL提升,ICE Lake根据英特尔的平均数据中心工作负载和53个平均HPC性能的平均性能提高,而且,冰湖平均为Intel提供了53个较高的HPC性能。在早期的基准测试中,英特尔还展示了冰湖优于最近推出的AMD第三代处理器,代号为米兰,在关键的HPC,AI和云应用程序上。

英特尔副总裁兼HPC Trish Damkroger的副总裁兼总经理突出了进入Sunny Cove核心以及HPC平台增强的工作。 “拥有八个内存通道是内存绑定工作负载的键,并且使用40个核心以及AVX-512,CPU为大量工作负载显示出更大的工作负载,”她说。 DAMKROGER进一步强调英特尔的速度选择技术(SST),可通过处理器频率,核心计数和电源进行粒度控制。虽然在Cascade湖上引入了速度选择,但它以前仅促进了频率的配置,但是用冰湖,有更多的灵活性来动态调整核心计数和功率。

使用英特尔的Optane持久性存储器(PMEM)200系列与传统的DRAM相结合,新的冰湖处理器每套接支持最多6个系统内存(与级联湖和级联湖 - 刷新)支持的4.5特拉布斯。 Optane PMEM 200是Intel的DataCenter产品组合的一部分,其针对新的第三代Xeon平台,以及Optane P5800X SSD,SSD D5-P5316 NAND,Intel Ethernet 800系列网络适配器(每次PCIe 4.0插槽提供高达200gbe),以及公司agilex fpgas。

除了与Gen3相比提供2倍带宽增加的PCIe Gen4之外,冰湖的插座互连速率的插座增加了近7.7%,以改善处理器之间的带宽。

Gen over Gen,Ice Lake提供了20%的IPC改进(28核,ISO频率,ISO编译器),并在一系列工作负载上提高了各种核心性能,下面的滑块(比较8380到8280)。

AVX-512指令的组合(2016年在2016年在现在停产的英特尔骑士登陆PHI上实施)和DDR4-3200内存的8通道对于促进HPC工作负载而言,尤为有价值。使用AVX-512启用,40核,顶-BIN 8380 Platinum Xeon在AVX2上实现了62个Linpack更好的性能。

与前一级级联湖相比,冰湖8380 Xeon在临床上实现了38%的临床表现,在英特尔测试中对流动性能提高了41%的性能,更快的性能更快。

这些改进行业标准基准应用程序反映在地球系统建模,金融服务,制造以及生活和物质科学中的应用代码。下面的幻灯片显示了总共12个HPC应用的改进,包括天气预报代码的性能下降58%,蒙特卡罗的表现提高了70%,在OpenFoam上加速了51%,并对NAMD改进了57%。

Damkroger说,NAMD的57%改善 - 生命科学中使用的分子动力学代码 - 只是开始。英特尔与伊利诺伊州Urbana-Champaign大学的NAMD团队合作,以进一步优化性能,实现2.43倍的Gen-Gen-Gen Performance Boost(143%)。 “这都是因为AVX-512优化,”Damkroger说。

在伊利诺伊大学的Oneapi卓越中心,研究人员正在努力通过使用ONEAPI的开放标准来扩展NAMD来支持GPU架构。 “我们正准备在阿尔冈国家实验室即将举行的奥罗拉超级计算机上更优惠,”伊利诺伊州厄巴纳大学高级研究程序员Dave Hardy说,戴夫哈迪说。

另一个说明性用例来自金融服务,一个由空间和功率限制(例如,在纽约市)困扰的领域,并使用复杂的内部软件。指向Monte Carlo模拟的70%的加速,Gen over Gen,与竞争对手的50%(即AMD的7nm米兰CPU),Damkroger表示,增长可归因于冰湖L1和L2缓存大小,八个更快的内存频道,以及AVX-512指令。她表明,更优化的结果将在路上。 “老实说,我们刚刚在一周前迈出了我们的米兰零件,”Damkroger说。 “我们有罗马的所有信息,但我们显然正在为最新竞争进行这些比较。”

英特尔已经拥有米兰零件,足够长,可以进行一些早期竞争的基准。下面的幻灯片(在媒体前一周内的媒体前介绍期间共享的英特尔)显示了HPC,云和AI对顶部冰湖部分(40核)的性能比较,而顶部AMD EPYC米兰部分(64核)套接字配置。根据英特尔的测试,Ice Lake在Linpack上表现出18%的米兰,在NAMD上的27%,蒙特卡罗(如上所述)上的50%。

在AMD的EPYC米兰发射后,即将到三周,英特尔冰湖发射坑三孔孔对抗第三届欧洲央行。 “英特尔的定位访问AMD肯定比以前更好,”Intersect360 Research的首席研究官丹老年说。 “我认为这可能是为客户折腾;它将取决于他们的工作量,它会像往常一样取决于价格表现,而在今天的发射之前,它是一个奠定了挑选的amd,它不再是。看着英特尔的基准[Gen over Gen],WRF较高近60%,Monte Carlo高出70%,Linpack增长38%,HPCG高出41% - 现在这是显着的,HPCG是酷刑测试。“

“我们必须看看现实世界头脑与AMD一起发生的事情,”Olds说:“但这将英特尔恢复在一个坚实的地方。从一代到生成的50%是一个大问题。这不是摩尔定律,但它非常坚实。“

Hyperion Research Steve Conway的高级顾问告诉HPCWire,“英特尔X86很容易在全球HPC市场中的主导处理器类型。”研究公司的研究表明,英特尔X86可能在预测期结束时仍然占主导地位。

“基于宣布的基准,冰湖看起来像一个令人印象深刻的技术进步,”康威说。 “我们将更多地知道挑战现实世界应用的结果。英特尔也对AMD进行了定价挑战,因此了解可比的SKUS比较的价格如何。最重要的冰湖利益是,它旨在有效地提供既有建立和新兴的HPC市场,尤其是AI,云,企业和边缘计算。这是未来成功的关键。“

Supermicro的高级副总裁Vik Malyala领先地区应用工程,告诉HPCWire,他们的客户渴望PCIe Gen 4和冰湖中提供的更高核心密度。 “对于我们的客户来说,在最长的时间内为英特尔架构进行了优化了许多工作负载。这就是我们许多客户愿意等待的原因,而不是跳到替代产品,“他说。

“AMD确实有一个流程优势,所以我们不应该低估,”马拉拉说。 “但与此同时,我兴奋的是它们都提供了良好的表现。而且客户实际上可以选择一个平台,而不是因为某些东西不可用,但两者都是可用的,所以他们实际上可以尝试一下,看看哪一个适合他们的预算中最好并符合他们的应用要求。“

对于人工智能空间,英特尔表示,冰湖可以提供比上一代的图像分类更多的AI推理性能,而且可以为图像识别提供高达66%的提升。对于语言处理,冰湖在批量推理Gen-Gen上提供74%的更高性能。在Resnet50-V1.5上,使用FP32相比,新CPU通过Intel的DL Boost功能使用Int8提供了4.3倍的性能。

“AI和HPC的融合正在成为现实,客户很激动,第3届Intel Xeon可扩展处理器使动态可重构的数据中心能够支持各种应用程序,”共享英特尔的Nash Palaniswarmy与HPCwire的电子邮件交换机。 “我们最新的3RD Gen Xeon可扩展的处理器是AI工作负载的强大,与我们的40核心CPU相比,通过我们的竞争对手的64个核心部分提供了高达25倍的图像识别性能,”惠普副总裁兼惠普副总裁兼总经理帕拉尼斯瓦马说,数据中心加速器在英特尔的解决方案和销售。

第三代Xeon可扩展处理器还添加了新的安全功能,包括内置安全性的英特尔软件保护扩展(SGX)和英特尔全内存加密(TME),以及用于简化加密算法的简化处理的Intel Crypto加速度。根据英特尔,超过200名ISV和合作伙伴部署了英特尔SGX。

冰湖家族包括56个SKU,分组到10个段(SKU图表图形):13可针对最高的每核可扩展性能(8至40个核心,140-270瓦),10,用于可扩展性能(8至32个核心, 105-205瓦),15个目标四和八个插座(18至28个核心,150-250瓦),有三个单插槽优化部件(24至36个核心,185-225瓦)。对于云,网络,媒体和其他工作负载也有优化的SKU。所有但四个SKU支持英特尔Optane持久存储器200系列技术。

保留用于液体冷却环境,38芯8368Q铂金Xeon拨打标准38核8368的频率,从2.4 GHz到2.6 GHz,从3.2 GHz到3.3 GHz的全核涡轮增长,将基本时钟增加到2.4 GHz。 - 从3.4 GHz到3.7 GHz的涡轮增压器。

在SKU山顶的顶部是8380,具有40个核心,频率为2.3 GHz(基础),3.0 GHz(Turbo)和3.4 GHz(单核涡轮增压器),提供60 MB缓存,在270瓦TDP中。与Cascade Lake 8280相比,8380提供12个额外的核心,并更热65瓦。建议新的8380的客户价格为8099美元,其实际上比8280(10009美元)的清单价格低约19%。

如果计划释放冰湖的多芯片模块(MCM)版本,英特尔尚未公开说,作为56核级联湖-AP部分的后续部分。英特尔可以想象地提供80核的ICL-AP,但是给出了8380的270瓦的动力包络,这可能不可从热角度不可行。

Supermicro的Malyala批准英特尔对特定于分割的Skus的方法以及对堆栈中Optane PMEM的近乎完全支持。 “很多人都有一个级联湖泊和小瀑布湖的人,他们试图弄清楚如何带来所有这些功能以及哪些能够启用。他说,这是一个很多清洁剂,冰湖,“他说。 “有虚拟化SKU,网络SKU,单插槽,长生命周期。通过这种方式提出它可以帮助客户选择并选择,因为现在产品组合已爆炸,对吧?那么人们如何知道哪一个挑选?这在某种程度上在某种程度上得到了特定于分段的SKU,这也有助于我们,Supermicro验证我们的产品。“

在上周举行的介绍前,英特尔表示,冰湖坡道在去年最后季度开始,进展顺利。该公司在2021年的第一季度发货了200,000多个单位,并在50个独特的OEM和ODM合作伙伴中报告了超过250个设计胜利的广泛行业采用,并注意到20多个公开宣布的HPC采用者。

收到迄今为止收到的出货量的知名HPC客户包括LRZ和Max Planck(在德国),Cineca(意大利),韩国气象管理(KMA)以及国家先进的工业科学和技术研究所(AIST), 东京大学和大阪大学(日本)。 第三代Xeon产品现已通过许多OEM,ODM,云提供商和渠道合作伙伴使用。 启动合作伙伴Cisco,Dell,Gigabyte,HPE,联想,Supermicro和Tyan(等)正在推出基于新英特尔CPU的新服务器或刷新的服务器,并且Oracle已在有限预览中宣布由新XEONS支持的计算实例,并以一般可用性为有限预览 2021年4月28日。将在未来的日期和几周内进行更多公告。