NVIDIA安培GA100 GPU支持的特斯拉A100:1PetaOps计算和96 GB HBM2内存

2020-05-14 21:12:51

采用NVIDIA Ampere GA100 GPU的特斯拉A100:全球最大的7 nm GPU、540亿个晶体管、1petaflops计算和放大器,最高可配96 GB HBM2内存。

NVIDIA发布了GA100图形处理器,这是他们的第一款,也是世界上最大的基于其下一代安培图形处理器架构的7 nm芯片。安培的性能是其前身Volta GPU的20倍,开启了高性能计算的新纪元,是世界上第一个为AI/DNN提供每秒1Peta-Ops以上峰值计算能力的GPU。

NVIDIA推出世界上最大的7 nm图形处理器-安培GA100图形处理器-采用540亿个晶体管和高达96 GB的无可争议的最快HBM2内存为特斯拉A100提供动力。

采用下一代安培GPU架构的特斯拉A100是HPC市场上一款令人印象深刻的主板。任何HPC GPU我们首先要谈的是它的规格&安培是一块怪物般的芯片。NVIDIA全力以赴推出了7 nm制程节点,使GA100成为生产中最大的7 nm芯片,但这还不是全部,它也是目前业界最先进、功能最齐全的芯片。

安培GA100图形处理器再次基于尖端的7 nm工艺节点,拥有540亿个晶体管的庞大数量。该芯片预计将封装128个SM单元,相当于总共8192个CUDA内核。仅此一项,核心总数就增加了50%。对于内存,我们将查看指向6144位总线接口的6个HBM堆栈。内存芯片肯定来自三星,三星一直是NVIDIA在以HPC为中心的GPU方面的战略内存合作伙伴。

三星最近发布了其HBM2E DRAM,其芯片容量为16 GB。根据堆栈的高度,NVIDIA可以提供从48 GB(4-hi)到96 GB(8-hi)的任何位置,与现有的最高可达32 GB的特斯拉V100相比,这是疯狂的VRAM数量。HBM2E堆栈还提供高达3.2 Gbps的更高速度,允许高达410 Gb/s带宽或2.5 Tb/s带宽,如果NVIDIA决定采用4.2 Gbps芯片,速度甚至更快,这将为整个芯片带来3.2 Tb/s带宽,这是一项令人惊叹的技术壮举。

在性能方面,安培GA100图形处理器可提供1Peta-ops运算能力,比Volta GV100图形处理器提高20倍。双精度性能比NVIDIA的Volta GV100 GPU高2.5倍,后者最终应该会达到20TFLOPS FP64左右,因为Volta的计算能力约为8TFLOPS FP64。这将意味着单精度性能的额定值超过40 TFLOPS(FP32),这对于HPC细分市场来说将是令人兴奋的。

NVIDIA的安培GA100还具有一个新的张量运算计算指示器,称为张量浮点32或TF32,它基于第三代张量核心,提供更高的AI/DNN核心输出。张量内核本身也支持双精度计算,这使得GA100 GPU的性能比其前身提高了2.5倍。到目前为止,已经宣布的比赛中没有任何东西能与这头野兽相提并论。

DGX-A100-第一个具有140 Peta-ops计算发货功能的HPC系统,现在售价199,000美元。

最后,NVIDIA将宣布其下一代DGX-A100系统,这是詹森·黄(Jensen Huang)几天前调侃的。DGX-A100配备6个基于安培的特斯拉A100图形处理器,可提供5petaflops的峰值性能。

该系统本身比以前基于NVIDIA的Volta GPU架构的DGX快20倍。参考群集设计具有140个DGX-A100 GPU,具有200 Gbps的Mellanox Infiniband互连。整个系统的起价为199,000美元,今天开始发货。