NVIDIA安培GA100 GPU支持的特斯拉A100：1PetaOps计算和96 GB HBM2内存

2020-05-14 21:12:51

采用NVIDIA Ampere GA100 GPU的特斯拉A100：全球最大的7 nm GPU、540亿个晶体管、1petaflops计算和放大器，最高可配96 GB HBM2内存。

NVIDIA发布了GA100图形处理器，这是他们的第一款，也是世界上最大的基于其下一代安培图形处理器架构的7 nm芯片。安培的性能是其前身Volta GPU的20倍，开启了高性能计算的新纪元，是世界上第一个为AI/DNN提供每秒1Peta-Ops以上峰值计算能力的GPU。

NVIDIA推出世界上最大的7 nm图形处理器-安培GA100图形处理器-采用540亿个晶体管和高达96 GB的无可争议的最快HBM2内存为特斯拉A100提供动力。

采用下一代安培GPU架构的特斯拉A100是HPC市场上一款令人印象深刻的主板。任何HPC GPU我们首先要谈的是它的规格&安培是一块怪物般的芯片。NVIDIA全力以赴推出了7 nm制程节点，使GA100成为生产中最大的7 nm芯片，但这还不是全部，它也是目前业界最先进、功能最齐全的芯片。

安培GA100图形处理器再次基于尖端的7 nm工艺节点，拥有540亿个晶体管的庞大数量。该芯片预计将封装128个SM单元，相当于总共8192个CUDA内核。仅此一项，核心总数就增加了50%。对于内存，我们将查看指向6144位总线接口的6个HBM堆栈。内存芯片肯定来自三星，三星一直是NVIDIA在以HPC为中心的GPU方面的战略内存合作伙伴。

三星最近发布了其HBM2E DRAM，其芯片容量为16 GB。根据堆栈的高度，NVIDIA可以提供从48 GB(4-hi)到96 GB(8-hi)的任何位置，与现有的最高可达32 GB的特斯拉V100相比，这是疯狂的VRAM数量。HBM2E堆栈还提供高达3.2 Gbps的更高速度，允许高达410 Gb/s带宽或2.5 Tb/s带宽，如果NVIDIA决定采用4.2 Gbps芯片，速度甚至更快，这将为整个芯片带来3.2 Tb/s带宽，这是一项令人惊叹的技术壮举。

在性能方面，安培GA100图形处理器可提供1Peta-ops运算能力，比Volta GV100图形处理器提高20倍。双精度性能比NVIDIA的Volta GV100 GPU高2.5倍，后者最终应该会达到20TFLOPS FP64左右，因为Volta的计算能力约为8TFLOPS FP64。这将意味着单精度性能的额定值超过40 TFLOPS(FP32)，这对于HPC细分市场来说将是令人兴奋的。

NVIDIA的安培GA100还具有一个新的张量运算计算指示器，称为张量浮点32或TF32，它基于第三代张量核心，提供更高的AI/DNN核心输出。张量内核本身也支持双精度计算，这使得GA100 GPU的性能比其前身提高了2.5倍。到目前为止，已经宣布的比赛中没有任何东西能与这头野兽相提并论。

DGX-A100-第一个具有140 Peta-ops计算发货功能的HPC系统，现在售价199,000美元。

最后，NVIDIA将宣布其下一代DGX-A100系统，这是詹森·黄(Jensen Huang)几天前调侃的。DGX-A100配备6个基于安培的特斯拉A100图形处理器，可提供5petaflops的峰值性能。

该系统本身比以前基于NVIDIA的Volta GPU架构的DGX快20倍。参考群集设计具有140个DGX-A100 GPU，具有200 Gbps的Mellanox Infiniband互连。整个系统的起价为199,000美元，今天开始发货。

https://wccftech.com/nvidia-ampere-ga100-gpu-powered-tesla-a100-worlds-largest-7nm-gpu/

NVIDIA首席执行官推出NVIDIA安培架构、NVIDIA A100图形处理器

2020-5-14 21:11

微软发布Surface Book 3，配备第10代英特尔CPU和新的NVIDIA图形处理器

2020-5-7 5:51

微软推出配备新NVIDIA GPU选项的Surface Book 3

2020-5-6 22:54

NVIDIA收购Cumulus

2020-5-5 0:31

tags users