NVIDIA GeForce RTX 3080测试:游戏性能的巨大飞跃

2020-09-17 07:34:13

NVIDIA首席执行官Jensen Huang在几周前大张旗鼓地正式发布了基于该公司安培架构的GeForce RTX 30系列。根据詹森的说法,他拥有的铲子比任何人实际应该拥有的都多,GeForce RTX 30系列代表了该公司历史上最伟大的代际飞跃。在演讲中,Jensen声称GeForce RTX 3080的性能将是其前身的两倍,效率更高,它将在整个设计中采用尖端技术,从芯片封装到PCB,一种新的冷却解决方案,以及GDDR6X内存。在揭开面纱和随后的后续简报之后,我们显然急于拿到GeForce RTX 3080。因此,当它到达时,经过短暂的拆箱和巡视,我们将其安装在我们的测试台上,并立即开挖。在前面的页面上,我们有太多关于安培、GeForce RTX 3080的数据共享,以及NVIDIA和AMD堆栈上的一堆竞争对手。我们在这里松散地使用了“竞争对手”这个词--当你看到数字时,你会意识到GeForce RTX 3080没有任何竞争对手,至少目前是这样。如果您喜欢看视频而不是文字,这里是GeForce RTX 3080快速浏览。然而,尽管这张牌可能很吸引人,但在我们看来,真正的美丽在于基准。我们最好别喋喋不休了,开始谈正事吧.。以上是新的基于安培的GeForce RTX 3080与其基于图灵的前身GeForce RTX 2080和2080 Super之间的详细规格比较。在我们深入研究之前,我们建议先看几篇以前的文章,为今天我们将在这里介绍的产品奠定基础。仔细阅读我们对NVIDIA最初发布的GeForce RTX 30系列产品的报道,以及对其新功能和安培架构的深入研究将是理想的选择。如果你没有时间,我们将在这里再次总结安培的新魔力。正如您在上表中看到的,GeForce RTX 3080在几乎所有方面都比RTX 2080/2080 Super更大、更结实,除了两个例外-RTX 3080具有更少的张量内核和更低的默认升压时钟。然而,GPU额外的资源足以补偿较低的默认升压时钟,而且安培的张量内核提供了两倍以上的吞吐量,并支持其他类型的数学运算。在填充率、内存带宽和计算性能方面,GeForce RTX 3080要强大得多。GeForce RTX 3080核心的GA102图形处理器在其628.4 mm 2芯片中封装了280亿个晶体管,采用定制的三星8 nm工艺(8N)制造。为RTX 2080供电的上一代图灵TA102采用12 nm FinFET工艺,封装的晶体管数量不到一半。所有这些额外的晶体管都被用来增强安培的性能,几乎适用于您可以在GPU上运行的每种类型的工作负载。例如,在图灵之前的上一代架构只有一个数据路径。使用图灵,NVIDIA确实添加了第二个数学数据路径--一个用于浮点,一个用于整数。但是有了Ampere,第二个整数路径进一步增加了一个额外的FP32单元,因此浮点繁重的工作负载有明显更多的可用资源。第二代RT内核也进行了优化,以获得更好的性能。GeForce RTX 3080中的68个RT内核(2080年Super中的48个)提供高达29.8 TFLOPS(图灵为11.2)的着色器性能,RT-TFLOPS高达58(图灵为34个RT-TFLOPS),张量器内核提供高达238个Int8的TFLOPS,而图灵为89。安培的流式多处理器也进行了调整。新的安培SMS将一级带宽和高速缓存分区大小提高了一倍,并将一级容量增加了33%,最高可达8,704KB。此外,安培的第二代RT(光线跟踪)内核可以处理三角形交叉率,速度是图灵的两倍,其第三代张量内核可以将稀疏矩阵(其中大多数元素为零的矩阵)的数学性能提高一倍,并支持更多的数学类型和精度级别。在分析图灵的性能特征时,NVIDIA发现它通常有很好的边界框交叉率,但三角形交叉率却阻碍了事情的发展。有了安培,NVIDIA希望能够并行处理包围盒和三角形交叉率。因此,Ampere将边界框和三角形资源分解为并行运行,随着可用的额外GPU资源的增加,三角形交叉率最终将提高约两倍。安培还添加了一个新的三角形位置插值单元,以帮助产生更精确的运动模糊效果。基于安培的高端GeForce RTX 3080和即将推出的GeForce RTX 3090还采用了美光尖端的GDDR6X内存(下个月将推出的3070使用标准DDR6),可提供明显更高的带宽。GDDR6X使用