#subgroup

Prefix Sum on Vulkan(raphlinus.github.io)
2020-5-2 17:57
如今,在GPU上运行计算工作负载主要有两种方式。一个是CUDA,它有一个非常棒的生态系统,包括高度调优的库,但(实际上)与NVIDIA硬件捆绑在一起。另一种是主要用于游戏的图形API,它们在各种各样的硬件上运行,但在历史上提供的能力比CUDA小得多。此外,那个空间的计算工具也很糟糕。从历史上看,使用OpenCL也做了......