#gpu

2020-10-11 16:20
让代码在GPU上快速运行需要一种非常不同的方法来使代码在CPU上快速运行,因为硬件体系结构从根本上是不同的。如果您有在CPU上进行高效编码的背景,那么您必须调整一些关于哪些模式是最佳模式的假设。 所有类型的机器学习工程师都应该关心从他们的模型和硬件中挤压性能-不仅是出于生产目的,也是为了研究和培训。在研究和开发中,快......
2020-9-24 17:30
我们距离AMD的rDNA2GPU的发布只有几周的时间了,但固件列表可能过早地暴露了该公司备受期待的Big Navi卡的规格。 一位目光敏锐的Rededitor在新的ROCM(Radeon Open Compute)固件中发现了一份清单,其中显示了所谓的Sienna cichlid GPU-也就是众所周知的Navi 2......
Attacking the Qualcomm Adreno GPU(googleprojectzero.blogspot.com)
2020-9-9 13:10
在编写Android漏洞攻击时,突破应用程序沙箱通常是关键的一步。有很多远程攻击可以让您以应用程序(如浏览器或消息传递应用程序)的权限执行代码,但是仍然需要沙盒转义才能获得完全的系统访问权限。 这篇博客关注的是一个有趣的攻击面,可以从Android应用程序沙箱访问:图形处理器(GPU)硬件。我们描述了高通Adreno......
2020-9-8 3:37
建立数据库连接时出错
2020-7-14 1:16
与计算相关的术语“通用”是一个不断发展的术语。按照今天的标准,过去看起来像通用的ASIC看起来像是有限的ASIC,对于GPU和FPGA也是如此,对于CPU也是如此。 有很多关于通用计算时代已经结束的说法,但我们认为更准确的说法可能是,仅使用CPU计算的时代-CPU是几十年来唯一可用的通用计算引擎-已经结束了。如果通用......
2020-7-13 3:42
下载PDF摘要:传统编译器在单个通用中间表示(IR)上操作。这些IR通常是低级的,接近机器指令。因此,依赖领域特定信息的优化要么是不可能的,要么需要复杂的分析来恢复丢失的信息。相反,多级重写实例化方言层次结构(IR),逐层降低程序,并在最合适的级别执行代码转换。我们展示了这种方法在天气和气候领域的有效性。特别地,我们......
2020-7-8 20:40
南非荷兰语(Af)、阿塞拜疆语(Az)、波斯尼亚语(Bs)、简体中文(Ch_Sim)、繁体中文(Ch_Tra)、捷克语(Cs)、威尔士语(Cy)、丹麦语(Da)、德语(De)、英语(En)、西班牙语(Es)、爱沙尼亚语(Et)、法语(Fr)、爱尔兰语(Ga)、克罗地亚语(Hr)、匈牙利语(Hu)、印度尼西亚语(Id)......
2020-7-8 0:42
机器学习和高性能计算应用程序永远不会以合理的价格获得过高的计算性能。今天,我们很高兴在Google计算引擎上推出基于NVIDIA Ampere A100张量核心GPU的加速器优化VM(A2)系列。单个虚拟机中最多有16个GPU,A2虚拟机是公共云中第一个基于A100的产品,现在可通过我们的私有Alpha计划提供,并将......
2020-6-19 2:40
为了响应大众的需求,微软在2020年5月的构建大会上宣布了Windows Subsystem for Linux2(WSL2)的一个新功能-GPU加速。此功能为许多计算应用程序、专业工具和工作负载打开了大门,这些应用程序、专业工具和工作负载目前只能在Linux上使用,但现在可以按原样在Windows上运行,并受益于G......
Fast 2D Rendering on GPU(raphlinus.github.io)
2020-6-14 8:12
在我寻求在GPU上快速渲染2D矢量图形之前,我已经发布了Piet-GPU更新,并对中间排序架构进行了更深入的探索。这些中间结果显示了希望,但没有达到我对真正高性能2D GPU渲染的愿景。 现在,我很高兴提出一个我相信能够实现这一愿景的架构。性能令人印象深刻,但更重要的是,该体系结构源自原则并建立在通用管道上,而不是服......
2020-6-1 4:39
自从并行RDP重写在世界上发布以来,已经做了相当多的工作。主要与性能相关,并绕过各种驱动程序。 不出所料,发现了一些错误,但与我预期的相比非常少。幸运的是,所有的渲染错误本质上都是微不足道的,并且不需要花费太多精力进行调试。我只能数到3个真正的虫子。要成为真正的错误,必须将问题隔离到并行RDP。不幸的是,核心错误相当......
2020-5-20 6:42
有一篇博客文章更详细地介绍了更大的图景,并介绍了完成这项工作所需的所有部件。它可以在这里获得:https://devblogs.microsoft.com/directx/directx-heart-linux。这封求职信的其余部分将集中在Linux内核位上。概述=这是Microsoft虚拟GPU(VGPU)驱动程序......
2020-5-16 10:43
早在2019年12月,我就打算离家度假。没有他们的游戏机,一个人一周能做什么呢?看书?。狂欢地看Netflix?不。参与的太少了。 来个小挑战怎么样:我能用低于100美元的价格造一台(Linux)游戏机吗?当然,在这样的成本约束下,我不会用新的闪亮部件来建造它。仅限使用过的部件。尽管如此,这还是让我想到,我可以去玩最......
2020-5-6 22:54
微软今天将推出Surface Book 3,承诺比两年多前的前身性能提高50%。这一次没有大的设计变化,仍然会有两种尺寸的选择:13.5英寸的型号或更大的15英寸版本。看不到任何设计调整是令人失望的,但在引擎盖下有一些重要的改变,应该会改善周围的性能。 Surface Book 3将搭载英特尔最新的第10代处理器,基......
Prefix Sum on Vulkan(raphlinus.github.io)
2020-5-2 17:57
如今,在GPU上运行计算工作负载主要有两种方式。一个是CUDA,它有一个非常棒的生态系统,包括高度调优的库,但(实际上)与NVIDIA硬件捆绑在一起。另一种是主要用于游戏的图形API,它们在各种各样的硬件上运行,但在历史上提供的能力比CUDA小得多。此外,那个空间的计算工具也很糟糕。从历史上看,使用OpenCL也做了......
2020-5-2 17:56
最新消息:I/O引擎现已推出!我们已经部分发布了这项工作中使用的源代码。您可以在此处找到英特尔82598/82599网卡的用户级数据包I/O引擎。到目前为止,我们还没有一个明确的发布计划来发布PacketShader代码的其他部分,这些代码还没有在网络上提供。 PacketShader是一款基于PC的高性能软件路由器......