#gpu

2020-11-25 17:25
在使用图形时,使用操作系统来简化我们的工作。在我们的实例中,除了其他方面。在本文中,我们将使用VirtIO规范编写GPU(图形处理单元)驱动程序。在这里,我们将允许用户应用程序将屏幕的一部分作为RAM -通常称为帧缓冲区。 我们通过将某些命令发送到主机(设备)来命令虚拟GPU(virtio-gpu)。来宾......
2020-11-16 22:53
追逐一个竞争者已经够难的了。想象一下,在不同但互补的市场上追逐两个不同的公司是多么困难,而这两个竞争对手却在考虑在这两个不同的市场上相互竞争,从而在两条战线上带来更大的竞争压力。 欢迎成为AMD。就像AMD已经推出了两代Epyc处理器,以便与英特尔的至强SPS竞争,并准备推出第三代处理器(在这种情况下,第三代Epyc......
2020-10-24 7:20
这是一个非常早期的项目,旨在使RUST成为构建图形处理器代码🚀🚧的一流语言和生态系统。 编译和运行非常简单的着色器是可行的,核心库的很大一部分也会编译。 然而,许多东西还没有实现:例如,循环和开关还不受支持!这意味着,虽然这个项目在技术上是可用的,但还远远没有准备好投入生产。 #[spirv(entry=";F......
2020-10-23 0:41
TL;DR:在云中模糊化嵌入式软件时,我们是否可以使用GPU获得10倍的性能/美元?根据我们的初步工作,我们认为答案是肯定的! 模糊是一种软件测试技术,它为程序提供许多随机化的输入,试图导致意想不到的行为。它是一项重要的行业标准技术,负责发现许多安全漏洞并预防更多漏洞。然而,很好地模糊化需要时间,并且模糊化嵌入式软件......
2020-10-22 14:38
[1.009621]brcm-pcie fd500000.pcie:主桥/scb/[email protected]范围:[1.009658]brcm-pcie fd500000.pcie:找不到/scb/[email protected]的总线范围,使用[总线00-ff][1.009734]brcm-pcie fd500000.p......
2020-10-21 5:22
目前市场上的大多数四GPU工作站都使用通用机箱。如果您只想要存储组件,但您得到的是一台运行过热并会降低系统速度的机器,那么它就可以工作。这就是Thelio Mega的用武之地。 所有关于散热材料我们设计了Thelio Mega,以确保您的顶级部件发挥最大潜能。它的热量实际上是两个独立的系统,因为我们发现分而治之更有效......
2020-10-21 3:23
加入Not a Monad Tutorial电报小组或频道,讨论编程、计算机科学和论文。那里见! 如果您正在寻找优秀的工程师,请给我发一封电子邮件到[email protected],或者您也可以通过Twitter联系我,电子邮件地址是@Federation iccarrone。 我们生活在一个每天都在创建越来越多的......
2020-10-11 16:20
让代码在GPU上快速运行需要一种非常不同的方法来使代码在CPU上快速运行,因为硬件体系结构从根本上是不同的。如果您有在CPU上进行高效编码的背景,那么您必须调整一些关于哪些模式是最佳模式的假设。 所有类型的机器学习工程师都应该关心从他们的模型和硬件中挤压性能-不仅是出于生产目的,也是为了研究和培训。在研究和开发中,快......
2020-9-24 17:30
我们距离AMD的rDNA2GPU的发布只有几周的时间了,但固件列表可能过早地暴露了该公司备受期待的Big Navi卡的规格。 一位目光敏锐的Rededitor在新的ROCM(Radeon Open Compute)固件中发现了一份清单,其中显示了所谓的Sienna cichlid GPU-也就是众所周知的Navi 2......
Attacking the Qualcomm Adreno GPU(googleprojectzero.blogspot.com)
2020-9-9 13:10
在编写Android漏洞攻击时,突破应用程序沙箱通常是关键的一步。有很多远程攻击可以让您以应用程序(如浏览器或消息传递应用程序)的权限执行代码,但是仍然需要沙盒转义才能获得完全的系统访问权限。 这篇博客关注的是一个有趣的攻击面,可以从Android应用程序沙箱访问:图形处理器(GPU)硬件。我们描述了高通Adreno......
2020-9-8 3:37
建立数据库连接时出错
2020-7-14 1:16
与计算相关的术语“通用”是一个不断发展的术语。按照今天的标准,过去看起来像通用的ASIC看起来像是有限的ASIC,对于GPU和FPGA也是如此,对于CPU也是如此。 有很多关于通用计算时代已经结束的说法,但我们认为更准确的说法可能是,仅使用CPU计算的时代-CPU是几十年来唯一可用的通用计算引擎-已经结束了。如果通用......
2020-7-13 3:42
下载PDF摘要:传统编译器在单个通用中间表示(IR)上操作。这些IR通常是低级的,接近机器指令。因此,依赖领域特定信息的优化要么是不可能的,要么需要复杂的分析来恢复丢失的信息。相反,多级重写实例化方言层次结构(IR),逐层降低程序,并在最合适的级别执行代码转换。我们展示了这种方法在天气和气候领域的有效性。特别地,我们......
2020-7-8 20:40
南非荷兰语(Af)、阿塞拜疆语(Az)、波斯尼亚语(Bs)、简体中文(Ch_Sim)、繁体中文(Ch_Tra)、捷克语(Cs)、威尔士语(Cy)、丹麦语(Da)、德语(De)、英语(En)、西班牙语(Es)、爱沙尼亚语(Et)、法语(Fr)、爱尔兰语(Ga)、克罗地亚语(Hr)、匈牙利语(Hu)、印度尼西亚语(Id)......
2020-7-8 0:42
机器学习和高性能计算应用程序永远不会以合理的价格获得过高的计算性能。今天,我们很高兴在Google计算引擎上推出基于NVIDIA Ampere A100张量核心GPU的加速器优化VM(A2)系列。单个虚拟机中最多有16个GPU,A2虚拟机是公共云中第一个基于A100的产品,现在可通过我们的私有Alpha计划提供,并将......
2020-6-19 2:40
为了响应大众的需求,微软在2020年5月的构建大会上宣布了Windows Subsystem for Linux2(WSL2)的一个新功能-GPU加速。此功能为许多计算应用程序、专业工具和工作负载打开了大门,这些应用程序、专业工具和工作负载目前只能在Linux上使用,但现在可以按原样在Windows上运行,并受益于G......
Fast 2D Rendering on GPU(raphlinus.github.io)
2020-6-14 8:12
在我寻求在GPU上快速渲染2D矢量图形之前,我已经发布了Piet-GPU更新,并对中间排序架构进行了更深入的探索。这些中间结果显示了希望,但没有达到我对真正高性能2D GPU渲染的愿景。 现在,我很高兴提出一个我相信能够实现这一愿景的架构。性能令人印象深刻,但更重要的是,该体系结构源自原则并建立在通用管道上,而不是服......
2020-6-1 4:39
自从并行RDP重写在世界上发布以来,已经做了相当多的工作。主要与性能相关,并绕过各种驱动程序。 不出所料,发现了一些错误,但与我预期的相比非常少。幸运的是,所有的渲染错误本质上都是微不足道的,并且不需要花费太多精力进行调试。我只能数到3个真正的虫子。要成为真正的错误,必须将问题隔离到并行RDP。不幸的是,核心错误相当......
2020-5-20 6:42
有一篇博客文章更详细地介绍了更大的图景,并介绍了完成这项工作所需的所有部件。它可以在这里获得:https://devblogs.microsoft.com/directx/directx-heart-linux。这封求职信的其余部分将集中在Linux内核位上。概述=这是Microsoft虚拟GPU(VGPU)驱动程序......
2020-5-16 10:43
早在2019年12月,我就打算离家度假。没有他们的游戏机,一个人一周能做什么呢?看书?。狂欢地看Netflix?不。参与的太少了。 来个小挑战怎么样:我能用低于100美元的价格造一台(Linux)游戏机吗?当然,在这样的成本约束下,我不会用新的闪亮部件来建造它。仅限使用过的部件。尽管如此,这还是让我想到,我可以去玩最......
2020-5-6 22:54
微软今天将推出Surface Book 3,承诺比两年多前的前身性能提高50%。这一次没有大的设计变化,仍然会有两种尺寸的选择:13.5英寸的型号或更大的15英寸版本。看不到任何设计调整是令人失望的,但在引擎盖下有一些重要的改变,应该会改善周围的性能。 Surface Book 3将搭载英特尔最新的第10代处理器,基......
Prefix Sum on Vulkan(raphlinus.github.io)
2020-5-2 17:57
如今,在GPU上运行计算工作负载主要有两种方式。一个是CUDA,它有一个非常棒的生态系统,包括高度调优的库,但(实际上)与NVIDIA硬件捆绑在一起。另一种是主要用于游戏的图形API,它们在各种各样的硬件上运行,但在历史上提供的能力比CUDA小得多。此外,那个空间的计算工具也很糟糕。从历史上看,使用OpenCL也做了......
2020-5-2 17:56
最新消息:I/O引擎现已推出!我们已经部分发布了这项工作中使用的源代码。您可以在此处找到英特尔82598/82599网卡的用户级数据包I/O引擎。到目前为止,我们还没有一个明确的发布计划来发布PacketShader代码的其他部分,这些代码还没有在网络上提供。 PacketShader是一款基于PC的高性能软件路由器......