订购请求加速磁盘I / O.

2021-04-07 06:22:16

在早期的帖子中，我展示了如何并行访问Data Onan SSD可以大大提高读取性能。但是，该技术对于存储在纺纱驱动器上的数据并不非常有效。在某些情况下，并行AccessCan甚至显着降低了性能。幸运的是，存在一类优化可以强烈帮助HDD：请求订购。通过按照正确的顺序请求数据，磁盘寻求延迟可以减少一个级别。由于我介绍了FCLONES 0.9中的优化，因此FCLONES成为我所知道的最快的重复文件查找器。

与SSD相反的纺纱驱动器具有重要的访问延迟，限制了每秒IO操作的影响，他们可以服务。磁盘访问延迟主要由以下组成：

旋转延迟 - 等待磁盘旋转所需的时间，以便正确的扇区位于头部下方，

寻求延迟更高，距离移动到右轨道的距离越多。制造商广告的典型平均搜索延迟大约是5-12毫秒。平均旋转延迟等于磁盘板的一半匝数所需的时间。在7200rpm驱动器的情况下，这等于60/7200/2 = 4.2 ms。总的来说，总平均延迟可以是大约10毫秒，最坏情况延迟超过20毫秒。

现在，如果我们想处理一堆在磁盘上随机放置的微小文件，我们将在随机顺序中访问它们，我们不应该预计每秒大约100多个（你可能会幸运，那么你的一些文件彼此靠近，可以改善它）。

这个背面的信封计算在现实世界中持续得很好。以下是一个示例iostat输出，同时搜索具有旧版本的fclones（0.8）的Duplicateson A 7200 RPM HDD：

设备TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 127,40 655,20 0,00 3276 0SDB 0,60 0,00 67,20 0 336DEVICE TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 135,00 659,20 0,00 3296 0SDB 26,00 0,00 174,40 0 872DEVICE TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 132,60 669,60 0,00 3348 0SDB 0,40 0,00 8,00 0 40DEVICE TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 127,40 683,20 0,00 3416 0SDB 0,40 2,40 28,00 12 140

我们可以看到每秒交易数量略高于100.这是考虑到SSD可以处理数十甚至每秒数百个随机访问的易易幂。数据速率也基本上通过延迟“杀死”。此驱动器可以连续读取100多MB / s，但在这里我们获得数百千字节的速率。

遗憾的是，即使在2021年，您仍然可能在较旧的HDD上呈现出大量千兆字节。如果您想处理所有这些（例如，搜索，备份或重复申请），那么你是否注定要等待几小时？

在[1]中，作者通过对操作系统进行分类，介绍了一种提高性能的一些好技术，以便执行。我在FCLONES中实施了它们，结果令人惊叹！

最多为0.8版，FCLONES按照其尺寸的顺序处理文件，因为这是从分组的第一阶段获得的orthnaturally。正如您所希望的那样，事实证明，文件大小根本没有与文件的物理位置相关联。因此，HDD上的性能实际上比在从扫描目录树中获得的顺序处理文件。至少，当在目录列表返回的顺序中处理文件时，它们在类似的时间内保存了很高的机会（例如，作为目录复制操作的结果），并且实际上彼此非常接近。事实上，尽管没有真正做出任何特殊速度磁盘访问，但某些替代程序就像FDUPES或RDFind一样表现优于硬盘上的FCLONES。

我尝试的第一个想法之一是通过inode标识来重新排序文件。这很容易，因为inode标识符已经在文件元数据结构中可用，以便正确检测链接。老实说，我并没有期待这种技术的改善，在理论上，文件姓氏的inode数与物理数据位置无关。在实践中，似乎有很多相关性。尽管一些小型增加了分类的成本，但这种技术就像魅力一样。

我们可以做得更好。一些文件系统，如Linux ext4，提供了一个用于获取有关文件扩展名信息的API：Fiemap Ioctl.we可以使用此API获取包含有关文件数据物理放置信息的数据结构。然后，可以使用数据开始的物理放置来对文件进行排序，以便我们可以在单个扫描中处理文件。一个好消息是，这个API也可用于非root用户。

使用Fiemap在Rust中很容易，因为已经有一个铁锈箱为此：Fiemap。 FCLONES代码的相关片段如下所示：

＃[cfg（target_os =＆＃34; linux＆＃34;）pub fn get_physical_file_location（路径：＆amp;路径） - ＆gt; IO ::结果＆lt;选择＆lt; U64＆gt;＆gt; {让mut extents = fiemap :: fiemap（＆amp; path .to_path_buf（））？ ;匹配extents .next（）{一些（fe）=＆gt;好的（一些（fe？.fe_physical）），none =＆gt;好的（无），}}

我最初担心每个文件的额外系统调用都会增加一些初始成本，取消了访问排序的Gains。幸运的是，它证明了成本真的很低 - 50k文件可以在不少于秒的时间内找到范围！我猜这一个事实已经在早期阶段查询了文件的元数据，因此所有的信息都已在缓存中。图2显示了尽管系统呼叫数量越多，但任务的总时间甚至减少到大约19秒！这比早期发布速度超过10倍。

ioStat报告的每秒交易数量和吞吐量也相当于上升。现在在单个磁盘板转动中读取Many文件。

设备TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 2424,40 11605,60 0,00 58028 0SDB 1,00 4,80 11,20 24 56DEVICE TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 2388,20 10436,80 0,00 52184 0SDB 6,60 356,80 38,40 1784 192Device TPS KB_READ / S KB_WRTN / S KB_READ KB_WRTNSDA 2397,00 11188,00 0,00 55940 0SDB 3,20 80,80 56,80 404 284

在介绍重新排序之前，我发现并行发出的请求，以便读取小（4-64 kB）数据的数据提高速度。操作系统肯定会充分利用提前了解某些文件并自行重新排序访问。我们订购读数后仍然是这种情况吗？也许给操作系统提前一点请求仍然可以节省一些时间？我认为该系统可以在技术上工作，而在应用程序仍在处理之前的应用程序时，请执行获取下一个文件。

不幸的是，至少在我的系统上，这似乎不起作用。在并行降级的性能中获取文件一位（图3）。该效果与大文件的顺序访问没有巨大，但足够大，我在FCLONES中更改了0.9.1中的默认值，现在使用每HDD设备单线。

文件I / O请求的顺序对旋转驱动器上的I / O性能产生了巨大影响。如果您的应用程序需要处理一批小文件，请确保以与磁盘上的物理放置相同的顺序请求它们。如果您不能这样做，因为您的文件系统您的操作系统不提供物理块放置信息，请至少由其标识符进行文件。如果您幸运的话，标识符将与数据的物理放置高度相关，并且这种订单仍然会做一些魔法。

如果您尝试过此帖以及您有多大的改进，请在评论中告诉我。 [1] C. Lunde，H.Espeland，H. Stensland和P. Halvorsen，“通过安排用户空间中的I / O操作来改善文件树遍历性能，”2009年12月，第145-152页，DOI：10.1109 /pccc.2009.5403829。

https://pkolaczk.github.io/disk-access-ordering/

tags users