HOPE:高速保序编码器

2020-06-19 06:03:21

HOPE是一个基于字典的快速压缩器,可以对任意字节串进行编码,同时保持它们的顺序。它针对压缩数据库索引键进行了优化。详细描述可以在我们的SIGMOD文件中找到。

我们在此存储库中包含了Wiki和URL数据集的示例。要复制我们论文中的结果,请下载完整的数据集(下载链接在论文中)以替换样本。我们的电子邮件数据集是私有的。您需要提供您自己的电子邮件列表(email.txt)来运行相应的实验。以下是帮助运行完整基准的子集的选项:

选项-r,--REPEAT_TIMES=N运行每个实验N次,并报告平均测量值。默认值:1.--email,--wiki,--url使用email/wiki/url数据集运行基准测试。如果未指定,脚本将包括Wiki和URL实验。--所有数据集都包括所有三个数据集的基准。--ALM包括基于ALM的编码器。默认情况下启用其他编码器(单码、双码、3码、4码)。--surf、--art、--hot、--btree、--prefix btree运行surf/art/hot/B+tree/prefix B+tree基准测试套件。-全部运行完整基准。如果未指定,则该脚本仅运行Wiki和URL的微基准。

上面的脚本将记录";Results/";下的基准测量结果。主绘图脚本位于";脚本/";下。单独的剧本在";Plots/";下面。生成的数字将在";数字/";下。在使用绘图脚本之前,请确保在打开--alm选项的情况下运行基准测试。