Filecoin,Storj和分散存储的问题(2019年)

2021-04-23 04:33:46

FileCoin和Storj等分散的存储服务寻求使用BlockChain标记来破坏数据存储行业,以创建一个竞争力的市场,可以以更低的成本提供更多空间。他们还承诺将合法性的贴面带到初始硬币提供(ICO)空间。在ICOS批量生产的时候,可能会像未注册的证券一样批量生产的稀薄地遮盖,可能会使Howey Test的OFOUS运行,文件存储看起来像是一个实际实用程序令牌的闪亮示例,用于有一些实用程序。而不是投注“更大的傻瓜”理论卸下令牌的下一个人愿意支付更高的价格,这些标记对于一个有用的服务有好处:支付其他人来存储备份。这个博客文章看一些警告并在设计中忽略了问题。

一个良好的起点是消除所谓的隐私优势。分散的存储系统经常宣传他们的隐私优势:数据存储由其所有者加密,使得存储提供商也无法读取它,即使它们想要。这似乎可以改善当前低酒吧,依赖于在一堆IPO股票上宣誓发出的服务提供商,这是Pinky-Promise,他们从未浸入客户数据进行业务优势,更常见的承诺作为Facebook和Google的示例违反了一再展示。但没有理由从根本上改变数据存储模型,以实现对流氓提供者的E2E安全。虽然远离阻力最小的路径,但是替代远程备份服务的历史悠久,例如隐私用户的tarsnap。 (所有17个。)此处的博客帖子已经证明,可以使用vanilla云存储服务来实现带来的云云存储服务,使云服务是存储随机噪声的最荣耀的远程驱动器理解。这些型号比任意,单尺寸适合的所有加密模型更灵活,所有加密模型都被硬编码成商店等协议。用户可以自由地采用其首选方案,与其现有的关键管理模型兼容。例如,对于AWS Storage Gateway,Linux用户可以将云存储作为iSCSI卷用Luks加密,而Windows上可以应用BitLocker-to-Go,以保护该卷完全正确,因为它们会加密USB拇指驱动器。备份很少访问企业中的数据甚至更轻松:没有比脚本到GPG标志和加密备份在将其上传到AWS / Azure / GCP之前的脚本更令人欣然。

一旦我们接受隐私的前提,只有备份服务的差异化因素 - 用户已经可以解决这个问题而不根据服务提供商 - 竞争景观恢复到商品服务的景观。粗略地说,提供商在三个维度上竞争:可靠性,成本和速度。

成本是在给定的时间段内存储每个千兆字节的价格。

速度是指在必要时和较小程度上可以下载数据的快速,在备份过程中可以快速地上载。

可靠性是能够在需要时获取所有数据的可能性。一家公司保留99.999%的客户数据,同时不可逆转地失去剩余的0.001%不会留在商业中。如果服务仅在上午9点至下午4点运行,甚至100%保留率也不伟大。

可以这种方式向分散储存的经济论点进行说明:分散的存储市场非常不太可能提供可以与中集提供商竞争的替代方案 - AWS,谷歌,Azure - 在任何这些维度上测量时。 (当然没有任何东西可以防止亚马逊或MSFT参与分散的市场销售存储,但这将是在区块链中增加摩擦的另一个例子,这些模块可以通过现有频道更有效地完成。)

在三个标准中,成本最简单的预测。以下是Storj网站的音高:

“有未使用的硬盘容量和带宽? Storj在Storj令牌中为您提供未使用的硬盘容量和带宽支付!“

云服务由一个无情的尺度经济统治。这是亚马逊,谷歌,msft和一系列其他云提供商闪耀的地方,从储存能力的数据中心和卑鄙的投资中获益。即使我们忽略了可靠性问题,它也非常不太可能与坐在地下室的一些备用驱动器中的爱好者可能具有较低的,每个千兆字节的成本。

对此批评的标准响应是指出分散的存储可以以零边际成本解锁备用,未使用的容量。返回我们的假设爱好者,他不需要添加新的能力来与AWS竞争。让我们假设他已经拥有已经支付的多余的存储存款,因为这已经支付了未充分利用;只有这么多的空间,您可以占用度假图片。磁盘消耗与1%占1%的99%相同的能量。根据此逻辑,由于用户目前正常获得0美元,因此备用容量的任何值高于零的值是一个很好的协议。在这种情况下,可以实现任何非零价格点,包括甚至削弱最具成本效益的云提供商的价值。我们的爱好者可以暂时启动那些古老的PC,删除数据在世界另一边的人愿意支付保障并在写备份后关闭电脑。当买方来到他们的数据时,设备仍然从墙壁上拔下电阻。

此模型的问题是分散的存储需求远远超过位的惰性存储。他们必须在没有通常的合同关系的情况下实现可靠​​性,即,如果数据消失,您可以申请损坏的人。相反,区块链本身必须强制执行交易中的公平性:仅当它们实际存储委托保障的数据时才获得服务提供商。否则,提供者可以掌握付款,丢弃上传的数据并将那个宝贵的磁盘空间放到其他一些使用中。解决此问题需要加密技术,称为数据证明(PDP)或替代验证。提供者定期通过所承诺的数据运行特定计算 - 只有在仍有100%的数据中仍有100%的数据,并在区块链上发布结果,这又有助于在周期性证据上提供支付条件。因为数据所有者可以观察这些证据,所以他们保证了他们的宝贵数据仍然存在。关键属性是,业主不需要访问原始文件以检查正确性:保留了关于上载数据的小“指纹”。简而言之,这是储存验证的点;如果所有者需要访问整个数据集以验证计算,它将打败外包存储点。

虽然存储证明可以保持服务提供商诚实,但它会破坏所要求保护的经济优势的假设之一:利用闲置能力。一旦我们在定期超过比特并运行加密计算时,存储架构就不能是从墙壁上拔下电源插头的古代PC。实施储存验证的非零边际成本。事实上,延迟和价格之间存在反比关系。磁带档案坐在架子上,每千兆字节的成本远低于连接到服务器的旋转磁盘。这些权衡甚至反映在亚马逊收费的定价模型中:AWS提供了一个名为冰川的存储层,这些存储层比S3更便宜,但随着时间的延迟而有关访问数据的顺序。需要定期的储存验证恰好是一个型号的一个型号 - 离线媒体聚集在保险库中的灰尘 - 这是削弱大规模集中提供商的最佳机会。

除了经济学之外,还有一个更微妙的问题,验证验证:知道你的数据是否存在,并不意味着您可以在需要时恢复回来。这是下一个博客文章的主题。