与PostgreSQL相比，redis在存储一个巨大的json时有多少钱？

2021-04-18 18:24:11

在歌曲搜索时＆＃39找到一首歌曲，它加载了一些与Amazon.com的联盟链接。（如果您＆＃39;令人叹息的＆＃39;每月降低两位数美元）。在i＆＃39之后，避免过载亚马逊联盟产品API，我询问了他们的API，我将其存储在我自己的数据库中以及一些元数据。然后，下次某人查看歌曲页面时，它可以从我本地数据库中读取。到目前为止和我在一起？

另一种警告是，您可以在价格变化和/或结果变化时当地闲长地存储这些查找。因此，如果我自己的存储结果超过几百天，则我将再次删除并再次获取网络。我目前的实现使用PostgreSQL（通过Django Orm）来存储此内容。该模型如下所示：

Class Amazonaffiliatelookup（模型。模型，TotalCountmixin）：歌曲=模型。 FookEyKey（歌曲，ON_DELETE =模型。级联）匹配= jsonfield（null = true）search_index =模型。 charfield（max_length = 100，null = true）lookup_seconds =模型。 floatfield（null = true）创建=模型。 DateTimefield（auto_now_add = true，db_index = true）修改=模型。 DateTimefield（auto_now = true）

然后，我想，为什么不使用redis这一点。然后我可以使用redis＆＃39; s＆＃34;自然＆＃34;只需将其存放到到期时间即可到期到期，然后我不必担心清理旧的东西。

I＆＃39; m在这个项目中使用redis的方式是a / the cache后端，我已如下配置：

缓存= {＆＃34;默认和＃34; ：{＆＃34;后端＆＃34; ：＆＃34; django_redis.cache.rediscache＆＃34; ，＆＃34;位置＆＃34; ：Redis_URL，＆＃34;超时＆＃34; ：配置（＆＃34; cache_timeout＆＃34;，500），＆＃34; key_prefix＆＃34; ：config（＆＃34; cache_key_prefix＆＃34;，＆＃34;＆＃34;），＆＃34;选项＆＃34; ：{＆＃34;压缩机＆＃34; ：＆＃34; django_redis.com压缩机.zlib.zlibcramper＆＃34; ，＆＃34;序列化器＆＃34; ：＆＃34; django_redis.serializers.msgpack.msgpackserializer＆＃34; ，}，}}

也许不现实但是我在我的MacBook Pro上做了所有这些测试。与postgres（版本11.4）和redis（3.2.1）的连接均在localhost上。

读取是最重要的，因为希望他们发生了10倍，而是几个人可以从以前的保存中受益。

我更改了我的代码，以便它可以从两个数据库中读取，如果它在两者中都发现，请在我＆＃39; ll后来汇总的日志文件中写下他们的时间。结果如下：

这意味着，当聚焦在中位数时，Redis比在阅读这些JSON Blob时比PostgreSQL快16倍。

写作不太重要，但由于我的Django的同步性，触发了一个触发我在＆＃39; t具有的瞬间触发，在XHR请求完成之前必须等待写入。但是，当发生这种情况时，对Amazon产品API的远程网络调用必然会慢得多。结果如下：

这意味着，当聚焦在中位数时，Redis在写这些JSON Blob时比PostgreSQL快20倍。

首先，我仍然是一个PostgreSQL粉丝男孩，无意停止这一点。这些时间比只有个别数据库更多地组成。例如，PostgreSQL速度取决于使SQL的Django orm代码依赖于django orm代码并发送查询，然后将其转换为模型实例。我不知道该比例与实际字节 - 从PG＆＃39; S磁盘时间之间的比例。但我不确定我也不确定。数据库周围的工具是不可避免的，它是对用户的重要事项。

redis和postgresql都是持久和生存的服务器重启和崩溃等，你得到了这么多＆＃34;批量相关＆＃34;具有PostgreSQL的功能如果您需要它们，例如能够获取为某些后处理批处理作业添加的最后10行列表。

我目前使用django＆＃39; s缓存框架，用redis作为它的后端，它是一个缓存框架。它并不意味着是一个持久的数据库。我喜欢这个想法，如果我真的不得不冲洗缓存，虽然对性能有害（暂时）它应该是灾难。所以我认为i＆＃39; ll do在两个数据库中都存储这些json blob。是的，它意味着大约6GB的SSD存储，但它也可能意味着在我的有限服务器上加载更多。额外的RAM使用这一整个博客文章的总和;当然它＆＃39; s更快，如果您可以依赖RAM而不是磁盘。现在我只需要弄清楚我为这件作用的RAM如何以及它是否值得。

我尝试了未经将Django ORM查询转换为每个记录的模型实例。相反，我这样做了：

+从Dataclasses导入DataClass + @ Dataclass +类_Lookup：+修改：DateTime.DateTeme +匹配：list ... + base_qs = base_qs.values_list（＆＃34;修改和＃34;＆＃34; matches＆＃34;） -lookup = base_qs.get（song__id = song_id）+ lookup_tuple = base_qs.get（song__id = song_id）+查找= _lookup（* lookup_tuple）打印（查找.modified）

基本上，让SQL驱动程序＆＃39; s＆＃34;生蟒和＃34;内容通过django orm。 PostgreSQL和Redis之间的旧区别为16倍。新的差异是14倍。

Arakel你是否在pg中掌握了桌子？你使用索引吗？哪种类型的索引？你有没有调整你的数据库？您不能简单地比较内存内存DB和PG的基本配置性能。你需要一些仔细的配置，然后是你最有可能＆＃39; ll获得更好的结果。

Peter Bengtsson Redis ISN＆＃39; t完全配置。也许如果PG更好地配置，则差异将是14倍而不是16倍。他们ann＆＃39; t两者苹果。它＆＃39;两个不同的数据库，具有各个优势和劣势。但是您可以将它们用于非常相似的应用程序，因此它有助于充分了解其特征。

Łukaszbiaływorln＆＃39; t它在psql中优化缓存DAO？基本上你*可以*在不增加我认为的数据层复杂性的情况下，可以获得巨大的perf升压。

Peter Bengtsson整个数据库约为35GB。那个表格，带有JSON Blob的表约为3GB。但是，我可以想到我可以做的一些简单优化，这是使用orm来为我制作sql，但不要打扮它和orm模型实例。

Serge即使REGIS可能是持久的，你仍然可以在崩溃上丢失数据。它不会在写入时立即刷新数据。记在脑子里。

Peter Bengtsson绝对是PG＆＃39; S帽子的羽毛。以及我对依赖的商店依赖*依赖*依赖*的原因。我越来越倾向于使用Redis作为缓存层。

凯尔哈里森我的意思是，Postgre是将此数据存储到磁盘，并读写到磁盘。换句话说，一个持久的数据存储。含义数据将在重启服务重新启动。 Redis是纯粹的内存存储，它读取并写入磁盘。换句话说，它＆＃39; s一个易失利的数据。意味着数据不会在重启服务中存活。他们为两种完全不同的目的服务。 redis纯粹是缓存服务器。所以它受到它当然是它＆＃39; s将疯狂地快速迅速。但嘿，想要更快的东西吗？检查keydB。它＆＃39;叉子的叉子，我相信兼容。但它使用多线程来完成工作，其中redis顽固地停留单线。

Kyle Harrison默认的快照对于一个人呼叫和＃34的默认的快照非常理想。一个应该在高速缓存服务器中存储关键任务数据，希望它＆＃39; ll存活。应该考虑Redis和尤其是Memcached等商店中的数据，并且始终是挥发性的。所有redis都与memcached不同，是由memcached（有条件地）转储它中的一个文件备份。真的，如果你需要你的钥匙来生存和不要关心性能，坚持常规数据库解决方案，它将绝对在那里更安全。

汤姆敦森＆gt; Redis是纯粹的内存存储，它读取并写入磁盘。换句话说，它＆＃39; s一个易失利的数据。意味着数据不会在重启服务中存活这是直截了当的。请参阅https://redis.io/topics/persistence。＆gt;默认的快照对人们称之为呼叫＆＃34;持久性的快照。所以......不要使用默认的快照。

凯尔哈里森＆gt;所以......不要使用默认的快照。你建议................什么？ AOF？在同一页面上链接的东西也将其描述为越野车和不可靠？因为那个＆＃39;这里是redis的唯一选择。持久性根本不是redis＆＃39;力量，简单，简单。它＆＃39; s一个缓存服务器。像一个人一样对待它，每个人都会很开心。不要试图像蒙古一样使用它。

基督徒我不知道为什么你＆＃39;在页面上说，越野车和不可靠，＆gt;＆gt;它没有这么说。事实上，它说它相反说它＆＃39; s＆＃34;更耐用的＆＃34;比快照。我也是，不同意你的坚持只是不是重新的＆＃39;力量。你建造什么样的应用程序？金融记录银行申请？不？我没有这么认为和＃39。大多数数据是短暂的瞬态型数据。 IE。设置点击应用程序的一个部分到下一个。状态类型存储。一旦用户离开或不再在服务再见中使用。它＆＃39; s的数据＆＃39; s没有重要，但需要速度的需求对于良好的用户体验至关重要。然后，在此用例中，Redis与上面列出的RDB或AOF选项非常持久。如果您尝试运行财务记录应用程序，则需要准确的数据商店，那么是Redis WORNN＆＃39; T在符合条件的意义上足够持久。

Neil Goldman你对自己说了Redis没有正确配置。正确配置REDIS需要一个不错的工作量，以持久。否则它不是。

凯尔哈里森你知道，我只想想到一个情景我＆＃39; d甚至希望redis＆＃34;持久和＃34;它＆＃39;是一个很好的服务器，并立即开始将序列化值存储到。建立进入应用程序层的依赖于过期或丢失时刷新该键。对于其他一切，我将关心的是，如果丢失到重启，我会在正常数据库中丢失，可以在正确尊重酸事务。有人勺子可以喂我一些情景，其中_redis_持久性实际上是一个希望的东西吗？什么＆＃39;对于牺牲速度（它＆＃39; s擅长）的角度，特别是如果它＆＃39;对于Redis＆＃39的不可靠;文档要记笔记吗？

Peter Bengtsson是的，它＆＃39;如果你用redis一般用作缓存模式。如果redis被刷新（损坏重启或flulall命令），则将是一个案例，并且它会导致缓存应该保护的后端冲压群。例如，许多Web应用程序使用Redis等内容来存储使用会话cookie值（例如https://docs.djangoproject.com/en/2/ref/settings/#std:setting-session_engine）并失去了缓存会签署每个人都会吮吸。但即使在那里，也有选择，例如Django中的“缓存_db`选项，其中*写入*两者，但是大多数*从缓存中读取*。

Neil Goldman I＆＃39;嗯不是说你是否想久经地使用REDIS，就像你＆＃39;重新比较postgres与REDIS，没有正确地配置REDIS要持久，它不是一个非常有效的比较。同样，我可以＆＃39想到我＆＃39; d更喜欢作为内存中的postgres作为内存中缓存的情况vs redis。

基督徒再次，他们没有注意到任何关于AOF的实际使用情况的错误，而是在生产或报告的使用中没有看到的特定命令？

Marco Ceppi这简直就是＆＃39; t真实。 RedID可以将内存刷新到磁盘并使用该磁盘映像启动。我们在没有太多问题的情况下使用redis和psql进行持久数据存储。写入磁盘是异步过程，通常不会破坏性能，除非它和＃39; s非常大的数据集。

凯尔哈里森哈哈，可悲的是。虽然是热闹的事情吗？我们＆＃39;虽然交换了推文！超级寒冷的家伙

亚伦是两个数据库，填充到相同的大小？如果Postgres通过日志查看更多数据，则可能存在比例差异。还有所做的索引。直速有大量的上下文。

Peter Bengtsson不，他们不是。 PG有大约3GB的数据。 redis只有几百兆字节。主键查找始终索引。

OZZ尼克松荒谬的比较！ Redis是基于RAM ... PG或大多数其他SQL Server是基于磁盘的。

彼得·孟斯森不是真的。 Redis也是磁盘持久性。您将关闭并重新启动服务器的内容丢失了。

OZZ nixon Redis Transactions不完全酸符（原子性，一致性，隔离和耐用性）。如果预期酸性交易，则Redis并不完美合适，不应使用。应在这些方案中使用RDBMS或其他数据库系统。 2019年2月25日，因为redis can＆＃34;刷新到磁盘＆＃34;在后台 - 不会使其成为RDBMS系统。这种技术是他们如何说出＆＃34;磁盘持久和＃34;但是，如果你添加到DB并拉动电源 - 请在数据解析器确认添加 - redis将丢失数据期。现在是Redis Sucks，只是你比较RAM DB VS磁盘DB。

Konstantin Gredeskoul似乎没有完全适合将内存中的数据库（REDIS）进行比较到适当的事务数据库，其中默认配置需要FSCYNC并实际确认将数据写入磁盘（您可以更改这些设置BTW）。他们吃了两个梦幻般的工具，但就像我不使用PostgreSQL作为缓存一样，我可能不会将Redis用作事务性RDBMS。

Peter Bengtsson FSYNC仅适用于写作。我没有使用PostgreSQL作为缓存。它＆＃39; s以非常持久的方式使用。

Morris de Oryx内存中缓存*应该更快，而且这些工具绝对有一个地方。 Redis等工具可以在正确的条件下制作不可用的系统。如果Postgres在V13或V14中添加的存储表中添加了存储器，则会很酷。在这种情况下，除非作品在循环中复合，否则即使是最慢的时间是*难以察觉的*，方式，你的一些结果是＆＃34; 20x更快＆＃34;到计算机，不知不觉地不同于一个人。

Peter Bengtsson数字加起来，它很高兴消除应用程序实际上更多的时候加起来的慢的东西，只要一个电话。

Denique de Nique你的反应问题是人类感知是唯一的因素。另一件需要考虑的是磨削额外10倍或20倍的成本。很多基础设施，特别是云基础设施，对此很敏感。所以即使它是NOSN＆＃39，你也可以通过节省20x计算来节省大量资金。

Konstantin Gredeskoul您可以随时添加内存内文件系统，并在该分区上安装一些PostgreSQL表，如果您想测试PostgreSQL的内存速度。或者您可以启用Delayed_commit，每10秒批量批量为单个FSYNC。然后数字将更靠近redis。

Konstantin Gredeskoul关于依赖Redis的额外点，用于通过许多同步连接支持并发写作并解决可能出现的任何冲突，而Redis是单线程，只能一次处理每个服务器实例的单个命令。因此，REDIS将在一些大量的OPS上达到峰值，然后掉线，阻止所有操作。

彼得腾科逊的优秀点。那些重要的思想和＃39;两个数据库都可以完成这项工作。他们有不同的利弊。这个特殊的博客文章仅仅在其中一个人聚焦了很多：速度。

Joseph Locke我觉得在管道向用户响应之前完成写作是一种不幸的方式处理事情。

Matteo pasquini好的，djago +是什么db工作。 postresql是db的背后，（好的，我＆＃39; m一个粉丝!!）有一个功能Django根本无法管理。寻求PostresQL I＆＃39中的表演。关于＆＃39;在记忆表＆＃39中; PG有，以及其他其他人，准备的交易，我＆＃39;在1TB上的表格找到了很大的好处（PG 9.3，没有分区）......可以redis做到这一点..？它需要TB的RAM ..欢呼声。

Peter Bengtsson神秘的事情是，实际上是RediS侧的＆＃39; T JSON。它＆＃39;是的一个问题。和我的Redis Serializer，在Redis驱动程序中是msgpack。

匿名家伙，你应该向Redis的创造者询问Antirez。让我解释：当Redis持久性就像PostgreSQL时，它具有相同的速度或更慢（写作）。 http://oldblog.antirez.com/post/redis-persistence-demystified.html.

匿名错字：＆＃34; tl;博士; Redis是速度快16倍并阅读这些json blobs。*＆＃34; - ＆gt; ＆＃34; tl;博士;阅读这些json blobs的速度速度快16倍。*＆＃34;

如果您可以尝试SQLite3，则对此感兴趣，因为它可以摆脱所有进程流量，因为它被加载到Python进程中。

Peter Bengtsson哦，是的，这将是整洁的。但这是否意味着如果您使用SQLite3，其整个内存将加载到每个UWSGI Python进程（AKA。工作人员）？

匿名这似乎是苹果和橘子比较。您＆＃39;重新使用Postgres中的JSONB类型，允许您在BLOB中索引和查询特定字段，您的测试似乎正在这样做。更公平的比较是使用Postgres＆＃39;文本类型，或单独的比较，用于使用两者查询特定字段。

Peter Bengtsson是的，它是苹果和橘子，但它们都是你可以用来用于多汁和健康的零食。你不必把苹果变成橙色（或其他方式），而是关于了解苹果的利弊和橘子的利弊。然后，配备了您可以做出明智的决策。

匿名识别的是要记住的，在大多数配置中，我已经看到与postgres的连接是加密的，而那些对Redis Arn＆＃39; t。虽然以下大多数差异可能是由于RAM VS磁盘读/写入。有些可能是由于TLS连接的开销。

泰勒Neely本文缺少真实储存决策的一大约一个重要的细节。 Redis具有特别浪费的存储方法，因为它定期重写所有内容。 Postgres和许多其他系统能够避免经常移动旧数据。持久性担保怎么样？复制要求怎么样？备份努力怎么样？列表继续和打开。＆＃34;更快＆＃34;意味着当您谈论需要低延迟的工作负载与需要高吞吐量的工作负载，意味着不同的东西。连接的KV跳过了很多实际数据库执行的工作。也许那个＆＃39;你真正不需要的工作，但是也许你＆＃39; ll学习后你希望你有它。没有

......

https://www.peterbe.com/plog/redis-vs-postgres-blob-of-json

tags users