#分布式系统

Silent Data Corruptions at Scale(muratbuffalo.blogspot.com)
2021-6-13 0:46
来自Facebook(Arxiv 2月2021)的本文在谷歌故障沉默的腐败执行错误(CEES)纸上被称为最近的最近的工作。这篇论文都讨论了同样的现象。 本文提供了杂志上涉及多年来的CEES的说明。在运行100K机器的广泛静音错误测试场景后,他们发现100多岁的CPU被标识为具有这些错误,显示CEES跨越世代的系统问......
Distributed Systems: A free online class(www.distributedsystemscourse.com)
2021-3-22 12:52
这是分布式系统的介绍性课程。分布式系统是如何构建计算机系统的研究,其中程序的状态划分多个机器(或"节点")。本课程处于积极发展。目前,它由一系列短视频组成。目的是创建一组完整的视频讲座,然后添加其他内容(例如更多项目)。由于我的其他承诺妨碍了,悲伤的进步很慢...... 因为我喜欢教学,我对分布式......
Foundational Distributed Systems Papers(muratbuffalo.blogspot.com)
2021-3-2 6:24
上周,我谈到了阅读基础论文的重要性。作为后续,这是我在分布式系统领域的基础论文汇编。 (我专注于核心分布式系统领域,不涉及网络,安全性,分布式分类帐,验证工作等。我什至没有涉及分布式事务,希望以后再进行介绍。) 我按主题对论文进行了分类,并按时间顺序列出了它们。在每个部分的末尾,我还列出了说明文和博客文章。 ......
2020-12-8 0:35
我经常争辩说,有关分布式系统的最困难的事情正在改变您的思维方式。 以下是我发现有助于激发这些变化的材料的集合。 使您思考设计方式的杂物。 大型服务器,数据库和事务无法解决所有问题。 延迟-新的网络性能瓶颈-根本不是新的(请参阅Patterson),但值得注意 规模化的尾巴-大型系统中处理延迟所固有的延迟挑战 ......
2020-9-12 0:48
不久前,我还对自己的分布式系统知识感到非常满意。我认为,真正需要有人来理解它们,就是透彻地理解paxos协议,并且不愿意按照TLA+的形象重塑您的大脑。也许可以添加少量无冲突的复制数据类型,这样您就知道什么是“最终一致性”。过去,只是一些优化和混搭很容易进入您被TLA+搞得头晕目眩的大脑。 多年来,这一信念被证明是出......
2020-6-10 21:51
这绝对不是21天后学习分布式系统的帖子。我推荐一个有原则的、从头开始学习分布式系统的项目,第一个阶段需要整整三个月的时间,之后需要更多的时间来建立能力。如果你是一个务实的、面向编码的人,你可能不太喜欢我的建议。你可能会反对这样的说法,我不应该通过编码和动手来学习分布式系统吗?为什么我不能从部署Hadoop集群或研究R......