原来一半的互联网都有一个叫做“云闪光”的单点故障

2020-07-20 22:01:44

周五,当Cloudflare显然笨手笨脚地更新了一次路由更新,并将他们所有的全球流量发送到一个POP,几乎立即将其蒸发时,互联网上的大部分内容都停止了广播。

这影响了他们的DNS服务,当然,每个人都知道,当您的DNS消失时,您也会消失。至少还有一家商业DNS提供商在他们自己的命名服务器面前使用Cloudflare来缓解DDoS,他们也停播了。

我们熟悉Cloudflare为DNS提供商提供的DDoS服务,因为我们自己也在使用它。幸运的是,easyDNS没有受到停机的影响(我甚至没有注意到它,TBH),而且我只是在当天晚些时候才听说过这件事,当时我在社交媒体上查看了一下,看到了所有关于“半个互联网被炸毁”的议论。

EasyDNS没有受到影响,因为虽然我们确实使用Cloudflare来吸收针对我们的名称服务器的大型DDoS攻击,但我们并不在所有的名称服务器上使用它们。我想我在书中的某个地方写过“DNS提供商对SPOFs近乎病态的厌恶”(Single Point Of Failures)。也许只有我们知道。

这就是为什么每当世界上最大的DNS提供商之一引爆自己,或者让DDoSed停播时,我们很快就会指出两件事:

这是不可避免的,是不可避免的,也是完全可以原谅的。每个人都会爆炸,每个现存的DNS提供商都会经历停机。没有例外。

当您的DNS提供商崩溃时,有一个避免您自己停机的灵丹妙药,那就是使用多个DNS提供商。

在easyDNS,我们从这一现实中经历了如此多的痛苦,以至于我们创建了一个系统,可以在出现问题的第一个迹象时自动翻转DNS提供商。

我们称它为主动命名服务器,出于某种原因,我们是世界上唯一一家这样做的公司。也许这是因为为了提供像名称服务器故障转移这样的服务,这意味着一家公司必须向其客户承认他们自己的名称服务器在某个时候可能会失败的现实。

多DNS体系结构的两种方法是主动/主动:始终使用多个DNS提供商,或者主动/被动,这是主动式DNS所做的事情。

对于主动/主动,您可以使用我们的easyRoute53集成到Amazon Route 53 DNS等多种方式,因此您只需在一个位置管理您的DNS设置,或者只需在某些带外提供商使用普通老式的辅助DNS。像OctDNS这样的工具可以帮助您跨多个提供商实现自动化(在这一点上,EasyDNS对OctDNS的支持要么现在已经推出,要么正在提交中)。

有关集成和低保真方法的更多信息,请参阅我们的高可用性DNS页面。

同样,在我的书中,即使是单个单播节点在所有其他节点都停止工作的情况下也能让您毫发无损地度过像这样的重大网络事件。

但是,如果您想使用首选的DNS提供商,如Cloudflare,他们会使用其DNS响应来优化您的网站代理。这在大多数情况下效果最好,所以你想要采用主动/被动模式,当事情按计划进行时,它会后退一步,然后当这些周期性的网络灾难真的发生时(他们会发生),它们会填补漏洞,更新你的命名服务器,这样你就至少可以熬夜到危机结束。

使用主动式域名服务器的唯一要求是我们必须是您的注册商,因为我们需要连接到注册表来更新您的域名服务器委派。如果出于某种难以理解的原因,我们不是您首选的DNS供应商,您可以继续使用我们的供应商,只需将您的域名转移到此处即可。(如果您需要的话,我们甚至有一名转机侍从为您做所有的重活)。