美国天气服务互联网系统摇摇欲坠

2021-04-03 03:07:39

全国天气服务于周二早上经历了一个主要的,系统化的互联网故障,使其预测和警告无法进入公众,并限制其气象学家可用的数据。

停电突出了其信息技术基础设施的系统性,长期存在,该机构因其服务的需求而努力解决,因此该机构仍然只有增加。

除周二早上的停机外,最近几个月的天气服务遇到了众多互联网服务的重复问题,包括:

强迫它提出并实施其客户可以下载的数据量的带宽短缺;

在银色春天,MD中的数据中心洪水剥离了对关键海洋浮标观测的访问;和

对于NWS聊天的多个中断,其用于将关键信息传达给广播公司和紧急经理,依赖于恶劣天气事件。

天气服务的信息传播基础设施的稳定性和可靠性问题返回到2013年至少2013年,当时的气候团伙开始报告该问题。

天气服务正致力于评估和实施解决这些问题的解决方案,这些问题会影响其履行保护生命和财产的使命的能力。

星期二早上的停电意味着天气服务的旗舰网站,天气.Gov已经下降,脱离了进入其预测和警告。

“有一个主要的,国家中断影响NWS产品的分销,”在大学公园,MD的天气服务的天气预报中心推文。

天气服务的中央运营中心在A.M.5:11发布了一款公告。突出全国的失败,其中包括其预测办公室与代理网络“影响产品传播和数据接收”的联系,无法访问的网站,无法访问NWS聊天。

缺乏数据限制了模型数据和观察天气服务气象学家可以用于预测。

气象学家和天气服务成分采取Twitter抱怨中断,许多人注意到其互联网服务的长期问题:

“为什么这样的事情一直在发生?这对此是不可分割的。 NWS的人们不断处理最近几个月的障碍。频率和并发症是关于我见过的绝对最糟糕的最糟糕的最糟糕,“能源行业的休斯顿的气象学家推文Matt Lanza。

“绝对没有适合推特的话可以描述它在2021年的疯狂,地球上最富有和最强大的政府无法让天气预报信息因内部的互联网停用而导致其公民,”推文杰克西林是康奈尔大学的气象学生。

“NWS必须处理的永久技术问题是完全不可接受的。当发生这种情况时,整个国家的响应能力受到破坏,“灾难专家宣传萨曼莎蒙大哥宣传。

“@NWS中断只是我国大量基础设施问题的一部分和包裹。很难想象有意义的气候恢复力,而无需解决我们的字面摇摇欲坠的桥梁,破碎的道路和1995年的数据服务,“北卡罗来纳州的国家气候学家推文·凯利。

“七个小时的NWS中断到恶劣天气季节的高峰.....所以很幸运,这是一个非常安静的夜晚。光纤切割与否,这不是NWS中IT问题的开始或结束。我会在丘斯波斯污染物之前要求国会调查,“伊利诺伊州北部大学气象学教授推文Victor Gensini。

在周二中间,互联网问题似乎得到了解决,但在最近几周和几个月的情况下,天气服务面临的众多其他信息技术问题。

天气服务的聊天系统已被证明是其更不可靠的系统之一,在多种情况下失败,包括危险的恶劣天气情况。

这些问题已经变得如此普遍,不管一个天气服务办公室试图放弃外部计划的NWS聊天,在银春天的天气服务总部举动。

3月15日,伯明翰的天气服务办公室在伯明翰,向媒体合作伙伴发送了一封电子邮件,了解其决定切换到Slack,即时通讯程序,在龙卷风爆发3月17日,释放了近50个扭转者。

“符合公共安全的兴趣,由于我们的控制超出了因素,NWS [伯明翰]将切换到Slack Chat作为我们的实时通信的主要手段,直到稳定,可靠,可靠的备份服务,并具有可靠的备份服务到位,“阅读警告协调气体学家John de块发送的电子邮件。

由华盛顿邮报获得的电子邮件指出,NWS聊天将成为办公室的新备份服务,并为媒体合作伙伴和紧急经理提供了一个注册Slack组的链接,这将在第二天早上播放。

“我们......相信这是我们这个时候为我们所有人的最佳选择,”街区写道。

伯明翰的天气服务拒绝发表对其开关的影响,但从较高升级的指令没有接受的指令不再这样做。

“办事处是提供指导,不采购自己的替代平台。此功能是NWS总部的责任,而不是个别办事处,“在一封电子邮件中写下公共事务苏珊布坎南的天气服务总监。

周四,预测了第二次“高风险”龙卷风爆发,但伯明翰的天气服务被要求利用NWS聊天而不是这次懈怠。

了解沉重的使用会崩溃聊天计划,天气服务预测员恳求受影响地区以外的合作伙伴留下它来节省带宽。

“如果您今天不在严重的WX [天气]风险区域,请不要使用NWSCHAT,”Tweeted Rick Smith,警告协调气象学家在诺曼诺曼,奥卡拉州的天气服务办公室。

Twitter上的许多气象学家回应了史密斯的吸引力,以缓解系统的压力。尽管如此,聊天服务仍然是黑暗的,因为致命的龙卷道风暴在南方旋转。

詹姆斯·斯普班,一位房屋的经验丰富的气象学家,当他覆盖龙卷风的时候遇到了龙卷风,说:“我认为NWS聊天再次下降,”在他的广播中。

乔什约翰逊,另一个受尊敬的阿拉巴马气象学家在李县龙卷风队的储蓄生活中克服了2019年推文,“我们不能使用可靠的NWS聊天平台的事实是令人难以置信的 - 对我们所服务的人来说是危险的。这是2021年。“

NWS聊天也在星期六晚上去了一段时间,因为龙卷风撕毁了阿肯色州,德克萨斯州,密西西比州和田纳西州和致命的闪光洪水吞没纳什维尔。

“我的心爱的NWS聊天,”爱荷华州立大学的系统分析师Tweeted Daryl Herzmann,他们首先帮助发展和实施了NWS聊天。 “我希望我能找到一些帮助他们解决它的机制。 [tens]到目前为止未答复的电子邮件。“

在Buchanan提供的一份声明中,上周描述的天气服务是“间歇性缓慢和临时停用”,承认“我们认识到与当地合作伙伴的重要性和协调的重要性和协调。”

Buchanan将问题归因于“与东南部的恶劣天气相关的网络流量的组合以及3月9日的一个数据中心的丢失,由于在银弹簧中的NWS总部的水管爆裂。”

但德克萨斯大学奥斯汀大学气象学高级讲师特洛伊金梅说,聊天系统不是临时问题,问题已经困扰了许多月份。 “它应该以100%的效率为单位。这是不可原谅的,“他说。 “如果它还没有,这件事会回滚国会询问。”

无法纠正NWS聊天的问题,天气服务,识别其不稳定,正在选择追求其他选择。

“好消息是,今年春天,我们将正式推出一项演示项目,以评估市售,现货产品的可行性,作为NWS聊天的长期更换,”Buchanan写道。 “我们正在努力在短期内提高系统的稳定性。”

天气服务的互联网系统的问题持续多年,部分原因是由于用户的需求越来越多,原子能机构努力满足。

12月份,由于带宽短缺的升级,天气服务建议将用户限制在大量网站上每分钟60个连接。

组成部分抱怨配额,本月早些时候,天气服务宣布它将施加每分钟120个请求的数据限制,而且仅在4月20日开始托管模型数据的服务器上。

“通过这种解决方案,访问所有其他NWS网站不会受到影响,”从天气服务到其合作伙伴的电子邮件。

该电子邮件还表示,该机构打算使用国会拨款资金升级其数据服务器和网络架构。

同时,3月9日,天气服务的银色春天的总部“经历了一个破裂的水管,这导致了重要和广泛的洪水,”该机构在一份声明中表示数据中心。

“一些NWS数据停止流动,包括来自海洋浮标的数据,”声明说,注意到一些浮标被用来“检测和找到可能导致海啸的地震事件”。

尼尔·雅各(Neil Jacobs)负责监督天气服务的国家海洋大气管理局的前代表主管,表示,该机构的许多互联网基础设施问题与他们在内部硬件上运行而不是通过亚马逊Web服务(如亚马逊Web服务)的事实相关联和谷歌云。

“我以书面形式要求NWS过渡这些应用程序......我们的云合作伙伴。这是我制定的内部战略的一部分,“特朗普政府任命的雅各布,在他离开办公室之前在电子邮件中告诉了首都天气帮派。

7月,NOAA发布了其云策略,该策略表示,“我们的数据的数量和速度预计将随着新的观测系统和数据收购能力的出现来呈指数级增长,并对我们的能力进行溢价,以缩放它的资格 支持这种增长的基础设施和服务。 现代化我们的基础架构需要利用云服务作为满足未来需求的解决方案。“