速度摘要6月8日中断

2021-06-09 20:56:01

由于在6月8日通过有效的客户配置更改触发时,我们因未被发现的软件错误而遇到了全球性中断。我们在一分钟内检测到中断,然后识别和隔离原因,并禁用配置。在49分钟内,我们的95%的网络正常运行。

这一中断广泛而严重,我们真的很抱歉对我们的客户和依赖于他们的每个人的影响。

5月12日,我们开始了一种软件部署,引入了一个可以在特定情况下由特定客户配置触发的错误。

6月8日早期,客户推动了有效的配置变更,其中包括触发错误的特定情况,这导致85%的网络返回错误。

这是当天活动的时间表(始终在UTC):

09:47初始上发布的全局中断09:48全球中断通过速度监控确定09:58状态帖子发布10:27速度识别客户配置10:36受影响的服务开始恢复11:00恢复12:00 35事件缓解12:44状态帖子已解决的17:25错误修复部署开始

一旦即时效果减轻了,我们就会注意到修复错误并与客户沟通。我们为错误创建了永久修复,并开始在17:25部署它。

我们尽可能快速安全地将Bug修复部署到我们的网络上。

我们正在进行此事件中的流程和实践的完整后验证。

我们将弄清楚为什么我们在软件质量保证和测试过程中没有检测到错误。

我们已经 - 并将继续创新,并投入对潜在平台的安全的根本变革。广泛地,这意味着完全利用Webassembly和Compute @ Edge的隔离功能来构建从地面的更大的弹性。我们将继续更新我们的社区,因为我们对此目标取得进展。

即使有特定的条件引发了这一停机,我们也应该预料到它。我们提供关键任务服务,我们处理任何可能导致服务问题的行动,以最大的敏感性和优先级。我们向客户和那些依赖于中断的人道歉,并真诚地感谢社会的支持。客户应始终随意发送电子邮件至[email protected]获取更多信息。

我们不时向即将到来的活动,新产品,&amp发送电子邮件;最新的行业趋势,但只有你想要他们。选中该框以同意接收这些消息。

通过提交您的请求,您同意您在美国迅速传输的信息,以便处理与我们的隐私政策一致。