谷歌表示,其周一的多服务中断是由于其帐户验证系统的更新导致系统使用率报告错误

2020-12-19 14:58:13

Google在本周开始时发生了大故障,导致Gmail,云端硬盘和所有其他Workspace应用程序崩溃。如所承诺的,Google现在对停机情况以及为防止将来发生事故将采取的步骤进行了详细说明。

从总体上讲,该问题与更新Google帐户身份验证系统的现有工作有关。随着工作的进行,以前的组件“留在原地”。保留这些较旧的方面会导致使用率为0的错误,但Google设置了宽限期以延迟影响。

该修补程序已过期,并导致自动化系统对错误进行响应,就好像它是真实的一样。由于使用率似乎为0,因此身份管理系统的容量已缩小。尽管进行了安全检查,但这些检查并非旨在解决特定问题。

该问题在太平洋标准时间凌晨3:47开始对用户产生影响,一分钟后,工程师收到了警报。 “工作区应用程序在事件发生期间一直处于关闭状态”,因为它们依赖于受影响的基础架构来确保您已登录,认证并有权查看诸如电子邮件和文档之类的内容。

在04:08,确定了根本原因并找出了可能的解决方法,这导致在04:22禁用一个数据中心的配额强制实施。这很快改善了情况,并在04:27对所有数据中心应用了相同的缓解措施,到04:33时,错误率已恢复到正常水平。

该公司制定了计划,以审查,改进和评估其系统,以防止此类性质的问题。 Google以道歉的方式结束了停机说明:

对于此次事件对客户及其业务的影响范围,我们深表歉意。我们非常认真地考虑任何会影响客户可用性和可靠性的事件,尤其是跨越多个区域的事件。

您正在阅读9to5Google-专家,他们日复一日地发布有关Google及其周围生态系统的新闻。 请务必查看我们的主页以获取所有最新新闻,并在Twitter,Facebook和LinkedIn上关注9to5Google以保持循环。 不知道从哪里开始? 查看我们的独家故事,评论,操作方法,并订阅我们的YouTube频道