CenturyLink路由问题导致Hulu、Steam、不和谐等发生故障

2020-08-31 02:53:47

CenturyLink和BGP的路由错误导致整个互联网产生连锁反应,导致Cloudflare、Amazon、Garmin、Steam、Discord、Blizzard等众多互联网连接服务中断。

这些停机开始于美国东部时间上午6点左右,当时客户开始报告美国发生了影响CenturyLink服务的大范围停机。

当在Twitter上进行搜索时,突然涌入大量关于暴雪、Steam、Discorde、Roblox、Cloudflare、Hulu、Slink、Reddit、Amazon AWS等连接服务性能不佳或宕机的投诉。

CenturyLink表示,他们的Level3CA3数据中心导致了此次停机,并正在调查此问题。

我们的技术团队正在调查一个影响CA3数据中心某些服务的问题。确保我们服务的可靠性是我们的首要任务。随着事件的进展,我们将继续提供状态更新。如果您需要进一步的支持,请发送电子邮件至[email protected],联系我们CenturyLink';的状态页面状态。

自那以后,停电问题已经得到解决,服务正在缓慢恢复,一些地区需要的时间比其他地区更长。

根据来自受影响客户的大量报告,今天的问题是由CenturyLink的BGP路由问题引起的,在那里他们没有正确地路由互联网的一部分。

为了使Internet正常工作,Internet服务提供商、数据中心和网络提供商通过BGP路由协议通告它们路由和管理的IP地址。

由于这主要是一个基于信任的系统,当大型ISP开始为他们不管理的IP地址范围通告路由时,会导致全球范围的中断和性能问题。

根据客户的报告,CenturyLink似乎在BGP路由中犯了一个错误,这导致了今天的大范围问题。

云主机提供商Cloudhelix今天也遇到了问题,并表示CenturyLink已经确认这是一个BGP问题。

CenturyLink已确认其网络中的路由问题阻碍了BGP会话的正确建立。他们现在已经纠正了问题,随着更新的配置传播到受影响的设备,他们的网络正在稳定下来。Cloudhelix在Equinix LD6工厂的CenturyLink连接继续受到影响。我们将在适当的时候发布另一次更新。

CenturyLink尚未更新其状态消息,也未公开确认这是BGP路由问题。