BackBlaze硬盘驱动器统计数据2020年第二季度

2020-08-18 23:53:38

截至2020年6月30日,Backblaze在我们的云存储生态系统中拥有142,630个旋转硬盘,分布在四个数据中心。其中,有2,271个引导驱动器和140,059个数据驱动器。此回顾着眼于我们数据中心当前运行的数据驱动器型号的2020年第2季度和整个生命周期的硬盘故障率,并在此过程中提供了一些见解和观察结果。我们一如既往地期待您的意见。

在2020年第二季度末,Backblaze使用140,059个硬盘存储客户数据。在我们的评估中,我们从考虑范围中剔除了不超过60个驱动器的驱动器型号(请参见下面的原因)。因此,我们将审查139,867个硬盘。下表介绍了2020年第2季度发生的情况。

2020年第二季度的年化故障率(AFR)为0.81%,而2020年第一季度为1.07%。第二季度的AFR数字是我们自2013年开始跟踪以来任何季度的最低AFR。此外,这是季度AFR首次低于1%。一年前(2019年第二季度),季度AFR为1.8%。

在本季度中,有三个驱动器型号的驱动器故障为0(零):东芝4TB(型号:MD04ABA400V)、希捷6TB(型号:ST6000DX000)和HGST 8TB(型号:HUH728080ALE600)。虽然东芝4TB驱动器记录的驱动器天数不到10,000天,但自2018年第四季度(即54,054个驱动器天数)以来,我们从未出现过该型号的驱动器故障。与东芝驱动器相比,Seagate 6TB和HGST 8TB驱动器的驱动器天数同样令人印象深刻,本季度没有出现故障,但在2020年第二季度分别记录了80、626和91,000个驱动器天数。

有192个驱动器(140,059减去139,867)没有包括在上面的列表中,因为我们没有至少60个给定型号的驱动器。例如,我们有20个东芝16TB驱动器(型号:MG08ACA16TA)正在通过认证过程。另一方面,我们还有25个HGST 4TB驱动器(型号:HDS5C4040ALE630),将时间投入到Storage Pods中。细心的读者可能会注意到这些HGST驱动器的型号,并意识到它们是最后一批使用日立型号生产的驱动器。

暂且不提,当我们报告季度、年度或生命周期驱动器统计数据时,那些驱动器少于60个的型号不包括在计算或图表中。我们最少使用60个驱动器,因为所有新部署的存储Pod中都有60个驱动器。注:Seagate 16TB驱动器(型号:ST16000NM001G)显示59个驱动器,并在报告中列出,因为在收集本报告的数据时尚未更换一个故障驱动器。

也就是说,所有驱动器型号(包括引导驱动器)的所有数据都包含在我们的硬盘测试数据网页上可以访问和下载的文件中。

我们在第二季度部署了12,063个新驱动器,并通过更换和迁移移除了1,960个驱动器,使我们净增加了10,103个驱动器。下表列出了我们部署的驱动器型号。

季度数据就是这样,只有那个季度的数据。在每个季度开始的时候,我们抹去所有以前的数据,然后开始汇编新的信息。在季度末,我们将这些数据捆绑到一个单元(集合、包、文件等)中,并为其命名;例如,2020年第二季度。这是您在查看本报告前面显示的2020年第2季度季度图表时查看的数据类型。我们还可以将给定季度的结果与其他季度的结果进行比较,每个季度都有自己独特的数据包。这种类型的比较可以揭示趋势,帮助我们确定需要进一步关注的东西。

下面的图表显示了制造商使用过去三年的季度数据得出的AFR。图表后面是两张表。第一个是用于创建图表的数据。第二个是每个制造商每个季度对应的硬盘数量的计数。

1.每个制造商的数据由所有使用中的驱动器型号组成,这些型号用于存储客户数据。不包括引导驱动器或测试驱动器。

2.2017年第三季度至2018年第三季度东芝驱动器的0.00%值是正确的。在此期间没有东芝驱动器故障。请注意,在同一时期内的任何时候,使用中的驱动器都不超过231个。虽然在五个季度内零故障是值得注意的,但驱动器的数量还不够高,不足以得出任何结论。

3.从2019年第二季度开始,WDC驱动器的“n/a”值表示在此期间我们的系统中没有用于客户数据的WDC驱动器。这不考虑品牌为WDC的较新的HGST驱动器型号,因为我们目前没有任何这些型号在运行。

1.WDC:WDC数据显示数据点(即硬盘)太少会导致季度间比较差异很大。

2.东芝:就像WDC数据一样,东芝硬盘数量在这段时间的大部分时间都太低,无法得出任何像样的结论,但从2019年第四季度开始,情况会发生变化,此后的数据会更可靠。

3.希捷(Seagate):在AFR稳步上升之后,过去两个季度对希捷有利,最近一个季度(AFR=0.90%)是我们自2013年开始统计以来希捷表现最好的一个季度。这是个好消息,值得在接下来的几个月里进行更深入的研究。

4.HGST:AFR在0.36%-0.61%之间波动,HGST驱动器获得可预测性奖。很无聊,是的,但是很无聊。

与季度数据不同,累积数据在给定点开始收集数据,并添加新数据,直到您停止收集。虽然季度数据反映的是给定季度内发生的事件,但累积数据是关于一段时间内我们收集的硬盘的全部信息。使用累积数据,我们可以看到一段时间内的较长期趋势,如下图所示,数据表格如下所示。

对于所有制造商,您可以看到AFR随着时间的推移呈下降趋势。虽然这是一个积极的事件,但我们确实想了解原因,并将这些经验教训纳入我们对环境的整体理解中-就像驱动器故障一样,驱动器“无故障”也很重要。在我们考虑这些发现的同时,如果您对这个问题有任何想法,请在评论中告诉我们。也许你认为硬盘正在变得更好,或者更有可能是我们在过去三年里增加了如此多的新驱动器,以至于它们占据了统计数据的主导地位,或者是其他什么原因?让我们知道。

下表显示了截至2020年6月30日我们已投入使用的硬盘型号的使用寿命AFR。报告期为2013年4月至2020年6月30日。列出的所有驱动器都是在此时间范围内安装的。

终身AFR为1.64%,是我们自2013年开始跟踪以来的最低水平。此外,生存期AFR已从2018年第二季度的1.86%降至当前值,尽管我们已经跨过了一些里程碑,如管理的存储空间达到1EB,在阿姆斯特丹开设了一个数据中心,公司规模几乎翻了一番。忙碌的两年。

所有Seagate 12TB驱动器(型号:ST12000NM001G)都已在第二季度安装,因此,尽管我们拥有合理的数据量,但作为一个整体,这些驱动器仍处于生命周期的早期阶段。虽然并不是所有的模特都会随着年龄的增长而遵循浴缸曲线,但我们应该再等几个季度,看看它们在我们的环境中表现如何。

希捷4TB驱动器(型号:ST4000DM000)一直在漫无边际。由于平均年龄接近五年,它们早已超过了保修期(根据购买时间的不同,一年或两年)。说到使用年限,图表中平均使用年限最高的驱动器型号是超过64个月的希捷6TB驱动器。同样的型号在2020年第二季度没有出现故障,所以它们似乎老化得很好。

用于创建本评审中使用的信息的完整数据集可在我们的硬盘测试数据网页上找到。您可以免费下载并使用此数据用于您自己的目的。我们所要求的只有三件事:1)如果您使用数据,则引用Backblaze作为来源;2)您接受您对如何使用数据负全部责任;3)您不会将此数据出售给任何人-它是免费的。

如果您只想使用汇总数据来创建本文中的表格和图表,您可以下载包含MS Excel电子表格的ZIP文件。