ハードウェア

13万台以上のHDD故障率レポート2020年Q1版をBackblazeが公開、強さを見せたHDDメーカーはどれ?


クラウドストレージサービスを運営するBackblazeが、自社で運用しているサーバーで使用しているHDDの故障率データをまとめたレポートの2020年第1四半期(1~3月)版を公開しました。
Hard Drive Failure Rates: A Look at Drive Reliability
https://www.backblaze.com/blog/backblaze-hard-drive-stats-q1-2020/

Backblazeでは、記事作成時点で4拠点のデータセンターで13万2339台のHDDを運用しており、うち2380台がブートドライブ、12万9959台がデータドライブとして使用されているとのこと。今回のデータ集計対象はデータドライブである12万9959台のHDDのうち、テスト用のものや、合計台数が60台に満たず有意なデータを取得できないモデルを排除した12万9764台が対象です。

さっそくデータを見てみると、2020年第1四半期における全体の年間平均故障率(AFR)は1.07%と、Backblazeが2013年にデータの収集を始めてから最も優れた数値を記録。2019年第1四半期のARFである1.56%と比較すると、大幅な改善を達成しています。今四半期では、Backblazeが採用しているHGST、Seagate、東芝の3メーカーすべてで故障件数がゼロを達成したモデルがありました。


故障件数がゼロのモデルはHGSTの8TBモデル「HUH728080ALE600」と12TBモデル「HUH721212ALE600」、Seagateの16TBモデル「ST16000NM001G」、東芝の4TBモデル「MD04ABA400V」でしたが、Seagateと東芝のモデルはまだ稼働日数が少ないことにもBackblazeは言及。この稼働日数の短いモデルが1台故障するだけで、Seagateの16TBモデルのAFRは7.25%、東芝の4TBモデルのAFRは4.05%という高い値になってしまうと説明されています。それに対し、ドライブ日数が十分に大きいHGSTのモデルの故障がないことは、有意な情報とのこと。例えば8TBモデルが1台故障してもAFTは0.40%、12TBモデルが1台故障してもAFRは0.26%であり、ほぼゼロに近い値を保ったままです。

前述の通り、テスト用のHDDや合計台数が60台に満たないモデルは集計に含まれていません。例えば、東芝の8TBモデル「HDWF180」や16TBモデル「MG08ACA16TA」20台、HGSTの10TBモデル「HUH721010ALE600」が除外したモデルとのこと。Backblazeが公開するデータは常に、こうしたモデルは除外していると説明されています。


また、Backblazeは今回のレポートで、2019年第1四半期のレポートにて行った残り四半期の予想についての振り返りも行っており、予想内容と結果は以下の通りです。

◆予想1:4TBのHDDを段階的に減らし、2019年末までには1万5000台にまで削減する
・結果:4TBのHDDの2019年末における台数は3万4908台であり、達成できなかった
・コメント:忙しすぎて手が付けられなかった

◆予想2:20TBのHDDをテストの目的で少なくとも20台導入する
・結果:20TBのHDDは0台
・コメント:試用などのオファーがなかった

◆予想3:クラウドストレージの容量として1エクサバイト(1000ペタバイト)を達成する
・結果:2019年末時点では850ペタバイトだったが、2020年3月に1エクサバイトを達成した
・コメント:それ行けスマートのせりふを引用して「待ちくたびれたよ」

◆予想4:HAMRもしくはMAMRを採用したHDDをどちらか1台ずつ、もしくは両方テストしてみる
・結果:HAMRもMAMRも所持していない
・コメント:2020年末までにはやりたい

2013年4月から2020年3月31日の期間で集計した、2020年3月31日時点で稼働しているHDDの生涯故障率を示した表がこれ。全体的にHGSTのパフォーマンスが良好であることがわかります。


今回のレポートでは、故障率の指標に使われている年間平均故障率(AFR)の説明もあわせて行われています。BackblazeにおけるAFRは、データ集計期間における「HDD故障台数」、HDDの稼働日数を合計した「ドライブ日数」をモデル別に集計することで、下記の数式から求められると説明されています。なお、2020年はうるう年のため、1年は366日でカウントされています。

年間平均故障率 = (HDD故障台数 / (ドライブ日数 / 366日) * 100


例えば、モデル名が「BB007」というHDDの半年間における年間平均故障率を求めてみます。モデル名がBB007のHDDは「半年」の間に「28台」故障し、集計期末に「6000台」稼働していました。ドライブ日数が87万8400日とすると、BB007の年間平均故障率は1.17%ということがわかります。

年間平均故障率 = (28台 / (87万8400日 / 366日)) * 100 = (28 / 2400) * 100 = 1.17%


実は、Backblazeの年間平均故障率の算出式では、期末のHDD台数は使用しません。HDDの台数を利用して年間平均故障率を算出すると、以下のようにAFRが0.93%となってしまいます。これは、先ほど算出したAFRである1.17%と一致しません。

AFR = (28 / 6000) * (366 / 183) * 100 = (0.00467) * (2) * 100 = 0.93%


Backblazeが数式の変数に期末のHDD台数ではなくドライブ日数を使用するのは、HDD台数の増減が理由とのこと。新しいサービスであるBackblaze VaultsやAmazon S3と互換性を持つストレージの需要増への対応のほか、古いHDDや容量の小さいHDDの交換などで、HDD台数の状況は動的に変わるそうです。HDDの台数を指標にすると、故障率はHDDの台数をカウントした時点が基準になるのに対し、ドライブ日数は集計期間全体の稼働状況を表しているため、集計期間全体の故障率を算出することができると説明されています。

先ほどの「BB007」の例では、以下のようなHDDの増減を前提にしていたとのこと。「Drive in Service」はその時点で稼働していたHDDの台数を表しており、HDDの台数が期末の状況のみを反映しているのに対し、ドライブ日数がHDD台数の変動を内包していることがよくわかります。Backblazeでは、自社の事業運営の実態に合ったドライブ日数法を採用していると語られてます。


なお、今回のレポート作成に使用された情報の完全版は、下記から取得することができます。

Backblaze Hard Drive Stats
https://www.backblaze.com/b2/hard-drive-test-data.html

この記事のタイトルとURLをコピーする

・関連記事
HDD故障率のメーカー・モデル別統計データ2019年版、故障率が最も高かったのは? - GIGAZINE

HDD故障率のメーカー・モデル別統計データ2018年版、故障率が最も高かったのは? - GIGAZINE

約10万台のHDD故障率レポート2018年Q3版公開、大容量モデルの信頼性の高さが明らかに - GIGAZINE

HDD故障率のメーカー・モデル別統計データ2017年版、故障率が最も高かったのは? - GIGAZINE

8万台以上のHDDを運用するBackblazeがHDD故障率の2017Q1レポートを発表、大量導入した高価なエンタープライズ向けの故障率は? - GIGAZINE

HDD故障率のメーカー・モデル別統計データ2016年版、故障率が最も高かったのは? - GIGAZINE

in ハードウェア, Posted by darkhorse_log

You can read the machine translated English article here.