ハードウェア

HDDが大容量化しても「RAIDを恐れなくてもいい」理由とは?


ウェブサーバーや家庭用のNASでは、複数のドライブをまとめて仮想的な1台のドライブとして運用するRAIDを組むことが多いはず。しかし、ふとした操作ミスやHDDの障害でRAIDの再構築が失敗し、データを失ってしまったという話を耳にしたことがあるかもしれません。ストレージやネットワークに関するブログを運営するLouwrentius氏が、「RAIDを恐れるな」とブログ上で呼びかけ、その理由を語っています。

Don't be afraid of RAID
https://louwrentius.com/dont-be-afraid-of-raid.html

Louwrentius氏によれば、「HDDの大容量化により、RAIDの再構築中にRAIDアレイが壊れてしまう可能性が高まった」という「神話」がインターネット上に拡散されているとのこと。こうした意見に対し、RAID技術は家庭や小規模事業者にとっては、HDDが大容量化した今でも信頼性と効率を両立できる技術だとLouwrentius氏は指摘しています。

神話の根源となっているのは2007年に投稿されたZDNetの記事であるとLouwrentius氏。記事では「およそ12TBごとに、HDDがセクタを読み込めない『回復不能な読み込みエラー(URE)』が発生する」と指摘されており、これが大容量HDDでRAIDを組むべきではないといううわさの始まりとのこと。ZDNetの記事が正しければ、14TBのHDDからすべてのデータをコピーするのは不可能、ということになります。多くのファイルシステムにおいて、RAIDは残りのドライブの内容を完全に読み込むことで再構築されるので、「HDDの内容をすべて読み込むことができない」のはRAIDにとって大問題です。


しかし、Louwrentius氏はBackblazeの統計データからZDNetの記事を否定しています。Backblazeでは14TBのHDDを使用していますが、14TBのHDDすべてにおいてUREが生じているならば、14TBのHDDを組み込んだRAIDはすべて再構築時に問題が生じるはず。しかし、統計データにはそういった記載はありません。ZDNetの記事は最悪のケースを想定したシナリオであり、エンタープライズ向けHDDを一般向けHDDと差別化するためのマーケティング手法に見えるとLouwrentius氏は語っています。

13万台以上のHDD故障率レポート2020年Q1版をBackblazeが公開、強さを見せたHDDメーカーはどれ? - GIGAZINE


また、仮にRAIDを構成するHDDに不良セクタが発生したとしても、不良セクタをスキャンし事前にHDDの交換を促す「スクラビング」という機能がRAIDに備わっているため、再構築中に問題が生じることはないとLouwrentius氏は説明。スクラビングの定期実行は、LinuxのソフトウェアRAIDや主要なNASベンダーの製品では標準で有効になっているとのこと。HDDのS.M.A.R.T.情報を監視し、異常が発生した場合は通知するようにしておくことも大切だとLouwrentius氏は語っています。

また、「RAID5を使うべきではない」という風潮についてもLouwrentius氏は疑問を呈しています。確かにRAID5はパリティデータがHDD1台分しかなく、RAIDを構成するHDDが同時に2台故障してしまうとデータを失ってしまいます。しかし、NASなどで小規模なRAIDを構築する場合は、パリティデータにHDD容量をひっ迫されないRAID5が最適とのこと。多数のHDDを使って大規模なRAIDを構築する際には、パリティデータを2台分持つRAID6が推奨されています。


主にRAID5やRAID6で話題になることが多い「ライトホール問題」についてもLouwrentius氏は言及。ライトホール問題は、あるHDDにはデータが書き込まれているのに、他のHDDにはデータが書き込まれていない状態で電源を失った場合、HDD間にデータの不一致が生じる問題のことです。このライトホール問題に対し、Louwrentius氏はNASを無停電電源装置につなぎ、予期せぬ電源の喪失を防ぐことを推奨。また、ZFSやLinuxのソフトウェアRAIDではライトホール問題は解決されており、ハードウェアRAIDではキャッシュメモリに書き込み情報が待避されるため、ライトホール問題は起こらないとのこと。

Louwrentius氏はRAIDが人々に避けられる心理的な理由として「RAIDが壊れたら、すべてのデータが消えてしまう」ことを挙げています。パリティデータ用にHDDを別途用意し、OS上で動作するUnraidSnapRAIDは、こうしたRAIDの特性を代替するものであるとのこと。例えば5台のデータ用HDDと1台のパリティ用HDDを用意し、HDDが2台故障してしまった場合を考えてみます。UnraidやSnapRAIDでは残りのHDDのデータは無事ですが、RAID5ではすべてのデータを失ってしまいます。Louwrentius氏自身はこうしたリスクをそれほど大きなものとは思っていないそうですが、UnraidやSnapRAIDは人気のある製品で、RAIDの合理的な代替品だと考えているとのこと。


たとえRAIDを構築していたとしても、誤って削除したデータは元にはもどらないので、バックアップの代わりにはならないとLouwrentius氏。データを保護したい場合は、他のストレージにデータをコピーしておく必要があるとのこと。Louwrentius氏は「RAIDがデータストレージにおいて今もなお有用で、信頼性の高い選択肢であることを証明できたと思います」とコメントしています。

この記事のタイトルとURLをコピーする

・関連記事
HDD故障率のメーカー・モデル別統計データ2019年版、故障率が最も高かったのは? - GIGAZINE

新しいHDDを使用する時に執り行うべき「儀式」とは? - GIGAZINE

NAS向けHDD「WD Red」の記録方式をこっそり変更した件についてWDが釈明 - GIGAZINE

最強NAS・Synologyの5ベイ上位モデル「DiskStation DS1517+」を導入するための初期設定まとめ - GIGAZINE

in ハードウェア, Posted by log1n_yi

You can read the machine translated English article here.