サーバのHDDから異音、エラー表示が出たのでDELLに修理を依頼してみた
サーバーマシンが搭載しているHDDが不調になり、DELL(デル)のサポートに連絡をして交換を行うことにしたので、その一部始終のレポートです。
DELL(デル)の「PowerEdge T310」にRAID1構成で載せているセカンダリーディスクをBIOSの画面で見ると「Pred Fail」の項目に「Yes」の表示が。S.M.A.R.Tから警告が上がってきているらしく、完全に壊れてしまっているわけではないものの故障の可能性が高まっているという状態です。
さらに詳しい状況をチェックするために「CrystalDiskInfo」で検査をしたところ「代替処理済のセクタ数」に問題がありディスクの「健康状態」は真っ赤な背景の上に「異常」と表示されています。なお、実際に稼働中のディスクに耳を近づけてみるとコリコリという異音を発しておりいかにも壊れる寸前といった感じ。
というわけでDELLに連絡をして、まず交換用のHDDを郵送してもらいました。
部品の準備ができたところでサポートの人に来てもらい、作業開始。最初に、ケーブルにタグを付けて1度抜いた後にすぐに正しい場所に接続し直せるようにします。
パーツ交換のためにサイドパネルを開けるのでラックから床にマシンを移動。
静電気防止用のシートを広げれば準備OK。
パカッ。
新品のHDDはこんな感じ。
問題のHDDをマシンから抜き取ります。
「被疑部品」と書かれた黄色のシールを貼り付け番号を記入。
プライマリーディスクには異常が出ていませんでしたが本当に問題が無いのか確証を得るために、セカンダリーディスクを空にしたまま一度マシンをラックに戻し起動してみる事に。
問題がなければすぐに新しいHDDを取り付けるのでサイドパネルは開けたまま。
ケーブル類の再接続中。
やはり、プライマリーディスクは問題なく動いています。
再度マシンをラックから下ろして……
新品のHDDを取り付けます。
今度はサイドパネルを閉めて……
ラックに戻します。
ケーブルをつなぎ直せば修理は完了。
ちゃんと両方のディスクの「PredFail」が「No」と表示されています。
後は新しく入れたセカンダリーディスクのデータシンクが終わるのを待つだけ。
この後約2時間で問題なくデータのシンクが完了し、RAIDが正しく機能する状態に復旧することができました。
・関連記事
DELLサーバのRAIDコントローラー不具合、その復旧までの一部始終を記録してみた - GIGAZINE
DELLサーバのRAIDコントローラーのバッテリーを交換してみた - GIGAZINE
GIGAZINEで使っているWebサーバ「PowerEdge T310」障害の一部始終 - GIGAZINE
DSET(Dell System E-support Tool)でサーバの故障箇所を特定してみた - GIGAZINE
想定外の壊れ方をしたDELL製サーバの復旧まで一部始終のレポート - GIGAZINE
・関連コンテンツ