トラブルをわざと発生させサーバ問題解決能力を鍛える「Trouble-Maker」
ほとんどのシステム管理者が経験したことがあるはずの状況は「何か悪いことが起きていて、サーバがダウンしているが、しかし何が起きているのか分からない」というシチュエーション。サーバを管理するシステムアドミニストレーターなどの立場でいると何が大変かというと、実際の製品として動かしている実環境でこのような問題が発生した場合です。
そこで役に立つのがこのオープンソースソフト「Trouble-Maker」です。
Trouble-Maker
http://trouble-maker.sourceforge.net/
システム管理者の仕事を簡単にするため、多くのツールが存在していますが、未知の状況を経験している場合になんとかしてくれるわけではありません。この一連のソフトウェア群「Trouble-Maker」は既存の便利なツールとは異なり、問題を解決するのではなく、むしろ問題を引き起こします。インストールして実行すると「Trouble-Maker」はランダムにあらかじめセットされた一連のトラブルからどれかを選び、インストールされたサーバに問題を発生させます。
「Trouble-Maker」を使うと以下のようなスキルが身につきます。
・ユーザーからの問題報告レポートでどの部分が正確かを切り分ける
・起動に関するトラブルシュート
・サービスの設定に関するトラブルシュート
・ハードウェアに起因する問題のトラブルシュート(仮想的にハードウェアが原因の場合のトラブルを引き起こすことが可能)
また、「Trouble-Maker」自体はRed Hat Enterprise Linux(CentOS)向けに作られていますが別のプラットフォームでも動作し、以下の3つのコンポーネントで構成されています。
・trouble-engine
・trouble-modules
・trouble-module-builder
各種ドキュメントは以下に整備されており、インストール方法から起動方法、オプション、FAQがまとめられています。
Trouble-Maker Documentation
http://trouble-maker.sourceforge.net/doc.html
RHEL以外にはNovell SUSE Linux Enterprise Server、Fedoraがサポートされており、今後はUbuntu・Debian・Gentoo・Sun Solaris・OpenBSD・FreeBSD・Slackware Linuxにも対応する予定だそうです。
なお、「DO NOT INSTALL THIS SYSTEM ON A PRODUCTION MACHINE!!!!(仕事で使っているマシンのシステムにはインストールするなよ!!!!)」とのことですので、トラブル解決の訓練はあくまでも訓練用のマシンを作って、その上で行いましょう。
・関連記事
これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」 - GIGAZINE
「ヨドバシ・ドット・コム」がリニューアル直後から表示が遅すぎて激重になる大規模障害が発生、一体何が起きているのか? - GIGAZINE
ソフトバンクの通信障害、人為的に仕組まれていたものであったことが明らかに - GIGAZINE
「RAIDを過信してはいけない」、データのバックアップやRAID復旧についてHDDのプロに聞いてみた - GIGAZINE
GIGAZINEで使っているWebサーバ「PowerEdge T310」障害の一部始終 - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by darkhorse
You can read the machine translated English article "Trouble-Maker" to troubleshoot and trai….