ソフトウェア

無料&オープンソースでシステム障害のレポートを一元化できるNetflix製インシデント管理ツール「Dispatch」


システムの保守・運用を行うインフラエンジニアにとって、障害対応は最も責任のある仕事のひとつであり、障害の監視や通知に関するツールは「PagerDuty」や「Zabbix」が有名です。そうした障害対応を助けてくれるツールとして、Netflixが無料のオープンソースソフトウェア「Dispatch」を公開しました。

Introducing Dispatch - Netflix TechBlog
https://netflixtechblog.com/introducing-dispatch-da4b8a2a8072

About - Dispatch
https://hawkins.gitbook.io/dispatch/

Netflix Dispatch - Reviews, Pros & Cons | Companies using Netflix Dispatch
https://stackshare.io/netflix-dispatch

Dispatchのワークフローはこんな感じで、すでに広く使われているツールとの連携を保ちつつ、障害データを保存・解析して障害の解決速度を速めることができるツールとなっています。


インストールするための要件は以下。

・「Docker」 バージョン17.05.0以降
・「Docker Compose」 バージョン1.19.0以降
・2400MB以上の物理メモリ
・2コア以上のCPU

Dispatchは「実際に障害対応にあたる人」と「障害対応を統括する人」の2つの区分を想定して作られており、UIや権限が分かれています。システムになんらかの障害が発生した際は、指定したURLにアクセスすると障害についてのレポートを誰でも提出することができます。


障害が報告されると、事前に設定したルールに基づいて「実際に障害対応にあたる人」が自動で選定され、メールもしくはSlackで該当する人物に通知されます。


障害が報告されると、「障害対応を統括する人」からは、障害対応にあたる人のリストを確認することができます。


「障害対応を統括する人」は、障害のステータスを随時更新したり……


障害対応にあたる人にタスクを割り当てることも可能。


障害が終息した後は、障害の履歴を一覧で表示できます。


障害のタイプや緊急度別に、障害の情報を可視化することもできるので、後のレビューも容易になります。


Slack、Jira、G Suite、PageDutyなどの他サービスと連携することもできるとのこと。


DispatchはGitHubにて無料のオープンソースソフトウェアとして公開され、誰でも利用することができます。

GitHub - Netflix/dispatch: All of the ad-hoc things you're doing to manage incidents today, done for you, and much more!
https://github.com/Netflix/dispatch

この記事のタイトルとURLをコピーする

・関連記事
Linuxの次期カーネル「Linux 5.6」にはUSB4やNVIDIA RTX 20シリーズのサポートなど多数の新機能が搭載される - GIGAZINE

「バグの影響で特定のサーバー証明書を失効させる」とLet’s Encryptが発表、影響を受けるのは全体の2.6% - GIGAZINE

科学に貢献するオープンソースソフトウェア開発者たちの知られざる苦労 - GIGAZINE

停電時のサーバー保守をサポートしてくれるヘッドライト「WOWTAC A2S」で真っ暗なサーバールームを照らしてみた - GIGAZINE

電源がオフでもOSが起動していなくてもPCを遠隔操作できる「IPMI」を使ってみた - GIGAZINE

in ソフトウェア, Posted by log1n_yi

You can read the machine translated English article here.