Discord・Amazonなどを巻き込む大規模障害が発生、「真の原因はVerizon」とCloudflareが非難
日本時間の2019年6月24日(月)21時ごろ、Discord・AWS・Twitchなどで大規模な障害が発生しました。発生から約2時間後にこの障害は回復しましたが、原因はアメリカ通信大手のVerizonだとみられています。
How Verizon and a BGP Optimizer Knocked Large Parts of the Internet Offline Today
https://blog.cloudflare.com/how-verizon-and-a-bgp-optimizer-knocked-large-parts-of-the-internet-offline-today/
Discord was down due to Cloudflare and Verizon issues - The Verge
https://www.theverge.com/2019/6/24/18715308/discord-down-outage-cloudflare-problems-crunchyroll-feedly
Verizon, AWS experience system outages, customers report - The Washington Post
https://www.washingtonpost.com/technology/2019/06/24/verizon-amazon-web-services-outages-reported-throughout-northeastern-us/?utm_term=.eec4533b131c
今回生じた大規模な通信障害は主にゲーマー向けチャットアプリのDiscordに影響を与えました。ユーザーはDiscordに接続できず、一時はDiscordのサーバーステータスを確認するのも困難な状態だったとのこと。Newsweekによると、「Discordにつながらない」といったツイートは10万件にも上ったそうです。
Discord (among other sites) is down and people are freaking out.
— Blake Robbins (@blakeir) June 24, 2019
Trending when your product goes down might be the best sign that you’ve built something people love. pic.twitter.com/TXKkdkmKQM
Discordの通信障害の直接的な原因となったのは、企業向けにDDoS対策サービスやプロキシサービスを提供しているCloudflareです。Cloudflareは6月23日20時頃には「問題の経過を観察中」と報告しており、問題の把握と原因の究明に努めていました。
Cloudflareの調査の結果判明したこととは、Verizonが使用するNoctionの「BGP Optimizer」サービスが根本的な原因だということ。BGPとは「インターネットの経路検索」のようなもので、大阪から東京まで移動するときにわざわざ沖縄を経由することがないのと同じように、無駄のないインターネット上の経路を検索する際に使われるものです。今回、BGP OptimizerサービスはVerizonのネットワークがインターネット上で「最適」だと多数のユーザーに表示してしまいました。「Verizonを経由するのが最適な経路なんだ!」と誤表示が行われた結果、Verizonに流れ込むトラフィックは急激に増加しました。
本来ならBGP Optimizerには「トラフィックが急増したときにBGPを一旦停止する」というフィルター機能が搭載されているはずでした。しかし、Verizonはこのフィルター機能を使用しておらず、トラフィックの急増に耐えきれずサービスはダウン。その結果、AWS、Linode、Cloudflareなど多くのインターネットサービスに影響が及び、Cloudflareを活用していたDiscordも余波を受けたわけです。
Cloudflareのマシュー・プリンスCEOはVerizonが基本的なフィルター機能をオンにしていなかった件について、「VerizonとNoctionはものすごく恥ずかしい思いをするだろう」とTwitter上でコメント。その後も「Verizonのテクニカルオペレーションセンターは何の反応もない」など、Verizonの対応のずさんさを強く批判していました。
The teams at @verizon and @noction should be incredibly embarrassed at their failings this morning which impacted @Cloudflare and other large chunks of the Internet. It’s absurd BGP is so fragile. It’s more absurd Verizon would blindly accept routes without basic filters.
— Matthew Prince ???? (@eastdakota) June 24, 2019
・関連記事
Googleカレンダーがシステム障害で世界的にダウン、世界中で悲鳴 - GIGAZINE
YouTubeやGoogle Cloudが激重になった大規模障害についてGoogleが詳細な原因を説明 - GIGAZINE
Googleのクラウドで大規模障害が発生、YouTubeやGmailなど多くのサービスが影響を受ける - GIGAZINE
AppleのiCloudで大規模なシステム障害が発生、GoogleやFacebookに引き続き - GIGAZINE
DiscordとSlackのチャンネルを一括で管理できるアプリ「Ripcord」を使ってみた - GIGAZINE
・関連コンテンツ