ネットサービス

Googleのサービスが45分間にわたり利用できなくなる大規模障害が発生、原因は認証サービスのストレージ問題


2020年12月14日(月)の20時47分から約45分間、Googleで検索を除くサービス全体が利用できなくなる障害が発生しました。サービスのパフォーマンス状態を確認できる「Google Workspace ステータス ダッシュボード」においても障害発生から30分間は「問題なし」と表示されたこともありやや混乱を招きましたが、最終的に、障害は認証処理を行うサービスの問題であったことが報告されています。

Google suffers global outage with Gmail, YouTube and majority of services affected | Google | The Guardian
https://www.theguardian.com/technology/2020/dec/14/google-suffers-worldwide-outage-with-gmail-youtube-and-other-services-down

Google suffers widespread outage taking YouTube, Gmail offline
https://www.cnbc.com/2020/12/14/googles-youtube-gmail-and-drive-services-suffer-outage.html

Gmail, YouTube, Google Docs, and other Google services hit by massive outage - The Verge
https://www.theverge.com/2020/12/14/22173803/gmail-youtube-google-assistant-docs-down-outage

Is Google Down? Gmail, YouTube Suffer Outages - WSJ
https://www.wsj.com/articles/google-suffers-widespread-outage-11607950400

障害の影響を受けたのはYouTube、Gmail、Googleカレンダーなど広範にわたりました。

Googleでは各サービスのパフォーマンスを確認できる「Google Workspace ステータス ダッシュボード」を公開していますが、障害翌日・12月15日9時に確認したダッシュボードの様子はこのように、12月14日夜にGoogleのサービス全体が停止していたことを示しています。


ただし、障害発生直後は「サービスが停止している」ことがダッシュボードに反映されず、何が起きているかわかりにくい状態となっていました。スクリーンショット最下部を見ると、このダッシュボードの状態が障害発生直後の12月14日20時55分のものであることがわかります。


Googleによると、問題となったのはユーザーのログインを管理する認証サービス部分で、根本的には「十分なストレージ容量が割り当てられていなかったため」だとのこと。本来、ストレージ容量が不足するとストレージクォータの自動処理が行われるはずでしたが、処理が走らず、データがいっぱいになってクラッシュしてしまったそうです。

これにより、ログインして利用するサービスは完全に利用できない状況に陥りました。また、Googleの認証プラットフォームを利用しているサービスの場合、すでにログイン済みのユーザーが使い続ける分には問題はありませんでしたが、改めてログインしようとした場合やログアウトしようとした場合にエラーが発生するようになっていました。

ただでさえユーザーの多いYouTubeやGmailがダウンしたほか、Googleの認証プラットフォームを利用するサービスもSlackをはじめ多数存在したことから、世界的に多数のユーザーが影響を受けることになりました。

We're aware of an ongoing issue with multiple products and our teams are investigating. Updates are being posted on the status dashboard: https://t.co/Y3OJ3Lg1ML

— Google Workspace (@GoogleWorkspace)


なお、前述の通り、障害は約45分間で回復しています。ただし、Gmailでは2020年12月15日10時時点でもサービス障害が報告されています。

この記事のタイトルとURLをコピーする

・関連記事
Googleの徹底的なシステム障害への対応「SRE」の中身とは? - GIGAZINE

AWSで大規模な障害が発生中、多数のサービスがあおりを受ける事態に - GIGAZINE

Amazon・Microsoft・PSNなどを巻き込む大規模なネットワーク障害が発生、原因はBGPの設定ミスか - GIGAZINE

Google ドライブ・Gmailなどで発生した大規模障害の原因と対策をGoogleが説明 - GIGAZINE

Googleのクラウドで大規模障害が発生、YouTubeやGmailなど多くのサービスが影響を受ける - GIGAZINE

Googleドライブがダウンして「仕事ができない」とパニックになる人が続出 - GIGAZINE

Discord・Amazonなどを巻き込む大規模障害が発生、「真の原因はVerizon」とCloudflareが非難 - GIGAZINE

Googleカレンダーがシステム障害で世界的にダウン、世界中で悲鳴 - GIGAZINE

YouTubeやGoogle Cloudが激重になった大規模障害についてGoogleが詳細な原因を説明 - GIGAZINE

in ネットサービス, Posted by logc_nt

You can read the machine translated English article here.