メモ

Amazonのクラウドサービスで日本に続きアメリカで障害が発生し顧客データが全損する事態が発生

by Bethany Drouin

日本では2019年8月23日(金)、Amazonが提供するクラウドサービス「アマゾン・ウェブ・サービス(AWS)」に大規模な障害が発生し、多数のサービスやウェブサイトなどが影響を受けました。これに引き続き、アメリカでも8月31日(土)に同様の障害が発生し、顧客のデータが損失するという事態が発生していることが分かりました。

AWS celebrates Labor Day weekend by roasting customer data in US-East-1 BBQ • The Register
https://www.theregister.co.uk/2019/09/04/aws_power_outage_data_loss/

2019年8月23日にAWSの東京リージョンで発生した障害についてAmazonは、「空調設備の管理システム障害が原因」だと発表。障害発生後の調査により、冗長化されているはずの冷却システムがバグにより正常に作動しなかったためにデータセンターの一部で室温が上昇し、サーバーの停止を招いたことが判明したと報告しています。


これに引き続き、8月31日にもAWSのアメリカ東部(バージニア北部)リージョンで障害が発生。AWSで使用されるクラウドストレージ「Amazon Elastic Block Store(EBS)」のデータが一部損失する被害が発生しました。

AWSを利用していたプログラマーのアンディ・ハント氏は9月4日にTwitterで「AWSで電力障害が発生してEBSサーバーが停止していたことが分かりました」とツイート。ハント氏がEBSに保存していたデータが全て消失したと述べました。

Amazon AWS had a power failure, their backup generators failed, which killed their EBS serversl, which took all of our data with it. Then it took them four days to figure this out and tell us about it.

Reminder: The cloud is just a computer in Reston with a bad power supply.

— Andy Hunt (@PragmaticAndy)


技術系ニュースメディアThe Registerの取材によると、今回の障害は8月31日の4時33分(太平洋標準時)にアメリカ東部リージョンのデータセンターで停電が発生したことが発端だとのこと。停電の発生と同時にバックアップ用の発電機が作動しましたが、1時間30分ほどで発電機が故障。その後の復旧作業により、12時30分にはシステムの99.5%が回復しましたが、残りは回復不能とみて復旧が断念され、EBSに保存されていたデータが消失する事態になったとのことです。

ハント氏はデータのバックアップを取っていたため事なきを得ましたが、「障害発生後のAmazonのサポートは著しく不十分でした」と非難。8月31日に発生した障害についてのAmazonの説明が障害発生から4日後にずれ込んだ点について「率直にいって、これが一番由々しい問題です」と述べています。

And that frankly is the part that annoyed me the most. We got days worth of “we don’t know what’s wrong, our engineers are looking into it." https://t.co/yYMh2hnaWw

— Andy Hunt (@PragmaticAndy)


ハント氏は「クラウドの正体は、Amazonのデータセンターが位置するレストンの電力不足なPCにすぎません」と述べて、クラウドを過信すべきではないとの教訓を強調しました。

この記事のタイトルとURLをコピーする

・関連記事
Discord・Amazonなどを巻き込む大規模障害が発生、「真の原因はVerizon」とCloudflareが非難 - GIGAZINE

Googleのクラウドで大規模障害が発生、YouTubeやGmailなど多くのサービスが影響を受ける - GIGAZINE

YouTubeやGoogle Cloudが激重になった大規模障害についてGoogleが詳細な原因を説明 - GIGAZINE

Appleは毎月33億円以上をAmazonのクラウドサービス・AWSに対して支払っている - GIGAZINE

Amazon.comがサーバーダウンするとさまざまな犬の写真が表示される - GIGAZINE

どちらが全体的に優秀なのか、AmazonとGoogleのクラウドのパフォーマンスを比較した結果 - GIGAZINE

インターネットを大混乱に陥れたAmazonのAWSがダウンした理由は「キーの打ち間違い」 - GIGAZINE

AmazonのAWS「S3」に障害が発生してネットは大混乱、復旧されるも影響は残っている模様 - GIGAZINE

in Posted by log1l_ks

You can read the machine translated English article here.