「AmazonプライムデーのダウンはOracleからのDB乗り換えが原因ではない」とAmazonのCTOがCNBCの報道を否定
By Mark Mathosian
日本時間で2018年7月16日の正午に始まったAmazonプライムデー2018の開始直後、サーバーがダウンして約1時間にわたってアクセス障害が発生しました。アメリカのCNBCはAmazonの内部文書をもとに、「サーバーダウンはDBをOracleから自社製に乗り換えたこと」が原因であると報じましたが、AmazonのCTO(最高技術責任者)であるWerner Vogels氏が「馬鹿げたミスリード誘導記事だ」と完全否定する事態となっています。
CNBCは現地時間の2018年10月23日、Amazonプライムデーのサーバーダウンはデータベースを従来のOracleからAWS Auroraに乗り換えて十分な準備を行っていなかったことが原因であるという記事を掲載しました。そこで取り上げられていたのは、個別の取引によって生成される「savepoint」の量が膨大になってしまったためにシステム全体の処理速度が異常に低下してしまったという状況です。
Amazonプライムデー初日にサーバーがダウンしたのは「DBをOracleから自社製に乗り換えた」ことが最大の理由 - GIGAZINE
大きな問題を引き起こすことになった要因の一つが、OracleとAuroraの間で「savepoint」の扱い方が異なる点にあるといいます。savepointは個別の取引をトラッキングあるいは復元するために重要なDBツールなのですが、プライムデーに発生した極めて大量の注文により膨大な量のsavepointが作成され、システム全体の処理速度が異常に低下してしまったと報告書では示されているとのこと。
しかしこの報道の翌日、AmazonでCTOを務めるVogels氏がTwitterに反論を投稿。文字数制限に引っかからないようにするためか、文章を画像に書き出して長文の反論を行いました。
Never let facts interrupt a "good story.” Tried to help reporter get it right, but clickbait won (https://t.co/4iiy2lGbQd). Our Fulfillment Centers have migrated 92% of DBs from Oracle to Aurora with better avail, less bugs and patches, less troubleshooting, less hw cost. More: pic.twitter.com/cwM5SHai2p
— Werner Vogels (@Werner) 2018年10月24日
Vogels氏は反論の中で、CNBCの記事を「馬鹿げていてミスリーディング」と一刀両断。その上で、「AWSおよびAuroraはプライムデーのサーバーダウンには全く関係がない。この問題は、Amazon Retailのソフトウェアにあった問題によって引き起こされたものだ」と、別の理由を明らかにすることでCNBCの記事が誤りであることを主張しています。
Vogels氏はまた、「CNBCの記者が読んだのは、世界中で185カ所にあるフルフィルメントセンターのうち、たった1カ所で起こった問題についての部分であり、そのフルフィルメントセンターでは小規模な出荷の遅れが発生しただけだ」と述べ、CNBCの記事では全く別の問題に目が向けられていたことを主張しています。
さらに、完全な第三者であるカーネギーメロン大学でデータベーステクノロジーの准教授を務めるAndy Pavlo氏が参戦。CNBCの記事を書いた記者は、Pavlo氏を含む複数の専門家にAmazonの内部文書を提供し、内容の分析を依頼した模様。その際に、「OracleとPostgreSQLのsavepointの扱いが違うのは重要な点ではない」と返答したところ、記者は激怒してしまったそうです。
So I was slightly involved with this story: https://t.co/ohZhpyqmjo
— Andy Pavlo (@andy_pavlo) 2018年10月24日
TLDR: I've read the internal Amazon document in the CNBC story. @Werner is correct. When I told the reporter that it wasn't a big deal he called me on the phone and flipped out.
また、Pavlo氏はVogels氏のツイートに対して「(記事は)取るに足らない内容だ」と返信して賛同しています。
So I agree with @Werner that this is a non-story. Oracle and Postgres are both solid DBMSs. Notice how he has no quotes from DB people.
— Andy Pavlo (@andy_pavlo) 2018年10月24日
And for the record, I am not on Amazon's payroll. They gave @danavanaken credits for her research & we are thankful: https://t.co/kz2WeJMFkZ
Vogels氏とPavlo氏とのやり取りは、以下のPublickeyの記事でも詳細に触れられています。
Amazonプライムデーのサーバ障害、AmazonがOracleからAurora DBに乗り換えたのが原因ではない。Amazon CTOがCNBCの報道を否定 - Publickey
https://www.publickey1.jp/blog/18/amazonamazonoracleaurora_dbamazon_ctocnbc.html
・関連記事
Amazonプライムデー初日にサーバーがダウンしたのは「DBをOracleから自社製に乗り換えた」ことが最大の理由 - GIGAZINE
Amazon巨大倉庫の信じられない規模のブラックフライデー作業風景 - GIGAZINE
Amazon労働者が巨大セール「プライムデー」に合わせてストライキを決行 - GIGAZINE
Amazonが初めてAWS事業の収支を公開、クラウド事業の「儲かる」実態が明らかに - GIGAZINE
米国防総省のデータをクラウドで一元管理する1兆円規模の事業「JEDI」をAmazonが獲得間近か、事実上の「出来レース」の見方も - GIGAZINE
・関連コンテンツ