AmazonでAIツールが原因と見られるAWS障害が発生、2025年12月にはKiro AIが原因で13時間に及ぶサービス停止

Amazonのクラウド事業であるAmazon Web Services(AWS)が、AmazonのAIコーディングツールを原因とした障害に数カ月で少なくとも2回見舞われていることが関係者の証言により判明しました。Amazonは障害とAIツールの関係を否定し、ユーザーによる操作ミスを指摘しています。
Amazon service was taken down by AI coding bot
https://www.ft.com/content/00c282de-ed14-4acd-a948-bc8d6bdb339d

AWS AI coding tool decided to "delete and recreate" a customer-facing system, causing 13-hour outage, report says
https://the-decoder.com/aws-ai-coding-tool-decided-to-delete-and-recreate-a-customer-facing-system-causing-13-hour-outage-report-says/
イギリスの経済紙・Financial Timesが事情に詳しい4人の関係者から得た情報によると、2025年12月中旬にAWSのエンジニアがコードの作成や変更、インフラストラクチャー設定の提案などを自動化する社内向けの自社製AIエージェント「Kiro」に特定の変更を許可した後、顧客向けシステムが13時間にわたって停止したそうです。

また、複数のAmazon従業員は、Kiroだけでなく別のAI開発支援ツールでも問題が起きていたと明かしています。証言によると、Kiroが原因とみられる障害の数カ月以内に、Amazon製のビジネス・開発者向けソフトウェア開発生成AIアシスタントであるAmazon Q Developerに関連するインシデントも発生していたそうです。匿名のAWSの上級従業員は「既に少なくとも2回の本番環境障害が発生しています。エンジニアがAIエージェントの判断をそのまま実行させた結果、障害が発生しました。障害は小規模でしたが、完全に予測可能な障害でした」と語りました。
2025年10月20日にはAWSで大規模な障害が発生し、インターネット上の何百万人もの人々に影響を与えて数十兆円規模の経済的損失が出たとも報道されました。一方で、今回報道された2件の障害は、どちらも顧客向けのAWSサービスには影響を与えておらず、「中国の一部地域で単一のサービスが影響を受けたという、極めて限定的な事象」とAmazonは表現しました。
AWSの大規模障害でウェブの半分がダウンし数十兆円規模の経済的損失が出たとの指摘、優秀なエンジニアがAWSを離れている証拠であるという指摘も - GIGAZINE

今回報じられた障害は、AIツールが本番環境と同等の権限を持っていたことが原因と考えられています。AIエージェントのコードや判断が、人間のレビューをほとんど通さずに自動実行されたことで、即座にサービス停止につながった可能性があります。
しかし、Amazonは障害について説明した声明の中で、「この障害の原因はAIではなく、ユーザーエラーによるものです。具体的にはアクセス制御の設定ミスによるものです」と自社製AIが原因とする報道を否定しました。また、12月に発生した障害について「AIツールが関係していたのは偶然」と語りました。
Amazonは「Kiroは何らかのアクションを起こす前に承認を求める」と述べており、障害の直接の原因にはならないと説明しています。Amazonの声明によると、ユーザーはKiroが実行できるアクションを設定する必要があり、デフォルトではKiroはアクションを実行する前に承認を求めるため、Kiroは開発者による制御を可能にしています。
一方で一部のAmazon内部のエンジニアは、AWS内のAIツールがオペレーターの拡張機能として扱われオペレーターと同じ権限を付与されていたため、第三者の承認を得ることなく何らかの変更を適用できた可能性があると述べました。また、2025年12月の障害が発生した後、AWSは多数の安全対策を実施し、本番環境へのアクセスにおけるピアレビューの義務化やスタッフのトレーニングなどを実施しました。これらの対策が障害の発生後に導入されたという事実は、問題は単にユーザーエラーによるものだというAmazonの主張と矛盾しているとFinancial Timesは指摘しています。
・関連記事
Amazon Web Services(AWS)障害が大規模化したのは「us-east-1」リージョンがSPOF化していることに起因している - GIGAZINE
AWSの大規模障害でウェブの半分がダウンし数十兆円規模の経済的損失が出たとの指摘、優秀なエンジニアがAWSを離れている証拠であるという指摘も - GIGAZINE
AWS大規模障害の原因は「DNS管理システム」に潜んでいた設計上の欠陥だったことが判明 - GIGAZINE
AWSの大規模障害でスマートベッドが熱くなったり傾きが戻せなくなったりする不具合発生 - GIGAZINE
Microsoft Azureで大規模障害が発生しMicrosoft 365・Xbox・マインクラフトなどがアクセス不能に - GIGAZINE
2025年で最も信頼性が低いAWSリージョンはus-east-1 - GIGAZINE
・関連コンテンツ
in AI, ネットサービス, Posted by log1e_dh
You can read the machine translated English article Amazon experiences AWS outage believed t….







