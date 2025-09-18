2025年09月18日 13時48分 ソフトウェア

AI「Claude」の応答品質が断続的に低下していたのは3つのバグが原因



2025年8月上旬から9月上旬にかけて、AnthropicのAI「Claude」の応答品質が低下したという報告が相次ぎました。Anthropicが調査したところ、3つのインフラストラクチャー上のバグが原因だったことが明らかになりました。



A postmortem of three recent issues \ Anthropic

https://www.anthropic.com/engineering/a-postmortem-of-three-recent-issues





1つ目のバグは、コンテキストウィンドウを処理するサーバーへのデータ転送ミス、ルーティングエラーでした。2025年8月5日、当時は20万トークンのコンテキストウィンドウしか扱えなかった「Sonnet 4」モデルのリクエストが、100万トークンのコンテキストウィンドウ用に設定されたサーバーへ誤って転送されてしまったとのこと。この時点で、ユーザーからのリクエストの0.8％にパフォーマンス低下などの影響が及びました。



8月29日には、定期的に実施していた負荷分散処理により、短いコンテキストのリクエストが意図せず100万トークン用のサーバーへ転送される不具合が発生。不具合がピークに達した8月31日には、Sonnet 4によるリクエストの16％が影響を受けました。一連の不具合発生中にリクエストを行ったユーザーの約30％は、少なくとも1つのメッセージが誤ったサーバーに転送され、応答速度の低下を経験したと考えられています。





また、一度誤ったサーバーでリクエストが処理されると、その後のリクエストも同じ誤ったサーバーで処理される可能性が高かったため、同じユーザーが何度も不具合を経験した可能性があるとのことです。



Anthropicはルーティングロジックを修正し、短コンテキストおよび長コンテキストのリクエストが正しいサーバープールに確実に振り分けられるようにしました。修正は9月4日にデプロイされています。



2つ目のバグは、Claude APIのTPUサーバーに誤った設定をデプロイしたことで発生しました。8月25日の誤設定が原因でトークン生成時にエラーが発生し、英語のプロンプトにタイ語や中国語を生成するなど文脈上生成されるべきでないと考えられる文字列が生成されてしまったとのこと。



この不具合は、8月25日から28日にかけてOpus 4.1およびOpus 4に対して行われたリクエスト、ならびに8月25日から9月2日にかけてSonnet 4に対して行われたリクエストに影響を及ぼしました。



Anthropicは9月2日に問題を特定し、変更をロールバックしました。また、予期しない文字が出力されないよう検出テストが追加されています。





3つ目は、8月25日にテキスト生成時のトークン選択を改善するコードをデプロイした結果、機械学習コンパイラ「XLA」に潜在していたバグが意図せず発動したことで起こりました。これにより、Claudeがテキストを生成する際、最も確率が高いトークンを意図せず除外してしまう問題が発生しました。



Claude Haiku 3.5への影響が確認されており、Claude API上のSonnet 4およびOpus 3の一部に影響を与えた可能性もあります。



AnthropicはHaiku 3.5への影響を確認し、9月4日にロールバックを実施。その後Opus 3でバグと一致する問題報告を受け、9月12日にさらにロールバック。Sonnet 4では再現を確認できなかったものの、慎重を期しロールバックを実施したとのこと。



Anthropicは、こうしたバグの検出が困難だった理由として、自社のプライバシー対策が理由の1つだったと指摘しています。プライバシー対策により、エンジニアはユーザーとClaudeのやり取りを見る方法が限られており、特にフィードバックとして報告されていないやり取りへのアクセスは制限されるからです。



また、Claudeは複数のハードウェアプラットフォームに分散して配置しているため、インフラが複雑で、あるユーザーには不具合が生じているのに別のユーザーには生じていないといった状況も混乱を招きました。



今後の対策として、Anthropicは正常な動作と不具合のある動作をもっと正確に区別できる評価手法を開発したほか、ユーザーのプライバシーを損なうことなく効率的にデバッグするインフラとツールを開発すると報告しています。



Anthropicは「ユーザーの皆様がClaudeに一貫した品質を期待されていることを認識しており、インフラの変更がモデル出力に影響を与えないよう極めて高い基準を維持しています。今回の事象では、その基準を満たせませんでした。ユーザーの皆様には、引き続き直接フィードバックをお送りいただけると大変助かります」と述べました。