「Claude Codeが雑になった」は気のせいじゃなかった——Anthropicが3つのバグを公式認定、v2.1.116で修正済み
「なんか最近、Claude Codeの精度が落ちた気がする」——そう感じていたのは、あなただけではありませんでした。
実は先日、開発元のAnthropicが公式にこの問題を認め、原因を詳しく公開しています。
ここ1〜2か月でClaude Codeの挙動に違和感を覚えていた方には、特に読んでいただきたい内容です。
Xで広がった「やっぱりそうだったか」の声
この件はX(旧Twitter)でも大きな反響を呼んでいます。
Anthropicの公式開発者アカウント「@ClaudeDevs」は4月23日、「過去1か月間、品質が低下したという報告を受けて調査し、3つの問題を特定した。
いずれもv2.1.116以降で修正済みで、全サブスクライバーの利用制限をリセットした」と発表しました。
Over the past month, some of you reported Claude Code's quality had slipped. We investigated, and published a post-mortem on the three issues we found.
All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.
— ClaudeDevs (@ClaudeDevs) 2026年4月23日
日本語圏でも話題になっており、AIニュースを発信するアカウント「SOU⚡️」が「3つの不具合が原因」「モデル自体の性能劣化はなし、APIも無関係」「全ユーザーの利用制限もリセット済み」と整理して紹介しています。
「やっぱりそうだったか」という反応が多く集まっていました。
【速報】Claude Codeの品質低下問題、Anthropicが認める
・この1か月で報告されていた品質低下は「3つの不具合」が原因
・問題はClaude Code本体とAgent SDKにあり、Coworkにも影響
・モデル自体の性能劣化はなし、APIも無関係
・すでに修正完了(v2.1.116+)、全ユーザーの利用制限もリセット済み https://t.co/nssw8PToef pic.twitter.com/AYFfxSlK8m— SOU⚡️投資ニュース / 仮想通貨・米国株・AI (@SOU_BTC) 2026年4月23日
また、問題が公式に認められるよりも前に、ユーザーのPaweł Huryn氏がClaude Codeのバイナリをリバースエンジニアリング(内部構造を解析する手法)してキャッシュ破損のバグを独自に発見・報告しており、その洞察がAnthropicの調査でも注目されています。
Did your Opus get dumber — or did it learn the wrong lesson from a month of token panic?
Here's what I found.
Early March — a cache bug shipped in Claude Code. Cache prefix matching broke. Every turn reprocessed the full conversation instead of reading from cache. Some users…
— Paweł Huryn (@PawelHuryn) 2026年4月10日
公式ポストモーテムを読んで分かった3つの原因
Anthropicは2026年4月23日に公式のポストモーテム(事後分析レポート)を公開し、品質低下の原因として3つの独立した変更を特定しています(参照:Anthropic Engineering Blog)。
1. 推論努力レベルのデフォルト変更(3月4日)
UIの応答が「固まっているように見える」問題を解消するため、Claude Codeのデフォルトの推論努力設定(reasoning effort:AIがどれだけ深く考えるかの設定)を「高(high)」から「中(medium)」に変更しました。
内部テストでは性能差がほぼないと判断されていたのですが、実際のユーザーからは「複雑なタスクで知能が落ちた」という声が相次いで届いたようです。
4月7日にロールバック(以前の設定に戻すこと)され、現在はOpus 4.7が「xhigh」、その他のモデルは「high」がデフォルトに戻っています。
2. キャッシングバグ(3月26日)
セッションを長時間放置した後に古い推論履歴(thinking blocks)を削除する最適化を実装したところ、コードのミスにより「放置後の1回だけ削除する」はずが「毎ターン削除し続ける」という挙動になってしまいました。
これによりClaudeは自分の判断の文脈を失い、「同じことを繰り返す」「奇妙なツールを選ぶ」「直前の情報を忘れる」といった症状が発生しています。
キャッシュの読み書きコストも大きく膨らみ、トークン費用が10〜20倍に跳ね上がったケースも報告されているようです。
4月10日にv2.1.101で修正されています。
3. 冗長さを抑えるシステムプロンプトの追加(4月16日)
ツール呼び出し間のテキストを25語以内、最終応答を100語以内に抑える指示をシステムプロンプト(AIの動作を設定する初期指示文)に追加したところ、コーディング品質の評価スコアが3%低下したことが確認されました。
4月20日にv2.1.116でロールバックされています。
これら3つの変更が異なるタイミングでそれぞれ異なるトラフィックに影響したため、まるで広範囲で一貫した品質低下が起きているように見えていたとのことです。
APIには影響なく、モデル自体の性能が劣化したわけでもないことも公式に確認されており、少し安心できる内容ではないでしょうか。
4月23日時点で全サブスクライバーの利用制限はリセット済みとなっており、最新バージョン(v2.1.116以降)を使っていれば3つの問題はすべて解消されています。
詳しく読みたい方へ
- Anthropic 公式ポストモーテム:An update on recent Claude Code quality reports — 原因と対応の詳細が英語で読める一次情報
- Simon Willison による解説:An update on recent Claude Code quality reports — 著名な開発者によるわかりやすいまとめ
- The Decoder の報道:Anthropic confirms Claude Code problems and promises stricter quality controls — 今後の品質管理強化の約束についても触れています
- VentureBeat の詳報:Mystery solved: Anthropic reveals changes to Claude’s harnesses and operating instructions likely caused degradation — 技術的な背景を含めた詳細報道
まとめ
Claude Codeの品質低下は、モデル本体の問題ではなく、Anthropicが加えた3つの製品変更によるものでした。
v2.1.116以降ではすべて修正済みですので、まだアップデートしていない方は早めに更新しておくとよいかもしれません。