Claude Code の使用上限がすぐ来る理由と 7 つの対処法(2026 年版)
Claude Code の上限が昼前に消える? Opus は Sonnet の数倍、subagent は 7 倍、MCP はコンテキストの 33% を食う。/usage で可視化し、7 つの対処法で解決。
朝 9 時に Claude Code を開いてリファクタを投げ、昼にはもう使用上限に達したと告げられる。有料プランでです。これは今の Claude Code の issue トラッカーで最もよくある不満のひとつで、原因はほぼ課金バグではありません。クォータの構造と、それを静かに食い潰すいくつかのデフォルト挙動が原因です。
Claude Code のプランを最速で空にする方法は、日常作業を Opus で回しながら、背後で 3 つの subagent を展開することです。そのどれもが、自分が使っているつもりのトークン消費の何倍にもなります。
これはサブスクリプションプランの上限のトラブルシューティングガイドです。Pro と Max で出る「You’ve hit your usage limit」の壁を扱います。API キーで 429 Rate Limit Reached が出ている場合は、原因も対処も別物で、Claude Code の rate limit reached エラー:原因と対処 が扱います。
30 秒の診断
2 つのコマンドを実行し、症状を下記の原因に当てはめてください。
| 手順 | コマンド | 何がわかるか |
|---|---|---|
| 1 | /usage | 5 時間のセッション上限と週次上限の両方に対する消費 |
| 2 | /context | 現在のウィンドウにロードされているもの。「MCP tools」の行に注目 |
| 症状 | 最も疑わしい原因 | 最速の対処 |
|---|---|---|
| 昼までに上限、セッションバーは高い | 日常作業を Opus デフォルトで | /model で Sonnet へ |
| セッション 2% なのに「limit reached」 | セッションではなく週次キャップ切れ | 7 日のリセット待ち、または API へ切替 |
| エージェント実行中に消える | subagent の並列展開(~7 倍トークン) | frontmatter で subagent を Sonnet/Haiku に固定 |
| ほとんど打つ前にクォータが消える | MCP サーバーが巨大なツール定義をロード | /context で確認し、未使用サーバーを削減 |
| 夜間に請求やクォータが跳ねる | auto-accept / バックグラウンドループ | effort を制限、アイドルのバックグラウンドタスクを停止 |
使用量はコントロールできていて、いますぐ余白が欲しいだけなら エスカレーション経路 へ飛んでください。ここからそこまでの内容は、プランを長持ちさせる話です。
いつ直すか、いつ切り替えるか、いつやめるか
すべての上限が戦う価値のあるものではないので、午後を最適化に溶かす前に方針を決めましょう。正しい一手は、セッションキャップに当たっているのか週次キャップに当たっているのかで完全に決まります。
- セッション内で直す:
/usageで重いバーストの間に 5 時間セッションキャップが上限まで達しているが、週次バーにはまだ余裕があるとき。Sonnet をデフォルトにし、積極的に compact し、MCP を削る。それでたいていセッションウィンドウ内に収まります。 - モデルを切り替える:単一の Opus 駆動ワークフローが問題の全体であるとき。subagent とデフォルトを Sonnet に固定するだけで、他に何も変えずにプランが 2〜3 倍長持ちすることがよくあります。
- 課金を切り替える:
/usageで全モデル共通の週次キャップが尽きていて、7 日のリセットまで数日あるとき。週次キャップをセッション内最適化で早めに戻すことはできません。その時点で、ティアを上げるか従量課金に移るかのどちらかです。 - 最適化をやめる:MCP を削りモデルをルーティングしても
/usageがなお速く空になるとき。実際の作業量がプランを超えているので、答えは エスカレーション経路 です。
簡単な目安として、エラーやリトライの率が低く、たまの重いスプリント中だけキャップに当たるなら、セッション内の対処で十分です。毎日午後の半ばに壁に当たるなら、それは衛生の問題ではなく課金モデルの問題です。
なぜこんなに早く減るのか:上限はひとつではなく 2 つ
人が驚く根本理由は、Claude Code が独立した 2 つの上限を課していて、しかも週次のほうは噛みつくまで見えないからです。5 時間の上限は最初のメッセージで始まり 5 時間後にリセットされるローリングのセッションウィンドウです。週次の上限はそれとは別の 7 日キャップで、Max プランでは 2 つあります。ひとつは全モデル共通、もうひとつは Sonnet 専用で、Anthropic 自身の使用量ドキュメント のとおりです。
これらは別の時計でリセットされます。重い週末を過ごすと、月曜に週次は余裕があるのにセッションキャップ、あるいはその逆になりえます。週次キャップに達すると、現在の 5 時間セッションにまだ余裕があっても 7 日のリセットまで使用がロックされます。5 時間待っても何も起きません。
もうひとつ人を惑わせるもの。Anthropic はウィンドウあたりのプロンプト数や週あたりの時間数といった固定値の公開をやめました。いま公開しているのは相対的なキャパシティです。Max 5x(月 $100)は Pro のセッションあたり使用量の 5 倍、Max 20x(月 $200)は 20 倍で、FrankX の料金解説 のとおりです。だから予算を組むための公開トークン数はありません。/usage を読み、自分の天井を覚えるしかありません。
flowchart TD
A[最初のメッセージ] --> B[5 時間セッションウィンドウ開始]
B --> C{セッションキャップ到達?}
C -->|はい| D[5 時間後のリセットまでロック]
C -->|いいえ| E{全モデル週次キャップ到達?}
E -->|はい| F[7 日リセットまでロック<br/>セッションに余裕があっても]
E -->|いいえ| G{Sonnet 専用週次キャップ到達?<br/>Max プランのみ}
G -->|はい| H[Sonnet ロック、他モデルは継続可]
G -->|いいえ| I[作業継続]
/usage でセッションが低いのに壁に当たるなら、それは週次キャップです。セッションバーが 2% を示しているのに週次 32% で上限が発火する 既知の Claude Code issue があります。そこでの対処は、セッションバーではなく週次の数字を信じることです。
目にする上限ステートと、それぞれの意味
これらは HTTP エラーコードではなく、Claude Code が表に出す上限ステートです。正しく読めば、待つべきか、モデルを切り替えるべきか、課金を切り替えるべきかがわかります。
| 表示されるステート | 意味 | 範囲 | いつ解除されるか |
|---|---|---|---|
| ”You’ve hit your usage limit” | 5 時間セッションキャップ到達 | 現在のセッション、全モデル | ローリングの 5 時間リセットで |
| ”Weekly limit reached” | 7 日の全モデルキャップ到達 | 全モデル、全セッション | 7 日のリセットでのみ |
| ”Sonnet weekly limit reached”(Max) | Sonnet 専用の 7 日キャップ到達 | Sonnet のみ、他モデルは継続 | 7 日のリセットでのみ |
| セッション % が低いのに “Limit reached” | ほぼ必ず週次キャップの発火 | セッションではなく週次 | 7 日のリセットでのみ |
| 軽い使用なのにセッションバーが 100% で固着 | 既知の表示バグ | 見た目だけ、真値は /usage で確認 | 再起動するか /usage の数字を信じる |
罠は 4 行目です。新しいセッションバーを見て「limit reached」を読み、バグとして報告する。ほとんどの場合それは週次キャップで、セッションバーには出ません。何かが壊れていると決めつける前に /usage を実行し、週次の行を読んでください。
症状・原因・対処
この表が記事の全体を一か所にまとめたものです。各原因は下の対処セクションに対応します。
| 症状 | 原因 | 対処 |
|---|---|---|
| 昼にはプランが空 | Opus がデフォルトモデル | /model で Sonnet をデフォルトに、Opus は難タスク用に温存 |
| セッション 2% で「limit reached」 | 週次キャップ切れ | /usage の週次数値を読む、リセット待ちか API へ |
| エージェント作業中が最速で減る | subagent が Opus を継承し別コンテキストで動く(~7 倍) | 各 subagent のモデルを frontmatter でルーティング |
| 実作業前にクォータが燃える | MCP ツール定義が 200k ウィンドウの ~33% | サーバーを削り、MCP Tool Search に遅延ロードさせる |
| コンテキストが再課金され続ける | セッション途中でキャッシュ接頭辞が無効化 | 開始時にツールとモデルを固定、/compact と /clear をきれいに |
| 夜間のスパイク | auto-accept とバックグラウンドループが無人で走る | プロンプトごとに effort 設定、アイドルのバックグラウンドタスクを停止 |
対処 1:Sonnet をデフォルトに、Opus は難しい部分に温存
デフォルトモデルの切り替えが最大のレバーです。Opus は 1 ターンあたり Sonnet の数倍、Sonnet は Haiku の数倍のコストです。API レートでは Opus 4.8 が入力 $5 / 出力 $25 per million トークン、Sonnet 4.6 が $3/$15、Haiku 4.5 が $1/$5 で、FrankX の料金 のとおりです。Opus のほうが重い推論まで数えると、現実の 1 ターンあたりの差はカタログ比よりさらに広がります。
Sonnet を作業のデフォルトにし、Opus は本当に難しい部分にだけ引き出してください。アーキテクチャの判断、厄介なデバッグ、答えを間違えると 1 時間を失うもの。切り替えは /model を使います。たいていの編集、リファクタ、テスト記述では Sonnet の出力は見分けがつきにくく、週次キャップを数倍長く持たせます。Opus が本当にコストに見合う場面のより深い仕組みは、Claude Code トークン最適化ガイド にあります。
もうひとつ変える価値のある設定が reasoning effort です。デフォルトの推論はほとんどのタスクで medium の約 2 倍のトークンを使います。グローバルな high のままにせず、プロンプトごとに effort を設定し、本当に必要な問題にだけ high を取っておきましょう。
対処 2:subagent が並列で Opus を燃やすのを止める
subagent の並列展開は、打鍵している間は見えないので最も静かな消費源です。各 subagent は新しいコンテキストウィンドウで自分の API リクエストを走らせます。あなたのセッションを継承しないので、必要なものを再読し、自分の呼び出しを課金します。エージェントチームは、メンバーが plan モードで走るとき 標準セッションの約 7 倍のトークン を使うことがあります。Max 20x を使い切ったある開発者は、使用量の 85% が subagent 中心のセッションから来ていたと突き止めました。
罠:ほとんどの構成は、すべての subagent がメインセッションのモデル(通常は Opus)を継承します。だから Opus 品質を必要としないタスクでも、すべてのワーカーが Opus 価格を払います。各ワーカーを frontmatter で明示的にルーティングしてください。
---
name: test-writer
model: sonnet # not the parent's Opus
---
モデルルーティングだけで subagent の費目をおよそ 30% 削れます。リネームや反復編集、ドキュメント参照のような機械的な作業では、それらのワーカーを Haiku に落としてください。重い計画と安価な実行を分けるパターンは、Claude Code のハイブリッドルーティングパターン で扱っています。
subagent にはもうひとつ、より見えにくいコストがあります。再読です。subagent はコールドで始まるので、親がすでにロードしたファイルを読み直します。subagent のプロンプトを狭く保ち、リポジトリの半分を再スキャンしないようにしましょう。「auth_test.py の失敗しているテストを直して」と言われたワーカーは 1 ファイルを読み、「テストカバレッジを上げて」と言われたワーカーは 20 ファイルを読みます。
対処 3:MCP サーバーがウィンドウを食う前に削る
MCP サーバーは、あなたが何かする前から課金します。接続済みの MCP サーバーが 7 つあると、セッション開始時にツール定義で 67,300 トークン、200k コンテキストウィンドウの 33.7% を消費しえます。各ツールのカタログは説明文 200〜800 トークンにスキーマが加わり、サーバーあたり約 50 ツールに掛け算されると、Async Let の分析 のとおりです。このオーバーヘッドは毎ターン乗ってくるので、週次キャップに対して急速に積み上がります。
2 つの手:
- 監査して無効化する。
/contextを実行し「MCP tools」の行を見ます。2 週間使っていないサーバーは無効化します。プロジェクト単位の設定を使い、現在のリポジトリに関係するサーバーだけがロードされるようにします。 - Tool Search に遅延させる。 Claude Code の MCP Tool Search(v2.1.7+)は、アクティブな MCP ツール記述がコンテキスト予算の 10% を超えると、ツールのロードを自動で遅延させます。発動後は
/contextの「MCP tools」行が大きく減るはずです。そこで機能していることを確認できます。
数個のサーバーを常時動かしているなら、/context が最速の監査手段です。接続したことを忘れていたサーバーが 2〜3 つ見つかり、それぞれがセッションごとに 5 桁トークンを静かに食っていた、というのがよくある結果です。
対処 4:/compact と /clear の規律でキャッシュを温かく保つ
コンテキストの衛生はプロンプトキャッシュを守り、温かいキャッシュが節約の大部分です。プロンプトキャッシングはキャッシュ済み入力のコストを劇的に下げます。キャッシュヒット率は 5 分のデフォルトで ~90% が健全、1 時間 TTL では ~97-99% まで上がります。Product Compass のコストガイド のとおりです。これを台無しにするもの:セッション途中でのツールの追加や削除は、キャッシュされた接頭辞を無効化し、完全な再読を強制します。ツールとモデルはセッション開始時に固定してください。
そのうえでウィンドウを意図的に管理します。
/compactを使用量 50% 前後、または個々のタスクのあとに実行し、古いターンが毎ターン丸ごと再送される代わりに要約されるようにする。/clearを無関係な作業の区切りで使う。新しいウィンドウを始めるほうが、1 時間分の古いコンテキストを新しいタスクに引きずるよりよい。- auto-accept とバックグラウンドループに注意する。再プロンプトを続ける無人ループは、あなたが寝ている間にセッションを夜通し空にしうる。離席する前に effort を制限し、アイドルのバックグラウンドタスクを停止しましょう。
プランティア別の対処
同じ消費源はどのプランにも当てはまりますが、ティアを上がるにつれて正しいレバーは移ります。各ティアがまずどこに注力すべきかを示します。
Free / Pro ティア
Pro は週次の余裕が最もきついので、モデルの規律が最重要です。Sonnet をデフォルトにし、Pro では subagent の並列展開を完全に避け(小さなキャップを最速で空にする手だから)、/compact を早めに実行します。Pro はまた、日常作業に Opus を使うと二重に払うことになります。ここで週次の壁に当たるなら、Max への移行か、重い日のための従量課金 API のどちらかが必要です。
Max 5x / Max 20x ティア
Max プランには subagent を動かす余裕がありますが、まさにそこが Max ユーザーの焼けどころです。Max 固有の最大の対処は、すべての subagent のモデルを frontmatter でルーティングし、Opus の継承をやめさせることです。Max には 2 つ目の Sonnet 専用週次キャップもあるので、全モデルキャップを守ろうとすべてを Sonnet に切り替えたら、/usage で Sonnet の行も見てください。全モデルキャップに余裕があるまま Sonnet キャップを使い切ることがあります。
Team / Enterprise ティア
シート単位のプランでは、使用量はローリングウィンドウでリセットされるプールから引かれます。Anthropic のドキュメント のとおりです。ここでの対処は組織的です。チーム全体が Sonnet をデフォルトにする共有のモデルルーティング規約、誰も 10 個のサーバーをロードしないようリポジトリにコミットされた削減済み MCP 設定、そしてプールが枯れた日のためのフォールバック API キー。プールの天井に定期的に当たるチームには、従量課金ゲートウェイがシートを再交渉せずにオーバーフロー用の車線を与えます。
観測されてきたよくある障害パターン
プラン上限に公開された障害履歴はありません。これはサービス停止の問題ではないからです。人が予想するより速くクォータを消費する、繰り返される挙動の集合です。何度も現れるのが次のパターンです。
| パターン | どう見えるか | なぜ速く減るか |
|---|---|---|
| Opus デフォルト | 日常編集で午後早くにプランが空 | Opus は 1 ターンあたり Sonnet の数倍 |
| subagent 並列展開 | エージェント実行中にクォータ急落、打鍵中は問題なし | 各 subagent が独自コンテキストで走る、~7 倍トークン |
| MCP の肥大 | 実作業の前にクォータが消える | ツール定義が開始時にウィンドウの ~33% になりうる |
| キャッシュ崩れ | 小さなターンでもトークン使用が高いまま | セッション途中のツール変更がキャッシュ接頭辞を無効化 |
| 幻の上限 | セッションバーがほぼ空なのに「limit reached」 | 週次キャップの発火、ときに表示バグ |
| 夜間ループ | 朝にはクォータが消えている、誰もキーボードにいなかった | auto-accept ループが無人で再プロンプトし続けた |
「上限がおかしい」という報告のほとんどは、この 6 行のどれかに対応します。特に幻の上限パターンは混乱の大きな割合を占めます。セッションバーと週次キャップは別の数字で、デフォルトでは一方しか見えないからです。
2026 年 6 月の課金変更:実際に何が起きたか
何も変わりませんでしたが、不安は本物で、理解しておく価値があります。Anthropic は、Agent SDK と claude -p の使用をサブスクリプションから切り離し、標準 API レートで課金される別建てのドル建て月次クレジットに移すと予告しました。Pro $20、Max 5x $100、Max 20x $200 で、繰り越しなし。
その後、6 月 15 日の発効日より前に Anthropic はそれを一時停止しました。これらの利用面は従来どおり Pro と Max のサブスクリプション上限から引かれます。請求すべきクレジットはなく、上限は変わっていません。Anthropic はプランを練り直しており、今後の変更前には事前告知すると述べています。
これがあなたにとって意味すること:まだ存在しないクレジットプールを前提にワークフローを組み直さないこと。上記の対処は、今日まさに有効な上限を狙っています。
| 日付(2026 年) | 変更 | ステータス |
|---|---|---|
| 5 月 6 日 | 5 時間上限を倍増(Pro/Max/Team/Enterprise)、ピーク時間のスロットリング撤廃 | 有効 |
| 5 月 13 日 | 週次上限を 7 月 13 日まで 50% 引き上げ(プロモ) | 有効、期間限定 |
| 6 月 15 日 | Agent SDK と claude -p を別建てクレジットプールへ | 一時停止、発効せず |
プランでも足りないときの従量課金ルート
/usage で週次キャップが尽きていて、リセットを待てないなら、プランの天井から逃れる唯一の現実的な手段は従量課金です。サブスクリプションは日常メインツールの使用量では安上がりです。その負荷では、同じトークンが生の API レートでは $100 の Max 5x 定額より約 2〜2.5 倍高くつきます。しかしサブスクリプションは週次キャップでハードに止まり、従量課金には週次キャップが一切ありません。
バースト的、ヘッドレス、予測不能な作業では、従量課金が完勝します。ofox のような OpenAI 互換ゲートウェイなら、Claude Code(または任意の OpenAI-SDK クライアント)を 1 つのキーに向け、トークン単位の課金・プラン上限なしで、プロバイダーのアカウントを掛け持ちせずに Claude、GPT、Gemini のモデルを切り替えられます。
export ANTHROPIC_BASE_URL="https://api.ofox.ai/v1"
export ANTHROPIC_API_KEY="sk-ofox-..."
# Claude Code now bills per token, no weekly cap
コードでは、モデル文字列はどこで使うのと同じ形です。
client.chat.completions.create(
model="anthropic/claude-sonnet-4.6", # one key, swap to opus/gpt/gemini freely
messages=[{"role": "user", "content": "refactor this module"}],
)
正直なトレードオフ:あるプランの上限内に収まる日常ヘビーユーザーなら、サブスクリプションを続けてください。従量課金が元を取るのは、使用がムラだらけでサブスクリプションの月額相当に決して届かないとき、あるいは週次の壁に当たり続けてリセットが遠すぎて待てないときです。
キャップに達したときの代替策
タスクの途中で週次の壁に当たったときの現実的な進み方です。週次キャップがなく、1 つのキーの裏に多数のモデルがある唯一の選択肢なので ofox を先頭に挙げます。
| 選択肢 | 週次キャップなし | 1 キーで多モデル | 向いている用途 |
|---|---|---|---|
| ofox API(従量課金) | あり | あり(Claude/GPT/Gemini) | バースト的・ヘッドレス・マルチモデル作業、週次の壁からの脱出 |
| Anthropic Max 20x | なし | なし(Anthropic のみ) | 1 プラン内に収まる日常ヘビーユース |
| Anthropic API キー直接 | あり | なし(Anthropic のみ) | Anthropic 限定の自動化、CI ジョブ |
| リセットを待つ | 該当なし | 該当なし | 7 日ウィンドウの終盤にいるライトユーザー |
プラン上限は報告すべきバグではありません。読める予算です。
/usageを実行し、Sonnet をデフォルトにすれば、昼に当たっていた壁は週末まで動きます。
タスクの途中でロックアウトされてリセットが数日先なら、現実的な一手はワークフローはそのままに、トークンがどこで課金されるかだけを変えることです。当たっているのが上限なのか、それとも明確なエラーなのか、より安全なデフォルト構成については、Claude Code セーフモードガイド を参照してください。
壁に当たる前に使用量を監視する方法
ここまでの要点は、二度と驚かないことです。外部ツールなしで、3 つのコマンドが必要なすべてを与えてくれます。
/usageはあなたのダッシュボードです。セッションの開始時と、重いエージェント実行の前に確認します。週次のほうが人を不意打ちするので、セッションの行と週次の行の両方を読みましょう。/contextは今ロードされているものを示します。「MCP tools」の行が大きければ、実作業に 1 ターンも費やす前に削減の余地があります。/costは現在のセッションを API レート換算したドル相当額を報告します。Opus 中心のセッションが実際どれほど高いかを最速で体感できます。
セッション開始時にさっと /usage と /context を見る習慣をつけてください。2 秒読むだけで、あなたをここに連れてきた昼前のロックアウトを防げます。
FAQ
Claude Code の使用上限がなぜこんなに早く来るのですか?
たいてい Opus デフォルト、subagent の並列展開、MCP の肥大です。Opus は 1 ターンあたり Sonnet の数倍。subagent は単一スレッドの約 7 倍のトークンで独自のコンテキストウィンドウを走らせます。MCP サーバー 7 つは、あなたが打鍵する前にウィンドウの 3 分の 1 を食いうる。/usage と /context でどれかを突き止めてください。
5 時間の上限と週次の上限は何が違うのですか? 5 時間の上限はローリングのセッションウィンドウです。週次の上限は 7 日キャップで、Max プランには 2 つあります(全モデルと Sonnet 専用)。別の時計でリセットされるので、片方に当たっても片方は全開、ということがあります。
週次の上限に達すると、5 時間セッションが新しくてもロックされますか? はい。週次キャップはセッションの余裕に関係なく 7 日のリセットまで使用をロックします。5 時間待っても助けになりません。
残り使用量はどうやって確認しますか?
/usage はセッションと週次の消費を、/context はロードされているものを、/cost はセッションの API レート換算ドル相当額を示します。
Anthropic は 2026 年 6 月 15 日に Claude Code の課金を変更しましたか? いいえ。予定されていた Agent SDK のクレジットプール変更は、発効前に一時停止されました。サブスクリプション上限は変わっていません。
Opus から Sonnet に切り替えるとプランは長持ちしますか?
大幅に。Opus は 1 ターンあたり数倍高価です。/model で Sonnet をデフォルトにし、Opus は難タスク用に温存してください。
セッションが 2% なのに「usage limit reached」と出るのはなぜですか?
それはセッションキャップではなく週次キャップの発火です。ときどき、ローカル使用量が低いのにセッションバーが 100% に跳ね上がる既知の表示バグです。/usage の週次の数字を信じてください。
Claude Pro プランと API キーを同時に使えますか? はい。多くの開発者は日常はサブスクリプションで走り、週次キャップを使い切った日だけ Claude Code を従量課金 API キーに切り替え、リセット後に戻します。base URL とキーは環境変数なので、入れ替えは 2 行です。
今回の更新で確認したソース
- Anthropic Help Center, Models, usage, and limits in Claude Code(2026-06-24 確認)
- Anthropic Help Center, Use Claude Code with your Pro or Max plan(2026-06-24 確認)
- DigitalApplied, Claude Credit Overhaul 2026: Anthropic Pauses the June 15 Change(2026-06-24 確認)
- MorphLLM, Claude Code Usage Limits (2026): 5-Hour Caps Doubled May 6(2026-06-24 確認)
- FrankX, Claude Code Pricing Explained 2026(2026-06-24 確認)
- You Can Build Things, Why Claude Code Subagents Burn So Many Tokens(2026-06-24 確認)
- Async Let, Do MCP Servers Really Eat Half Your Context Window?(2026-06-24 確認)
- Product Compass, Claude Code Limits: 4 Fixes to Cut Your Bill(2026-06-24 確認)
- GitHub, anthropics/claude-code Issue #61828: ‘Usage limit reached’ despite session at 2%(2026-06-24 確認)
- ofox models catalog snapshot, https://ofox.ai/models(2026-06-24 確認)


