Лимит Claude Code исчерпан слишком быстро: почему и 7 способов починить (2026)

Лимит Claude Code кончился к обеду? Opus жжёт в разы больше Sonnet, субагенты — 7x токенов, MCP съедает 33% контекста. Разбор через /usage и 7 решений.

Лимит Claude Code исчерпан слишком быстро: почему и 7 способов починить (2026)

Вы открыли Claude Code в 9 утра, дали ему задачу на рефакторинг, а к обеду он сообщил, что вы исчерпали лимит. На платном плане. Это одна из самых частых жалоб в трекере проблем Claude Code прямо сейчас, и причина почти никогда не в баге биллинга. Дело в том, как устроена квота, плюс пара поведений по умолчанию, которые тихо её прожигают.

Быстрее всего опустошить план Claude Code так: гонять Opus на рутине, пока за вашей спиной веером расходятся три субагента. Каждый из них — это кратный множитель к тому расходу токенов, который вы себе представляете.

Это руководство по устранению проблем с лимитом плана подписки: со стеной «You’ve hit your usage limit» на Pro и Max. Если у вас API-ключ и вы получаете 429 Rate Limit Reached, то это другой сбой с другими решениями — он разобран в статье Ошибка Rate Limit Reached в Claude Code: причины 429 и способы починить.

Диагностика за 30 секунд

Запустите две команды, затем сопоставьте свой симптом с причиной ниже.

ШагКомандаЧто показывает
1/usageРасход относительно 5-часового лимита сессии и недельного лимита (или лимитов)
2/contextЧто загружено в текущее окно. Следите за строкой «MCP tools»
СимптомНаиболее вероятная причинаСамое быстрое решение
Лимит исчерпан к середине дня, шкала сессии высокоOpus по умолчанию на рутинной работе/model на Sonnet
Сессия на 2%, но «limit reached»Исчерпан недельный потолок, не сессияЖдать 7-дневного сброса или перейти на API
Лимит тает во время прогонов агентовВеер субагентов (~7x токенов)Прибить субагентов к Sonnet/Haiku во frontmatter
Квота кончилась раньше, чем вы напечаталиMCP-серверы грузят огромные описания инструментов/context, затем убрать неиспользуемые серверы
Счёт или квота скачут ночьюАвто-подтверждение / фоновые циклыОграничить усилие, убить простаивающие фоновые задачи

Если расход под контролем и вам нужен просто запас прямо сейчас, переходите к пути эскалации. Всё, что между этим местом и тем, — про то, как растянуть план.

Когда чинить, когда переключаться, а когда остановиться

Не каждый лимит стоит того, чтобы с ним бороться, так что определите стратегию заранее, прежде чем потратить полдня на оптимизацию. Правильный ход целиком зависит от того, во что вы упёрлись — в потолок сессии или в недельный потолок.

  • Чините внутри сессии, когда /usage показывает, что 5-часовой потолок сессии выбит в тяжёлых всплесках, но недельная шкала ещё с запасом. По умолчанию используйте Sonnet, агрессивно сжимайте контекст и подрезайте MCP. После этого вы обычно остаётесь в рамках окна сессии.
  • Переключайте модель, когда вся проблема — в одном рабочем процессе на Opus. Прибив субагентов и дефолт к Sonnet, вы часто удваиваете или утраиваете срок жизни плана, и больше ничего менять не нужно.
  • Переключайте биллинг, когда /usage показывает, что недельный потолок на все модели исчерпан, а до 7-дневного сброса ещё несколько дней. Никакая оптимизация внутри сессии не вернёт недельный потолок досрочно. В этот момент вы либо поднимаете тариф, либо переходите на оплату по факту.
  • Перестаньте оптимизировать, когда вы уже подрезали MCP, развели модели по ролям, а /usage всё равно опустошается быстро. Ваш реальный объём перерос план, и ответ — путь эскалации.

Быстрая самопроверка: если частота ошибок и повторов низкая, а в потолок вы упираетесь только во время редких тяжёлых спринтов, то решений внутри сессии достаточно. Если вы упираетесь в стену каждый божий день к середине дня, у вас проблема модели биллинга, а не гигиены.

Почему лимит тает так быстро: два потолка, а не один

Главная причина, по которой люди удивляются, в том, что Claude Code применяет два независимых лимита, и недельный невидим, пока не укусит. 5-часовой лимит — это скользящее окно сессии, которое стартует с первого сообщения и сбрасывается через пять часов. Недельный лимит — это отдельный 7-дневный потолок, а на планах Max их два: один на все модели и один только на Sonnet, согласно официальной документации Anthropic по использованию.

Они сбрасываются по разным часам. Тяжёлые выходные могут оставить вас с выбитой сессией в понедельник при запасе недельной квоты — или наоборот, с выбитой неделей при запасе сессий. Достижение недельного потолка блокирует работу до его 7-дневного сброса, даже если в текущей пятичасовой сессии ещё есть запас. Ждать пять часов бесполезно.

Ещё одно, что сбивает людей: Anthropic перестал публиковать фиксированные цифры «промптов на окно» и «часов в неделю». Сейчас публикуется относительная ёмкость. Max 5x ($100/мес) даёт 5x от посессионного расхода Pro, а Max 20x ($200/мес) — 20x, согласно разбору цен на FrankX. Так что публичной цифры по токенам, под которую можно бюджетировать, нет. Приходится читать /usage и узнавать свой собственный потолок.

flowchart TD
    A[Первое сообщение] --> B[Стартует 5-часовое окно сессии]
    B --> C{Потолок сессии достигнут?}
    C -->|Да| D[Блокировка до сброса сессии через 5 ч]
    C -->|Нет| E{Недельный потолок на все модели достигнут?}
    E -->|Да| F[Блокировка до 7-дневного сброса<br/>даже при запасе сессии]
    E -->|Нет| G{Недельный потолок только на Sonnet достигнут?<br/>Только планы Max}
    G -->|Да| H[Sonnet заблокирован, другие модели могут продолжать]
    G -->|Нет| I[Продолжаем работу]

Если /usage показывает, что сессия низко, а вы всё равно упёрлись в стену — это недельный потолок. Есть известная проблема Claude Code, где шкала сессии показывает 2%, а лимит срабатывает на 32% недельной квоты. Решение там — доверять недельной цифре, а не шкале сессии.

Состояния лимита, которые вы увидите, и что каждое значит

Это не HTTP-коды ошибок, а состояния лимита, которые показывает Claude Code. Прочитав их правильно, вы поймёте, что делать — ждать, менять модель или менять биллинг.

Что вы видитеЧто это значитОбластьКогда снимется
«You’ve hit your usage limit»Достигнут 5-часовой потолок сессииТекущая сессия, все моделиНа скользящем 5-часовом сбросе
«Weekly limit reached»Достигнут 7-дневный потолок на все моделиКаждая модель, все сессииТолько на 7-дневном сбросе
«Sonnet weekly limit reached» (Max)Достигнут 7-дневный потолок только на SonnetТолько Sonnet, другие модели продолжаютТолько на 7-дневном сбросе
«Limit reached» при низком % сессииПочти всегда срабатывает недельный потолокНеделя, не сессияТолько на 7-дневном сбросе
Шкала сессии застряла на 100% при лёгком расходеИзвестный баг отображенияКосметика, проверьте /usage для правдыПерезапуск или доверяйте цифрам /usage

Ловушка — четвёртая строка. Люди видят свежую шкалу сессии, читают «limit reached» и заводят баг. Почти всегда это недельный потолок, который шкала сессии не показывает. Запустите /usage и прочитайте недельную строку, прежде чем считать, что что-то сломалось.

Симптом, причина, решение

Эта таблица — вся статья в одном месте. Каждая причина ведёт к разделу с решением ниже.

СимптомПричинаРешение
План пустеет к обедуOpus — модель по умолчаниюСделать Sonnet дефолтом через /model, Opus беречь для сложных задач
«Limit reached» при сессии на 2%Исчерпан недельный потолокЧитать недельные цифры в /usage, ждать сброса или перейти на API
Тает быстрее всего во время работы агентовСубагенты наследуют Opus и ведут отдельные контексты (~7x)Разводить модель каждого субагента в его frontmatter
Квота сгорает до реальной работыОписания MCP-инструментов ~33% окна на 200kПодрезать серверы, дать MCP Tool Search отложить загрузку
Контекст переоплачивается сноваПрефикс кэша сброшен посреди сессииЗафиксировать инструменты и модель в начале, чисто /compact и /clear
Ночные скачкиАвто-подтверждение и фоновые циклы работают без присмотраЗадать усилие на промпт, убить простаивающие фоновые задачи

Решение 1: По умолчанию Sonnet, Opus — для сложных кусков

Смена модели по умолчанию — самый большой рычаг. Opus стоит в несколько раз дороже за ход, чем Sonnet, а Sonnet — дороже Haiku. По тарифам API это Opus 4.8 за $5/$25 за миллион входных/выходных токенов, Sonnet 4.6 за $3/$15 и Haiku 4.5 за $1/$5, согласно ценам FrankX. Реальный разрыв за ход шире, чем сухое отношение цен, как только учесть более тяжёлые рассуждения Opus.

Сделайте Sonnet своим рабочим дефолтом и доставайте Opus только для по-настоящему сложных кусков: архитектурных решений, заковыристой отладки — всего, где неверный ответ стоит вам часа. Используйте /model для переключения. Для большинства правок, рефакторингов и написания тестов вывод Sonnet почти неотличим, и он растягивает ваш недельный потолок в несколько раз дальше. Глубокая механика того, когда Opus действительно отрабатывает свою цену, разобрана в нашем руководстве по оптимизации токенов в Claude Code.

Ещё одна настройка, которую стоит сменить: усилие рассуждений. Рассуждения по умолчанию жгут примерно 2x токенов от среднего уровня для большинства задач. Задавайте усилие на каждый промпт, а не оставляйте глобальный high, и берегите высокое усилие для задач, которым оно действительно нужно.

Решение 2: Не дать субагентам жечь Opus параллельно

Веер субагентов — самый тихий расход, потому что он не виден, пока вы печатаете. Каждый субагент ведёт собственные API-запросы в свежем окне контекста. Он не наследует вашу сессию, поэтому перечитывает нужное и оплачивает собственные вызовы. Команды агентов могут расходовать примерно 7x токенов стандартной сессии, когда напарники работают в режиме планирования. Один разработчик, прожёгший Max 20x, обнаружил, что 85% расхода пришлось на сессии с обилием субагентов.

Ловушка: в большинстве конфигураций каждый субагент наследует модель главной сессии, а это обычно Opus. Так что каждый рабочий платит цену Opus за задачи, которым качество Opus не нужно. Явно разводите каждого рабочего в его frontmatter:

---
name: test-writer
model: sonnet   # not the parent's Opus
---

Одна только маршрутизация модели срезает строку расхода на субагентов примерно на 30%. Для механической работы вроде переименований, повторяющихся правок или поиска по документации опускайте этих рабочих до Haiku. Паттерн разделения тяжёлого планирования и дешёвого исполнения разобран в нашем паттерне гибридной маршрутизации Claude Code.

Есть и второй, более коварный расход на субагентов: перечитывания. Поскольку субагент стартует с холодного старта, он перечитывает файлы, которые родитель уже загрузил. Держите промпты субагентов узкими, чтобы они не пересканировали половину репозитория. Рабочий с заданием «почини падающий тест в auth_test.py» читает один файл; рабочий с заданием «улучши покрытие тестами» читает двадцать.

Решение 3: Подрежьте MCP-серверы, пока они не съели ваше окно

MCP-серверы списывают с вас ещё до того, как вы что-то сделали. Семь подключённых MCP-серверов могут потреблять 67 300 токенов описаний инструментов — это 33,7% окна контекста на 200k — на старте сессии. Каталог каждого инструмента — это 200–800 токенов прозы плюс схема, умноженные примерно на 50 инструментов на сервер, согласно разбору Async Let. Этот оверхед едет на каждом ходу, поэтому он быстро накапливается против вашего недельного потолка.

Два хода:

  1. Аудит и отключение. Запустите /context и посмотрите на строку «MCP tools». Отключите любой сервер, которым вы не пользовались две недели. Используйте конфиг на уровне проекта, чтобы грузились только серверы, релевантные текущему репозиторию.
  2. Дайте Tool Search отложить. MCP Tool Search в Claude Code (v2.1.7+) автоматически откладывает загрузку инструментов, когда описания активных MCP-инструментов превышают 10% бюджета контекста. После того как он включится, строка «MCP tools» в /context должна резко упасть. Прямо там можно убедиться, что он работает.

Если вы держите горстку серверов постоянно, /context — самый быстрый аудит. Частый результат — обнаружить два-три сервера, о подключении которых вы забыли, и каждый тихо стоит вам пятизначного числа токенов за сессию.

Решение 4: Держите кэш тёплым дисциплиной /compact и /clear

Гигиена контекста защищает ваш кэш промптов, а тёплый кэш — это бо́льшая часть вашей экономии. Кэширование промптов резко снижает стоимость кэшированного ввода. Доля попаданий в кэш ~90% — норма на дефолтных 5 минутах и поднимается до ~97–99% на TTL в 1 час, согласно руководству по затратам Product Compass. То, что его убивает: добавление или удаление инструмента посреди сессии сбрасывает кэшированный префикс и заставляет полностью перечитывать. Зафиксируйте инструменты и модель в начале сессии.

Затем управляйте окном осознанно:

  • /compact примерно при 50% расхода или после каждой отдельной задачи, чтобы старые ходы суммировались, а не пересылались целиком на каждом ходу.
  • /clear между несвязанными кусками работы. Начать свежее окно лучше, чем тащить час устаревшего контекста в новую задачу.
  • Следите за авто-подтверждением и фоновыми циклами. Цикл без присмотра, который продолжает заново запрашивать, может опустошить сессию за ночь, пока вы спите. Ограничьте усилие и убейте простаивающие фоновые задачи, прежде чем уйти.

Решения по уровням плана

Те же расходы действуют на каждом плане, но правильный рычаг смещается по мере роста тарифа. Вот на чём каждому уровню стоит сосредоточиться в первую очередь.

Уровень Free / Pro

На Pro у вас самый тесный недельный запас, так что дисциплина моделей важнее всего. По умолчанию используйте Sonnet, полностью откажитесь от веера субагентов на плане Pro (это самый быстрый способ опустошить маленький потолок) и запускайте /compact рано. Pro также не может опираться на Opus в рутинной работе, не платя за неё дважды. Если вы упёрлись в недельную стену здесь, вам пора либо на Max, либо на потокенный API-биллинг для тяжёлых дней.

Уровень Max 5x / Max 20x

У планов Max есть запас, чтобы гонять субагентов, но именно там пользователей Max и обжигает. Самое крупное специфичное для Max решение — разводить модель каждого субагента во frontmatter, чтобы они перестали наследовать Opus. Max также несёт второй, только-Sonnet недельный потолок, так что если вы переключите всё на Sonnet ради экономии потолка на все модели, следите и за строкой Sonnet в /usage. Можно исчерпать потолок Sonnet, пока у потолка на все модели ещё есть запас.

Уровень Team / Enterprise

На посадочных (seat-based) планах расход берётся из общего пула, сбрасываемого по скользящему окну, согласно документации Anthropic. Решения здесь организационные: общая конвенция маршрутизации моделей, чтобы вся команда по умолчанию шла на Sonnet; подрезанный MCP-конфиг, закоммиченный в репозиторий, чтобы никто не грузил десять серверов; и запасной API-ключ на дни, когда пул пересыхает. Командам, которые регулярно упираются в потолок пула, потокенный шлюз даёт полосу для перелива без перезаключения договоров по посадкам.

Типичные паттерны сбоев, которые мы наблюдали

Публичной истории сбоев для лимитов плана нет, потому что это не проблема падения сервиса. Это набор повторяющихся поведений, опустошающих квоту быстрее, чем люди ожидают. Вот паттерны, которые всплывают снова и снова.

ПаттернКак выглядитПочему тает быстро
Opus-по-умолчаниюПлан пустеет к началу дня на рутинных правкахOpus стоит в несколько раз дороже Sonnet за ход
Веер субагентовКвота падает во время прогонов агентов, нормально при наборе текстаКаждый субагент ведёт свой контекст, ~7x токенов
Раздутый MCPКвота кончилась до начала реальной работыОписания инструментов могут быть ~33% окна на старте
Трэшинг кэшаРасход токенов остаётся высоким даже на мелких ходахСмены инструментов посреди сессии сбрасывают кэшированный префикс
Фантомный лимит«Limit reached» при почти пустой шкале сессииСрабатывает недельный потолок, иногда баг отображения
Ночной циклКвота кончилась к утру, никого не было за клавиатуройЦикл авто-подтверждения продолжал заново запрашивать без присмотра

Большинство отчётов «у меня сломан лимит» ложатся на одну из этих шести строк. На паттерн фантомного лимита, в частности, приходится большая доля путаницы, потому что шкала сессии и недельный потолок — это разные числа, и только одно из них видно по умолчанию.

Изменение биллинга в июне 2026: что на самом деле произошло

Ничего не изменилось, но испуг был реальным и его стоит понять. Anthropic объявил, что расход Agent SDK и claude -p переедет с подписки на отдельный долларовый ежемесячный кредит по стандартным тарифам API: $20 для Pro, $100 для Max 5x, $200 для Max 20x, без переноса остатка.

Затем, до даты вступления в силу 15 июня, Anthropic приостановил это. Эти поверхности по-прежнему списываются с лимитов подписки Pro и Max ровно как раньше. Нет никакого кредита, который нужно заявлять, и ваши лимиты не изменились. Anthropic говорит, что перерабатывает план и заранее предупредит о любых будущих изменениях.

Что это значит для вас: не перестраивайте свой рабочий процесс вокруг пула кредитов, которого пока нет. Решения выше нацелены на лимиты, которые реально живут сегодня.

Дата (2026)ИзменениеСтатус
6 мая5-часовые лимиты удвоены (Pro/Max/Team/Enterprise), троттлинг в часы пик убранДействует
13 маяНедельные лимиты подняты на 50% до 13 июля (промо)Действует, ограничено по времени
15 июняAgent SDK и claude -p перенесены в отдельный пул кредитовПриостановлено, не вступило в силу

Когда плана всё равно мало: маршрут оплаты по факту

Если /usage показывает, что ваш недельный потолок исчерпан, а ждать сброса вы не можете, единственный реальный выход из потолка плана — потокенный биллинг. Подписки дешевле на объёме «ежедневного основного инструмента». При такой нагрузке те же токены стоят примерно в 2–2,5 раза дороже по сырым тарифам API, чем фиксированные $100 за Max 5x. Но подписки жёстко останавливают вас на недельном потолке, а у оплаты по факту недельного потолка нет вовсе.

Для рваной, headless или непредсказуемой работы потокенный биллинг выигрывает безоговорочно. OpenAI-совместимый шлюз вроде ofox позволяет направить Claude Code (или любой клиент на OpenAI SDK) на один ключ с тарификацией за токен и без потолка плана, и переключаться между моделями Claude, GPT и Gemini, не жонглируя аккаунтами провайдеров:

export ANTHROPIC_BASE_URL="https://api.ofox.ai/v1"
export ANTHROPIC_API_KEY="sk-ofox-..."
# Claude Code now bills per token, no weekly cap

В коде строка модели той же формы, что вы использовали бы где угодно:

client.chat.completions.create(
    model="anthropic/claude-sonnet-4.6",  # one key, swap to opus/gpt/gemini freely
    messages=[{"role": "user", "content": "refactor this module"}],
)

Честный компромисс: если вы ежедневный тяжёлый пользователь в рамках лимитов одного плана, оставайтесь на подписке. Потокенный биллинг оправдывает себя, когда ваш расход достаточно рваный, чтобы вы никогда не дотягивали до месячной стоимости подписки, или когда вы постоянно врезаетесь в недельную стену, а сброс слишком далеко, чтобы ждать.

Альтернативы, когда вы упёрлись в потолок

Когда недельная стена бьёт посреди задачи, вот реалистичные пути вперёд, с ofox первым, потому что это единственный вариант здесь без недельного потолка и со многими моделями за одним ключом.

ВариантБез недельного потолкаОдин ключ, много моделейЛучше всего для
ofox API (оплата по факту)ДаДа (Claude/GPT/Gemini)Рваной, headless, мультимодельной работы, ухода от недельной стены
Anthropic Max 20xНетНет (только Anthropic)Ежедневной тяжёлой работы в рамках одного плана
Прямой API-ключ AnthropicДаНет (только Anthropic)Автоматизации только на Anthropic, CI-задач
Ждать сбросаЛёгких пользователей в конце 7-дневного окна

Лимит плана — это не баг, который нужно завести. Это бюджет, который можно прочитать. Запустите /usage, перейдите по умолчанию на Sonnet — и стена, в которую вы упёрлись к обеду, сдвинется на конец недели.

Если вы заблокированы посреди задачи, а сброс через несколько дней, практичный ход — сохранить тот же рабочий процесс и сменить только то, где списываются токены. По более широкому вопросу — лимит перед вами или прямая ошибка, и какая настройка по умолчанию безопаснее, — смотрите руководство по безопасному режиму Claude Code.

Как следить за расходом, прежде чем упереться в стену

Смысл всего этого — больше никогда не удивляться. Три команды дают всё необходимое, без внешних инструментов.

  • /usage — ваша панель. Проверяйте её в начале сессии и снова перед любым тяжёлым прогоном агентов. Читайте и строку сессии, и недельную строку, ведь именно недельная подкарауливает людей.
  • /context показывает, что загружено прямо сейчас. Если строка «MCP tools» большая, у вас есть возможность подрезать ещё до того, как вы потратили хоть один ход на реальную работу.
  • /cost отчитывается о долларовой стоимости текущей сессии по тарифам API — самый быстрый способ ощутить, насколько дорога на самом деле сессия с обилием Opus.

Выработайте привычку быстро запускать /usage и /context в начале сессии. Две секунды чтения предотвращают ту самую блокировку к обеду, которая привела вас сюда.

FAQ

Почему лимит использования Claude Code исчерпывается так быстро? Обычно Opus-по-умолчанию, веер субагентов или раздутый MCP. Opus стоит в несколько раз дороже за ход, чем Sonnet. Субагенты ведут собственные окна контекста, примерно 7x токенов одного потока. Семь MCP-серверов могут съесть треть окна ещё до того, как вы начали печатать. Запустите /usage и /context, чтобы найти виновника.

В чём разница между 5-часовым лимитом и недельным лимитом? 5-часовой лимит — это скользящее окно сессии. Недельный лимит — 7-дневный потолок, и у планов Max их два (на все модели и только на Sonnet). Они сбрасываются по разным часам, так что можно упереться в один при полностью открытом другом.

Блокирует ли недельный лимит, даже если 5-часовая сессия свежая? Да. Недельный потолок блокирует работу до своего 7-дневного сброса независимо от запаса сессии. Ждать пять часов не поможет.

Как проверить, сколько расхода у меня осталось? /usage показывает расход по сессии и неделе, /context показывает, что загружено, а /cost показывает долларовую стоимость сессии по тарифам API.

Менял ли Anthropic биллинг Claude Code 15 июня 2026? Нет. Запланированный перенос Agent SDK в пул кредитов приостановлен до вступления в силу. Лимиты подписки не изменились.

Продлит ли переход с Opus на Sonnet жизнь моему плану? Существенно. Opus в несколько раз дороже за ход. Сделайте Sonnet дефолтом через /model и берегите Opus для сложных задач.

Почему пишет «usage limit reached», когда сессия на 2%? Это срабатывает недельный потолок, а не лимит сессии. Иногда это известный баг отображения, когда шкала сессии прыгает на 100% при низком локальном расходе. Доверяйте недельным цифрам в /usage.

Можно ли использовать план Claude Pro и API-ключ одновременно? Да. Многие разработчики работают на подписке изо дня в день и переключают Claude Code на потокенный API-ключ в дни, когда исчерпывают недельный потолок, а после сброса переключаются обратно. Базовый URL и ключ — это переменные окружения, так что замена в две строки.

Источники, проверенные для этого обновления