Почему Fable 5 отклоняет часть запросов или направляет их на Opus 4.8?

Так задумано. Fable 5 поставляется с тремя классификаторами безопасности; когда запрос выглядит как кибербезопасность, биология и химия или дистилляция модели, Anthropic направляет его на Claude Opus 4.8 вместо Fable 5. Жёсткий отказ возвращается как успешный HTTP 200 с `stop_reason: "refusal"`, а не как ошибка, так что проверяйте stop reason перед чтением содержимого. Если ваша работа лежит в этих доменах, вызывайте `anthropic/claude-opus-4.8` напрямую и пропустите слой маршрутизации.

Claude Fable 5 vs Sonnet 5 (2026): в 5 раз дороже, когда это окупается

Q: Стоит ли Claude Fable 5 своей пятикратной цены против Sonnet 5?

Только для самых сложных задач. По вводным ценам Fable 5 стоит $10/$50 за миллион токенов против $2/$10 у Sonnet 5 — ровно в 5 раз по обеим строкам. Fable 5 даёт реальный скачок возможностей (80,3% в SWE-bench Pro против 63,2% и 91/100 в тесте Senior Engineer от Every, где Opus 4.8 набирает 63), но по стоимости за решённую задачу Sonnet 5 остаётся дешевле даже с учётом повторов. Fable 5 окупается, когда неверный первый ответ обходится дороже разницы в токенах или когда Sonnet 5 просто не может закрыть задачу.

Q: Сколько стоит Claude Fable 5 по сравнению с Sonnet 5?

Fable 5 стоит $10 за миллион входных токенов и $50 за миллион выходных — это ставка Anthropic API. Sonnet 5 стоит $2/$10 по вводным ценам до 31 августа 2026 года, затем $3/$15. Так что Fable 5 в 5 раз дороже Sonnet 5 во вводном окне и примерно в 3,3 раза дороже после него. Чтение кешированного входа — $1/M на Fable 5 (стандартное соотношение 0.1x у Anthropic) против $0.2/M на Sonnet 5. Ценник занижает реальный разрыв, потому что мышление Fable 5 всегда включено, так что на задачу приходится больше выходных токенов.

Q: Доступен ли Claude Fable 5 на ofox?

С перерывами. Sonnet 5 есть в каталоге ofox постоянно по адресу `anthropic/claude-sonnet-5`. Fable 5 предлагается в окнах доступа, а не как постоянная позиция, так что `anthropic/claude-fable-5` появляется и исчезает у агрегатора так же, как Anthropic ротировала её в подписных планах и обратно после 9 июня. Убедитесь, что модель активна в каталоге ofox, прежде чем встраивать её в продакшн; когда её нет в списке, обращайтесь к Fable 5 через собственный API Anthropic.

Q: Fable 5 лучше Sonnet 5 для программирования?

На фронтире — очевидно. Fable 5 набирает 80,3% в SWE-bench Pro и 91/100 в бенчмарке Senior Engineer от Every против 63,2% в SWE-bench Pro у Sonnet 5. Для рутинного программирования (правки в одном файле, рефакторинги, каркас тестов, комментарии ревью) Sonnet 5 уже хватает, и он стоит впятеро дешевле. Работающее на практике разделение — Sonnet 5 для повседневных 80%, Fable 5 для сложного хвоста, где провальный патч дорог.

Q: Можно ли задать temperature на Fable 5 или Sonnet 5?

Нет, на обеих. Недефолтные `temperature`, `top_p` или `top_k` возвращают ошибку 400, ручное расширенное мышление через `budget_tokens` тоже даёт 400. Управляйте поведением через системный промпт и глубиной — через параметр `effort`. Одно дополнительное правило для Fable 5: мышление всегда включено, так что явный `thinking: {type: "disabled"}` тоже возвращает 400. Просто не передавайте этот параметр.

Q: Каков размер контекстного окна у Fable 5 и Sonnet 5?

У обеих 1M токенов при 128K максимальных выходных токенов. Номинальные окна совпадают, но новый токенизатор Sonnet 5 упаковывает меньше текста на токен, так что окно в 1M вмещает несколько меньше фактического текста на Sonnet 5, чем на старой модели. Для выбора между Fable 5 и Sonnet 5 окно роли не играет; решают цена и возможности.

Коротко Fable 5 — это потолок возможностей Anthropic, а Sonnet 5 — её ценовой пол, и впервые обе доступны через один эндпоинт. Fable 5 стоит $10/$50 за миллион токенов — ровно в 5 раз дороже вводных $2/$10 у Sonnet 5 (в 3,3 раза после 31 августа). Она отрабатывает наценку на цифрах: 80,3% в SWE-bench Pro против 63,2% у Sonnet 5 и 91/100 в тесте Senior Engineer от Every, где Opus 4.8 набирает 63. Подвох в том, что ценовой разрыв — это пол, а не потолок, потому что всегда включённое мышление Fable 5 выдаёт больше выходных токенов на задачу, и есть подвох по доступности: Sonnet 5 в каталоге всегда, Fable 5 появляется и исчезает в окнах доступа. Ниже — характеристики, таблица бенчмарков, арифметика стоимости за решённую задачу и способ в 10 строк, как провести A/B обеих на вашем трафике.

Ценник в 5 раз — это самое малое, до чего когда-либо сжимается разница. Мышление Fable 5 всегда включено, так что на той же задаче она выдаёт больше выходных токенов, чем Sonnet 5, а выход — это строка, что тарифицируется по $50.

Коротко: что выбрать?

Для большинства команд ответ таков: «Sonnet 5 по умолчанию, Fable 5 — для сложного хвоста, где ошибиться нельзя». Вот однострочный вердикт по сценариям.

Сценарий	Выбор	Почему
Классификация, извлечение, чат, ответы RAG	Sonnet 5	Ограниченный выход, возможностей с избытком, впятеро дешевле
Рутинное программирование: правки, рефакторинги, каркасы тестов	Sonnet 5	63,2% в SWE-bench Pro закрывают повседневную работу
Фронтирное агентное программирование, где провальный патч дорог	Fable 5	80,3% в SWE-bench Pro, 91/100 в тесте senior-инженера
Длинные автономные прогоны, что должны сработать с первого раза	Fable 5	Меньше повторов, когда узкое место — корректность
Экономичный дефолт для смешанной нагрузки	Маршрутизируйте обе	Дешёвую работу на Sonnet 5, сложный хвост — на Fable 5
Кибербезопасность, биология или дистилляция	Ни одну, берите Opus 4.8	Fable 5 всё равно автоматически направляет это на Opus 4.8

Остальная часть материала — доказательства за этой таблицей, плюс честная версия ответа «когда же ярус за $50 на самом деле окупается».

Что изменилось: Fable 5 вернулась, Sonnet 5 появилась

Два выпуска с разницей в три недели пересобрали верхушку и середину линейки Claude.

Claude Fable 5 вышла 9 июня 2026 года как первая общедоступная модель класса Mythos от Anthropic — семейство, которое Anthropic ранее придерживала из-за возможностей в кибербезопасности. Это модель Mythos с тремя наложенными сверху классификаторами безопасности. Anthropic на две недели включила её в подписные планы Pro, Max и Team, затем убрала из них 23 июня, оставив ставку API $10/$50 как способ доступа. С тех пор она ротируется в окнах доступа и обратно, и это важно для того, как строить архитектуру вокруг неё.

Claude Sonnet 5 вышла 30 июня 2026 года по вводной цене $2/$10 (стандарт $3/$15 после 31 августа). Это самая агентная модель Anthropic в классе Sonnet и новый дефолт для профессиональной работы, что не на фронтире. Прямое сравнение со средним ярусом мы разобрали в Sonnet 5 vs Opus 4.8.

Причина сравнить два края напрямую, а не каждый против Opus 4.8, в том, что они отвечают на разные вопросы. Sonnet 5 отвечает «какая самая дешёвая модель проходит мою повседневную планку». Fable 5 отвечает «какая лучшая модель за деньги, когда задача достаточно сложна, чтобы ошибка была дорогим исходом». Большинству команд нужны оба ответа, а интересное решение — где провести черту между ними. Если вам нужен полный тройной поединок по коду с GPT-5.5 в раскладе, он в Fable 5 vs Opus 4.8 vs GPT-5.5; этот материал уже и практичнее: два яруса, одно решение о маршрутизации.

Краткое сравнение характеристик

Обе модели делят одно и то же номинальное окно контекста в 1M и максимум выхода в 128K. Реальные отличия — цена, доступность и тот факт, что Fable 5 не может выключить мышление.

Характеристика	Claude Fable 5	Claude Sonnet 5
ID модели в ofox	`anthropic/claude-fable-5`	`anthropic/claude-sonnet-5`
Вход	$10/M	$2/M (вводная), $3/M (стандарт)
Выход	$50/M	$10/M (вводная), $15/M (стандарт)
Чтение кешированного входа	$1/M (соотношение 0.1x)	$0.2/M
Контекстное окно	1M	1M
Максимум выхода	128K	128K
Мышление	Всегда включено, нельзя выключить	Адаптивное, включено по умолчанию, можно выключить
Параметры сэмплинга	ошибка 400	ошибка 400
Маршрутизация безопасности	Кибер / био / дистилляция на Opus 4.8	Отказы по кибербезопасности в реальном времени
Доступность в ofox	В окнах, не всегда в списке	Постоянная позиция

Вводные цены Sonnet 5 ($2/$10) и чтение из кеша ($0.2/M) совпадают со страницей модели ofox для anthropic/claude-sonnet-5 по состоянию на 2 июля 2026 года. $10/$50 у Fable 5 — это ставка Anthropic API из анонса Fable 5 от Anthropic; её чтение из кеша — стандартное соотношение 0.1x от входа, которое Anthropic применяет по всей линейке. На момент написания позиция Fable 5 в ofox не была активна, так что её числа здесь взяты у Anthropic, а не считаны с живой страницы ofox. Проверьте каталог ofox на текущую позицию Fable 5, прежде чем строить под неё.

Ценовой разрыв и почему он больше, чем в 5 раз

По ставкам за токен разрыв чистый: Fable 5 в 5 раз дороже Sonnet 5 во вводном окне — на входе, выходе и чтении из кеша одинаково. После 31 августа, когда Sonnet 5 переходит на $3/$15, множитель падает примерно до 3,3x. В любом случае Sonnet 5 драматически дешевле за токен.

Ценник занижает реальную разницу по одной структурной причине. Мышление Fable 5 всегда включено, и его нельзя выключить, так что на любой нетривиальной задаче она выдаёт порцию thinking- и выходных токенов, которых у более экономного вызова не было бы. У Sonnet 5 адаптивное мышление тоже включено по умолчанию, но его можно приглушить параметром effort или полностью отключить для ограниченной работы. Выход — это строка, что тарифицируется по $50/M на Fable 5 против $10/M на Sonnet 5, так что больше выходных токенов на более дорогой модели расширяет фактический разрыв за пределы ценника в 5 раз. Это противоположность сюжету «Sonnet против Opus», где собственное мышление более дешёвой модели сужает скидку. Здесь более дорогая модель по умолчанию думает усерднее, так что разрыв только растёт.

Чтение из кеша — единственное место, где соотношение остаётся ровно 5-кратным без звёздочек. Если ваши промпты несут большой стабильный префикс (системный промпт, схему инструментов, повторяющийся набор документов), чтение из кеша стоит $0.2/M на Sonnet 5 против $1/M на Fable 5. Для продакшн-эндпоинта с интенсивным кешем эта строка одна может доминировать в месячном счёте, и она никогда не в пользу Fable 5.

Бенчмарк по программированию: разрыв в возможностях реален

Бенчмарки шумные, но разрыв между этими двумя достаточно широк, чтобы пережить шум. Вот где они садятся на тестах, что соответствуют продакшн-программированию, с Opus 4.8 в роли ориентира среднего яруса.

Бенчмарк	Fable 5	Sonnet 5	Opus 4.8
SWE-bench Verified	95,0%	н/д	88,6%
SWE-bench Pro (агентное программирование)	80,3%	63,2%	69,2%
Every Senior Engineer (/100)	91	не опубликовано	63
Terminal-Bench 2.1	80,5%	н/д	74,6%

Две строки решают дело.

SWE-bench Pro — это продакшн-показатель. Он прогоняет модели против реальных задач GitHub от начала до конца: прочитать репозиторий, написать патч, и патч либо проходит скрытый тестовый набор, либо нет, без частичного зачёта. 80,3% у Fable 5 против 63,2% у Sonnet 5 — это разрыв в 17 пунктов, и каждый из этих пунктов — задача, что закрывается с первого прогона вместо провала. На сложной многофайловой задаче промах с первого прохода означает цикл повторов или человека, разгребающего последствия, и то и другое стоит дороже токенов.

Бенчмарк Senior Engineer от Every — это показатель потолка. Every прогоняет его на самых сложных задачах, какие может составить, — из тех, что у senior-инженера уходят на рабочий день. Fable 5 с 91/100 попадает в диапазон живого senior-инженера. Opus 4.8 сидит на 63. Anthropic не опубликовала число Sonnet 5 для этого теста, но Sonnet 5 уже отстаёт от Opus 4.8 в SWE-bench Pro (63,2% против 69,2%), так что на более сложном бенчмарке она садится на уровень Opus или ниже, не рядом с Fable 5. Вот тот разрыв, что покупает ценовая наценка: не «немного лучше в среднем», а «может делать класс задач, что более дешёвая модель в основном проваливает». Относитесь к этим оценкам в стиле лидербордов как к моментальному снимку и смотрите Transparency Hub Anthropic для источника по каждому бенчмарку; для маршрутизации важно направление, а не последний знак после запятой.

Честное резюме таблицы: для повседневного программирования лишние пункты не меняют исход, потому что Sonnet 5 и так закрывает задачу. Для фронтирного программирования лишние пункты — это разница между «отгрузили» и «встали».

Арифметика цен: когда ярус за $50 на самом деле окупается

Прайс-цена — одно число, стоимость за решённую задачу — другое, и они могут указывать в разные стороны. Вот две нагрузки с явно указанными допущениями, чтобы вы подставили свои.

Сценарий A, повседневный парк программирования. 5 разработчиков, по 20 задач в день, 20 рабочих дней (2 000 задач в месяц). На рутинную задачу: 40K входа и выход в 8K на Sonnet 5 (мышление приглушено) против 25K на Fable 5 (мышление всегда включено). Допустим, задача вполне в пределах досягаемости обеих моделей, так что успех с первого прохода близок к 1 у обеих.

Строка	Sonnet 5 (вводная)	Fable 5
Вход на задачу (40K)	$0.08	$0.40
Выход на задачу	$0.08 (8K)	$1.25 (25K)
Стоимость задачи	$0.16	$1.65
В месяц (2 000 задач)	$320	$3,300
против другой	база	примерно в 10 раз больше

На рутинной работе Fable 5 не в 5 раз дороже, а примерно в 10, потому что всегда включённое мышление наваливается на строку выхода по $50. Платить это за работу, которую Sonnet 5 и так закрывает, — чистая трата.

Сценарий B, сложный хвост. Теперь возьмём по-настоящему сложные многофайловые задачи, где успех с первого прохода — вся игра. Используем ставки SWE-bench Pro как замену: 80,3% для Fable 5, 63,2% для Sonnet 5. На попытку: 60K входа, 40K выхода на Fable 5, 30K выхода на Sonnet 5.

Строка	Sonnet 5 (вводная)	Fable 5
Стоимость попытки	$0.42	$2.60
Успех с первого прохода	63,2%	80,3%
Ожидаемое число попыток до решения	~1,58	~1,25
Стоимость за решённую задачу (только токены)	~$0.66	~$3.24

По одним токенам Sonnet 5 всё ещё дешевле за решённую задачу даже с учётом повторов, потому что за пятую часть цены попытки покупается много повторов. Так что аргумент в пользу Fable 5 — не про стоимость токенов. Он вот в чём: ставка SWE-bench Pro льстит Sonnet 5 на самых сложных задачах. На классе проблем, что нацелен бенчмарк Every (где Fable 5 набирает 91, а Opus 4.8 лишь 63), реальная доля решений Sonnet 5 падает существенно ниже её заголовочных 63,2%, число повторов растёт, а часть задач она не закрывает вообще. Как только провальный патч стоит часа времени senior-инженера или отгружает баг, дельта в $3 по токенам перестаёт быть значимым числом. Вот когда Fable 5 окупается: не потому что дешевле, а потому что ошибаться дорого, а она ошибается реже.

Оценим в числах. Senior-инженер при полной стоимости $120/час — это $2/минуту. Если направить сложную задачу на Fable 5 вместо Sonnet 5 экономит хотя бы пятнадцать минут распутывания человеком неверного патча, это $30 инженерного времени против дельты по токенам в единичные доллары. Точка окупаемости не близко. Ловушка — применять эту логику к повседневным 80%, где нет стоимости неверного патча, которую надо избежать, потому что Sonnet 5 и так закрыл бы задачу. Вся дисциплина ярусной организации — держать долю Fable 5 малой настолько, чтобы её 10-кратная фактическая стоимость ложилась только на задачи, где на кону сэкономленный инженеро-час. Определяйте эту долю замерами, а не на вкус: большинство команд находят, что настоящий фронтир — это однозначный процент их трафика, а всё сверх этого процента — деньги, потраченные на возможности, которых задача не требовала.

Когда выбирать Claude Sonnet 5

Выбирайте anthropic/claude-sonnet-5 для подавляющего большинства работы:

Высокообъёмный ограниченный выход. Классификация, извлечение, маршрутизация, модерация. Короткие выходы, большой объём входа, часто с интенсивным кешем. $2/$10 у Sonnet 5 и чтение из кеша по $0.2/M срезают эти счета до доли от Fable 5.
Ответы RAG и суммаризация. Извлечение делает основную работу; модель пишет ограниченный ответ. Возможностей с избытком.
Рутинное программирование. Правки в одном файле, шаблонный код, каркасы тестов, комментарии ревью. 63,2% в SWE-bench Pro закрывают работу, что не на фронтире.
Всё, что чувствительно к задержке и интерактивно. Скорость и цена класса Sonnet подходят чату и ассистентским поверхностям лучше, чем потолочная модель, что всегда сначала думает.

Когда выбирать Claude Fable 5

Выбирайте anthropic/claude-fable-5, когда задача на фронтире возможностей, а неверный ответ — дорогой исход:

Фронтирное агентное программирование. Сложные многофайловые задачи, где отрыв в 17 пунктов по SWE-bench Pro — это разница между одним прогоном и циклом повторов и где отгруженный неверный патч стоит реального инженерного времени.
Длинные автономные прогоны. Ночные рефакторинги и многошаговые агентные циклы, что должны держаться воедино без человека, ловящего неверный поворот на шаге 12.
Задачи класса senior-инженера. Работа, что нацелен бенчмарк Every, где реальная доля решений Sonnet 5 падает, а 91/100 у Fable 5 — причина за ней потянуться.
Когда у вас есть доступ. Доступность Fable 5 в окнах, так что закладывайте её как ярус, на который вы маршрутизируете, когда она активна, а не как постоянную зависимость.

Когда не выбирать ни одну (и что использовать вместо этого)

Два случая падают между ярусами.

Первый — кибербезопасность, биология и химия или дистилляция модели. Fable 5 обнаруживает это и всё равно направляет на Opus 4.8, так что вызов Fable 5 для них лишь добавляет прыжок маршрутизации. Вызывайте anthropic/claude-opus-4.8 напрямую и пропустите его.

Второй — середина диапазона сложности, задачи слишком сложные, чтобы Sonnet 5 надёжно их закрывал, но недостаточно сложные, чтобы оправдать 10-кратную фактическую стоимость Fable 5. Именно там живёт Opus 4.8: $5/$25, 69,2% в SWE-bench Pro и никакого окна доступности, под которое надо планировать. У многих команд реальное дерево маршрутизации содержит три яруса, а не два, с Opus 4.8 в роли повседневно-сложной рабочей лошадки и Fable 5, зарезервированной для настоящего фронтира. Разбор Sonnet 5 vs Opus 4.8 покрывает нижнюю границу; обзор выпуска Opus 4.8 — середину.

flowchart TD
    A[Incoming task] --> B{Cyber / bio / distillation?}
    B -->|Yes| C[anthropic/claude-opus-4.8]
    B -->|No| D{Frontier-hard?<br/>failed answer is expensive}
    D -->|No| E[anthropic/claude-sonnet-5]
    D -->|Yes| F{Fable 5 in an access window?}
    F -->|Yes| G[anthropic/claude-fable-5]
    F -->|No| H[anthropic/claude-opus-4.8]

Попробуйте обе через ofox: A/B в 10 строках

Честный способ определить черту маршрутизации — прогнать обе на ваших задачах и прочитать счётчики токенов. ofox отдаёт линейку Claude на одном OpenAI-совместимом эндпоинте (https://api.ofox.ai/v1), так что единственное, что меняется между прогонами, — строка ID модели, и один ключ покрывает все три яруса без отдельного биллинга Anthropic. Два нюанса перед запуском: обе модели отклоняют недефолтные temperature, top_p и top_k с ошибкой 400, так что оставьте параметры сэмплинга на значениях по умолчанию (примеры так и делают). И Fable 5 должна быть активна в окне доступа ofox, чтобы её строка разрешилась; когда её нет в списке, либо дождитесь окна, либо направьте этот один вызов на собственный API Anthropic.

Python: A/B обеих моделей в одном цикле

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="YOUR_OFOX_KEY")

prompt = "Fix the race condition in this worker pool: ..."
for model in ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]:
    r = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )
    u = r.usage
    print(model, u.prompt_tokens, u.completion_tokens)

Следите за столбцом completion_tokens. Всегда включённое мышление Fable 5 проявляется именно там, и, умноженное на $50/M, это то место, где живёт фактический ценовой разрыв.

Node: та же форма

import OpenAI from "openai";

const client = new OpenAI({ baseURL: "https://api.ofox.ai/v1", apiKey: process.env.OFOX_KEY });

const prompt = "Fix the race condition in this worker pool: ...";
for (const model of ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]) {
  const r = await client.chat.completions.create({
    model,
    messages: [{ role: "user", content: prompt }],
  });
  console.log(model, r.usage.prompt_tokens, r.usage.completion_tokens);
}

Прогоните это на 20–30 ваших по-настоящему сложных задачах, просуммируйте входные и выходные токены по каждой модели, умножьте на ставки из таблицы характеристик и поделите на то, сколько каждая реально решила. Эта стоимость за решённую задачу, а не ценник, — число, что решает, где пройдёт черта маршрутизации. Про саму сантехнику маршрутизации — материал о паттерне гибридной маршрутизации Claude Code, где разбирается выбор сигнала (длина входа, тег типа задачи или проверка уверенности, что эскалирует только при провале).

Подводные камни миграции: та же форма, три ошибки 400

Обе модели сохраняют форму Messages API, но тот же запрос, что работал на более старом Claude, может вернуть 400 на любой из этих.

Изменение	Старое поведение	На Fable 5 / Sonnet 5
Параметры сэмплинга	`temperature` / `top_p` / `top_k` принимаются	Недефолтные значения возвращают 400 на обеих
Ручное мышление	`budget_tokens` принимался на части моделей	Возвращает 400 на обеих; используйте `effort`
Отключение мышления	`thinking: {type: "disabled"}` принимался	Работает на Sonnet 5; 400 на Fable 5 (не передавайте параметр)
Отказы	выбрасывались как ошибки	HTTP 200 с `stop_reason: "refusal"` на обеих; обрабатывайте это

Строки про Fable 5 — те, на которых спотыкаются. Мышление всегда включено, так что переключателя отключения нет, а классификаторы безопасности могут передать запрос на Opus 4.8 на лету. На API подключите фолбэк, чтобы отказ не просто останавливал запрос; серверный параметр fallbacks от Anthropic переотправляет отклонённый запрос на Opus 4.8 в том же вызове. Если вы поднимаете нагрузку Sonnet 5 до Fable 5 для сложного хвоста, закладывайте больше выходных токенов на задачу, а не меньше, потому что всегда включённое мышление работает против интуиции, что более умная модель заканчивает быстрее.

Тест маршрутизации — не оценка в бенчмарке, а стоимость за решённую задачу: прогоните обе на ваших реальных сложных задачах, посчитайте токены и посчитайте, сколько каждая реально закрыла.

Альтернативы

ofox ставит Sonnet 5, Opus 4.8 и Fable 5 (когда она в окне) на один OpenAI-совместимый эндпоинт, так что маршрутизация между ярусами — это изменение одной строки, а не три интеграции. Цены в реальном времени — в каталоге моделей.
Opus 4.8 — средний ярус, что стоит назвать явно: $5/$25, 69,2% в SWE-bench Pro, всегда доступен, никакого окна под планирование. Для задач между потолком Sonnet 5 и полом Fable 5 он часто верный выбор.
Anthropic напрямую — фолбэк конкретно для Fable 5. Когда Fable 5 нет в списке агрегатора, её собственный API держит ставку $10/$50 доступной ценой второго ключа и отдельного биллинга.

FAQ

Стоит ли Claude Fable 5 своей пятикратной цены против Sonnet 5? Только для самых сложных задач. Fable 5 даёт реальный скачок возможностей (80,3% в SWE-bench Pro против 63,2% и 91/100 в тесте Senior Engineer от Every, где Opus 4.8 набирает 63), но по стоимости за решённую задачу Sonnet 5 остаётся дешевле даже с учётом повторов. Fable 5 окупается, когда неверный первый ответ обходится дороже разницы в токенах.

Сколько стоит Claude Fable 5 по сравнению с Sonnet 5? $10/$50 за миллион токенов против $2/$10 вводных у Sonnet 5 ($3/$15 стандарт). Это в 5 раз дороже во вводном окне, примерно в 3,3 раза после 31 августа. Чтение из кеша — $1/M против $0.2/M.

Доступен ли Claude Fable 5 на ofox? С перерывами. Sonnet 5 — постоянная позиция по адресу anthropic/claude-sonnet-5; Fable 5 предлагается в окнах доступа, так что убедитесь, что она активна в каталоге ofox, прежде чем строить под неё.

Fable 5 лучше Sonnet 5 для программирования? На фронтире — очевидно (80,3% в SWE-bench Pro, 91/100 в тесте senior-инженера). Для рутинного программирования Sonnet 5 уже хватает при пятой части стоимости.

Почему Fable 5 отклоняет запросы или направляет на Opus 4.8? Её классификаторы безопасности передают запросы по кибербезопасности, биологии и дистилляции на Opus 4.8. Отказ возвращается как HTTP 200 с stop_reason: "refusal", так что проверяйте stop reason перед чтением содержимого.

Можно ли задать temperature на Fable 5 или Sonnet 5? Нет. Недефолтные параметры сэмплинга возвращают 400 на обеих, как и budget_tokens. Fable 5 также возвращает 400 на thinking: {type: "disabled"}, потому что мышление всегда включено.

Каков размер контекстного окна у Fable 5 и Sonnet 5? У обеих 1M токенов, 128K максимум выхода. Для этого выбора окно роли не играет; решают цена и возможности.

Стоит ли переходить с Sonnet 5 на Fable 5? Не целиком. Оставьте Sonnet 5 по умолчанию и эскалируйте на Fable 5 только тогда, когда вывод Sonnet 5 не проходит проверку. Тотальный переход платит впятеро за возможности, которые большинству запросов не нужны.

Проверенные источники

Anthropic, анонс «Claude Fable 5 and Mythos 5» (Fable 5 $10/$50, класс Mythos, классификаторы безопасности с маршрутизацией на Opus 4.8), проверено 2 июля 2026 года: https://www.anthropic.com/news/claude-fable-5-mythos-5
Anthropic, документация «Introducing Claude Fable 5» (всегда включённое мышление, отсутствие параметров сэмплинга, обработка отказов): https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5
Anthropic, пост о запуске «Introducing Claude Sonnet 5», 30 июня 2026 года: https://www.anthropic.com/news/claude-sonnet-5
Anthropic, документация «What’s new in Claude Sonnet 5» (изменения поведения, цены): https://platform.claude.com/docs/en/about-claude/models/whats-new-sonnet-5
Anthropic Transparency Hub (источник по каждому бенчмарку): https://www.anthropic.com/transparency
Страница модели ofox для anthropic/claude-sonnet-5 ($2/$10 вводная, $0.2/M чтение из кеша, контекст 1M), проверено 2 июля 2026 года: https://ofox.ai/models/anthropic/claude-sonnet-5
Каталог моделей ofox (статус позиции Fable 5, цены в реальном времени), проверено 2 июля 2026 года: https://ofox.ai/models
Значения SWE-bench Pro / SWE-bench Verified / Every Senior Engineer из материалов запуска Anthropic и опубликованного бенчмарка Every, сверено с нашим материалом Fable 5 vs Opus 4.8 vs GPT-5.5