Claude Fable 5 vs Sonnet 5 (2026): в 5 раз дороже, когда это окупается

Fable 5 стоит $10/$50 — в 5 раз дороже $2/$10 у Sonnet 5, но берёт 80,3% в SWE-bench Pro против 63,2%. Когда потолочная модель окупается и как маршрутизировать обе на ofox.

Claude Fable 5 vs Sonnet 5 (2026): в 5 раз дороже, когда это окупается

Коротко Fable 5 — это потолок возможностей Anthropic, а Sonnet 5 — её ценовой пол, и впервые обе доступны через один эндпоинт. Fable 5 стоит $10/$50 за миллион токенов — ровно в 5 раз дороже вводных $2/$10 у Sonnet 5 (в 3,3 раза после 31 августа). Она отрабатывает наценку на цифрах: 80,3% в SWE-bench Pro против 63,2% у Sonnet 5 и 91/100 в тесте Senior Engineer от Every, где Opus 4.8 набирает 63. Подвох в том, что ценовой разрыв — это пол, а не потолок, потому что всегда включённое мышление Fable 5 выдаёт больше выходных токенов на задачу, и есть подвох по доступности: Sonnet 5 в каталоге всегда, Fable 5 появляется и исчезает в окнах доступа. Ниже — характеристики, таблица бенчмарков, арифметика стоимости за решённую задачу и способ в 10 строк, как провести A/B обеих на вашем трафике.

Ценник в 5 раз — это самое малое, до чего когда-либо сжимается разница. Мышление Fable 5 всегда включено, так что на той же задаче она выдаёт больше выходных токенов, чем Sonnet 5, а выход — это строка, что тарифицируется по $50.

Коротко: что выбрать?

Для большинства команд ответ таков: «Sonnet 5 по умолчанию, Fable 5 — для сложного хвоста, где ошибиться нельзя». Вот однострочный вердикт по сценариям.

СценарийВыборПочему
Классификация, извлечение, чат, ответы RAGSonnet 5Ограниченный выход, возможностей с избытком, впятеро дешевле
Рутинное программирование: правки, рефакторинги, каркасы тестовSonnet 563,2% в SWE-bench Pro закрывают повседневную работу
Фронтирное агентное программирование, где провальный патч дорогFable 580,3% в SWE-bench Pro, 91/100 в тесте senior-инженера
Длинные автономные прогоны, что должны сработать с первого разаFable 5Меньше повторов, когда узкое место — корректность
Экономичный дефолт для смешанной нагрузкиМаршрутизируйте обеДешёвую работу на Sonnet 5, сложный хвост — на Fable 5
Кибербезопасность, биология или дистилляцияНи одну, берите Opus 4.8Fable 5 всё равно автоматически направляет это на Opus 4.8

Остальная часть материала — доказательства за этой таблицей, плюс честная версия ответа «когда же ярус за $50 на самом деле окупается».

Что изменилось: Fable 5 вернулась, Sonnet 5 появилась

Два выпуска с разницей в три недели пересобрали верхушку и середину линейки Claude.

Claude Fable 5 вышла 9 июня 2026 года как первая общедоступная модель класса Mythos от Anthropic — семейство, которое Anthropic ранее придерживала из-за возможностей в кибербезопасности. Это модель Mythos с тремя наложенными сверху классификаторами безопасности. Anthropic на две недели включила её в подписные планы Pro, Max и Team, затем убрала из них 23 июня, оставив ставку API $10/$50 как способ доступа. С тех пор она ротируется в окнах доступа и обратно, и это важно для того, как строить архитектуру вокруг неё.

Claude Sonnet 5 вышла 30 июня 2026 года по вводной цене $2/$10 (стандарт $3/$15 после 31 августа). Это самая агентная модель Anthropic в классе Sonnet и новый дефолт для профессиональной работы, что не на фронтире. Прямое сравнение со средним ярусом мы разобрали в Sonnet 5 vs Opus 4.8.

Причина сравнить два края напрямую, а не каждый против Opus 4.8, в том, что они отвечают на разные вопросы. Sonnet 5 отвечает «какая самая дешёвая модель проходит мою повседневную планку». Fable 5 отвечает «какая лучшая модель за деньги, когда задача достаточно сложна, чтобы ошибка была дорогим исходом». Большинству команд нужны оба ответа, а интересное решение — где провести черту между ними. Если вам нужен полный тройной поединок по коду с GPT-5.5 в раскладе, он в Fable 5 vs Opus 4.8 vs GPT-5.5; этот материал уже и практичнее: два яруса, одно решение о маршрутизации.

Краткое сравнение характеристик

Обе модели делят одно и то же номинальное окно контекста в 1M и максимум выхода в 128K. Реальные отличия — цена, доступность и тот факт, что Fable 5 не может выключить мышление.

ХарактеристикаClaude Fable 5Claude Sonnet 5
ID модели в ofoxanthropic/claude-fable-5anthropic/claude-sonnet-5
Вход$10/M$2/M (вводная), $3/M (стандарт)
Выход$50/M$10/M (вводная), $15/M (стандарт)
Чтение кешированного входа$1/M (соотношение 0.1x)$0.2/M
Контекстное окно1M1M
Максимум выхода128K128K
МышлениеВсегда включено, нельзя выключитьАдаптивное, включено по умолчанию, можно выключить
Параметры сэмплингаошибка 400ошибка 400
Маршрутизация безопасностиКибер / био / дистилляция на Opus 4.8Отказы по кибербезопасности в реальном времени
Доступность в ofoxВ окнах, не всегда в спискеПостоянная позиция

Вводные цены Sonnet 5 ($2/$10) и чтение из кеша ($0.2/M) совпадают со страницей модели ofox для anthropic/claude-sonnet-5 по состоянию на 2 июля 2026 года. $10/$50 у Fable 5 — это ставка Anthropic API из анонса Fable 5 от Anthropic; её чтение из кеша — стандартное соотношение 0.1x от входа, которое Anthropic применяет по всей линейке. На момент написания позиция Fable 5 в ofox не была активна, так что её числа здесь взяты у Anthropic, а не считаны с живой страницы ofox. Проверьте каталог ofox на текущую позицию Fable 5, прежде чем строить под неё.

Ценовой разрыв и почему он больше, чем в 5 раз

По ставкам за токен разрыв чистый: Fable 5 в 5 раз дороже Sonnet 5 во вводном окне — на входе, выходе и чтении из кеша одинаково. После 31 августа, когда Sonnet 5 переходит на $3/$15, множитель падает примерно до 3,3x. В любом случае Sonnet 5 драматически дешевле за токен.

Ценник занижает реальную разницу по одной структурной причине. Мышление Fable 5 всегда включено, и его нельзя выключить, так что на любой нетривиальной задаче она выдаёт порцию thinking- и выходных токенов, которых у более экономного вызова не было бы. У Sonnet 5 адаптивное мышление тоже включено по умолчанию, но его можно приглушить параметром effort или полностью отключить для ограниченной работы. Выход — это строка, что тарифицируется по $50/M на Fable 5 против $10/M на Sonnet 5, так что больше выходных токенов на более дорогой модели расширяет фактический разрыв за пределы ценника в 5 раз. Это противоположность сюжету «Sonnet против Opus», где собственное мышление более дешёвой модели сужает скидку. Здесь более дорогая модель по умолчанию думает усерднее, так что разрыв только растёт.

Чтение из кеша — единственное место, где соотношение остаётся ровно 5-кратным без звёздочек. Если ваши промпты несут большой стабильный префикс (системный промпт, схему инструментов, повторяющийся набор документов), чтение из кеша стоит $0.2/M на Sonnet 5 против $1/M на Fable 5. Для продакшн-эндпоинта с интенсивным кешем эта строка одна может доминировать в месячном счёте, и она никогда не в пользу Fable 5.

Бенчмарк по программированию: разрыв в возможностях реален

Бенчмарки шумные, но разрыв между этими двумя достаточно широк, чтобы пережить шум. Вот где они садятся на тестах, что соответствуют продакшн-программированию, с Opus 4.8 в роли ориентира среднего яруса.

БенчмаркFable 5Sonnet 5Opus 4.8
SWE-bench Verified95,0%н/д88,6%
SWE-bench Pro (агентное программирование)80,3%63,2%69,2%
Every Senior Engineer (/100)91не опубликовано63
Terminal-Bench 2.180,5%н/д74,6%

Две строки решают дело.

SWE-bench Pro — это продакшн-показатель. Он прогоняет модели против реальных задач GitHub от начала до конца: прочитать репозиторий, написать патч, и патч либо проходит скрытый тестовый набор, либо нет, без частичного зачёта. 80,3% у Fable 5 против 63,2% у Sonnet 5 — это разрыв в 17 пунктов, и каждый из этих пунктов — задача, что закрывается с первого прогона вместо провала. На сложной многофайловой задаче промах с первого прохода означает цикл повторов или человека, разгребающего последствия, и то и другое стоит дороже токенов.

Бенчмарк Senior Engineer от Every — это показатель потолка. Every прогоняет его на самых сложных задачах, какие может составить, — из тех, что у senior-инженера уходят на рабочий день. Fable 5 с 91/100 попадает в диапазон живого senior-инженера. Opus 4.8 сидит на 63. Anthropic не опубликовала число Sonnet 5 для этого теста, но Sonnet 5 уже отстаёт от Opus 4.8 в SWE-bench Pro (63,2% против 69,2%), так что на более сложном бенчмарке она садится на уровень Opus или ниже, не рядом с Fable 5. Вот тот разрыв, что покупает ценовая наценка: не «немного лучше в среднем», а «может делать класс задач, что более дешёвая модель в основном проваливает». Относитесь к этим оценкам в стиле лидербордов как к моментальному снимку и смотрите Transparency Hub Anthropic для источника по каждому бенчмарку; для маршрутизации важно направление, а не последний знак после запятой.

Честное резюме таблицы: для повседневного программирования лишние пункты не меняют исход, потому что Sonnet 5 и так закрывает задачу. Для фронтирного программирования лишние пункты — это разница между «отгрузили» и «встали».

Арифметика цен: когда ярус за $50 на самом деле окупается

Прайс-цена — одно число, стоимость за решённую задачу — другое, и они могут указывать в разные стороны. Вот две нагрузки с явно указанными допущениями, чтобы вы подставили свои.

Сценарий A, повседневный парк программирования. 5 разработчиков, по 20 задач в день, 20 рабочих дней (2 000 задач в месяц). На рутинную задачу: 40K входа и выход в 8K на Sonnet 5 (мышление приглушено) против 25K на Fable 5 (мышление всегда включено). Допустим, задача вполне в пределах досягаемости обеих моделей, так что успех с первого прохода близок к 1 у обеих.

СтрокаSonnet 5 (вводная)Fable 5
Вход на задачу (40K)$0.08$0.40
Выход на задачу$0.08 (8K)$1.25 (25K)
Стоимость задачи$0.16$1.65
В месяц (2 000 задач)$320$3,300
против другойбазапримерно в 10 раз больше

На рутинной работе Fable 5 не в 5 раз дороже, а примерно в 10, потому что всегда включённое мышление наваливается на строку выхода по $50. Платить это за работу, которую Sonnet 5 и так закрывает, — чистая трата.

Сценарий B, сложный хвост. Теперь возьмём по-настоящему сложные многофайловые задачи, где успех с первого прохода — вся игра. Используем ставки SWE-bench Pro как замену: 80,3% для Fable 5, 63,2% для Sonnet 5. На попытку: 60K входа, 40K выхода на Fable 5, 30K выхода на Sonnet 5.

СтрокаSonnet 5 (вводная)Fable 5
Стоимость попытки$0.42$2.60
Успех с первого прохода63,2%80,3%
Ожидаемое число попыток до решения~1,58~1,25
Стоимость за решённую задачу (только токены)~$0.66~$3.24

По одним токенам Sonnet 5 всё ещё дешевле за решённую задачу даже с учётом повторов, потому что за пятую часть цены попытки покупается много повторов. Так что аргумент в пользу Fable 5 — не про стоимость токенов. Он вот в чём: ставка SWE-bench Pro льстит Sonnet 5 на самых сложных задачах. На классе проблем, что нацелен бенчмарк Every (где Fable 5 набирает 91, а Opus 4.8 лишь 63), реальная доля решений Sonnet 5 падает существенно ниже её заголовочных 63,2%, число повторов растёт, а часть задач она не закрывает вообще. Как только провальный патч стоит часа времени senior-инженера или отгружает баг, дельта в $3 по токенам перестаёт быть значимым числом. Вот когда Fable 5 окупается: не потому что дешевле, а потому что ошибаться дорого, а она ошибается реже.

Оценим в числах. Senior-инженер при полной стоимости $120/час — это $2/минуту. Если направить сложную задачу на Fable 5 вместо Sonnet 5 экономит хотя бы пятнадцать минут распутывания человеком неверного патча, это $30 инженерного времени против дельты по токенам в единичные доллары. Точка окупаемости не близко. Ловушка — применять эту логику к повседневным 80%, где нет стоимости неверного патча, которую надо избежать, потому что Sonnet 5 и так закрыл бы задачу. Вся дисциплина ярусной организации — держать долю Fable 5 малой настолько, чтобы её 10-кратная фактическая стоимость ложилась только на задачи, где на кону сэкономленный инженеро-час. Определяйте эту долю замерами, а не на вкус: большинство команд находят, что настоящий фронтир — это однозначный процент их трафика, а всё сверх этого процента — деньги, потраченные на возможности, которых задача не требовала.

Когда выбирать Claude Sonnet 5

Выбирайте anthropic/claude-sonnet-5 для подавляющего большинства работы:

  • Высокообъёмный ограниченный выход. Классификация, извлечение, маршрутизация, модерация. Короткие выходы, большой объём входа, часто с интенсивным кешем. $2/$10 у Sonnet 5 и чтение из кеша по $0.2/M срезают эти счета до доли от Fable 5.
  • Ответы RAG и суммаризация. Извлечение делает основную работу; модель пишет ограниченный ответ. Возможностей с избытком.
  • Рутинное программирование. Правки в одном файле, шаблонный код, каркасы тестов, комментарии ревью. 63,2% в SWE-bench Pro закрывают работу, что не на фронтире.
  • Всё, что чувствительно к задержке и интерактивно. Скорость и цена класса Sonnet подходят чату и ассистентским поверхностям лучше, чем потолочная модель, что всегда сначала думает.

Когда выбирать Claude Fable 5

Выбирайте anthropic/claude-fable-5, когда задача на фронтире возможностей, а неверный ответ — дорогой исход:

  • Фронтирное агентное программирование. Сложные многофайловые задачи, где отрыв в 17 пунктов по SWE-bench Pro — это разница между одним прогоном и циклом повторов и где отгруженный неверный патч стоит реального инженерного времени.
  • Длинные автономные прогоны. Ночные рефакторинги и многошаговые агентные циклы, что должны держаться воедино без человека, ловящего неверный поворот на шаге 12.
  • Задачи класса senior-инженера. Работа, что нацелен бенчмарк Every, где реальная доля решений Sonnet 5 падает, а 91/100 у Fable 5 — причина за ней потянуться.
  • Когда у вас есть доступ. Доступность Fable 5 в окнах, так что закладывайте её как ярус, на который вы маршрутизируете, когда она активна, а не как постоянную зависимость.

Когда не выбирать ни одну (и что использовать вместо этого)

Два случая падают между ярусами.

Первый — кибербезопасность, биология и химия или дистилляция модели. Fable 5 обнаруживает это и всё равно направляет на Opus 4.8, так что вызов Fable 5 для них лишь добавляет прыжок маршрутизации. Вызывайте anthropic/claude-opus-4.8 напрямую и пропустите его.

Второй — середина диапазона сложности, задачи слишком сложные, чтобы Sonnet 5 надёжно их закрывал, но недостаточно сложные, чтобы оправдать 10-кратную фактическую стоимость Fable 5. Именно там живёт Opus 4.8: $5/$25, 69,2% в SWE-bench Pro и никакого окна доступности, под которое надо планировать. У многих команд реальное дерево маршрутизации содержит три яруса, а не два, с Opus 4.8 в роли повседневно-сложной рабочей лошадки и Fable 5, зарезервированной для настоящего фронтира. Разбор Sonnet 5 vs Opus 4.8 покрывает нижнюю границу; обзор выпуска Opus 4.8 — середину.

flowchart TD
    A[Incoming task] --> B{Cyber / bio / distillation?}
    B -->|Yes| C[anthropic/claude-opus-4.8]
    B -->|No| D{Frontier-hard?<br/>failed answer is expensive}
    D -->|No| E[anthropic/claude-sonnet-5]
    D -->|Yes| F{Fable 5 in an access window?}
    F -->|Yes| G[anthropic/claude-fable-5]
    F -->|No| H[anthropic/claude-opus-4.8]

Попробуйте обе через ofox: A/B в 10 строках

Честный способ определить черту маршрутизации — прогнать обе на ваших задачах и прочитать счётчики токенов. ofox отдаёт линейку Claude на одном OpenAI-совместимом эндпоинте (https://api.ofox.ai/v1), так что единственное, что меняется между прогонами, — строка ID модели, и один ключ покрывает все три яруса без отдельного биллинга Anthropic. Два нюанса перед запуском: обе модели отклоняют недефолтные temperature, top_p и top_k с ошибкой 400, так что оставьте параметры сэмплинга на значениях по умолчанию (примеры так и делают). И Fable 5 должна быть активна в окне доступа ofox, чтобы её строка разрешилась; когда её нет в списке, либо дождитесь окна, либо направьте этот один вызов на собственный API Anthropic.

Python: A/B обеих моделей в одном цикле

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="YOUR_OFOX_KEY")

prompt = "Fix the race condition in this worker pool: ..."
for model in ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]:
    r = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )
    u = r.usage
    print(model, u.prompt_tokens, u.completion_tokens)

Следите за столбцом completion_tokens. Всегда включённое мышление Fable 5 проявляется именно там, и, умноженное на $50/M, это то место, где живёт фактический ценовой разрыв.

Node: та же форма

import OpenAI from "openai";

const client = new OpenAI({ baseURL: "https://api.ofox.ai/v1", apiKey: process.env.OFOX_KEY });

const prompt = "Fix the race condition in this worker pool: ...";
for (const model of ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]) {
  const r = await client.chat.completions.create({
    model,
    messages: [{ role: "user", content: prompt }],
  });
  console.log(model, r.usage.prompt_tokens, r.usage.completion_tokens);
}

Прогоните это на 20–30 ваших по-настоящему сложных задачах, просуммируйте входные и выходные токены по каждой модели, умножьте на ставки из таблицы характеристик и поделите на то, сколько каждая реально решила. Эта стоимость за решённую задачу, а не ценник, — число, что решает, где пройдёт черта маршрутизации. Про саму сантехнику маршрутизации — материал о паттерне гибридной маршрутизации Claude Code, где разбирается выбор сигнала (длина входа, тег типа задачи или проверка уверенности, что эскалирует только при провале).

Подводные камни миграции: та же форма, три ошибки 400

Обе модели сохраняют форму Messages API, но тот же запрос, что работал на более старом Claude, может вернуть 400 на любой из этих.

ИзменениеСтарое поведениеНа Fable 5 / Sonnet 5
Параметры сэмплингаtemperature / top_p / top_k принимаютсяНедефолтные значения возвращают 400 на обеих
Ручное мышлениеbudget_tokens принимался на части моделейВозвращает 400 на обеих; используйте effort
Отключение мышленияthinking: {type: "disabled"} принималсяРаботает на Sonnet 5; 400 на Fable 5 (не передавайте параметр)
Отказывыбрасывались как ошибкиHTTP 200 с stop_reason: "refusal" на обеих; обрабатывайте это

Строки про Fable 5 — те, на которых спотыкаются. Мышление всегда включено, так что переключателя отключения нет, а классификаторы безопасности могут передать запрос на Opus 4.8 на лету. На API подключите фолбэк, чтобы отказ не просто останавливал запрос; серверный параметр fallbacks от Anthropic переотправляет отклонённый запрос на Opus 4.8 в том же вызове. Если вы поднимаете нагрузку Sonnet 5 до Fable 5 для сложного хвоста, закладывайте больше выходных токенов на задачу, а не меньше, потому что всегда включённое мышление работает против интуиции, что более умная модель заканчивает быстрее.

Тест маршрутизации — не оценка в бенчмарке, а стоимость за решённую задачу: прогоните обе на ваших реальных сложных задачах, посчитайте токены и посчитайте, сколько каждая реально закрыла.

Альтернативы

  • ofox ставит Sonnet 5, Opus 4.8 и Fable 5 (когда она в окне) на один OpenAI-совместимый эндпоинт, так что маршрутизация между ярусами — это изменение одной строки, а не три интеграции. Цены в реальном времени — в каталоге моделей.
  • Opus 4.8 — средний ярус, что стоит назвать явно: $5/$25, 69,2% в SWE-bench Pro, всегда доступен, никакого окна под планирование. Для задач между потолком Sonnet 5 и полом Fable 5 он часто верный выбор.
  • Anthropic напрямую — фолбэк конкретно для Fable 5. Когда Fable 5 нет в списке агрегатора, её собственный API держит ставку $10/$50 доступной ценой второго ключа и отдельного биллинга.

FAQ

Стоит ли Claude Fable 5 своей пятикратной цены против Sonnet 5? Только для самых сложных задач. Fable 5 даёт реальный скачок возможностей (80,3% в SWE-bench Pro против 63,2% и 91/100 в тесте Senior Engineer от Every, где Opus 4.8 набирает 63), но по стоимости за решённую задачу Sonnet 5 остаётся дешевле даже с учётом повторов. Fable 5 окупается, когда неверный первый ответ обходится дороже разницы в токенах.

Сколько стоит Claude Fable 5 по сравнению с Sonnet 5? $10/$50 за миллион токенов против $2/$10 вводных у Sonnet 5 ($3/$15 стандарт). Это в 5 раз дороже во вводном окне, примерно в 3,3 раза после 31 августа. Чтение из кеша — $1/M против $0.2/M.

Доступен ли Claude Fable 5 на ofox? С перерывами. Sonnet 5 — постоянная позиция по адресу anthropic/claude-sonnet-5; Fable 5 предлагается в окнах доступа, так что убедитесь, что она активна в каталоге ofox, прежде чем строить под неё.

Fable 5 лучше Sonnet 5 для программирования? На фронтире — очевидно (80,3% в SWE-bench Pro, 91/100 в тесте senior-инженера). Для рутинного программирования Sonnet 5 уже хватает при пятой части стоимости.

Почему Fable 5 отклоняет запросы или направляет на Opus 4.8? Её классификаторы безопасности передают запросы по кибербезопасности, биологии и дистилляции на Opus 4.8. Отказ возвращается как HTTP 200 с stop_reason: "refusal", так что проверяйте stop reason перед чтением содержимого.

Можно ли задать temperature на Fable 5 или Sonnet 5? Нет. Недефолтные параметры сэмплинга возвращают 400 на обеих, как и budget_tokens. Fable 5 также возвращает 400 на thinking: {type: "disabled"}, потому что мышление всегда включено.

Каков размер контекстного окна у Fable 5 и Sonnet 5? У обеих 1M токенов, 128K максимум выхода. Для этого выбора окно роли не играет; решают цена и возможности.

Стоит ли переходить с Sonnet 5 на Fable 5? Не целиком. Оставьте Sonnet 5 по умолчанию и эскалируйте на Fable 5 только тогда, когда вывод Sonnet 5 не проходит проверку. Тотальный переход платит впятеро за возможности, которые большинству запросов не нужны.

Проверенные источники