Fable 5 が一部のリクエストを拒否したり Opus 4.8 にルーティングするのはなぜですか？

設計上そうなっています。Fable 5 には3つのセーフティ分類器が搭載されており、リクエストがサイバーセキュリティ、生物学・化学、モデル蒸留のいずれかに見えると、Anthropic は Fable 5 ではなく Claude Opus 4.8 にルーティングします。ハードな拒否はエラーではなく、成功した HTTP 200 に `stop_reason: "refusal"` を付けて返るため、コンテンツを読む前に停止理由を確認してください。作業がこれらのドメインにあるなら、`anthropic/claude-opus-4.8` を直接呼び出してルーティング層を省きましょう。

Claude Fable 5 vs Sonnet 5（2026）：5倍高いが、報われる場面

Q: Claude Fable 5 は Sonnet 5 の5倍の価格に見合いますか？

最も難しいタスクに限ります。導入価格では Fable 5 は 100万トークンあたり $10/$50 で、Sonnet 5 の $2/$10 に対し入力・出力ともにちょうど5倍です。Fable 5 は本物の能力ジャンプを買えます（SWE-bench Pro 80.3% 対 63.2%、Every の Senior Engineer テストで 91/100、Opus 4.8 は 63）。ただし解決済みイシューあたりのコストでは、リトライを織り込んでも Sonnet 5 のほうが依然として安価です。Fable 5 が報われるのは、初回の誤答がトークン差以上のコストになるとき、あるいは Sonnet 5 では単純にタスクをクローズできないときです。

Q: Claude Fable 5 は Sonnet 5 と比べてどれくらいのコストですか？

Fable 5 は入力 100万トークンあたり $10、出力 $50 で、これは Anthropic API のレートです。Sonnet 5 は 2026年8月31日までの導入価格で $2/$10、その後 $3/$15 です。つまり Fable 5 は導入期間中は Sonnet 5 の5倍、期間後は約3.3倍です。キャッシュ済み入力の読み取りは Fable 5 が $1/M（Anthropic 標準の 0.1x 比率）、Sonnet 5 が $0.2/M です。Fable 5 の thinking は常時オンで1タスクあたりの出力トークンが多くなるため、表示価格の差は実際の差を小さく見せています。

Q: Claude Fable 5 は ofox で利用できますか？

断続的にです。Sonnet 5 は `anthropic/claude-sonnet-5` として ofox カタログに常設されています。Fable 5 は常設リストではなくアクセスウィンドウとして提供されるため、`anthropic/claude-fable-5` は、Anthropic が6月9日以降サブスクプランに入れたり外したりしたのと同じように、アグリゲーター上に現れたり消えたりします。本番に組み込む前に ofox カタログでモデルが稼働中か確認してください。リストにないときは、代わりに Anthropic 自身の API 経由で Fable 5 にアクセスしましょう。

Q: コーディングでは Fable 5 のほうが Sonnet 5 より優れていますか？

最前線では明確にそうです。Fable 5 は SWE-bench Pro で 80.3%、Every の Senior Engineer ベンチマークで 91/100 を記録し、Sonnet 5 の SWE-bench Pro 63.2% を上回ります。日常的なコーディング（単一ファイルの編集、リファクタリング、テストの足場、レビューコメント）には Sonnet 5 で十分で、コストは5分の1です。実務で効く切り分けは、日常の80%には Sonnet 5、パッチの失敗が高くつく難しいテールには Fable 5 です。

Q: Fable 5 や Sonnet 5 で temperature を設定できますか？

両方とも、いいえです。デフォルト以外の `temperature`、`top_p`、`top_k` は 400 エラーを返し、手動の `budget_tokens` thinking も 400 になります。挙動はシステムプロンプトで制御し、深さは `effort` パラメータで調整してください。Fable 5 には追加ルールが1つあります。thinking は常時オンなので、明示的な `thinking: {type: "disabled"}` も 400 を返します。このパラメータは完全に省いてください。

Q: Fable 5 と Sonnet 5 のコンテキストウィンドウはどれくらいですか？

どちらも 1M トークンで、最大出力は 128K です。名目上のウィンドウは同じですが、Sonnet 5 の新しいトークナイザーは1トークンあたりに詰め込むテキストが少ないため、1M ウィンドウに収まる実テキスト量は、古いモデルよりも Sonnet 5 のほうが少なくなります。Fable 5 対 Sonnet 5 の選択では、ウィンドウは互角です。価格と能力が決め手になります。

Q: Sonnet 5 から Fable 5 に切り替えるべきですか？

全面的には違います。Sonnet 5 をデフォルトに保ち、Sonnet 5 の初回出力がチェックに失敗したタスクに限って Fable 5 へエスカレーションしてください。そのエスカレーションパターンは高価なティアを小さく保ち、それこそが狙いです。全面的な切り替えは、ほとんどのリクエストで不要な能力に5倍払うことになります。

TL;DR Fable 5 は Anthropic の能力の天井、Sonnet 5 はそのバリューの床であり、初めて両方が1つのエンドポイント経由で手に入るようになりました。Fable 5 の表示価格は 100万トークンあたり $10/$50 で、Sonnet 5 の導入価格 $2/$10 のちょうど 5倍です（8月31日以降は3.3倍）。その上乗せ分は数字で正当化されます。SWE-bench Pro で 80.3%、Sonnet 5 の 63.2% に対して。そして Every の Senior Engineer テストで 91/100、Opus 4.8 は 63 です。落とし穴は、価格差が天井ではなく床だということです。Fable 5 の常時オンな thinking が1タスクあたりの出力トークンを増やすためです。可用性の落とし穴もあります。Sonnet 5 は常にリスト掲載、Fable 5 はアクセスウィンドウで現れたり消えたりします。以下では、スペック、ベンチマーク表、解決済みイシューあたりのコスト計算、そして自分のトラフィックで両方を A/B する10行のやり方を示します。

5倍という表示上の差は、この差が縮まりきった最小値です。Fable 5 の thinking は常時オンなので、同じタスクでも Sonnet 5 より多くの出力トークンを吐き、その出力こそ $50 で課金される行なのです。

TL;DR：どちらを選ぶべきか？

ほとんどのチームにとっての答えは「Sonnet 5 をデフォルトに、間違えるわけにいかない難しいテールに Fable 5」です。以下はシナリオ別の一行結論です。

シナリオ	選択	理由
分類、抽出、チャット、RAG 回答	Sonnet 5	出力が限定的、能力は十分、価格は5分の1
日常的なコーディング：編集、リファクタリング、テストの足場	Sonnet 5	SWE-bench Pro 63.2% は日常作業に十分
パッチの失敗が高くつく最前線のエージェントコーディング	Fable 5	SWE-bench Pro 80.3%、senior-engineer テスト 91/100
初回で必ず着地させたい長期の自律実行	Fable 5	正確さがボトルネックのとき、リトライが少ない
混在ワークロード全体でコストを重視したデフォルト	両方をルーティング	安価な処理は Sonnet 5、難しいテールは Fable 5
サイバーセキュリティ、バイオ、蒸留の作業	どちらでもなく Opus 4.8	Fable 5 はどのみちこれらを自動で Opus 4.8 にルーティング

この記事の残りは、その表の裏付けとなる証拠と、「$50 ティアが実際に報われるのはいつか」の誠実な回答です。

何が変わったか：Fable 5 が戻り、Sonnet 5 が登場した

3週間差の2つのリリースが、Claude ラインの頂点と中間をリセットしました。

Claude Fable 5 は 2026年6月9日、Anthropic 初の一般提供 Mythos クラスのモデルとして出荷されました。これはサイバーセキュリティ能力を懸念して Anthropic がこれまで温存していたファミリーです。Fable 5 は、3つのセーフティ分類器を上に重ねた Mythos モデルです。Anthropic は2週間 Pro、Max、Team のサブスクプランに載せ、その後6月23日にそれらのプランから外し、$10/$50 の API レートを入口として残しました。以降、アクセスウィンドウで出入りを繰り返しており、これはその周りをどう設計するかに影響します。

Claude Sonnet 5 は 2026年6月30日、導入価格 $2/$10（8月31日以降は標準 $3/$15）で出荷されました。Anthropic の最もエージェント寄りな Sonnet 帯モデルであり、最前線ではないプロ作業の新しいデフォルトです。中間ティアとの直接対決は Sonnet 5 vs Opus 4.8 で取り上げました。

両端を、それぞれ Opus 4.8 と比べるのではなく直接比較する理由は、両者が異なる問いに答えるからです。Sonnet 5 は「日常の基準を満たす最も安いモデルは何か」に答えます。Fable 5 は「タスクが十分に難しく、間違えることこそが高くつく結果になるとき、金で買える最良のモデルは何か」に答えます。ほとんどのチームは両方の答えを必要とし、興味深い判断はその間にどこで線を引くかです。GPT-5.5 を混ぜた3者間のコーディング対決を求めるなら、それは Fable 5 vs Opus 4.8 vs GPT-5.5 にあります。この記事はより狭く実務的です。2つのティア、1つのルーティング判断です。

クイックスペック比較

両モデルは同じ名目上の 1M コンテキストウィンドウと 128K 最大出力を共有します。実際の違いは、価格、可用性、そして Fable 5 が thinking をオフにできないという点です。

スペック	Claude Fable 5	Claude Sonnet 5
ofox モデル ID	`anthropic/claude-fable-5`	`anthropic/claude-sonnet-5`
入力	$10/M	$2/M（導入）、$3/M（標準）
出力	$50/M	$10/M（導入）、$15/M（標準）
キャッシュ済み入力の読み取り	$1/M（0.1x 比率）	$0.2/M
コンテキストウィンドウ	1M	1M
最大出力	128K	128K
thinking	常時オン、無効化不可	adaptive、デフォルトでオン、無効化可能
サンプリングパラメータ	400 エラー	400 エラー
セーフティルーティング	サイバー / バイオ / 蒸留を Opus 4.8 へ	リアルタイムのサイバー拒否
ofox 可用性	ウィンドウ制、常時掲載ではない	常設掲載

導入時の Sonnet 5 価格（$2/$10）とキャッシュ読み取り（$0.2/M）は、2026年7月2日時点で anthropic/claude-sonnet-5 の ofox モデルページと一致します。Fable 5 の $10/$50 は Anthropic の Fable 5 発表から得た Anthropic API レートです。そのキャッシュ読み取りは、Anthropic がライン全体に適用する標準の入力比 0.1x です。執筆時点で Fable 5 の ofox 掲載は稼働していなかったため、ここでの数値はライブの ofox ページから読んだものではなく Anthropic 由来です。組み込む前に ofox カタログで現在の Fable 5 掲載を確認してください。

価格差、そしてそれが5倍より大きい理由

トークン単価では差はきれいです。Fable 5 は導入期間中、入力・出力・キャッシュ読み取りのいずれも Sonnet 5 の5倍です。8月31日以降、Sonnet 5 が $3/$15 に移ると、倍率は約3.3倍に下がります。いずれにせよ、Sonnet 5 はトークンあたり圧倒的に安価です。

表示価格が実際の差を過小に見せる構造的な理由が1つあります。Fable 5 の thinking は常時オンで、オフにできません。そのため些細でないタスクでは、より軽い呼び出しなら生じないはずの thinking と出力トークンをひとまとまり生成します。Sonnet 5 も adaptive thinking がデフォルトでオンですが、effort パラメータで下げたり、限定的な作業では完全に無効化したりできます。出力は Fable 5 では $50/M、Sonnet 5 では $10/M で課金される行なので、高価なモデルで出力トークンが増えると、実効の差は5倍という表示を超えて広がります。これは Sonnet 対 Opus の話の逆です。あちらでは安いモデル自身の thinking が割引を縮めていました。ここでは高価なモデルのほうがデフォルトでより深く考えるため、差は広がる一方です。

キャッシュ読み取りは、比率がアスタリスクなしのちょうど5倍になる唯一の場所です。プロンプトが大きく安定した接頭部（システムプロンプト、ツールスキーマ、繰り返される文書群）を持つなら、キャッシュ読み取りは Sonnet 5 で $0.2/M、Fable 5 で $1/M です。キャッシュ多用の本番エンドポイントでは、この行だけで月額請求を支配し得ますし、それが Fable 5 に有利になることは決してありません。

コーディングベンチマーク：能力差は本物

ベンチマークはノイズが多いのですが、この2つの差はノイズに耐えるほど広いです。以下は本番のコーディングに対応するテストでの着地点で、中間ティアの参照として Opus 4.8 を並べます。

ベンチマーク	Fable 5	Sonnet 5	Opus 4.8
SWE-bench Verified	95.0%	n/a	88.6%
SWE-bench Pro（エージェントコーディング）	80.3%	63.2%	69.2%
Every Senior Engineer（/100）	91	未公開	63
Terminal-Bench 2.1	80.5%	n/a	74.6%

2つの行が判断を決めます。

SWE-bench Pro は本番向けの読みです。 実際の GitHub イシューに対してモデルをエンドツーエンドで走らせます。リポジトリを読み、パッチを書き、そのパッチが隠しテストスイートに通るか通らないか、部分点はなしです。Fable 5 の 80.3% 対 Sonnet 5 の 63.2% は17ポイント差で、その1点1点が、失敗ではなく初回実行でクローズするイシューに相当します。難しいマルチファイルのイシューでは、初回のミスはリトライループか、人間が後始末をすることを意味し、どちらもトークン以上のコストがかかります。

Every の Senior Engineer ベンチマークは天井の読みです。 Every は自分たちが書ける最も難しい問題、つまり熟練エンジニアが解くのに1営業日かかる類の問題で走らせます。91/100 の Fable 5 は、人間の熟練エンジニアの域に着地します。Opus 4.8 は 63 です。Anthropic はこのテストの Sonnet 5 の数値を公開していませんが、Sonnet 5 はすでに SWE-bench Pro で Opus 4.8 に劣っている（63.2% 対 69.2%）ため、より難しいベンチマークでは Fable 5 の近くではなく、Opus 以下に着地します。それこそが価格プレミアムで買う差です。「平均でちょっと良い」ではなく、「安いモデルがほぼ失敗する種類のタスクをこなせる」のです。これらのリーダーボードスコアはスナップショットとして扱い、ベンチマークごとのソースは Anthropic の Transparency Hub を参照してください。ルーティングに重要なのは方向性であって、末尾の小数ではありません。

表の誠実な要約はこうです。日常的なコーディングでは、追加のポイントは結果を変えません。Sonnet 5 がすでにイシューをクローズするからです。最前線のコーディングでは、追加のポイントが「出荷する」か「立ち往生する」かの差になります。

価格の計算：$50 ティアが実際に報われるのはいつか

表示価格は1つの数字、解決済みイシューあたりのコストは別の数字で、両者は逆方向を指し得ます。以下は前提を明示した2つのワークロードで、自分の値に差し替えられます。

シナリオ A、日常のコーディング群。 開発者5人、各自1日20タスク、20営業日（月2,000タスク）。日常タスクあたり：入力 40K、出力は Sonnet 5 が 8K（thinking を低く抑える）、Fable 5 が 25K（thinking 常時オン）。タスクは両モデルの射程内に十分収まると仮定し、初回成功率はどちらもほぼ1とします。

項目	Sonnet 5（導入）	Fable 5
タスクあたり入力（40K）	$0.08	$0.40
タスクあたり出力	$0.08（8K）	$1.25（25K）
タスクあたりコスト	$0.16	$1.65
月額（2,000タスク）	$320	$3,300
相手比	基準	約10倍高い

日常作業では Fable 5 は5倍高いのではなく、おおよそ10倍です。常時オンの thinking が $50 の出力行に積み上がるためです。Sonnet 5 がすでにクローズする作業にそれを払うのは、純粋な無駄です。

シナリオ B、難しいテール。 今度は本当に難しいマルチファイルのイシューで、初回成功が全てというケースを取ります。代理指標として SWE-bench Pro のレートを使います。Fable 5 が 80.3%、Sonnet 5 が 63.2%。試行あたり：入力 60K、出力は Fable 5 が 40K、Sonnet 5 が 30K。

項目	Sonnet 5（導入）	Fable 5
試行あたりコスト	$0.42	$2.60
初回成功率	63.2%	80.3%
解決までの想定試行回数	約 1.58	約 1.25
解決済みイシューあたりコスト（トークンのみ）	約 $0.66	約 $3.24

トークンだけで見ると、リトライを織り込んでも解決済みイシューあたりでは依然 Sonnet 5 のほうが安価です。試行あたり価格が5分の1なら、多くのリトライを買えるからです。したがって Fable 5 の根拠はトークンコストの話ではありません。こうです。SWE-bench Pro のレートは最も難しいタスクで Sonnet 5 を美しく見せています。Every のベンチマークが狙う種類の問題（Fable 5 が 91、Opus 4.8 が 63 しか取れない）では、Sonnet 5 の実世界での解決率は 63.2% の見出しをはるかに下回り、リトライ回数が増え、一部のイシューは決してクローズしません。パッチの失敗が熟練エンジニアの1時間を要したりバグを出荷したりすれば、$3 のトークン差はもはや意味を持つ数字ではなくなります。それこそが Fable 5 が報われるときです。安いからではなく、間違えることが高くつき、そして間違える頻度がより低いからです。

数字にしてみましょう。フルコスト $120/時の熟練エンジニアは $2/分です。難しいイシューを Sonnet 5 ではなく Fable 5 にルーティングして、誤ったパッチをほどく人間の時間を15分でも節約できれば、それは1桁ドルで測られるトークン差に対して $30 のエンジニア時間です。損益分岐点は接近すらしていません。罠は、そのロジックを日常の80%に当てはめることです。そこには回避すべき誤パッチのコストがありません。どのみち Sonnet 5 がイシューをクローズするはずだったからです。ティア分けの全ての規律は、Fable 5 のシェアを、その10倍の実効コストが「エンジニアの1時間節約が俎上にある」タスクにのみ落ちるほど小さく保つことにあります。そのシェアは味ではなく計測でサイズを決めましょう。ほとんどのチームは、真の最前線がトラフィックの1桁パーセントであり、そのパーセントを超えるものはすべて、タスクが要求しなかった能力に費やされる金だと気づきます。

Claude Sonnet 5 を選ぶべきとき

大多数の作業には anthropic/claude-sonnet-5 を選びましょう：

大量・限定出力。 分類、抽出、ルーティング、モデレーション。短い出力、膨大な入力量、多くの場合キャッシュ多用。Sonnet 5 の $2/$10 と $0.2/M のキャッシュ読み取りが、これらの請求を Fable 5 の数分の一に削減します。
RAG 回答と要約。 重い仕事は検索が担い、モデルは限定的な応答を書きます。能力は十分です。
日常的なコーディング。 単一ファイルの編集、定型コード、テストの足場、レビューコメント。SWE-bench Pro 63.2% は、最前線ではない作業をこなします。
レイテンシに敏感でインタラクティブなもの全般。 Sonnet 帯の速度と価格は、常にまず考える天井モデルよりも、チャットやアシスタント面にフィットします。

Claude Fable 5 を選ぶべきとき

タスクが能力の最前線にあり、誤答こそが高くつく結果になるときは anthropic/claude-fable-5 を選びましょう：

最前線のエージェントコーディング。 難しいマルチファイルのイシューで、17ポイントの SWE-bench Pro リードが「1回の実行」と「リトライループ」の差であり、誤って出荷されたパッチが実際のエンジニア時間を要するケース。
長期の自律実行。 夜間のリファクタリングや、12ステップ目で誤った方向転換を人間が拾わずにまとまり続けなければならないマルチステップのエージェントループ。
熟練エンジニア級の問題。 Every のベンチマークが狙う作業で、Sonnet 5 の実解決率が落ち、Fable 5 の 91/100 が手を伸ばす理由になるもの。
アクセスがあるとき。 Fable 5 の可用性はウィンドウ制なので、常設の依存先ではなく、稼働中にルーティングするティアとして設計してください。

どちらも選ばないとき（そして代わりに何を使うか）

2つのケースがティアの間に落ちます。

1つ目は サイバーセキュリティ、生物学・化学、モデル蒸留の作業 です。Fable 5 はこれらを検出してどのみち Opus 4.8 にルーティングするため、これらで Fable 5 を呼ぶのはルーティングホップを増やすだけです。anthropic/claude-opus-4.8 を直接呼び出して省きましょう。

2つ目は 難易度域の中間 です。Sonnet 5 が確実にクローズするには難しすぎるが、Fable 5 の10倍の実効コストを正当化するほど難しくはないタスクです。まさにそこが Opus 4.8 の居場所です。$5/$25、SWE-bench Pro 69.2%、そして計画すべきアクセスウィンドウもありません。多くのチームにとって、実際のルーティングツリーは2ティアではなく3ティアで、日常の難タスクの働き手が Opus 4.8、真の最前線に予約されるのが Fable 5 です。Sonnet 5 vs Opus 4.8 の解説が下側の境界を、Opus 4.8 リリースレビューが中間をカバーします。

flowchart TD
    A[Incoming task] --> B{Cyber / bio / distillation?}
    B -->|Yes| C[anthropic/claude-opus-4.8]
    B -->|No| D{Frontier-hard?<br/>failed answer is expensive}
    D -->|No| E[anthropic/claude-sonnet-5]
    D -->|Yes| F{Fable 5 in an access window?}
    F -->|Yes| G[anthropic/claude-fable-5]
    F -->|No| H[anthropic/claude-opus-4.8]

ofox で両方を試す：10行で A/B

ルーティングの線に決着をつける誠実な方法は、自分のタスクで両方を走らせてトークン数を読むことです。ofox は Claude ラインを1つの OpenAI 互換エンドポイント（https://api.ofox.ai/v1）で公開しているので、実行間で変わるのはモデル ID の文字列だけで、1つのキーで3ティアすべてをカバーし、Anthropic への別建て課金は不要です。走らせる前に2つの落とし穴があります。両モデルともデフォルト以外の temperature、top_p、top_k を 400 で拒否するので、サンプリングパラメータはデフォルトのままにしてください（例はそうしています）。そして Fable 5 は、その行が解決するには ofox のアクセスウィンドウで稼働している必要があります。リストにないときは、ウィンドウを待つか、その1呼び出しを Anthropic 自身の API に向けてください。

Python：1ループで両モデルを A/B

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="YOUR_OFOX_KEY")

prompt = "Fix the race condition in this worker pool: ..."
for model in ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]:
    r = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )
    u = r.usage
    print(model, u.prompt_tokens, u.completion_tokens)

completion_tokens の列を見ましょう。Fable 5 の常時オンな thinking はそこに現れ、$50/M を掛けた値こそ、実効のコスト差が宿る場所です。

Node：同じ形

import OpenAI from "openai";

const client = new OpenAI({ baseURL: "https://api.ofox.ai/v1", apiKey: process.env.OFOX_KEY });

const prompt = "Fix the race condition in this worker pool: ...";
for (const model of ["anthropic/claude-fable-5", "anthropic/claude-sonnet-5"]) {
  const r = await client.chat.completions.create({
    model,
    messages: [{ role: "user", content: prompt }],
  });
  console.log(model, r.usage.prompt_tokens, r.usage.completion_tokens);
}

これを本当に難しいタスク20〜30個で走らせ、モデルごとに入力と出力のトークンを合計し、スペック表のレートを掛け、各モデルが実際に解決した数で割ってください。その解決済みイシューあたりコストが、表示価格ではなく、ルーティングの線をどこに引くかを決める数字です。ルーティングの配管そのものについては、Claude Code ハイブリッドルーティングパターンの記事が、シグナルの選び方（入力長、タスク種別タグ、失敗時のみエスカレーションする信頼度チェック）をカバーしています。

移行時の落とし穴：形は同じ、3つの 400

両モデルとも Messages API の形を保ちますが、古い Claude で動いていた同じリクエストが、どちらでも 400 になり得ます。

変更	旧挙動	Fable 5 / Sonnet 5 では
サンプリングパラメータ	`temperature` / `top_p` / `top_k` を受け付ける	デフォルト以外の値は両方で 400
手動 thinking	一部モデルで `budget_tokens` を受け付ける	両方で 400。`effort` を使う
thinking の無効化	`thinking: {type: "disabled"}` を受け付ける	Sonnet 5 では動作、Fable 5 では 400（パラメータを省く）
拒否	エラーとしてスローされる	両方で HTTP 200 に `stop_reason: "refusal"`。処理すること

Fable 5 の行が人をつまずかせます。thinking は常時オンなので無効化スイッチはなく、セーフティ分類器は途中でリクエストを Opus 4.8 に渡し得ます。API では、拒否がリクエストを単に止めないようフォールバックにオプトインしてください。Anthropic のサーバーサイド fallbacks パラメータは、拒否されたリクエストを同じ呼び出し内で Opus 4.8 に再サーブします。Sonnet 5 のワークロードを難しいテール向けに Fable 5 へ引き上げるなら、1タスクあたりの出力トークンは少なくではなく多く見積もってください。常時オンの thinking は、賢いモデルほど速く終わるという直感に反して働くからです。

ルーティングのテストはベンチマークスコアではなく、解決済みイシューあたりのコストです。本当に難しいタスクで両方を走らせ、トークンを数え、それぞれが実際に何件クローズしたかを数えましょう。

代替案

ofox は Sonnet 5、Opus 4.8、そして（ウィンドウ内なら）Fable 5 を1つの OpenAI 互換エンドポイントに載せるので、ティア間のルーティングは3つの統合ではなく文字列1つの変更になります。リアルタイムの価格はモデルカタログにあります。
Opus 4.8 は明示的に名指しする価値のある中間ティアです。$5/$25、SWE-bench Pro 69.2%、常時利用可能、計画すべきウィンドウもなし。Sonnet 5 の天井と Fable 5 の床の間のタスクには、しばしばこれが正解です。
Anthropic 直接 は特に Fable 5 向けのフォールバックです。Fable 5 がアグリゲーターに掲載されていないとき、その API は $10/$50 レートを利用可能に保ちます。ただし2つ目のキーと別建て課金の代償を伴います。

FAQ

Claude Fable 5 は Sonnet 5 の5倍の価格に見合いますか？ 最も難しいタスクに限ります。Fable 5 は本物の能力ジャンプを買えます（SWE-bench Pro 80.3% 対 63.2%、Every の Senior Engineer テストで 91/100、Opus 4.8 は 63）が、解決済みイシューあたりのコストではリトライを織り込んでも Sonnet 5 のほうが安価です。Fable 5 が報われるのは、初回の誤答がトークン差以上のコストになるときです。

Claude Fable 5 は Sonnet 5 と比べてどれくらいのコストですか？ 100万トークンあたり $10/$50 で、Sonnet 5 の導入価格 $2/$10（標準 $3/$15）に対してです。導入期間中は5倍、8月31日以降は約3.3倍です。キャッシュ読み取りは $1/M 対 $0.2/M です。

Claude Fable 5 は ofox で利用できますか？ 断続的にです。Sonnet 5 は anthropic/claude-sonnet-5 で常設掲載です。Fable 5 はアクセスウィンドウで提供されるため、組み込む前に ofox カタログで稼働中か確認してください。

コーディングでは Fable 5 のほうが Sonnet 5 より優れていますか？ 最前線では明確にそうです（SWE-bench Pro 80.3%、senior-engineer テスト 91/100）。日常的なコーディングには、Sonnet 5 で5分の1のコストですでに十分です。

Fable 5 が拒否したり Opus 4.8 にルーティングするのはなぜですか？ セーフティ分類器がサイバーセキュリティ、バイオ、蒸留のリクエストを Opus 4.8 に渡します。拒否は HTTP 200 に stop_reason: "refusal" を付けて返るので、コンテンツを読む前に停止理由を確認してください。

Fable 5 や Sonnet 5 で temperature を設定できますか？ いいえ。デフォルト以外のサンプリングパラメータは両方で 400、budget_tokens も同様です。Fable 5 は thinking が常時オンなので thinking: {type: "disabled"} でも 400 になります。

Fable 5 と Sonnet 5 のコンテキストウィンドウはどれくらいですか？ どちらも 1M トークン、最大出力 128K です。この選択ではウィンドウは互角で、価格と能力が決め手になります。

Sonnet 5 から Fable 5 に切り替えるべきですか？ 全面的には違います。Sonnet 5 をデフォルトに保ち、Sonnet 5 の出力がチェックに失敗したときに限って Fable 5 へエスカレーションしてください。全面的な切り替えは、ほとんどのリクエストで不要な能力に5倍払うことになります。

今回の更新で確認した情報源

Anthropic「Claude Fable 5 and Mythos 5」発表（Fable 5 $10/$50、Mythos クラス、Opus 4.8 へルーティングするセーフティ分類器）、2026年7月2日検証：https://www.anthropic.com/news/claude-fable-5-mythos-5
Anthropic「Introducing Claude Fable 5」ドキュメント（常時オンの thinking、サンプリングパラメータ不可、拒否の処理）：https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5
Anthropic「Introducing Claude Sonnet 5」ローンチ投稿、2026年6月30日：https://www.anthropic.com/news/claude-sonnet-5
Anthropic「What’s new in Claude Sonnet 5」ドキュメント（挙動変更、価格）：https://platform.claude.com/docs/en/about-claude/models/whats-new-sonnet-5
Anthropic Transparency Hub（ベンチマークごとのソース）：https://www.anthropic.com/transparency
anthropic/claude-sonnet-5 の ofox モデルページ（導入 $2/$10、キャッシュ読み取り $0.2/M、1M コンテキスト）、2026年7月2日検証：https://ofox.ai/models/anthropic/claude-sonnet-5
ofox モデルカタログ（Fable 5 の掲載状況、リアルタイム価格）、2026年7月2日確認：https://ofox.ai/models
SWE-bench Pro / SWE-bench Verified / Every Senior Engineer の数値は Anthropic のローンチ資料と Every の公開ベンチマークより。私たちの Fable 5 vs Opus 4.8 vs GPT-5.5 の記事とクロスリファレンス済み