Anthropic выпустила Claude Fable 5 — новый уровень выше Opus и самую мощную модель Claude на сегодняшний день. Id модели — claude-fable-5, она уже доступна на OmniaKey по цене на 70% ниже официальной, на том же ключе и балансе, что и все остальные модели.

Что нового в Fable 5

Fable 5 — не минорный релиз Opus. Это новый верхний уровень с собственной ценой, стоящий над Opus 4.8 так же, как Opus стоит над Sonnet:

	Claude Fable 5	Claude Opus 4.8
Id модели	`claude-fable-5`	`claude-opus-4-8`
Контекстное окно	1M токенов	1M токенов
Максимальный вывод	128K токенов	128K токенов
Thinking	Только adaptive: явно отключить нельзя, не нужен — опустите поле `thinking`	Adaptive, опционально — явный `disabled` принимается
Официальная цена (за 1M токенов, ввод / вывод)	$10 / $50	$5 / $25

Формат запросов тот же, что у Opus 4.8 и 4.7: adaptive thinking заменяет фиксированные бюджеты на рассуждения, а классические параметры сэмплирования убраны полностью (подробнее ниже). Если ваш код уже работает на Opus 4.8, переход — замена одной строки, с единственным исключением: явный thinking: {"type": "disabled"} на Fable 5 отклоняется (детали в заметках о миграции ниже).

За цифрами бенчмарков — к system card Fable 5 от Anthropic, это первоисточник. Здесь же только то, что меняется на практике: характеристики, цена и как запустить.

Цена API: официальная vs OmniaKey

Fable 5 стоит вдвое дороже Opus — $10 за ввод / $50 за вывод на миллион токенов. Тяжёлые агентские сессии быстро сжигают выходные токены, так что разница в тарифе ощущается сильнее, чем кажется. На OmniaKey каждая модель Anthropic стоит 30% от официальной цены — одна и та же скидка 70% на весь каталог:

За 1M токенов	Ввод	Вывод	Попадание в кэш
Anthropic официально	$10	$50	$1
OmniaKey	$3	$15	$0.30

Это оплата за токены без месячной подписки — пополнили, потратили, а дашборд показывает, сколько стоил каждый вызов. Prompt caching пробрасывается без изменений, так что повторяющийся контекст длинных агентских сессий оплачивается по кэш-тарифу $0.30.

Fable 5 или Opus 4.8?

При двойной цене Fable 5 — не новый дефолт, а новый потолок.

Оставайтесь на Opus 4.8 для повседневного кодинга. Он по-прежнему отлично справляется с длинными агентскими задачами, и в большинстве сессий разницы вы не почувствуете.
Берите Fable 5, когда вы действительно застряли — сложнейшие рефакторинги, глубокие многошаговые рассуждения, работа, где провальный прогон стоит дороже токенов.

Обе модели живут на одном эндпоинте и одном ключе, так что практичный паттерн простой: по умолчанию Opus 4.8, на задачах, которые этого заслуживают, переключаетесь на /model claude-fable-5, потом обратно.

Попробовать в Claude Code

Если Claude Code уже указывает на OmniaKey, достаточно переключить модель внутри сессии:

text

/model claude-fable-5

С нуля — две переменные окружения:

bash

export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude

Только голый хост — без суффикса /v1. Claude Code сам добавляет /v1/messages. Полная инструкция, включая создание ключа, — в гайде по настройке Claude Code.

Cursor, Cline и aider работают с Fable 5 через OpenAI-совместимый эндпоинт OmniaKey — тот же id claude-fable-5, никакой протокольной гимнастики:

OpenAI-compatible

https://api.omniakey.com/v1

Anthropic-native

https://api.omniakey.com

Gemini-native

https://api.omniakey.com/v1beta

Какой бы интерфейс вы ни выбрали, какой id модели вы запросили — та модель и обрабатывает запрос. OmniaKey никогда втихую не подменит вызов Fable 5 чем-то подешевле.

Миграция со старых моделей Claude: три ошибки 400, о которых надо знать

Fable 5 сохраняет формат запросов Opus 4.8. Но при переходе с более старых моделей Claude три конструкции запроса, которые раньше работали, теперь возвращают 400 — через любой шлюз, включая OmniaKey, потому что это ограничения на уровне самой модели:

Параметров сэмплирования больше нет. temperature, top_p и top_k возвращают 400. Удалите их; управляйте поведением через промпт.
Фиксированного thinking-бюджета больше нет. thinking: {"type": "enabled", "budget_tokens": N} возвращает 400. Используйте thinking: {"type": "adaptive"} — модель сама решит, сколько думать.
Thinking нельзя явно выключить. Особенность именно Fable 5: thinking: {"type": "disabled"} возвращает 400 (Opus 4.8 это ещё принимает). Чтобы работать без thinking, просто опустите поле thinking целиком.

Префилл последнего сообщения ассистента (assistant prefill) тоже не поддерживается — как и на всех моделях начиная с семейства 4.6; используйте структурированный вывод. Few-shot сообщения ассистента в середине диалога — без проблем.

Получить API-ключ OmniaKey Посмотреть цены моделей