Ограниченное время · те же модели — GPT −95%, Claude −70%
Блог
Guide

Claude Fable 5: что нового

Новая топовая модель Anthropic: характеристики, цена API на 70% ниже официальной, Fable 5 против Opus 4.8 и настройка Claude Code за пару минут.

5 мин чтенияOmniaKey
ClaudeFable 5AnthropicpricingClaude Code

Anthropic выпустила Claude Fable 5 — новый уровень выше Opus и самую мощную модель Claude на сегодняшний день. Id модели — claude-fable-5, она уже доступна на OmniaKey по цене на 70% ниже официальной, на том же ключе и балансе, что и все остальные модели.

Что нового в Fable 5

Fable 5 — не минорный релиз Opus. Это новый верхний уровень с собственной ценой, стоящий над Opus 4.8 так же, как Opus стоит над Sonnet:

Claude Fable 5Claude Opus 4.8
Id моделиclaude-fable-5claude-opus-4-8
Контекстное окно1M токенов1M токенов
Максимальный вывод128K токенов128K токенов
ThinkingТолько adaptive: явно отключить нельзя, не нужен — опустите поле thinkingAdaptive, опционально — явный disabled принимается
Официальная цена (за 1M токенов, ввод / вывод)$10 / $50$5 / $25

Формат запросов тот же, что у Opus 4.8 и 4.7: adaptive thinking заменяет фиксированные бюджеты на рассуждения, а классические параметры сэмплирования убраны полностью (подробнее ниже). Если ваш код уже работает на Opus 4.8, переход — замена одной строки, с единственным исключением: явный thinking: {"type": "disabled"} на Fable 5 отклоняется (детали в заметках о миграции ниже).

За цифрами бенчмарков — к system card Fable 5 от Anthropic, это первоисточник. Здесь же только то, что меняется на практике: характеристики, цена и как запустить.

Цена API: официальная vs OmniaKey

Fable 5 стоит вдвое дороже Opus — $10 за ввод / $50 за вывод на миллион токенов. Тяжёлые агентские сессии быстро сжигают выходные токены, так что разница в тарифе ощущается сильнее, чем кажется. На OmniaKey каждая модель Anthropic стоит 30% от официальной цены — одна и та же скидка 70% на весь каталог:

За 1M токеновВводВыводПопадание в кэш
Anthropic официально$10$50$1
OmniaKey$3$15$0.30

Это оплата за токены без месячной подписки — пополнили, потратили, а дашборд показывает, сколько стоил каждый вызов. Prompt caching пробрасывается без изменений, так что повторяющийся контекст длинных агентских сессий оплачивается по кэш-тарифу $0.30.

Fable 5 или Opus 4.8?

При двойной цене Fable 5 — не новый дефолт, а новый потолок.

  • Оставайтесь на Opus 4.8 для повседневного кодинга. Он по-прежнему отлично справляется с длинными агентскими задачами, и в большинстве сессий разницы вы не почувствуете.
  • Берите Fable 5, когда вы действительно застряли — сложнейшие рефакторинги, глубокие многошаговые рассуждения, работа, где провальный прогон стоит дороже токенов.

Обе модели живут на одном эндпоинте и одном ключе, так что практичный паттерн простой: по умолчанию Opus 4.8, на задачах, которые этого заслуживают, переключаетесь на /model claude-fable-5, потом обратно.

Попробовать в Claude Code

Если Claude Code уже указывает на OmniaKey, достаточно переключить модель внутри сессии:

text
/model claude-fable-5

С нуля — две переменные окружения:

bash
export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude

Только голый хост — без суффикса /v1. Claude Code сам добавляет /v1/messages. Полная инструкция, включая создание ключа, — в гайде по настройке Claude Code.

Cursor, Cline и aider работают с Fable 5 через OpenAI-совместимый эндпоинт OmniaKey — тот же id claude-fable-5, никакой протокольной гимнастики:

OpenAI-compatible
https://api.omniakey.com/v1
Anthropic-native
https://api.omniakey.com
Gemini-native
https://api.omniakey.com/v1beta

Какой бы интерфейс вы ни выбрали, какой id модели вы запросили — та модель и обрабатывает запрос. OmniaKey никогда втихую не подменит вызов Fable 5 чем-то подешевле.

Миграция со старых моделей Claude: три ошибки 400, о которых надо знать

Fable 5 сохраняет формат запросов Opus 4.8. Но при переходе с более старых моделей Claude три конструкции запроса, которые раньше работали, теперь возвращают 400 — через любой шлюз, включая OmniaKey, потому что это ограничения на уровне самой модели:

  1. Параметров сэмплирования больше нет. temperature, top_p и top_k возвращают 400. Удалите их; управляйте поведением через промпт.
  2. Фиксированного thinking-бюджета больше нет. thinking: {"type": "enabled", "budget_tokens": N} возвращает 400. Используйте thinking: {"type": "adaptive"} — модель сама решит, сколько думать.
  3. Thinking нельзя явно выключить. Особенность именно Fable 5: thinking: {"type": "disabled"} возвращает 400 (Opus 4.8 это ещё принимает). Чтобы работать без thinking, просто опустите поле thinking целиком.

Префилл последнего сообщения ассистента (assistant prefill) тоже не поддерживается — как и на всех моделях начиная с семейства 4.6; используйте структурированный вывод. Few-shot сообщения ассистента в середине диалога — без проблем.