Claude Fable 5: что нового
Новая топовая модель Anthropic: характеристики, цена API на 70% ниже официальной, Fable 5 против Opus 4.8 и настройка Claude Code за пару минут.
Anthropic выпустила Claude Fable 5 — новый уровень выше Opus и самую мощную модель Claude на сегодняшний день. Id модели — claude-fable-5, она уже доступна на OmniaKey по цене на 70% ниже официальной, на том же ключе и балансе, что и все остальные модели.
Что нового в Fable 5
Fable 5 — не минорный релиз Opus. Это новый верхний уровень с собственной ценой, стоящий над Opus 4.8 так же, как Opus стоит над Sonnet:
| Claude Fable 5 | Claude Opus 4.8 | |
|---|---|---|
| Id модели | claude-fable-5 | claude-opus-4-8 |
| Контекстное окно | 1M токенов | 1M токенов |
| Максимальный вывод | 128K токенов | 128K токенов |
| Thinking | Только adaptive: явно отключить нельзя, не нужен — опустите поле thinking | Adaptive, опционально — явный disabled принимается |
| Официальная цена (за 1M токенов, ввод / вывод) | $10 / $50 | $5 / $25 |
Формат запросов тот же, что у Opus 4.8 и 4.7: adaptive thinking заменяет фиксированные бюджеты на рассуждения, а классические параметры сэмплирования убраны полностью (подробнее ниже). Если ваш код уже работает на Opus 4.8, переход — замена одной строки, с единственным исключением: явный thinking: {"type": "disabled"} на Fable 5 отклоняется (детали в заметках о миграции ниже).
За цифрами бенчмарков — к system card Fable 5 от Anthropic, это первоисточник. Здесь же только то, что меняется на практике: характеристики, цена и как запустить.
Цена API: официальная vs OmniaKey
Fable 5 стоит вдвое дороже Opus — $10 за ввод / $50 за вывод на миллион токенов. Тяжёлые агентские сессии быстро сжигают выходные токены, так что разница в тарифе ощущается сильнее, чем кажется. На OmniaKey каждая модель Anthropic стоит 30% от официальной цены — одна и та же скидка 70% на весь каталог:
| За 1M токенов | Ввод | Вывод | Попадание в кэш |
|---|---|---|---|
| Anthropic официально | $10 | $50 | $1 |
| OmniaKey | $3 | $15 | $0.30 |
Это оплата за токены без месячной подписки — пополнили, потратили, а дашборд показывает, сколько стоил каждый вызов. Prompt caching пробрасывается без изменений, так что повторяющийся контекст длинных агентских сессий оплачивается по кэш-тарифу $0.30.
Fable 5 или Opus 4.8?
При двойной цене Fable 5 — не новый дефолт, а новый потолок.
- Оставайтесь на Opus 4.8 для повседневного кодинга. Он по-прежнему отлично справляется с длинными агентскими задачами, и в большинстве сессий разницы вы не почувствуете.
- Берите Fable 5, когда вы действительно застряли — сложнейшие рефакторинги, глубокие многошаговые рассуждения, работа, где провальный прогон стоит дороже токенов.
Обе модели живут на одном эндпоинте и одном ключе, так что практичный паттерн простой: по умолчанию Opus 4.8, на задачах, которые этого заслуживают, переключаетесь на /model claude-fable-5, потом обратно.
Попробовать в Claude Code
Если Claude Code уже указывает на OmniaKey, достаточно переключить модель внутри сессии:
/model claude-fable-5
С нуля — две переменные окружения:
export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude
Только голый хост — без суффикса /v1. Claude Code сам добавляет /v1/messages. Полная инструкция, включая создание ключа, — в гайде по настройке Claude Code.
Cursor, Cline и aider работают с Fable 5 через OpenAI-совместимый эндпоинт OmniaKey — тот же id claude-fable-5, никакой протокольной гимнастики:
Какой бы интерфейс вы ни выбрали, какой id модели вы запросили — та модель и обрабатывает запрос. OmniaKey никогда втихую не подменит вызов Fable 5 чем-то подешевле.
Миграция со старых моделей Claude: три ошибки 400, о которых надо знать
Fable 5 сохраняет формат запросов Opus 4.8. Но при переходе с более старых моделей Claude три конструкции запроса, которые раньше работали, теперь возвращают 400 — через любой шлюз, включая OmniaKey, потому что это ограничения на уровне самой модели:
- Параметров сэмплирования больше нет.
temperature,top_pиtop_kвозвращают 400. Удалите их; управляйте поведением через промпт. - Фиксированного thinking-бюджета больше нет.
thinking: {"type": "enabled", "budget_tokens": N}возвращает 400. Используйтеthinking: {"type": "adaptive"}— модель сама решит, сколько думать. - Thinking нельзя явно выключить. Особенность именно Fable 5:
thinking: {"type": "disabled"}возвращает 400 (Opus 4.8 это ещё принимает). Чтобы работать без thinking, просто опустите полеthinkingцеликом.
Префилл последнего сообщения ассистента (assistant prefill) тоже не поддерживается — как и на всех моделях начиная с семейства 4.6; используйте структурированный вывод. Few-shot сообщения ассистента в середине диалога — без проблем.