A Anthropic lançou o Claude Fable 5 — um novo nível acima do Opus e o modelo Claude mais capaz até hoje. O ID do modelo é claude-fable-5, e ele já está disponível na OmniaKey com 70% de desconto sobre a tarifa oficial, com a mesma chave e o mesmo saldo de todos os outros modelos.

O que há de novo no Fable 5

O Fable 5 não é uma atualização pontual do Opus. É um novo nível superior com preço próprio, acima do Opus 4.8 da mesma forma que o Opus fica acima do Sonnet:

	Claude Fable 5	Claude Opus 4.8
ID do modelo	`claude-fable-5`	`claude-opus-4-8`
Janela de contexto	1M de tokens	1M de tokens
Saída máxima	128K tokens	128K tokens
Thinking	Apenas adaptive — não dá para desativar explicitamente; omita o campo para rodar sem thinking	Adaptive, opcional — aceita `disabled` explícito
Preço oficial (por 1M de tokens, entrada / saída)	$10 / $50	$5 / $25

A interface de requisição é a mesma do Opus 4.8 e 4.7: o adaptive thinking substitui os orçamentos fixos de raciocínio, e os parâmetros clássicos de amostragem foram removidos por completo (detalhes abaixo). Se o seu código já roda no Opus 4.8, a troca é mudar uma string — com uma exceção: um thinking: {"type": "disabled"} explícito é rejeitado no Fable 5 (detalhes nas notas de migração abaixo).

Para os números de benchmark, a fonte primária é o system card do Fable 5 da Anthropic. Este post fica no que muda na prática: especificações, preço e como rodar.

Preço da API: oficial vs OmniaKey

O Fable 5 estreia pelo dobro da tarifa do Opus — $10 de entrada / $50 de saída por milhão de tokens. Sessões pesadas de agente queimam tokens de saída rápido, então a tarifa pesa mais do que parece. Na OmniaKey, todo modelo Anthropic é cobrado a 30% do preço oficial — o mesmo desconto de 70% em todo o catálogo:

Por 1M de tokens	Entrada	Saída	Cache hit
Anthropic oficial	$10	$50	$1
OmniaKey	$3	$15	$0.30

Cobrança por token, sem plano mensal — você recarrega, gasta, e o dashboard mostra exatamente quanto custou cada chamada. O prompt caching é repassado integralmente, então sessões longas de agente pagam a tarifa de cache de $0.30 no contexto repetido.

Fable 5 ou Opus 4.8?

Pelo dobro do preço, o Fable 5 não é o novo padrão — é o novo teto.

Fique no Opus 4.8 para a programação do dia a dia. Ele continua excelente em trabalho agêntico de longo horizonte, e na maioria das sessões você não vai sentir diferença.
Vá de Fable 5 quando você realmente travar — os refactors mais difíceis, raciocínio profundo em várias etapas, trabalho em que uma execução malsucedida custa mais do que os tokens.

Como os dois rodam no mesmo endpoint e na mesma chave, na prática: Opus 4.8 como padrão, suba para /model claude-fable-5 nas tarefas que merecem e volte depois.

Teste no Claude Code

Se o Claude Code já aponta para a OmniaKey, basta trocar de modelo dentro da sessão:

text

/model claude-fable-5

Começando do zero, são duas variáveis de ambiente:

bash

export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude

Use só o host — sem o sufixo /v1. O Claude Code acrescenta /v1/messages sozinho. O passo a passo completo, incluindo a criação da chave, está no guia de setup do Claude Code.

Cursor, Cline e aider usam o Fable 5 pelo endpoint da OmniaKey compatível com a OpenAI — mesmo ID claude-fable-5, sem malabarismos de protocolo:

OpenAI-compatible

https://api.omniakey.com/v1

Anthropic-native

https://api.omniakey.com

Gemini-native

https://api.omniakey.com/v1beta

Seja qual for a interface, o ID de modelo que você pede é o modelo que executa. A OmniaKey nunca troca silenciosamente uma chamada do Fable 5 por algo mais barato.

Migrando de modelos Claude antigos: três erros 400 que você precisa conhecer

O Fable 5 mantém a interface de requisição do Opus 4.8. Vindo de modelos Claude mais antigos, porém, três formatos de requisição que funcionavam antes agora retornam 400 — em qualquer gateway, inclusive na OmniaKey, porque são regras do próprio modelo:

Os parâmetros de amostragem acabaram. temperature, top_p e top_k retornam 400. Remova-os; direcione o comportamento pelo prompt.
Os orçamentos fixos de raciocínio acabaram. thinking: {"type": "enabled", "budget_tokens": N} retorna 400. Use thinking: {"type": "adaptive"} e deixe o modelo decidir quanto pensar.
Não dá para desativar o thinking explicitamente. Particularidade do Fable 5: thinking: {"type": "disabled"} retorna 400 (o Opus 4.8 ainda aceita). Para rodar sem thinking, omita o campo thinking por completo.

O prefill do último turno do assistant também continua sem suporte, como em todo modelo desde a família 4.6 — use saídas estruturadas no lugar. Mensagens few-shot do assistant no meio da conversa continuam valendo.

Obter uma chave de API OmniaKey Ver preços dos modelos