Claude Fable 5: o que mudou
O novo modelo top da Anthropic — especificações, preço de API a 30% da tabela oficial, Fable 5 vs Opus 4.8 e setup do Claude Code com duas variáveis de ambiente.
A Anthropic lançou o Claude Fable 5 — um novo nível acima do Opus e o modelo Claude mais capaz até hoje. O ID do modelo é claude-fable-5, e ele já está disponível na OmniaKey com 70% de desconto sobre a tarifa oficial, com a mesma chave e o mesmo saldo de todos os outros modelos.
O que há de novo no Fable 5
O Fable 5 não é uma atualização pontual do Opus. É um novo nível superior com preço próprio, acima do Opus 4.8 da mesma forma que o Opus fica acima do Sonnet:
| Claude Fable 5 | Claude Opus 4.8 | |
|---|---|---|
| ID do modelo | claude-fable-5 | claude-opus-4-8 |
| Janela de contexto | 1M de tokens | 1M de tokens |
| Saída máxima | 128K tokens | 128K tokens |
| Thinking | Apenas adaptive — não dá para desativar explicitamente; omita o campo para rodar sem thinking | Adaptive, opcional — aceita disabled explícito |
| Preço oficial (por 1M de tokens, entrada / saída) | $10 / $50 | $5 / $25 |
A interface de requisição é a mesma do Opus 4.8 e 4.7: o adaptive thinking substitui os orçamentos fixos de raciocínio, e os parâmetros clássicos de amostragem foram removidos por completo (detalhes abaixo). Se o seu código já roda no Opus 4.8, a troca é mudar uma string — com uma exceção: um thinking: {"type": "disabled"} explícito é rejeitado no Fable 5 (detalhes nas notas de migração abaixo).
Para os números de benchmark, a fonte primária é o system card do Fable 5 da Anthropic. Este post fica no que muda na prática: especificações, preço e como rodar.
Preço da API: oficial vs OmniaKey
O Fable 5 estreia pelo dobro da tarifa do Opus — $10 de entrada / $50 de saída por milhão de tokens. Sessões pesadas de agente queimam tokens de saída rápido, então a tarifa pesa mais do que parece. Na OmniaKey, todo modelo Anthropic é cobrado a 30% do preço oficial — o mesmo desconto de 70% em todo o catálogo:
| Por 1M de tokens | Entrada | Saída | Cache hit |
|---|---|---|---|
| Anthropic oficial | $10 | $50 | $1 |
| OmniaKey | $3 | $15 | $0.30 |
Cobrança por token, sem plano mensal — você recarrega, gasta, e o dashboard mostra exatamente quanto custou cada chamada. O prompt caching é repassado integralmente, então sessões longas de agente pagam a tarifa de cache de $0.30 no contexto repetido.
Fable 5 ou Opus 4.8?
Pelo dobro do preço, o Fable 5 não é o novo padrão — é o novo teto.
- Fique no Opus 4.8 para a programação do dia a dia. Ele continua excelente em trabalho agêntico de longo horizonte, e na maioria das sessões você não vai sentir diferença.
- Vá de Fable 5 quando você realmente travar — os refactors mais difíceis, raciocínio profundo em várias etapas, trabalho em que uma execução malsucedida custa mais do que os tokens.
Como os dois rodam no mesmo endpoint e na mesma chave, na prática: Opus 4.8 como padrão, suba para /model claude-fable-5 nas tarefas que merecem e volte depois.
Teste no Claude Code
Se o Claude Code já aponta para a OmniaKey, basta trocar de modelo dentro da sessão:
/model claude-fable-5
Começando do zero, são duas variáveis de ambiente:
export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude
Use só o host — sem o sufixo /v1. O Claude Code acrescenta /v1/messages sozinho. O passo a passo completo, incluindo a criação da chave, está no guia de setup do Claude Code.
Cursor, Cline e aider usam o Fable 5 pelo endpoint da OmniaKey compatível com a OpenAI — mesmo ID claude-fable-5, sem malabarismos de protocolo:
Seja qual for a interface, o ID de modelo que você pede é o modelo que executa. A OmniaKey nunca troca silenciosamente uma chamada do Fable 5 por algo mais barato.
Migrando de modelos Claude antigos: três erros 400 que você precisa conhecer
O Fable 5 mantém a interface de requisição do Opus 4.8. Vindo de modelos Claude mais antigos, porém, três formatos de requisição que funcionavam antes agora retornam 400 — em qualquer gateway, inclusive na OmniaKey, porque são regras do próprio modelo:
- Os parâmetros de amostragem acabaram.
temperature,top_petop_kretornam 400. Remova-os; direcione o comportamento pelo prompt. - Os orçamentos fixos de raciocínio acabaram.
thinking: {"type": "enabled", "budget_tokens": N}retorna 400. Usethinking: {"type": "adaptive"}e deixe o modelo decidir quanto pensar. - Não dá para desativar o thinking explicitamente. Particularidade do Fable 5:
thinking: {"type": "disabled"}retorna 400 (o Opus 4.8 ainda aceita). Para rodar sem thinking, omita o campothinkingpor completo.
O prefill do último turno do assistant também continua sem suporte, como em todo modelo desde a família 4.6 — use saídas estruturadas no lugar. Mensagens few-shot do assistant no meio da conversa continuam valendo.