Anthropic ha lanzado Claude Fable 5 — un nuevo nivel por encima de Opus y el modelo Claude más potente hasta la fecha. El ID del modelo es claude-fable-5, y ya está disponible en OmniaKey con un 70% de descuento sobre la tarifa oficial, con la misma clave y el mismo saldo que el resto de modelos.

Qué hay de nuevo en Fable 5

Fable 5 no es una revisión menor de Opus. Es un nuevo nivel superior con precio propio, situado por encima de Opus 4.8 igual que Opus se sitúa por encima de Sonnet:

	Claude Fable 5	Claude Opus 4.8
ID del modelo	`claude-fable-5`	`claude-opus-4-8`
Ventana de contexto	1M de tokens	1M de tokens
Salida máxima	128K tokens	128K tokens
Thinking	Solo adaptive — no se puede desactivar explícitamente; omite el campo para trabajar sin thinking	Adaptive, opcional — acepta `disabled` explícito
Precio oficial (por 1M de tokens, entrada / salida)	$10 / $50	$5 / $25

El formato de las peticiones es el mismo que en Opus 4.8 y 4.7: el adaptive thinking sustituye a los presupuestos fijos de razonamiento, y los parámetros clásicos de muestreo se han eliminado por completo (más detalles abajo). Si tu código ya usa Opus 4.8, migrar se reduce a cambiar una sola cadena: el ID del modelo — con una excepción: un thinking: {"type": "disabled"} explícito se rechaza en Fable 5 (detalles en las notas de migración de abajo).

Para los números de benchmarks, la fuente primaria es el system card de Fable 5 de Anthropic. Este post se centra en lo que cambia en la práctica: especificaciones, precio y cómo usarlo.

Precio de la API: oficial vs OmniaKey

Fable 5 sale al doble de la tarifa de Opus — $10 de entrada / $50 de salida por millón de tokens. Las sesiones intensas de agente queman tokens de salida rápido, así que la tarifa importa más de lo que parece. En OmniaKey, cada modelo de Anthropic se factura al 30% del precio oficial — el mismo 70% de descuento en todo el catálogo:

Por 1M de tokens	Entrada	Salida	Cache hit
Anthropic oficial	$10	$50	$1
OmniaKey	$3	$15	$0.30

Es facturación por token sin plan mensual — recargas, gastas, y el dashboard muestra exactamente cuánto costó cada llamada. El descuento se aplica también al prompt caching, así que las sesiones largas de agente pagan la tarifa de caché de $0.30 por el contexto repetido.

¿Fable 5 u Opus 4.8?

Al doble de precio, Fable 5 no es el nuevo modelo por defecto — es el nuevo techo.

Quédate en Opus 4.8 para el código del día a día. Sigue siendo excelente en tareas agénticas largas y autónomas, y en la mayoría de las sesiones no notarás la diferencia.
Recurre a Fable 5 cuando estés realmente atascado — los refactors más difíciles, razonamiento profundo de varios pasos, trabajo donde una ejecución fallida cuesta más que los tokens.

Como ambos corren en el mismo endpoint y con la misma clave, en la práctica: Opus 4.8 por defecto, sube a /model claude-fable-5 en las tareas que lo merezcan y vuelve después.

Pruébalo en Claude Code

Si Claude Code ya apunta a OmniaKey, solo necesitas cambiar de modelo dentro de la sesión:

text

/model claude-fable-5

Desde cero, son dos variables de entorno:

bash

export ANTHROPIC_BASE_URL="https://api.omniakey.com"
export ANTHROPIC_AUTH_TOKEN="your-omniakey-api-key"
claude

Usa el host a secas — sin el sufijo /v1. Claude Code añade /v1/messages por su cuenta. El tutorial completo, incluida la creación de la clave, está en la guía de configuración de Claude Code.

Cursor, Cline y aider usan Fable 5 a través del endpoint de OmniaKey compatible con OpenAI — el mismo ID claude-fable-5, sin malabarismos de protocolo:

OpenAI-compatible

https://api.omniakey.com/v1

Anthropic-native

https://api.omniakey.com

Gemini-native

https://api.omniakey.com/v1beta

Sea cual sea la interfaz, el ID de modelo que pides es el modelo que se ejecuta. OmniaKey nunca sustituye en silencio una llamada a Fable 5 por algo más barato.

Migrar desde modelos Claude anteriores: tres errores 400 que conviene conocer

Fable 5 mantiene el formato de peticiones de Opus 4.8. Pero viniendo de modelos Claude más antiguos, tres tipos de petición que antes funcionaban ahora devuelven 400 — en cualquier gateway, incluida OmniaKey, porque son reglas a nivel de modelo:

Los parámetros de muestreo desaparecen. temperature, top_p y top_k devuelven 400. Elimínalos; dirige el comportamiento con el prompt.
Los presupuestos fijos de razonamiento desaparecen. thinking: {"type": "enabled", "budget_tokens": N} devuelve 400. Usa thinking: {"type": "adaptive"} y deja que el modelo decida cuánto pensar.
No se puede desactivar el thinking explícitamente. Particularidad de Fable 5: thinking: {"type": "disabled"} devuelve 400 (Opus 4.8 todavía lo acepta). Para trabajar sin thinking, omite el campo thinking por completo.

El prefill del último turno del assistant tampoco está soportado, como en todos los modelos desde la familia 4.6 — usa salidas estructuradas en su lugar. Los mensajes few-shot del assistant en mitad de la conversación siguen siendo válidos.

Obtener una clave de API de OmniaKey Ver precios de modelos