Hermes Agent + OmniaKey: un endpoint personalizado compatible con OpenAI
Apunta el Hermes Agent de Nous Research a OmniaKey con un endpoint personalizado — `hermes model` o unas líneas de config.yaml, y Claude, GPT y Gemini responden todos a una clave.
Hermes Agent (de Nous Research) viene con proveedores integrados, pero está diseñado para hablar con cualquier endpoint compatible con OpenAI. Por eso OmniaKey encaja sin fricciones: un endpoint personalizado, y la misma clave alcanza Claude, GPT y Gemini — cambias de modelo por id, no reconfigurando todo.
La vía rápida: hermes model
La configuración más rápida es el selector interactivo:
hermes model
Elige Custom endpoint (self-hosted / VLLM / etc.), luego introduce:
- Base URL:
https://api.omniakey.com/v1 - Clave de API: tu clave de OmniaKey
- Modelo: por ejemplo,
claude-opus-4-8
Termina la base URL en /v1. Hermes añade /chat/completions por su cuenta, así que una URL que ya incluye la ruta completa — o una barra final — es la causa habitual de un 404.
O a mano: config.yaml
¿Prefieres editarlo directamente, o quieres una configuración persistente y multimodelo? Pon lo mismo en ~/.hermes/config.yaml:
model:
provider: custom
base_url: https://api.omniakey.com/v1
api_key: your-omniakey-api-key
default: claude-opus-4-8
models:
- claude-opus-4-8
- gpt-5.5
- gemini-3.1-pro-preview
provider: custom es lo que le dice a Hermes que llame a tu endpoint directamente con la clave de arriba, en vez de a uno de sus proveedores integrados. La lista models: es lo que aparece en el selector /model — reinicia Hermes una vez tras editar, y puedes alternar entre claude-opus-4-8, gpt-5.5 y gemini-3.1-pro-preview sin salir de la sesión.
Una clave, tres familias
Como OmniaKey enruta por id de modelo en la superficie compatible con OpenAI, un único endpoint personalizado cubre las tres familias — sin un segundo bloque de proveedor, sin hacer malabares con base URLs. La facturación es por token desde un saldo prepago, sin plan mensual. Y el id de modelo que fijas es el que se ejecuta: ningún fallback silencioso a un "equivalente" más barato que, a mitad de tarea, razonaría sobre tu base de código de otra forma.
La guía de agentes de programación cubre las demás herramientas.