Tiempo limitado · los mismos modelos — GPT 95% off, Claude 70% off
Blog
Guide

Hermes Agent + OmniaKey: un endpoint personalizado compatible con OpenAI

Apunta el Hermes Agent de Nous Research a OmniaKey con un endpoint personalizado — `hermes model` o unas líneas de config.yaml, y Claude, GPT y Gemini responden todos a una clave.

4 min de lecturaOmniaKey
HermesNous Researchcoding agentsetup

Hermes Agent (de Nous Research) viene con proveedores integrados, pero está diseñado para hablar con cualquier endpoint compatible con OpenAI. Por eso OmniaKey encaja sin fricciones: un endpoint personalizado, y la misma clave alcanza Claude, GPT y Gemini — cambias de modelo por id, no reconfigurando todo.

La vía rápida: hermes model

La configuración más rápida es el selector interactivo:

bash
hermes model

Elige Custom endpoint (self-hosted / VLLM / etc.), luego introduce:

  • Base URL: https://api.omniakey.com/v1
  • Clave de API: tu clave de OmniaKey
  • Modelo: por ejemplo, claude-opus-4-8

Termina la base URL en /v1. Hermes añade /chat/completions por su cuenta, así que una URL que ya incluye la ruta completa — o una barra final — es la causa habitual de un 404.

O a mano: config.yaml

¿Prefieres editarlo directamente, o quieres una configuración persistente y multimodelo? Pon lo mismo en ~/.hermes/config.yaml:

yaml
model:
  provider: custom
  base_url: https://api.omniakey.com/v1
  api_key: your-omniakey-api-key
  default: claude-opus-4-8
models:
  - claude-opus-4-8
  - gpt-5.5
  - gemini-3.1-pro-preview

provider: custom es lo que le dice a Hermes que llame a tu endpoint directamente con la clave de arriba, en vez de a uno de sus proveedores integrados. La lista models: es lo que aparece en el selector /model — reinicia Hermes una vez tras editar, y puedes alternar entre claude-opus-4-8, gpt-5.5 y gemini-3.1-pro-preview sin salir de la sesión.

Una clave, tres familias

Como OmniaKey enruta por id de modelo en la superficie compatible con OpenAI, un único endpoint personalizado cubre las tres familias — sin un segundo bloque de proveedor, sin hacer malabares con base URLs. La facturación es por token desde un saldo prepago, sin plan mensual. Y el id de modelo que fijas es el que se ejecuta: ningún fallback silencioso a un "equivalente" más barato que, a mitad de tarea, razonaría sobre tu base de código de otra forma.

OpenAI-compatible
https://api.omniakey.com/v1
Anthropic-native
https://api.omniakey.com
Gemini-native
https://api.omniakey.com/v1beta

La guía de agentes de programación cubre las demás herramientas.