Hermes Agent + OmniaKey: um endpoint customizado compatível com OpenAI
Aponte o Hermes Agent da Nous Research para a OmniaKey com um endpoint customizado — `hermes model` ou algumas linhas de config.yaml, e Claude, GPT e Gemini respondem todos à mesma chave.
O Hermes Agent (da Nous Research) vem com provedores embutidos, mas foi projetado para falar com qualquer endpoint compatível com OpenAI. Por isso a OmniaKey se encaixa perfeitamente: um endpoint customizado, e a mesma chave dá acesso a Claude, GPT e Gemini — você troca de modelo pelo id, sem reconfigurar nada.
O caminho rápido: hermes model
A configuração mais rápida é o seletor interativo:
hermes model
Escolha Custom endpoint (self-hosted / VLLM / etc.), depois informe:
- Base URL:
https://api.omniakey.com/v1 - Chave de API: sua chave OmniaKey
- Modelo: por exemplo,
claude-opus-4-8
Termine a base URL em /v1. O Hermes anexa /chat/completions sozinho, então uma URL que já inclui o caminho completo — ou uma barra no final — costuma ser a causa de um 404.
Ou na mão: config.yaml
Prefere editar direto, ou quer uma configuração persistente e multi-modelo? Coloque a mesma coisa em ~/.hermes/config.yaml:
model:
provider: custom
base_url: https://api.omniakey.com/v1
api_key: your-omniakey-api-key
default: claude-opus-4-8
models:
- claude-opus-4-8
- gpt-5.5
- gemini-3.1-pro-preview
provider: custom é o que diz ao Hermes para chamar seu endpoint diretamente com a chave acima, em vez de um dos provedores embutidos. A lista models: é o que aparece no seletor /model — reinicie o Hermes uma vez depois de editar, e você pode alternar entre claude-opus-4-8, gpt-5.5 e gemini-3.1-pro-preview sem sair da sessão.
Uma chave, três famílias
Como a OmniaKey roteia por id de modelo na superfície compatível com OpenAI, um único endpoint customizado cobre as três famílias — sem um segundo bloco de provedor, sem fazer malabarismo com base URLs. A cobrança é por token a partir de um saldo pré-pago, sem plano mensal. E o id de modelo que você define é o que roda: nenhum fallback silencioso para um "equivalente" mais barato que, no meio da tarefa, raciocinaria sobre a sua base de código de outro jeito.
O guia de agentes de código cobre as outras ferramentas.