Tempo limitado · os mesmos modelos — GPT 95% off, Claude 70% off
Blog
Guide

Hermes Agent + OmniaKey: um endpoint customizado compatível com OpenAI

Aponte o Hermes Agent da Nous Research para a OmniaKey com um endpoint customizado — `hermes model` ou algumas linhas de config.yaml, e Claude, GPT e Gemini respondem todos à mesma chave.

4 min de leituraOmniaKey
HermesNous Researchcoding agentsetup

O Hermes Agent (da Nous Research) vem com provedores embutidos, mas foi projetado para falar com qualquer endpoint compatível com OpenAI. Por isso a OmniaKey se encaixa perfeitamente: um endpoint customizado, e a mesma chave dá acesso a Claude, GPT e Gemini — você troca de modelo pelo id, sem reconfigurar nada.

O caminho rápido: hermes model

A configuração mais rápida é o seletor interativo:

bash
hermes model

Escolha Custom endpoint (self-hosted / VLLM / etc.), depois informe:

  • Base URL: https://api.omniakey.com/v1
  • Chave de API: sua chave OmniaKey
  • Modelo: por exemplo, claude-opus-4-8

Termine a base URL em /v1. O Hermes anexa /chat/completions sozinho, então uma URL que já inclui o caminho completo — ou uma barra no final — costuma ser a causa de um 404.

Ou na mão: config.yaml

Prefere editar direto, ou quer uma configuração persistente e multi-modelo? Coloque a mesma coisa em ~/.hermes/config.yaml:

yaml
model:
  provider: custom
  base_url: https://api.omniakey.com/v1
  api_key: your-omniakey-api-key
  default: claude-opus-4-8
models:
  - claude-opus-4-8
  - gpt-5.5
  - gemini-3.1-pro-preview

provider: custom é o que diz ao Hermes para chamar seu endpoint diretamente com a chave acima, em vez de um dos provedores embutidos. A lista models: é o que aparece no seletor /model — reinicie o Hermes uma vez depois de editar, e você pode alternar entre claude-opus-4-8, gpt-5.5 e gemini-3.1-pro-preview sem sair da sessão.

Uma chave, três famílias

Como a OmniaKey roteia por id de modelo na superfície compatível com OpenAI, um único endpoint customizado cobre as três famílias — sem um segundo bloco de provedor, sem fazer malabarismo com base URLs. A cobrança é por token a partir de um saldo pré-pago, sem plano mensal. E o id de modelo que você define é o que roda: nenhum fallback silencioso para um "equivalente" mais barato que, no meio da tarefa, raciocinaria sobre a sua base de código de outro jeito.

OpenAI-compatible
https://api.omniakey.com/v1
Anthropic-native
https://api.omniakey.com
Gemini-native
https://api.omniakey.com/v1beta

O guia de agentes de código cobre as outras ferramentas.