Hermes Agent + OmniaKey:一个 OpenAI 兼容的自定义端点
用一个自定义端点把 Nous Research 的 Hermes Agent 指向 OmniaKey——`hermes model` 交互式或几行 config.yaml,Claude、GPT、Gemini 共用一把 key。
Hermes Agent(来自 Nous Research)自带几个内置 provider,但它的设计就是能对接任何 OpenAI 兼容端点。所以 OmniaKey 接起来很省事:一个自定义端点,同一把 key 就能用上 Claude、GPT、Gemini——换模型只要换 model id,不用重新配置。
最快的路子:hermes model
最省事的方式是用交互式选择器:
hermes model
选 Custom endpoint (self-hosted / VLLM / etc.),然后填:
- Base URL:
https://api.omniakey.com/v1 - API key: 你的 OmniaKey key
- Model: 比如
claude-opus-4-8
base URL 写到 /v1 为止。Hermes 会自己补上 /chat/completions,所以如果 URL 已经带了完整路径、或者末尾多了斜杠,就是这里报 404 的常见原因。
或者手写:config.yaml
想直接改文件,或者要做持久、多模型的设置?把同样的东西写进 ~/.hermes/config.yaml:
model:
provider: custom
base_url: https://api.omniakey.com/v1
api_key: your-omniakey-api-key
default: claude-opus-4-8
models:
- claude-opus-4-8
- gpt-5.5
- gemini-3.1-pro-preview
provider: custom 的作用,就是让 Hermes 拿上面那把 key 直接调你的端点,而不是走它某个内置 provider。models: 列表会填充 /model 选择器——改完重启一次 Hermes,你就能在会话进行中随时切换 claude-opus-4-8、gpt-5.5、gemini-3.1-pro-preview。
一把 key,三家模型
因为 OmniaKey 在 OpenAI 兼容接口上按 model id 路由,一个自定义端点就覆盖三家模型——不用第二个 provider 块,不用在多个 base URL 之间倒腾。计费是按 token 从一份预付余额里扣,没有月费。而且你设的 model id 就是实际运行的:不会偷偷 fallback 到一个更便宜的“等价模型”——那种替身跑到一半,对你代码库的推理会跟之前不一样。
编程 agent 指南 覆盖了其他工具。