博客
Cost control
为什么你的 AI 网关账单算不清——以及怎么治
倍率、分组、共享号池,让多数网关账单根本对不上。该看哪些信号,以及为什么“能逐条查的按 token 计费”才是真正的解法。
5 分钟阅读OmniaKey
billingtransparencyAPI gatewaycost
便宜的 AI 网关很好找。账单能对得上的网关不好找——而大多数意外成本,就藏在这两者的差距里。
算不清,是怎么来的
多数计费不透明的网关,靠的是同一批套路:
- 倍率和分组。 标出来的是个基础价,再乘一个模型倍率,再乘一个分组倍率。叠上两三个系数,一次调用的真实成本,你只能事后才知道。
- 偷偷降级模型。 你点的是 Claude Opus,高峰期被悄悄路由到一个更便宜的“平替”。账单看着没问题——可输出变笨了,你还查不出为什么。
- 共享号池。 便宜档常常跑在共享的上游账号上:高峰前都挺快,一撞限流或风控,你的 agent 就卡在半道上。
- 没有明细。 只有一个余额数字在往下掉。调了哪个模型、in / out token 各多少、有没有命中缓存、失败的调用扣没扣费——一样都看不见。
判断很简单,就是道算术题:一个网关要是“比官方低一半”还“满血不限量”,账平不了。中转拿的是上游的真实价,再叠一层服务,不可能从结构上比源头便宜一大截。个位数到三成左右的价差是正常的;“低一半还不限量”,通常是号池、降级,或者某个系数在帮它藏成本。便宜不是问题,便宜得算不清才是。
托付一个网关之前,先查这三条
- 账单能不能拉出明细? 每次调用:哪个模型、in / out token、缓存命中、失败扣不扣费。只有一个余额数字的,长期用很痛苦。
- 模型真不真、稳不稳? 别拿“写个登录页”测。拿一个真实 repo 去跑——读代码、改文件、跑测试、修报错——再在高峰期跑一遍,盯着有没有降级。
- 是不是有人当产品在认真做? 有独立 API 域名、文档、dashboard、真人客服——而不是把 key 贴在群里。
OmniaKey 怎么计费
OmniaKey 就是围着这里最要紧的那条轴打造的——透明:
- 不玩倍率、不分组。 标多少是多少,你不用拿计算器去反推。
- 按 token、预付。 用多少付多少,从预付余额里扣,没有月度套餐。
- 每次调用都有明细。 模型、in / out token、缓存、延迟、费用——dashboard 里逐条可查。
- 你点的模型就是实际跑的。 不偷换,不拿量化版顶替。
OpenAI-compatible
https://api.omniakey.com/v1
Anthropic-native
https://api.omniakey.com
Gemini-native
https://api.omniakey.com/v1beta
一把 key 就够到 Claude、GPT、Gemini,全走同一块透明的表。编程 agent 指南 讲了怎么接你的工具。