Matrix 模型路由:一把 Key 走遍多家模型
设计目标
让任意 OpenAI 兼容的客户端(Cursor / Cherry Studio / 自建应用 / SDK)只需要配置 一次 base URL 和 Key,就能跨厂商调用:
gpt-4o-miniclaude-haiku-4-5deepseek-chatgemini-2.0-flashqwen-max- 等等
工作机制
- 客户端把请求发到 Matrix 网关
- 网关识别
model字段,路由到对应厂商的真实接口 - 实时统计 Tokens,按 该厂商的输入 / 输出价格 × 你账户的 group ratio 计费
- 计费成功后返回真实响应
价格公式
实际扣费 = 厂商单价 × Tokens × 你账户的 group ratio
group ratio 默认是 1.0;后续会针对特定企业用户或活动开放更优惠的 ratio。
一些常见问题
Q: 我能用 stream 接口吗?
A: 支持。和 OpenAI 协议完全一致,stream: true 即可。
Q: 工具调用 / function calling 支持吗? A: 支持,只要后端厂商支持。如 GPT-4 系列、Claude 系列、DeepSeek。
Q: 多模态(图像 / 音频)支持吗? A: 视模型而定。在 模型列表 里能看到每个模型支持的 endpoint。