跳转到主要内容
ARouter 的每个 API 响应都包含详细的使用信息,让您无需额外 API 调用即可实时跟踪成本和 Token 消耗。

响应中的使用量

usage 对象在每个非流式响应(以及流式响应的最后一个数据块)中返回:
{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token 字段说明

字段说明
prompt_tokens输入 Token 总数(包含缓存 Token)
completion_tokens输出 Token 总数(包含推理 Token)
total_tokens提示词 Token + 补全 Token 之和
prompt_tokens_details.cached_tokens从服务商提示词缓存中获取的 Token
completion_tokens_details.reasoning_tokens用于内部推理的 Token(思考模型)
completion_tokens_details.accepted_prediction_tokens推测解码接受的 Token
completion_tokens_details.rejected_prediction_tokens推测解码拒绝的 Token

成本追踪

ARouter 根据上游服务商报告的实际 Token 数量计费,价格按成本透传,不附加推理加价。计算精确成本的公式:
成本 = (prompt_tokens × 每 Token 输入价格) + (completion_tokens × 每 Token 输出价格)
缓存 Token 通常以较低的费率计费(通常为标准输入价格的 50%)。详情参阅提示词缓存

流式响应中的使用量

在流式模式下,最后一个 SSE 数据块包含完整的使用量对象,choices 为空:
{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}
在请求中传入 stream_options: { include_usage: true } 来启用流式使用量统计。

控制台报告

所有使用量数据均可在活动页面查看,支持按以下条件筛选:
  • 时间段(1 小时 → 1 年)
  • 分组方式(模型、API Key、创建者)
可导出为 CSV 或 PDF 用于核算和预算规划。参阅活动导出

API 访问

以编程方式获取交易历史和余额:
# 获取当前余额
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 列出最近的交易记录
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"