使用量核算 - ARouter

ARouter 的每个 API 响应都包含详细的使用信息，让您无需额外 API 调用即可实时跟踪成本和 Token 消耗。

响应中的使用量

usage 对象在每个非流式响应（以及流式响应的最后一个数据块）中返回：

{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token 字段说明

字段	说明
`prompt_tokens`	输入 Token 总数（包含缓存 Token）
`completion_tokens`	输出 Token 总数（包含推理 Token）
`total_tokens`	提示词 Token + 补全 Token 之和
`prompt_tokens_details.cached_tokens`	从服务商提示词缓存中获取的 Token
`completion_tokens_details.reasoning_tokens`	用于内部推理的 Token（思考模型）
`completion_tokens_details.accepted_prediction_tokens`	推测解码接受的 Token
`completion_tokens_details.rejected_prediction_tokens`	推测解码拒绝的 Token

成本追踪

ARouter 根据上游服务商报告的实际 Token 数量计费，价格按成本透传，不附加推理加价。计算精确成本的公式：

成本 = (prompt_tokens × 每 Token 输入价格) + (completion_tokens × 每 Token 输出价格)

缓存 Token 通常以较低的费率计费（通常为标准输入价格的 50%）。详情参阅提示词缓存。

流式响应中的使用量

在流式模式下，最后一个 SSE 数据块包含完整的使用量对象，choices 为空：

{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}

在请求中传入 stream_options: { include_usage: true } 来启用流式使用量统计。

控制台报告

所有使用量数据均可在活动页面查看，支持按以下条件筛选：

时间段（1 小时 → 1 年）
分组方式（模型、API Key、创建者）

可导出为 CSV 或 PDF 用于核算和预算规划。参阅活动导出。

API 访问

以编程方式获取交易历史和余额：

# 获取当前余额
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 列出最近的交易记录
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"

​响应中的使用量

​Token 字段说明

​成本追踪

​流式响应中的使用量

​控制台报告

​API 访问