使用量核算 - ARouter

ARouter 的每個 API 回應都包含詳細的使用資訊，讓您無需額外 API 呼叫即可即時追蹤成本和 Token 消耗。

回應中的使用量

usage 物件在每個非串流回應（以及串流回應的最後一個資料區塊）中回傳：

{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token 欄位說明

欄位	說明
`prompt_tokens`	輸入 Token 總數（包含快取 Token）
`completion_tokens`	輸出 Token 總數（包含推理 Token）
`total_tokens`	提示詞 Token + 補全 Token 之和
`prompt_tokens_details.cached_tokens`	從服務商提示詞快取中取得的 Token
`completion_tokens_details.reasoning_tokens`	用於內部推理的 Token（思考模型）
`completion_tokens_details.accepted_prediction_tokens`	推測解碼接受的 Token
`completion_tokens_details.rejected_prediction_tokens`	推測解碼拒絕的 Token

成本追蹤

ARouter 根據上游服務商回報的實際 Token 數量計費，價格按成本直通，不附加推理加價。計算精確成本的公式：

成本 = (prompt_tokens × 每 Token 輸入價格) + (completion_tokens × 每 Token 輸出價格)

快取 Token 通常以較低費率計費（通常為標準輸入價格的 50%）。詳情請參閱提示詞快取。

串流回應中的使用量

在串流模式下，最後一個 SSE 資料區塊包含完整的使用量物件，choices 為空：

{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}

在請求中傳入 stream_options: { include_usage: true } 以啟用串流使用量統計。

控制台報告

所有使用量資料均可在活動頁面查看，支援依以下條件篩選：

時間段（1 小時 → 1 年）
分組方式（模型、API Key、建立者）

可匯出為 CSV 或 PDF 用於核算和預算規劃。參閱活動匯出。

API 存取

以程式化方式取得交易歷史和餘額：

# 取得目前餘額
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 列出最近的交易記錄
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"

​回應中的使用量

​Token 欄位說明

​成本追蹤

​串流回應中的使用量

​控制台報告

​API 存取