使用量会計 - ARouter

ARouter からのすべての API レスポンスには詳細な使用量情報が含まれています。これにより、追加の API 呼び出しなしにコストと Token 消費をリアルタイムで追跡できます。

レスポンスの使用量

usage オブジェクトはすべての非ストリーミングレスポンス（およびストリーミングレスポンスの最後のチャンク）で返されます：

{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token フィールド

フィールド	説明
`prompt_tokens`	入力 Token の合計（キャッシュされた Token を含む）
`completion_tokens`	出力 Token の合計（推論 Token を含む）
`total_tokens`	プロンプト Token + 補完 Token の合計
`prompt_tokens_details.cached_tokens`	プロバイダーのプロンプトキャッシュから提供された Token
`completion_tokens_details.reasoning_tokens`	内部推論に使用された Token（思考モデル）
`completion_tokens_details.accepted_prediction_tokens`	投機的デコードで受け入れられた Token
`completion_tokens_details.rejected_prediction_tokens`	投機的デコードで拒否された Token

コスト追跡

ARouter は上流プロバイダーが報告する実際の Token 数に基づいて請求します。価格はコストスルーです — 推論マークアップなし。正確なコストを計算するには：

コスト = (prompt_tokens × Token あたりの入力価格) + (completion_tokens × Token あたりの出力価格)

キャッシュされた Token は通常、低い料率で請求されます（多くの場合、標準入力価格の 50%）。詳細はプロンプトキャッシングを参照してください。

ストリーミング使用量

ストリーミングモードでは、最後の SSE チャンクに空の choices を持つ完全な使用量オブジェクトが含まれます：

{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}

リクエストに stream_options: { include_usage: true } を渡してストリーミング使用量を有効にします。

ダッシュボードレポート

すべての使用量データはアクティビティページで以下のフィルタリングと共に確認できます：

時間帯（1 時間 → 1 年）
グループ化（モデル、API Key、作成者）

会計と予算計画のために CSV または PDF としてエクスポートします。アクティビティエクスポートを参照してください。

API アクセス

トランザクション履歴と残高をプログラムで取得します：

# 現在の残高を取得
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 最近のトランザクションを一覧表示
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"

組織管理アクティビティエクスポート

​レスポンスの使用量

​Token フィールド

​コスト追跡

​ストリーミング使用量

​ダッシュボードレポート

​API アクセス