メインコンテンツへスキップ
ARouter からのすべての API レスポンスには詳細な使用量情報が含まれています。これにより、追加の API 呼び出しなしにコストと Token 消費をリアルタイムで追跡できます。

レスポンスの使用量

usage オブジェクトはすべての非ストリーミングレスポンス(およびストリーミングレスポンスの最後のチャンク)で返されます:
{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token フィールド

フィールド説明
prompt_tokens入力 Token の合計(キャッシュされた Token を含む)
completion_tokens出力 Token の合計(推論 Token を含む)
total_tokensプロンプト Token + 補完 Token の合計
prompt_tokens_details.cached_tokensプロバイダーのプロンプトキャッシュから提供された Token
completion_tokens_details.reasoning_tokens内部推論に使用された Token(思考モデル)
completion_tokens_details.accepted_prediction_tokens投機的デコードで受け入れられた Token
completion_tokens_details.rejected_prediction_tokens投機的デコードで拒否された Token

コスト追跡

ARouter は上流プロバイダーが報告する実際の Token 数に基づいて請求します。価格はコストスルーです — 推論マークアップなし。正確なコストを計算するには:
コスト = (prompt_tokens × Token あたりの入力価格) + (completion_tokens × Token あたりの出力価格)
キャッシュされた Token は通常、低い料率で請求されます(多くの場合、標準入力価格の 50%)。詳細は プロンプトキャッシング を参照してください。

ストリーミング使用量

ストリーミングモードでは、最後の SSE チャンクに空の choices を持つ完全な使用量オブジェクトが含まれます:
{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}
リクエストに stream_options: { include_usage: true } を渡してストリーミング使用量を有効にします。

ダッシュボードレポート

すべての使用量データは アクティビティ ページで以下のフィルタリングと共に確認できます:
  • 時間帯(1 時間 → 1 年)
  • グループ化(モデル、API Key、作成者)
会計と予算計画のために CSV または PDF としてエクスポートします。アクティビティエクスポート を参照してください。

API アクセス

トランザクション履歴と残高をプログラムで取得します:
# 現在の残高を取得
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 最近のトランザクションを一覧表示
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"