메인 콘텐츠로 건너뛰기
ARouter의 모든 API 응답에는 상세한 사용량 정보가 포함되어 있습니다. 이를 통해 추가 API 호출 없이 실시간으로 비용과 Token 소비량을 추적할 수 있습니다.

응답의 사용량

usage 객체는 모든 비스트리밍 응답(및 스트리밍 응답의 마지막 청크)에서 반환됩니다:
{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token 필드

필드설명
prompt_tokens입력 Token 합계 (캐시된 Token 포함)
completion_tokens출력 Token 합계 (추론 Token 포함)
total_tokens프롬프트 + 완성 Token 합계
prompt_tokens_details.cached_tokens제공업체의 프롬프트 캐시에서 제공된 Token
completion_tokens_details.reasoning_tokens내부 추론에 사용된 Token (사고 모델)
completion_tokens_details.accepted_prediction_tokens투기적 디코딩에서 수락된 Token
completion_tokens_details.rejected_prediction_tokens투기적 디코딩에서 거부된 Token

비용 추적

ARouter는 업스트림 제공업체가 보고한 실제 Token 수를 기반으로 청구합니다. 가격은 비용 그대로 전달됩니다 — 추론 마크업 없음. 정확한 비용을 계산하려면:
비용 = (prompt_tokens × Token당 입력 가격) + (completion_tokens × Token당 출력 가격)
캐시된 Token은 일반적으로 낮은 요금으로 청구됩니다 (종종 표준 입력 가격의 50%). 자세한 내용은 프롬프트 캐싱을 참조하세요.

스트리밍 사용량

스트리밍 모드에서 마지막 SSE 청크에는 빈 choices와 함께 전체 사용량 객체가 포함됩니다:
{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}
요청에 stream_options: { include_usage: true }를 전달하여 스트리밍 사용량을 활성화합니다.

대시보드 보고

모든 사용량 데이터는 활동 페이지에서 다음 필터링 기능과 함께 확인할 수 있습니다:
  • 시간대 (1시간 → 1년)
  • 그룹화 (모델, API Key, 생성자)
회계 및 예산 계획을 위해 CSV 또는 PDF로 내보내기. 활동 내보내기를 참조하세요.

API 접근

트랜잭션 내역과 잔액을 프로그래밍 방식으로 가져오기:
# 현재 잔액 가져오기
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 최근 트랜잭션 목록 조회
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"