사용량 회계

ARouter의 모든 API 응답에는 상세한 사용량 정보가 포함되어 있습니다. 이를 통해 추가 API 호출 없이 실시간으로 비용과 Token 소비량을 추적할 수 있습니다.

응답의 사용량

usage 객체는 모든 비스트리밍 응답(및 스트리밍 응답의 마지막 청크)에서 반환됩니다:

{
  "id": "gen-abc123",
  "model": "openai/gpt-5.4",
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205,
    "prompt_tokens_details": {
      "cached_tokens": 60,
      "audio_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 30,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Token 필드

필드	설명
`prompt_tokens`	입력 Token 합계 (캐시된 Token 포함)
`completion_tokens`	출력 Token 합계 (추론 Token 포함)
`total_tokens`	프롬프트 + 완성 Token 합계
`prompt_tokens_details.cached_tokens`	제공업체의 프롬프트 캐시에서 제공된 Token
`completion_tokens_details.reasoning_tokens`	내부 추론에 사용된 Token (사고 모델)
`completion_tokens_details.accepted_prediction_tokens`	투기적 디코딩에서 수락된 Token
`completion_tokens_details.rejected_prediction_tokens`	투기적 디코딩에서 거부된 Token

비용 추적

ARouter는 업스트림 제공업체가 보고한 실제 Token 수를 기반으로 청구합니다. 가격은 비용 그대로 전달됩니다 — 추론 마크업 없음. 정확한 비용을 계산하려면:

비용 = (prompt_tokens × Token당 입력 가격) + (completion_tokens × Token당 출력 가격)

캐시된 Token은 일반적으로 낮은 요금으로 청구됩니다 (종종 표준 입력 가격의 50%). 자세한 내용은 프롬프트 캐싱을 참조하세요.

스트리밍 사용량

스트리밍 모드에서 마지막 SSE 청크에는 빈 choices와 함께 전체 사용량 객체가 포함됩니다:

{
  "id": "gen-abc123",
  "choices": [],
  "usage": {
    "prompt_tokens": 120,
    "completion_tokens": 85,
    "total_tokens": 205
  }
}

요청에 stream_options: { include_usage: true }를 전달하여 스트리밍 사용량을 활성화합니다.

대시보드 보고

모든 사용량 데이터는 활동 페이지에서 다음 필터링 기능과 함께 확인할 수 있습니다:

시간대 (1시간 → 1년)
그룹화 (모델, API Key, 생성자)

회계 및 예산 계획을 위해 CSV 또는 PDF로 내보내기. 활동 내보내기를 참조하세요.

API 접근

트랜잭션 내역과 잔액을 프로그래밍 방식으로 가져오기:

# 현재 잔액 가져오기
curl https://api.arouter.ai/v1/billing/balance \
  -H "Authorization: Bearer $AROUTER_API_KEY"

# 최근 트랜잭션 목록 조회
curl https://api.arouter.ai/v1/billing/transactions \
  -H "Authorization: Bearer $AROUTER_API_KEY"

​응답의 사용량

​Token 필드

​비용 추적

​스트리밍 사용량

​대시보드 보고

​API 접근