가동 시간 최적화

ARouter는 모든 업스트림 AI 제공업체의 상태와 가용성을 지속적으로 모니터링하여 애플리케이션의 최대 가동 시간을 보장합니다.

작동 방식

ARouter는 모든 제공업체의 응답 시간, 오류율, 가용성을 실시간으로 추적합니다. 이 데이터는 지능적인 라우팅 결정을 주도하고 활동 피드에서 신뢰성 정보를 제공합니다. 제공업체에서 성능 저하나 중단이 발생하면 ARouter는 자동으로 라우팅 가중치를 조정하여 해당 제공업체의 우선순위를 낮춥니다 — 사용자 측에서 변경이 필요 없습니다.

ARouter가 모니터링하는 항목

각 제공업체와 모델에 대해 ARouter는 지속적으로 추적합니다:

성공률: 오류 없이 완료된 요청의 비율
첫 번째 토큰까지의 시간 (TTFT): 요청 제출부터 첫 번째 스트리밍 토큰까지의 지연 시간
총 응답 시간: 비스트리밍 응답의 엔드투엔드 지연 시간
오류 유형: 일시적 오류(5xx, 속도 제한)와 영구적 오류(잘못된 모델, 잘못된 요청) 구분

중단 시 자동 라우팅

ARouter가 제공업체 성능 저하를 감지하면:

제공업체의 라우팅 가중치가 일시적으로 감소하거나 0이 됩니다
후속 요청은 동일한 모델 패밀리를 제공하는 다른 건강한 제공업체로 라우팅됩니다
제공업체는 주기적으로 재평가되고 상태 지표가 회복되면 재도입됩니다

이 과정은 투명하게 이루어집니다 — 제공업체 사고 중에도 요청은 계속 성공합니다.

높은 가용성을 위한 커스터마이징

순서가 지정된 후보 모델 목록 사용

중요한 워크로드의 경우 순서가 지정된 모델 목록을 지정하세요. ARouter는 성공할 때까지 순서대로 각 모델을 시도합니다:

{
  "models": [
    "anthropic/claude-sonnet-4-6",
    "openai/gpt-5.4",
    "google/gemini-2.5-pro"
  ],
  "route": "fallback"
}

이렇게 하면 기본 모델의 제공업체가 완전히 사용 불가능한 경우에도 애플리케이션이 계속 작동합니다. 전체 구성 참조는 모델 라우팅을 확인하세요.

자동 라우팅 사용

model: "auto"를 설정하여 ARouter가 현재 제공업체 상태, 비용, 능력을 기반으로 최적의 사용 가능한 모델을 동적으로 선택하도록 합니다:

{ "model": "auto" }

모델 라우팅 — 자동 라우팅을 참조하세요.

비용 안정 라우팅에 `:floor` 사용

:floor 접미사는 모델을 제공하는 최저 비용 제공업체로 라우팅하며, 이는 기본 제공업체와 다른 경우가 많아 자연적인 다양성을 제공합니다:

{ "model": "anthropic/claude-sonnet-4-6:floor" }

제공업체 상태 모니터링

ARouter 대시보드에서 실시간 제공업체 상태 데이터를 확인하세요. 대시보드는 모델별 가용성과 지연 시간 추세를 보여주어 워크로드에 대한 모델 선택에 대해 정보에 입각한 결정을 내릴 수 있습니다.

​작동 방식

​ARouter가 모니터링하는 항목

​중단 시 자동 라우팅

​높은 가용성을 위한 커스터마이징

​순서가 지정된 후보 모델 목록 사용

​자동 라우팅 사용

​비용 안정 라우팅에 :floor 사용

​제공업체 상태 모니터링