쿼리 파라미터
Models API는 결과 필터링을 위한 쿼리 파라미터를 지원합니다.output_modalities
출력 능력으로 모델을 필터링합니다. 쉼표로 구분된 모달리티 목록이나 "all"을 사용하여 모든 모델을 포함할 수 있습니다.
| 값 | 설명 |
|---|---|
text | 텍스트 출력을 생성하는 모델(기본값) |
image | 이미지를 생성하는 모델 |
audio | 오디오 출력을 생성하는 모델 |
embeddings | 임베딩 모델 |
all | 모든 모델 포함, 모달리티 필터링 건너뜀 |
supported_parameters
지원하는 API 파라미터로 모델을 필터링합니다. 예를 들어, 도구 호출을 지원하는 모델을 찾으려면:
모델 목록
응답 형식
모델 객체 스키마
data 배열의 각 모델에는 다음 필드가 포함됩니다:
| 필드 | 타입 | 설명 |
|---|---|---|
id | string | API 요청에 사용되는 고유 모델 식별자(예: "openai/gpt-5.4") |
canonical_slug | string | 변경되지 않는 모델의 영구 슬러그 |
name | string | 사람이 읽을 수 있는 표시 이름 |
created | number | 모델이 ARouter에 추가된 Unix 타임스탬프 |
description | string | 모델 기능에 대한 상세 설명 |
context_length | number | 토큰 단위의 최대 컨텍스트 창 크기 |
architecture | Architecture | 기술 능력 객체 |
pricing | Pricing | 이 모델 사용의 비용 구조(USD/토큰) |
top_provider | TopProvider | 기본 제공업체의 구성 세부 정보 |
per_request_limits | object | null | 속도 제한 정보(제한 없는 경우 null) |
supported_parameters | string[] | 지원되는 API 파라미터 배열 |
default_parameters | object | null | 기본 파라미터 값(없는 경우 null) |
expiration_date | string | null | 지원 종료 날짜(지원 종료되지 않은 경우 null) |
Architecture 객체
Pricing 객체
모든 가격 값은 USD/토큰입니다."0" 값은 해당 기능이 무료임을 의미합니다.
Top Provider 객체
지원되는 파라미터
supported_parameters 배열은 모델에서 작동하는 OpenAI 호환 파라미터를 나열합니다:
| 파라미터 | 설명 |
|---|---|
tools | 함수 호출 기능 |
tool_choice | 도구 선택 제어 |
max_tokens | 응답 길이 제한 |
temperature | 무작위성 제어 |
top_p | 핵 샘플링 |
reasoning | 내부 추론 모드 |
include_reasoning | 응답에 추론 포함 |
structured_outputs | JSON 스키마 강제 |
response_format | 출력 형식 지정 |
stop | 사용자 정의 중지 시퀀스 |
frequency_penalty | 반복 감소 |
presence_penalty | 주제 다양성 |
seed | 결정론적 출력 |
모델 사용
id를 요청의 model 필드에 직접 사용하세요:
- Python
- TypeScript
- cURL
지원되는 파라미터로 필터링
도구 호출을 지원하는 모델 찾기:자동 라우팅
특정 모델 ID 외에도, ARouter는 자동 모델 선택을 지원합니다:| 모델 | 설명 |
|---|---|
"auto" | ARouter가 요청에 가장 적합한 모델을 자동으로 선택 |
model 필드는 항상 실제로 사용된 모델을 표시합니다. 자세한 내용은 모델 라우팅을 참조하세요.
모델 변형
모델 ID에 접미사를 추가하여 라우팅 동작을 변경할 수 있습니다:| 접미사 | 효과 |
|---|---|
:nitro | 최고 처리량 인스턴스로 라우팅 — 속도 최적화 |
:floor | 최저 비용 인스턴스로 라우팅 — 가격 최적화 |
:free | 무료 티어 인스턴스로 라우팅(속도 제한 적용) |
:thinking | 확장 추론 / 사고 연쇄 모드 활성화 |
토큰화
모델마다 텍스트를 토큰화하는 방식이 다릅니다. 일부 모델(GPT, Claude, Llama)은 텍스트를 다중 문자 청크로 분할하고, 다른 모델은 문자별로 토큰화합니다(PaLM). 이는 동일한 입력과 출력이라도 모델마다 토큰 수——따라서 비용——가 다를 수 있다는 것을 의미합니다. 비용은 사용 중인 모델의 토크나이저에 따라 청구됩니다. 각 응답의usage 필드를 사용하여 정확한 토큰 수를 확인하세요:
참고 사항
- 모델 목록은 계정에서 활성화된 제공업체로 필터링됩니다. 제공업체가 활성화되지 않은 경우 해당 모델은 표시되지 않습니다.
- 새 모델은 제공업체가 출시할 때 자동으로 추가됩니다.
- 이 목록의 모델 ID를 채팅 완성 요청의
model필드에 직접 사용하세요.