クエリパラメータ
Models API はクエリパラメータによる結果のフィルタリングをサポートしています。output_modalities
出力能力でモデルをフィルタリングします。カンマ区切りのモダリティリスト、または "all" を指定してすべてのモデルを含めます。
| 値 | 説明 |
|---|---|
text | テキスト出力を生成するモデル(デフォルト) |
image | 画像を生成するモデル |
audio | 音声出力を生成するモデル |
embeddings | 埋め込みモデル |
all | すべてのモデルを含める(モダリティフィルタリングをスキップ) |
supported_parameters
サポートする API パラメータでモデルをフィルタリングします。例えば、ツール呼び出しをサポートするモデルを検索する場合:
モデル一覧
レスポンス形式
モデルオブジェクトスキーマ
data 配列の各モデルには以下のフィールドが含まれます:
| フィールド | 型 | 説明 |
|---|---|---|
id | string | API リクエストで使用する一意のモデル識別子(例:"openai/gpt-5.4") |
canonical_slug | string | 変更されないモデルの永続的なスラッグ |
name | string | 人間が読める表示名 |
created | number | モデルが ARouter に追加された Unix タイムスタンプ |
description | string | モデルの機能の詳細な説明 |
context_length | number | トークン単位の最大コンテキストウィンドウサイズ |
architecture | Architecture | 技術的な機能オブジェクト |
pricing | Pricing | このモデルの使用コスト構造(USD/トークン) |
top_provider | TopProvider | プライマリプロバイダーの設定詳細 |
per_request_limits | object | null | レート制限情報(制限なしの場合は null) |
supported_parameters | string[] | サポートされる API パラメータの配列 |
default_parameters | object | null | デフォルトパラメータ値(ない場合は null) |
expiration_date | string | null | 廃止日(廃止されていない場合は null) |
Architecture オブジェクト
Pricing オブジェクト
すべての価格値はUSD/トークンです。"0" は無料を意味します。
Top Provider オブジェクト
サポートされるパラメータ
supported_parameters 配列は、モデルで動作する OpenAI 互換パラメータを一覧表示します:
| パラメータ | 説明 |
|---|---|
tools | 関数呼び出し機能 |
tool_choice | ツール選択の制御 |
max_tokens | レスポンス長の制限 |
temperature | ランダム性の制御 |
top_p | ニュークリアスサンプリング |
reasoning | 内部推論モード |
include_reasoning | レスポンスに推論を含める |
structured_outputs | JSON スキーマの強制 |
response_format | 出力形式の指定 |
stop | カスタム停止シーケンス |
frequency_penalty | 繰り返しの削減 |
presence_penalty | トピックの多様性 |
seed | 決定論的な出力 |
モデルの使用
id をリクエストの model フィールドに直接使用します:
- Python
- TypeScript
- cURL
サポートされるパラメータによるフィルタリング
ツール呼び出しをサポートするモデルを検索:自動ルーティング
特定のモデル ID に加えて、ARouter は自動モデル選択をサポートします:| モデル | 説明 |
|---|---|
"auto" | ARouter がリクエストに最適な利用可能モデルを自動選択 |
model フィールドには常に実際に使用されたモデルが表示されます。詳細はモデルルーティングを参照してください。
モデルバリアント
任意のモデル ID にサフィックスを追加してルーティング動作を変更できます:| サフィックス | 効果 |
|---|---|
:nitro | 最高スループットのインスタンスにルーティング — 速度最適化 |
:floor | 最低コストのインスタンスにルーティング — 価格最適化 |
:free | 無料ティアのインスタンスにルーティング(レート制限あり) |
:thinking | 拡張推論 / 思考の連鎖モードを有効化 |
トークン化
モデルによってテキストのトークン化方法が異なります。一部のモデル(GPT、Claude、Llama)はテキストを複数文字のチャンクに分割しますが、他のモデルは文字単位でトークン化します(PaLM)。これは、入力と出力が同一であっても、モデルによってトークン数——したがってコスト——が異なることを意味します。 コストは使用中のモデルのトークナイザーに基づいて請求されます。各レスポンスのusage フィールドを使用して正確なトークン数を取得してください:
注意事項
- モデルリストはアカウントで有効なプロバイダーでフィルタリングされます。プロバイダーが有効でない場合、そのモデルは表示されません。
- 新しいモデルはプロバイダーがリリースすると自動的に追加されます。
- このリストのモデル ID をチャット補完リクエストの
modelフィールドに直接使用してください。