跳转到主要内容
模型回退允许你按优先级顺序指定多个候选模型。如果第一个模型返回错误、超时或不可用,ARouter 会自动使用下一个模型重试。

快速开始

{
  "model": "openai/gpt-5.4-pro",
  "models": ["openai/gpt-5.4-pro", "openai/gpt-5.4", "anthropic/claude-sonnet-4.6"],
  "messages": [{"role": "user", "content": "Hello"}]
}

回退行为

场景操作
主模型返回 5xx使用下一个模型重试
主模型被限流(429使用下一个模型重试
主模型不可用使用下一个模型重试
主模型返回 4xx(错误请求)立即返回错误
所有模型都失败返回最后一个尝试模型的错误

识别哪个模型响应了

响应中的 model 字段始终反映实际生成响应的模型。

定价

你只为实际响应的模型付费。失败的尝试不计费

与提供商回退结合使用

{
  "model": "openai/gpt-5.4-pro",
  "models": ["openai/gpt-5.4-pro", "openai/gpt-5.4"],
  "provider": {"order": ["Azure", "OpenAI"], "allow_fallbacks": true}
}

使用场景

高可用生产环境:
{"models": ["anthropic/claude-opus-4.5", "anthropic/claude-sonnet-4.6", "openai/gpt-5.4-pro"]}
成本优化同时保证质量下限:
{"models": ["openai/gpt-5.4:free", "meta-llama/llama-4-maverick:free", "openai/gpt-5.4"]}

相关