使用 service_tier 参数控制成本与延迟之间的权衡。
service_tier
{ "model": "openai/gpt-5.4", "messages": [{"role": "user", "content": "Hello"}], "service_tier": "auto" }
"auto"
"default"
"flex"