基于Qwen3的代码生成模型,继承Qwen3-Coder-Plus的coding agent能力,支持多轮工具交互,重点优化仓库级别理解能力并增加工具调用稳定性。
1M janela de contexto
64K tokens máx de saída
Lançamento: 2025-08-05
Protocolos Suportados:openaianthropic
Provedores Disponíveis:Aliyun
Capacidades:Function CallingRaciocínioPrompt Caching
Preços
| Tipo | Preço |
|---|---|
| Tokens de Entrada | $0.5/M |
| Tokens de Saída | $2.5/M |
| Leitura de Cache | $0.06/M |
| Escrita de Cache | $0.27/M |
Exemplos de Código
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="bailian/qwen3-coder-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modelos Relacionados
Perguntas Frequentes
Qwen3 Coder Flash na Ofox.ai custa $0.5/M por milhão de tokens de entrada e $2.5/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
Qwen3 Coder Flash suporta uma janela de contexto de 1M tokens com saída máxima de 64K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
Qwen3 Coder Flash suporta as seguintes capacidades: Function Calling, Raciocínio, Prompt Caching. Acesse todos os recursos pela API unificada Ofox.ai.