Alibaba Qwen Flash via Dashscope. Ultra-fast inference for latency-sensitive tasks. Lowest cost option in the Qwen family.
1M ventana de contexto
32K tokens de salida máximos
Lanzamiento: 2025-07-28
Protocolos Soportados:openaianthropic
Proveedores Disponibles:Aliyun
Capacidades:Function CallingPrompt CachingBúsqueda Web
Precios
| Tipo | Precio |
|---|---|
| Tokens de Entrada | $0.022/M |
| Tokens de Salida | $0.22/M |
| Lectura de Caché | $0.0043/M |
| Escritura de Caché | $0.027/M |
| Búsqueda Web | $0.01/R |
Ejemplos de Código
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="bailian/qwen-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modelos Relacionados
Preguntas Frecuentes
Qwen Flash en Ofox.ai cuesta $0.022/M por millón de tokens de entrada y $0.22/M por millón de tokens de salida. Pago por uso, sin cuotas mensuales.
Qwen Flash soporta una ventana de contexto de 1M tokens con salida máxima de 32K tokens, permitiéndote procesar documentos extensos y mantener conversaciones largas.
Simplemente configura tu base URL a https://api.ofox.ai/v1 y usa tu API key de Ofox. La API es compatible con OpenAI — solo cambia la base URL y la API key en tu código existente.
Qwen Flash soporta las siguientes capacidades: Function Calling, Prompt Caching, Búsqueda Web. Accede a todas las funciones a través de la API unificada de Ofox.ai.