How much does Qwen Flash cost on Ofox?

Qwen Flash on Ofox.ai costs $0.022/M per million input tokens and $0.22/M per million output tokens. Pay-as-you-go, no monthly fees.

What is Qwen Flash's context window?

Qwen Flash supports a context window of 1,000,000 tokens, allowing you to process large documents and maintain long conversations.

How to use Qwen Flash API via Ofox?

Simply set your base URL to https://api.ofox.ai/v1 and use your Ofox API key. The API is OpenAI-compatible — just change the base URL and API key in your existing code.

What capabilities does Qwen Flash support?

Qwen Flash supports the following capabilities: function calling, prompt caching, web search. Access all features through the Ofox.ai unified API.

Qwen Flash

Name: Qwen Flash
Brand: bailian
Price: 0.022 USD
Availability: InStock
Rating: 5 (1 reviews)

Chat

bailian/qwen-flash

CompararEmpezar

Qwen Flash es el modelo más rápido y económico de la familia Qwen de Alibaba, servido a través de Dashscope y diseñado para tareas sensibles a la latencia. Ofrece inferencia ultrarrápida y admite uso de herramientas (function calling), caché de prompts y búsqueda web, con un precio de $0.022/M tokens de entrada y $0.22/M de salida. Ventana de contexto: 1M tokens, salida: 32K. Disponible mediante los protocolos OpenAI y Anthropic.

Ventana de Contexto

Tokens de Salida Máximos

32K

Lanzamiento

2025-07-28

Capacidades

Function CallingPrompt CachingBúsqueda Web

Proveedores Disponibles

Aliyun

Protocolos Soportados

openaianthropic

Providers

Aliyun

Tokens de Entrada

$0.022/M

Tokens de Salida

$0.22/M

Lectura de Caché

$0.0043/M

Escritura de Caché

$0.027/M

Búsqueda Web

$0.01/R

Protocols

openai/v1/chat/completions/v1/responses

anthropic

Ejemplos de Código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="YOUR_OFOX_API_KEY",
)

response = client.chat.completions.create(
    model="bailian/qwen-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
)

print(response.choices[0].message.content)