DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and high-throughput workloads, while maintaining strong reasoning and coding performance.
1M ventana de contexto
384K tokens de salida máximos
Lanzamiento: 2026-04-24
Protocolos Soportados:openaianthropic
Proveedores Disponibles:DeepSeek
Capacidades:Function CallingPrompt Caching
Precios
| Tipo | Precio |
|---|---|
| Tokens de Entrada | $0.14/M |
| Tokens de Salida | $0.28/M |
| Lectura de Caché | $0.028/M |
Ejemplos de Código
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="deepseek/deepseek-v4-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modelos Relacionados
Preguntas Frecuentes
DeepSeek V4 Flash en Ofox.ai cuesta $0.14/M por millón de tokens de entrada y $0.28/M por millón de tokens de salida. Pago por uso, sin cuotas mensuales.
DeepSeek V4 Flash soporta una ventana de contexto de 1M tokens con salida máxima de 384K tokens, permitiéndote procesar documentos extensos y mantener conversaciones largas.
Simplemente configura tu base URL a https://api.ofox.ai/v1 y usa tu API key de Ofox. La API es compatible con OpenAI — solo cambia la base URL y la API key en tu código existente.
DeepSeek V4 Flash soporta las siguientes capacidades: Function Calling, Prompt Caching. Accede a todas las funciones a través de la API unificada de Ofox.ai.