DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and high-throughput workloads, while maintaining strong reasoning and coding performance.
1M janela de contexto
384K tokens máx de saída
Lançamento: 2026-04-24
Protocolos Suportados:openaianthropic
Provedores Disponíveis:DeepSeek
Capacidades:Function CallingPrompt Caching
Preços
| Tipo | Preço |
|---|---|
| Tokens de Entrada | $0.14/M |
| Tokens de Saída | $0.28/M |
| Leitura de Cache | $0.028/M |
Exemplos de Código
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="deepseek/deepseek-v4-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modelos Relacionados
Perguntas Frequentes
DeepSeek V4 Flash na Ofox.ai custa $0.14/M por milhão de tokens de entrada e $0.28/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
DeepSeek V4 Flash suporta uma janela de contexto de 1M tokens com saída máxima de 384K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
DeepSeek V4 Flash suporta as seguintes capacidades: Function Calling, Prompt Caching. Acesse todos os recursos pela API unificada Ofox.ai.