How much does DeepSeek V4 Flash cost on Ofox?

DeepSeek V4 Flash on Ofox.ai costs $0.14/M per million input tokens and $0.28/M per million output tokens. Pay-as-you-go, no monthly fees.

What is DeepSeek V4 Flash's context window?

DeepSeek V4 Flash supports a context window of 1,000,000 tokens, allowing you to process large documents and maintain long conversations.

How to use DeepSeek V4 Flash API via Ofox?

Simply set your base URL to https://api.ofox.ai/v1 and use your Ofox API key. The API is OpenAI-compatible — just change the base URL and API key in your existing code.

What capabilities does DeepSeek V4 Flash support?

DeepSeek V4 Flash supports the following capabilities: function calling, prompt caching. Access all features through the Ofox.ai unified API.

DeepSeek V4 Flash

Name: DeepSeek V4 Flash
Brand: deepseek
Price: 0.14 USD
Availability: InStock
Rating: 5 (1 reviews)

Chat

deepseek/deepseek-v4-flash

CompararComeçar

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and high-throughput workloads, while maintaining strong reasoning and coding performance.

Janela de Contexto

Tokens Máx de Saída

384K

Lançamento

2026-04-24

Capacidades

Function CallingPrompt Caching

Provedores Disponíveis

DeepSeekAzureAliyun

Protocolos Suportados

openaianthropic

Providers

Aliyun

Tokens de Entrada

$0.14/M

Tokens de Saída

$0.28/M

Leitura de Cache

$0.028/M

Escrita de Cache

$0.175/M

Busca Web

$0.01/R

Protocols

anthropic

Azure

Tokens de Entrada

$0.19/M

Tokens de Saída

$0.51/M

Leitura de Cache

$0.19/M

Busca Web

$0.035/R

Protocols

openai/v1/chat/completions/v1/responses

anthropic

DeepSeek

Tokens de Entrada

$0.14/M

Tokens de Saída

$0.28/M

Leitura de Cache

$0.0028/M

Protocols

openai/v1/chat/completions

anthropic

Exemplos de Código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="YOUR_OFOX_API_KEY",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
)

print(response.choices[0].message.content)

Disponibilidade e status

Benchmarks

LMArena ↗Avaliado como deepseek-v4-flash

DeepSeek V4 Flash obtém 1438 na categoria geral do ranking de texto do LMArena (controle de estilo), ficando em 70º de 374 modelos com base em 41.568 votos de preferência humana (atualizado em 2026-07-12).

Pontuações de benchmark de deepseek-v4-flash no LMArena
Categoria	IC de 95%	Posição	Votos
Geral	1433–1442	70º de 374	41.568
Prompts difíceis	1455–1466	65º de 374	27.503
Programação	1476–1489	71º de 369	12.085
Matemática	1414–1441	78º de 362	2.133
Escrita criativa	1401–1418	65º de 372	6.649
Seguimento de instruções	1423–1436	66º de 374	13.952
Chinês	1460–1489	73º de 344	2.014

Fonte: LMArena · CC BY 4.0 · Atualizado em 2026-07-12 · Metodologia ↗ · As posições comparam modelos dentro de cada categoria do ranking de texto do LMArena (controle de estilo). As pontuações vêm de avaliações de preferência humana de terceiros, não da OFOX.