DeepSeek V4 Flash
Chatdeepseek/deepseek-v4-flashDeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and high-throughput workloads, while maintaining strong reasoning and coding performance.
Fenêtre de contexte
1M
Tokens de sortie max
384K
Publié
2026-04-24
Capacités
Function CallingPrompt Caching
Fournisseurs disponibles
DeepSeekAliyunAzure
Protocoles supportés
openaianthropic
Providers
Aliyun
Tokens d'entrée
$0.14/M
Tokens de sortie
$0.28/M
Lecture cache
$0.028/M
Recherche web
$0.01/R
Protocols
anthropic
Azure
Tokens d'entrée
$0.14/M
Tokens de sortie
$0.28/M
Lecture cache
$0.0028/M
Protocols
openai
/v1/chat/completions/v1/responsesanthropic
DeepSeek
Tokens d'entrée
$0.14/M
Tokens de sortie
$0.28/M
Lecture cache
$0.0028/M
Protocols
openai
/v1/chat/completionsanthropic
Exemples de code
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="deepseek/deepseek-v4-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Disponibilité et état
Modèles associés
Questions fréquentes
DeepSeek V4 Flash sur Ofox.ai coûte $0.14/M par million de tokens d'entrée et $0.28/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
DeepSeek V4 Flash supporte une fenêtre de contexte de 1M tokens avec un maximum de 384K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
DeepSeek V4 Flash supporte les capacités suivantes : Function Calling, Prompt Caching. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.