Google: Gemini 3.1 Flash Lite
Chatgoogle/gemini-3.1-flash-liteGemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.
Fenêtre de contexte
1M
Tokens de sortie max
64K
Publié
2026-05-07
Capacités
VisionFunction CallingRaisonnementPrompt CachingRecherche webEntrée audioEntrée vidéoEntrée PDF
Fournisseurs disponibles
Vertex
Protocoles supportés
openaigemini
Providers
Vertex
Tokens d'entrée
$0.25/M
Tokens de sortie
$1.5/M
Lecture cache
$0.025/M
Écriture cache
$1/M
Entrée audio
$0.5/M
Écriture cache (1 h)
$1/M
Audio en cache
$0.05/M
Recherche web
$0.014/R
Protocols
openai
/v1/chat/completionsgemini
Exemples de code
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "base_url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite",contents="Hello!",)print(response.text)
Modèles associés
Questions fréquentes
Google: Gemini 3.1 Flash Lite sur Ofox.ai coûte $0.25/M par million de tokens d'entrée et $1.5/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
Google: Gemini 3.1 Flash Lite supporte une fenêtre de contexte de 1M tokens avec un maximum de 64K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
Google: Gemini 3.1 Flash Lite supporte les capacités suivantes : Vision, Function Calling, Raisonnement, Prompt Caching, Recherche web, Entrée audio, Entrée vidéo, Entrée PDF. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.