Google: Gemini 3.1 Flash Lite
Chatgoogle/gemini-3.1-flash-liteGemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.
1M kontextfenster
64K max. ausgabe-tokens
Veröffentlicht: 2026-05-07
Unterstützte Protokolle:openaigemini
Verfügbare Anbieter:Vertex
Fähigkeiten:VisionFunction CallingReasoningPrompt CachingWebsucheAudio-EingabeVideo-EingabePDF-Eingabe
Preise
| Typ | Preis |
|---|---|
| Eingabe-Tokens | $0.25/M |
| Ausgabe-Tokens | $1.5/M |
| Audioeingabe | $0.5/M |
| Cache-Lesen | $0.025/M |
| Cache-Schreiben | $1/M |
| Cache-Schreiben (1 Std.) | $1/M |
| Gecachtes Audio | $0.05/M |
| Websuche | $0.014/R |
Code-Beispiele
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite",contents="Hello!",)print(response.text)
Verwandte Modelle
Häufig gestellte Fragen
Google: Gemini 3.1 Flash Lite auf Ofox.ai kostet $0.25/M pro Million Eingabe-Tokens und $1.5/M pro Million Ausgabe-Tokens. Pay-as-you-go, keine monatlichen Gebühren.
Google: Gemini 3.1 Flash Lite unterstützt ein Kontextfenster von 1M Tokens mit max. Ausgabe von 64K Tokens, was die Verarbeitung großer Dokumente und lange Konversationen ermöglicht.
Einfach Ihre Base-URL auf https://api.ofox.ai/v1 setzen und Ihren Ofox API Key verwenden. Die API ist OpenAI-kompatibel — einfach Base-URL und API Key in Ihrem bestehenden Code ändern.
Google: Gemini 3.1 Flash Lite unterstützt folgende Fähigkeiten: Vision, Function Calling, Reasoning, Prompt Caching, Websuche, Audio-Eingabe, Video-Eingabe, PDF-Eingabe. Zugriff auf alle Features über die einheitliche Ofox.ai API.