Gemini

Google: Gemini 3.1 Flash Lite

Chat
google/gemini-3.1-flash-lite

Gemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.

1M kontextfenster
64K max. ausgabe-tokens
Veröffentlicht: 2026-05-07
Unterstützte Protokolle:OpenAIopenaiGeminigemini
Verfügbare Anbieter:GoogleCloudVertex
Fähigkeiten:VisionFunction CallingReasoningPrompt CachingWebsucheAudio-EingabeVideo-EingabePDF-Eingabe

Preise

TypPreis
Eingabe-Tokens$0.25/M
Ausgabe-Tokens$1.5/M
Audioeingabe$0.5/M
Cache-Lesen$0.025/M
Cache-Schreiben$1/M
Cache-Schreiben (1 Std.)$1/M
Gecachtes Audio$0.05/M
Websuche$0.014/R

Code-Beispiele

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},
)
response = client.models.generate_content(
model="google/gemini-3.1-flash-lite",
contents="Hello!",
)
print(response.text)

Häufig gestellte Fragen

Google: Gemini 3.1 Flash Lite auf Ofox.ai kostet $0.25/M pro Million Eingabe-Tokens und $1.5/M pro Million Ausgabe-Tokens. Pay-as-you-go, keine monatlichen Gebühren.