Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M fenêtre de contexte
66K tokens de sortie max
Publié: 2025-07-22
Protocoles supportés:openaigemini
Fournisseurs disponibles:Vertex
Capacités:VisionFunction CallingPrompt CachingEntrée PDF
Tarifs
| Type | Prix |
|---|---|
| Tokens d'entrée | $0.1/M |
| Tokens de sortie | $0.4/M |
| Entrée audio | $0.3/M |
| Lecture cache | $0.025/M |
| Écriture cache | $1/M |
| Audio en cache | $0.3/M |
| Recherche web | $0.035/R |
Exemples de code
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
Modèles associés
Questions fréquentes
Google: Gemini 2.5 Flash Lite sur Ofox.ai coûte $0.1/M par million de tokens d'entrée et $0.4/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
Google: Gemini 2.5 Flash Lite supporte une fenêtre de contexte de 1M tokens avec un maximum de 66K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
Google: Gemini 2.5 Flash Lite supporte les capacités suivantes : Vision, Function Calling, Prompt Caching, Entrée PDF. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.