Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M janela de contexto
66K tokens máx de saída
Lançamento: 2025-07-22
Protocolos Suportados:openaigemini
Provedores Disponíveis:Vertex
Capacidades:VisãoFunction CallingPrompt CachingEntrada PDF
Preços
| Tipo | Preço |
|---|---|
| Tokens de Entrada | $0.1/M |
| Tokens de Saída | $0.4/M |
| Entrada de Áudio | $0.3/M |
| Leitura de Cache | $0.025/M |
| Escrita de Cache | $1/M |
| Áudio em Cache | $0.3/M |
| Busca Web | $0.035/R |
Exemplos de Código
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
Modelos Relacionados
Perguntas Frequentes
Google: Gemini 2.5 Flash Lite na Ofox.ai custa $0.1/M por milhão de tokens de entrada e $0.4/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
Google: Gemini 2.5 Flash Lite suporta uma janela de contexto de 1M tokens com saída máxima de 66K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
Google: Gemini 2.5 Flash Lite suporta as seguintes capacidades: Visão, Function Calling, Prompt Caching, Entrada PDF. Acesse todos os recursos pela API unificada Ofox.ai.