Gemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.
1M janela de contexto
64K tokens máx de saída
Lançamento: 2026-05-07
Protocolos Suportados:openaigemini
Provedores Disponíveis:Vertex
Capacidades:VisãoFunction CallingRaciocínioPrompt CachingBusca WebEntrada de ÁudioEntrada de VídeoEntrada PDF
Preços
| Tipo | Preço |
|---|---|
| Tokens de Entrada | $0.25/M |
| Tokens de Saída | $1.5/M |
| Entrada de Áudio | $0.5/M |
| Leitura de Cache | $0.025/M |
| Escrita de Cache | $1/M |
| Escrita de Cache (1 hora) | $1/M |
| Áudio em Cache | $0.05/M |
| Busca Web | $0.014/R |
Exemplos de Código
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite",contents="Hello!",)print(response.text)
Modelos Relacionados
Perguntas Frequentes
Google: Gemini 3.1 Flash Lite na Ofox.ai custa $0.25/M por milhão de tokens de entrada e $1.5/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
Google: Gemini 3.1 Flash Lite suporta uma janela de contexto de 1M tokens com saída máxima de 64K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
Google: Gemini 3.1 Flash Lite suporta as seguintes capacidades: Visão, Function Calling, Raciocínio, Prompt Caching, Busca Web, Entrada de Áudio, Entrada de Vídeo, Entrada PDF. Acesse todos os recursos pela API unificada Ofox.ai.