Fast and cost-effective Gemini 2.5 with 1M context. Features toggleable reasoning capabilities and full multimodal support at significantly lower cost than Pro.
1M janela de contexto
66K tokens máx de saída
Lançamento: 2025-06-17
Protocolos Suportados:openaigemini
Provedores Disponíveis:Vertex
Capacidades:VisãoFunction CallingRaciocínioPrompt CachingBusca WebEntrada de ÁudioEntrada de VídeoEntrada PDF
Providers
Vertex
Tokens de Entrada
$0.3/M
Tokens de Saída
$2.5/M
Leitura de Cache
$0.03/M
Escrita de Cache
$1/M
Entrada de Áudio
$1/M
Áudio em Cache
$0.1/M
Busca Web
$0.035/R
Protocols
openai
/v1/chat/completionsgemini
Exemplos de Código
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash",contents="Hello!",)print(response.text)
Modelos Relacionados
Perguntas Frequentes
Google: Gemini 2.5 Flash na Ofox.ai custa $0.3/M por milhão de tokens de entrada e $2.5/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
Google: Gemini 2.5 Flash suporta uma janela de contexto de 1M tokens com saída máxima de 66K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
Google: Gemini 2.5 Flash suporta as seguintes capacidades: Visão, Function Calling, Raciocínio, Prompt Caching, Busca Web, Entrada de Áudio, Entrada de Vídeo, Entrada PDF. Acesse todos os recursos pela API unificada Ofox.ai.