Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M контекстное окно
66K макс. выходных токенов
Дата релиза: 2025-07-22
Поддерживаемые протоколы:openaigemini
Доступные провайдеры:Vertex
Возможности:ЗрениеFunction CallingКэширование промптовPDF-вход
Цены
| Тип | Цена |
|---|---|
| Входные токены | $0.1/M |
| Выходные токены | $0.4/M |
| Вход: аудио | $0.3/M |
| Чтение кэша | $0.025/M |
| Запись кэша | $1/M |
| Кэш: аудио | $0.3/M |
| Веб-поиск | $0.035/R |
Примеры кода
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
Похожие модели
Часто задаваемые вопросы
Google: Gemini 2.5 Flash Lite на Ofox.ai стоит $0.1/M за миллион входных токенов и $0.4/M за миллион выходных токенов. Оплата по потреблению, без абонплаты.
Google: Gemini 2.5 Flash Lite поддерживает контекстное окно 1M токенов с максимальным выходом 66K токенов, позволяя обрабатывать большие документы и вести длинные диалоги.
Просто установите base URL на https://api.ofox.ai/v1 и используйте API-ключ Ofox. API совместим с OpenAI — просто измените base URL и API-ключ в существующем коде.
Google: Gemini 2.5 Flash Lite поддерживает следующие возможности: Зрение, Function Calling, Кэширование промптов, PDF-вход. Все функции доступны через единый API Ofox.ai.