Gemini

Google: Gemini 2.5 Flash Lite

Chat
google/gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.

1M контекстное окно
66K макс. выходных токенов
Дата релиза: 2025-07-22
Поддерживаемые протоколы:OpenAIopenaiGeminigemini
Доступные провайдеры:GoogleCloudVertex
Возможности:ЗрениеFunction CallingКэширование промптовPDF-вход

Цены

ТипЦена
Входные токены$0.1/M
Выходные токены$0.4/M
Вход: аудио$0.3/M
Чтение кэша$0.025/M
Запись кэша$1/M
Кэш: аудио$0.3/M
Веб-поиск$0.035/R

Примеры кода

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},
)
response = client.models.generate_content(
model="google/gemini-2.5-flash-lite",
contents="Hello!",
)
print(response.text)

Часто задаваемые вопросы

Google: Gemini 2.5 Flash Lite на Ofox.ai стоит $0.1/M за миллион входных токенов и $0.4/M за миллион выходных токенов. Оплата по потреблению, без абонплаты.

Discord

Присоединяйтесь к Discord-серверу

Discord