Gemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.
1M контекстное окно
64K макс. выходных токенов
Дата релиза: 2026-05-07
Поддерживаемые протоколы:openaigemini
Доступные провайдеры:Vertex
Возможности:ЗрениеFunction CallingРассуждениеКэширование промптовВеб-поискАудио-входВидео-входPDF-вход
Цены
| Тип | Цена |
|---|---|
| Входные токены | $0.25/M |
| Выходные токены | $1.5/M |
| Вход: аудио | $0.5/M |
| Чтение кэша | $0.025/M |
| Запись кэша | $1/M |
| Запись кэша (1 час) | $1/M |
| Кэш: аудио | $0.05/M |
| Веб-поиск | $0.014/R |
Примеры кода
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite",contents="Hello!",)print(response.text)
Похожие модели
Часто задаваемые вопросы
Google: Gemini 3.1 Flash Lite на Ofox.ai стоит $0.25/M за миллион входных токенов и $1.5/M за миллион выходных токенов. Оплата по потреблению, без абонплаты.
Google: Gemini 3.1 Flash Lite поддерживает контекстное окно 1M токенов с максимальным выходом 64K токенов, позволяя обрабатывать большие документы и вести длинные диалоги.
Просто установите base URL на https://api.ofox.ai/v1 и используйте API-ключ Ofox. API совместим с OpenAI — просто измените base URL и API-ключ в существующем коде.
Google: Gemini 3.1 Flash Lite поддерживает следующие возможности: Зрение, Function Calling, Рассуждение, Кэширование промптов, Веб-поиск, Аудио-вход, Видео-вход, PDF-вход. Все функции доступны через единый API Ofox.ai.