此模型已下線
該模型已停止接受新請求,請改用其他可用的活躍模型。
Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across key capabilities. Improvements span audio input/ASR, RAG snippet ranking, translation, data extraction, and code completion. Supports full thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash.
上下文視窗
1M
最大輸出 Token
64K
發布日期
2026-03-03
能力
視覺函式呼叫推理提示快取網路搜尋音訊輸入影片輸入PDF 輸入
可用供應商
Vertex
支援的協定
openaigemini
定價
| 類型 | 價格 |
|---|---|
| 輸入 Token | $0.25/M |
| 輸出 Token | $1.5/M |
| 音訊輸入 | $0.5/M |
| 快取讀取 | $0.025/M |
| 快取寫入 | $1/M |
| 快取寫入(1 小時) | $1/M |
| 快取音訊 | $0.05/M |
| 網路搜尋 | $0.014/R |
程式碼範例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "base_url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite-preview",contents="Hello!",)print(response.text)
運行狀態
相關模型
常見問題
Google: Gemini 3.1 Flash Lite Preview 在 Ofox.ai 上的價格為輸入 $0.25/M/百萬 Token,輸出 $1.5/M/百萬 Token。按量計費,無月費。
Google: Gemini 3.1 Flash Lite Preview 支援 1M Token 的上下文視窗,最大輸出 64K Token,可處理大型文件並維持長對話。
只需將 base URL 設定為 https://api.ofox.ai/v1,並使用你的 Ofox API Key。API 相容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 3.1 Flash Lite Preview 支援以下能力:視覺, 函式呼叫, 推理, 提示快取, 網路搜尋, 音訊輸入, 影片輸入, PDF 輸入。透過 Ofox.ai 統一 API 存取所有功能。