Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M 上下文視窗
66K 最大輸出 token
發布日期: 2025-07-22
支援的協定:openaigemini
可用供應商:Vertex
能力:視覺函式呼叫提示快取PDF 輸入
定價
| 類型 | 價格 |
|---|---|
| 輸入 Token | $0.1/M |
| 輸出 Token | $0.4/M |
| 音訊輸入 | $0.3/M |
| 快取讀取 | $0.025/M |
| 快取寫入 | $1/M |
| 快取音訊 | $0.3/M |
| 網路搜尋 | $0.035/R |
程式碼範例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
相關模型
常見問題
Google: Gemini 2.5 Flash Lite 在 Ofox.ai 上的價格為輸入 $0.1/M/百萬 Token,輸出 $0.4/M/百萬 Token。按量計費,無月費。
Google: Gemini 2.5 Flash Lite 支援 1M Token 的上下文視窗,最大輸出 66K Token,可處理大型文件並維持長對話。
只需將 base URL 設定為 https://api.ofox.ai/v1,並使用你的 Ofox API Key。API 相容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 2.5 Flash Lite 支援以下能力:視覺, 函式呼叫, 提示快取, PDF 輸入。透過 Ofox.ai 統一 API 存取所有功能。

