Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M 上下文窗口
66K 最大输出 token
发布日期: 2025-07-22
支持的协议:openaigemini
可用供应商:Vertex
能力:视觉函数调用提示缓存PDF 输入
定价
| 类型 | 价格 |
|---|---|
| 输入 Token | $0.1/M |
| 输出 Token | $0.4/M |
| 音频输入 | $0.3/M |
| 缓存读取 | $0.025/M |
| 缓存写入 | $1/M |
| 缓存音频 | $0.3/M |
| 网络搜索 | $0.035/R |
代码示例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
相关模型
常见问题
Google: Gemini 2.5 Flash Lite 在 Ofox.ai 上的价格为输入 $0.1/M/百万 Token,输出 $0.4/M/百万 Token。按量计费,无月费。
Google: Gemini 2.5 Flash Lite 支持 1M Token 的上下文窗口,最大输出 66K Token,可处理大型文档并维持长对话。
只需将 base URL 设置为 https://api.ofox.ai/v1,并使用你的 Ofox API Key。API 兼容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 2.5 Flash Lite 支持以下能力:视觉, 函数调用, 提示缓存, PDF 输入。通过 Ofox.ai 统一 API 访问所有功能。

