Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
1M 컨텍스트 윈도우
66K 최대 출력 토큰
출시일: 2025-07-22
지원 프로토콜:openaigemini
제공업체:Vertex
기능:비전Function Calling프롬프트 캐싱PDF 입력
요금
| 유형 | 요금 |
|---|---|
| 입력 토큰 | $0.1/M |
| 출력 토큰 | $0.4/M |
| 오디오 입력 | $0.3/M |
| 캐시 읽기 | $0.025/M |
| 캐시 쓰기 | $1/M |
| 캐시된 오디오 | $0.3/M |
| 웹 검색 | $0.035/R |
코드 예제
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
관련 모델
자주 묻는 질문
Google: Gemini 2.5 Flash Lite은(는) Ofox.ai에서 입력 $0.1/M/백만 토큰, 출력 $0.4/M/백만 토큰입니다. 종량제, 월정액 없음.
Google: Gemini 2.5 Flash Lite은(는) 1M 토큰의 컨텍스트 윈도우와 최대 66K 토큰 출력을 지원하여, 대용량 문서 처리와 장기 대화가 가능합니다.
base URL을 https://api.ofox.ai/v1로 설정하고 Ofox API Key를 사용하면 됩니다. OpenAI 호환 API — 기존 코드에서 base URL과 API Key만 변경하면 됩니다.
Google: Gemini 2.5 Flash Lite은(는) 비전, Function Calling, 프롬프트 캐싱, PDF 입력 기능을 지원합니다. Ofox.ai 통합 API로 모든 기능에 접근하세요.