Gemini

Google: Gemini 2.5 Flash Lite

Chat
google/gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.

1M 컨텍스트 윈도우
66K 최대 출력 토큰
출시일: 2025-07-22
지원 프로토콜:OpenAIopenaiGeminigemini
제공업체:GoogleCloudVertex
기능:비전Function Calling프롬프트 캐싱PDF 입력

요금

유형요금
입력 토큰$0.1/M
출력 토큰$0.4/M
오디오 입력$0.3/M
캐시 읽기$0.025/M
캐시 쓰기$1/M
캐시된 오디오$0.3/M
웹 검색$0.035/R

코드 예제

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},
)
response = client.models.generate_content(
model="google/gemini-2.5-flash-lite",
contents="Hello!",
)
print(response.text)

자주 묻는 질문

Google: Gemini 2.5 Flash Lite은(는) Ofox.ai에서 입력 $0.1/M/백만 토큰, 출력 $0.4/M/백만 토큰입니다. 종량제, 월정액 없음.

Discord

Discord 서버 참여

Discord