Gemini

Google: Gemini 3.1 Flash Lite

Chat
google/gemini-3.1-flash-lite

Gemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.

1M 컨텍스트 윈도우
64K 최대 출력 토큰
출시일: 2026-05-07
지원 프로토콜:OpenAIopenaiGeminigemini
제공업체:GoogleCloudVertex
기능:비전Function Calling추론프롬프트 캐싱웹 검색오디오 입력영상 입력PDF 입력

요금

유형요금
입력 토큰$0.25/M
출력 토큰$1.5/M
오디오 입력$0.5/M
캐시 읽기$0.025/M
캐시 쓰기$1/M
캐시 쓰기 (1시간)$1/M
캐시된 오디오$0.05/M
웹 검색$0.014/R

코드 예제

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},
)
response = client.models.generate_content(
model="google/gemini-3.1-flash-lite",
contents="Hello!",
)
print(response.text)

자주 묻는 질문

Google: Gemini 3.1 Flash Lite은(는) Ofox.ai에서 입력 $0.25/M/백만 토큰, 출력 $1.5/M/백만 토큰입니다. 종량제, 월정액 없음.