Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across key capabilities. Improvements span audio input/ASR, RAG snippet ranking, translation, data extraction, and code completion. Supports full thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash.
1M 컨텍스트 윈도우
64K 최대 출력 토큰
출시일: 2026-03-03
지원 프로토콜:openaianthropicgemini
제공업체:Vertex
기능:비전Function Calling추론프롬프트 캐싱웹 검색오디오 입력영상 입력PDF 입력
요금
| 유형 | 요금 |
|---|---|
| 입력 토큰 | $0.25/M |
| 출력 토큰 | $1.5/M |
| 오디오 입력 | $0.5/M |
| 캐시 읽기 | $0.025/M |
| 캐시 쓰기 | $1/M |
| 캐시 쓰기 (1시간) | $1/M |
| 캐시된 오디오 | $0.05/M |
| 웹 검색 | $0.014/R |
코드 예제
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite-preview",contents="Hello!",)print(response.text)
관련 모델
자주 묻는 질문
Google: Gemini 3.1 Flash Lite Preview은(는) Ofox.ai에서 입력 $0.25/M/백만 토큰, 출력 $1.5/M/백만 토큰입니다. 종량제, 월정액 없음.
Google: Gemini 3.1 Flash Lite Preview은(는) 1M 토큰의 컨텍스트 윈도우와 최대 64K 토큰 출력을 지원하여, 대용량 문서 처리와 장기 대화가 가능합니다.
base URL을 https://api.ofox.ai/v1로 설정하고 Ofox API Key를 사용하면 됩니다. OpenAI 호환 API — 기존 코드에서 base URL과 API Key만 변경하면 됩니다.
Google: Gemini 3.1 Flash Lite Preview은(는) 비전, Function Calling, 추론, 프롬프트 캐싱, 웹 검색, 오디오 입력, 영상 입력, PDF 입력 기능을 지원합니다. Ofox.ai 통합 API로 모든 기능에 접근하세요.