Gemini 3 Flash Preview is a high speed, high value thinking model designed for agentic workflows, multi turn chat, and coding assistance. It delivers near Pro level reasoning and tool use performance with substantially lower latency than larger Gemini variants, making it well suited for interactive development, long running agent loops, and collaborative coding tasks. Compared to Gemini 2.5 Flash, it provides broad quality improvements across reasoning, multimodal understanding, and reliability.
1M 컨텍스트 윈도우
66K 최대 출력 토큰
출시일: 2025-12-17
지원 프로토콜:openaigemini
제공업체:Vertex
기능:비전Function Calling추론프롬프트 캐싱웹 검색오디오 입력영상 입력PDF 입력
요금
| 유형 | 요금 |
|---|---|
| 입력 토큰 | $0.5/M |
| 출력 토큰 | $3/M |
| 오디오 입력 | $1/M |
| 캐시 읽기 | $0.05/M |
| 캐시 쓰기 | $1/M |
| 캐시된 오디오 | $0.1/M |
| 웹 검색 | $0.014/R |
코드 예제
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.ai/gemini"},)response = client.models.generate_content(model="google/gemini-3-flash-preview",contents="Hello!",)print(response.text)
관련 모델
자주 묻는 질문
Google: Gemini 3 Flash Preview은(는) Ofox.ai에서 입력 $0.5/M/백만 토큰, 출력 $3/M/백만 토큰입니다. 종량제, 월정액 없음.
Google: Gemini 3 Flash Preview은(는) 1M 토큰의 컨텍스트 윈도우와 최대 66K 토큰 출력을 지원하여, 대용량 문서 처리와 장기 대화가 가능합니다.
base URL을 https://api.ofox.ai/v1로 설정하고 Ofox API Key를 사용하면 됩니다. OpenAI 호환 API — 기존 코드에서 base URL과 API Key만 변경하면 됩니다.
Google: Gemini 3 Flash Preview은(는) 비전, Function Calling, 추론, 프롬프트 캐싱, 웹 검색, 오디오 입력, 영상 입력, PDF 입력 기능을 지원합니다. Ofox.ai 통합 API로 모든 기능에 접근하세요.