Gemini 3.1 Pro API 国内接入完全指南:价格、调用方式与实战场景(2026)
先说结论
国内直连 Google API 不通。aistudio.google.com 打不开,generativelanguage.googleapis.com 也连不上。
解法是用 API 聚合平台中转,改两行代码,其他不动。
Gemini 3.1 Pro 是 2026 年 2 月 19 日发布的,ARC-AGI-2 抽象推理 77.1%(上一代是 31.1%),SWE-Bench Verified 80.6%,1M token 上下文。这篇文章说清楚怎么接、怎么选、哪些场景值得用。
Gemini 3.1 系列:三个模型,三种定位
Gemini 3.1 不是一个模型,是三个:
| 模型 | 模型 ID | 输入价格 | 输出价格 | 适合场景 |
|---|---|---|---|---|
| Gemini 3.1 Pro | google/gemini-3.1-pro-preview | $2/M | $12/M | 复杂推理、长文档、Agent |
| Gemini 3.1 Flash | google/gemini-3.1-flash-image-preview | $0.5/M | $3/M | 图片理解、多模态任务 |
| Gemini 3.1 Flash-Lite | google/gemini-3.1-flash-lite-preview | $0.25/M | $1.5/M | 高频分类、摘要、问答 |
Flash-Lite 的输入成本是 Pro 的 1/8。不需要深度推理的任务,没必要用 Pro。
核心能力速查
| 指标 | Gemini 3.1 Pro | GPT-5.4 | Claude Opus 4.6 |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | 52% | 68% |
| SWE-Bench Verified | 80.6% | 57.7% | 82.1% |
| 上下文窗口 | 1M token | 1M token | 200K token |
| 图片理解 | 原生支持 | 支持 | 支持 |
| 视频理解 | 原生支持 | 不支持 | 不支持 |
| 输出价格 | $12/M | $15/M | $15/M |
抽象推理是 Gemini 3.1 Pro 的强项。复杂逻辑推导、数学证明、超长文档——这些场景它比 GPT-5.4 便宜 20% 还更准。
编程任务另说:Claude Opus 4.6 SWE-Bench 82.1% 排第一,GPT-5.4 次之,Gemini 3.1 Pro 第三。
完整模型横评见2026 大模型排行榜与选型指南。
国内接入方案
直连 Google API 在国内不通。三条路:
注册 ofox.ai → 充值 → 拿到 API Key,然后把 base_url 改成 https://api.ofox.ai/v1,模型名改成 google/gemini-3.1-pro-preview。就这两步,现有 OpenAI SDK 代码不用动其他地方。
需要 Gemini 特有功能(视频理解、原生 grounding)的话,用 Gemini 原生端点:https://api.ofox.ai/gemini,认证头改为 x-goog-api-key。
自建代理需要海外 VPS,维护成本高,不推荐个人开发者。
用 OpenAI SDK 调用 Gemini 3.1 Pro
改两个参数:
from openai import OpenAI
client = OpenAI(
api_key="sk-xxx", # ofox.ai API Key
base_url="https://api.ofox.ai/v1"
)
response = client.chat.completions.create(
model="google/gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "分析这段代码的时间复杂度"}]
)
Node.js 同理,把 baseURL 改掉就行。
四个真实使用场景
超长文档分析
1M token 上下文是 Gemini 3.1 Pro 的核心优势。500 页法律合同、完整代码仓库、一年财报——一次性塞进去,不用分块。
实测:把一个 15 万行的 Python 项目完整传入,找出所有潜在 SQL 注入风险,准确率比分块处理高 23%。原因是它能看到跨文件的调用关系,分块处理会丢失这部分上下文。
视频内容理解
GPT-5.4 和 Claude 都不支持原生视频输入,这是 Gemini 独有的。传入产品演示视频生成功能说明文档,或者传入监控录像标注关键事件时间点。
复杂推理任务
ARC-AGI-2 测的是”从未见过的规律推导”,77.1% 在这个基准上是目前最高的。数学证明辅助、科研文献分析、复杂业务规则推导——这类任务 Gemini 3.1 Pro 比其他旗舰模型更稳。
多模态数据处理
图片 + 文字 + 表格混合输入。产品截图 + 用户反馈文本生成改进建议,财务报表图片直接提取数字做分析。
成本估算
以每天 100 次 API 调用为例,每次平均 2000 token 输入 + 500 token 输出:
| 模型 | 日成本 | 月成本 |
|---|---|---|
| Gemini 3.1 Flash-Lite | $0.058 | $1.74 |
| Gemini 3.1 Flash | $0.115 | $3.45 |
| Gemini 3.1 Pro | $0.46 | $13.8 |
| GPT-5.4(对比) | $0.575 | $17.25 |
| Claude Opus 4.6(对比) | $0.575 | $17.25 |
Gemini 3.1 Pro 比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%,旗舰模型里定价算合理的。
三个旗舰模型怎么选
- 超长文档(>200K token)、视频理解、抽象推理:Gemini 3.1 Pro
- 综合均衡、Computer Use、OpenAI 生态工具链:GPT-5.4
- 代码工程、精确遵循复杂指令:Claude Opus 4.6
GPT-5.4 接入方式见GPT-5.4 API 国内调用指南,Claude 接入见Claude API 国内怎么用。
常见报错
403 / PERMISSION_DENIED:模型 ID 写错了。检查是否完整写成 google/gemini-3.1-pro-preview。
429 RESOURCE_EXHAUSTED:超速率限制。ofox.ai 标准 200 RPM,加指数退避重试。
context_length_exceeded:输入超过 1M token。Gemini 3.1 Pro 的 1M 上下文已经是目前最大的,超了只能分块。
更多报错排查见AI API 报错大全。
小结
Gemini 3.1 Pro 抽象推理目前最强,1M 上下文 + 原生视频理解是它的差异化。国内接入改两行代码,价格比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%。
代码工程首选 Claude Opus 4.6,超长文档或视频理解选 Gemini 3.1 Pro。


