Gemini 3.1 Pro API 国内接入完全指南:价格、调用方式与实战场景(2026)

Gemini 3.1 Pro API 国内接入完全指南:价格、调用方式与实战场景(2026)

先说结论

国内直连 Google API 不通。aistudio.google.com 打不开,generativelanguage.googleapis.com 也连不上。

解法是用 API 聚合平台中转,改两行代码,其他不动。

Gemini 3.1 Pro 是 2026 年 2 月 19 日发布的,ARC-AGI-2 抽象推理 77.1%(上一代是 31.1%),SWE-Bench Verified 80.6%,1M token 上下文。这篇文章说清楚怎么接、怎么选、哪些场景值得用。

Gemini 3.1 系列:三个模型,三种定位

Gemini 3.1 不是一个模型,是三个:

模型模型 ID输入价格输出价格适合场景
Gemini 3.1 Progoogle/gemini-3.1-pro-preview$2/M$12/M复杂推理、长文档、Agent
Gemini 3.1 Flashgoogle/gemini-3.1-flash-image-preview$0.5/M$3/M图片理解、多模态任务
Gemini 3.1 Flash-Litegoogle/gemini-3.1-flash-lite-preview$0.25/M$1.5/M高频分类、摘要、问答

Flash-Lite 的输入成本是 Pro 的 1/8。不需要深度推理的任务,没必要用 Pro。

核心能力速查

指标Gemini 3.1 ProGPT-5.4Claude Opus 4.6
ARC-AGI-277.1%52%68%
SWE-Bench Verified80.6%57.7%82.1%
上下文窗口1M token1M token200K token
图片理解原生支持支持支持
视频理解原生支持不支持不支持
输出价格$12/M$15/M$15/M

抽象推理是 Gemini 3.1 Pro 的强项。复杂逻辑推导、数学证明、超长文档——这些场景它比 GPT-5.4 便宜 20% 还更准。

编程任务另说:Claude Opus 4.6 SWE-Bench 82.1% 排第一,GPT-5.4 次之,Gemini 3.1 Pro 第三。

完整模型横评见2026 大模型排行榜与选型指南

国内接入方案

直连 Google API 在国内不通。三条路:

注册 ofox.ai → 充值 → 拿到 API Key,然后把 base_url 改成 https://api.ofox.ai/v1,模型名改成 google/gemini-3.1-pro-preview。就这两步,现有 OpenAI SDK 代码不用动其他地方。

需要 Gemini 特有功能(视频理解、原生 grounding)的话,用 Gemini 原生端点:https://api.ofox.ai/gemini,认证头改为 x-goog-api-key

自建代理需要海外 VPS,维护成本高,不推荐个人开发者。

用 OpenAI SDK 调用 Gemini 3.1 Pro

改两个参数:

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",  # ofox.ai API Key
    base_url="https://api.ofox.ai/v1"
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "分析这段代码的时间复杂度"}]
)

Node.js 同理,把 baseURL 改掉就行。

四个真实使用场景

超长文档分析

1M token 上下文是 Gemini 3.1 Pro 的核心优势。500 页法律合同、完整代码仓库、一年财报——一次性塞进去,不用分块。

实测:把一个 15 万行的 Python 项目完整传入,找出所有潜在 SQL 注入风险,准确率比分块处理高 23%。原因是它能看到跨文件的调用关系,分块处理会丢失这部分上下文。

视频内容理解

GPT-5.4 和 Claude 都不支持原生视频输入,这是 Gemini 独有的。传入产品演示视频生成功能说明文档,或者传入监控录像标注关键事件时间点。

复杂推理任务

ARC-AGI-2 测的是”从未见过的规律推导”,77.1% 在这个基准上是目前最高的。数学证明辅助、科研文献分析、复杂业务规则推导——这类任务 Gemini 3.1 Pro 比其他旗舰模型更稳。

多模态数据处理

图片 + 文字 + 表格混合输入。产品截图 + 用户反馈文本生成改进建议,财务报表图片直接提取数字做分析。

成本估算

以每天 100 次 API 调用为例,每次平均 2000 token 输入 + 500 token 输出:

模型日成本月成本
Gemini 3.1 Flash-Lite$0.058$1.74
Gemini 3.1 Flash$0.115$3.45
Gemini 3.1 Pro$0.46$13.8
GPT-5.4(对比)$0.575$17.25
Claude Opus 4.6(对比)$0.575$17.25

Gemini 3.1 Pro 比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%,旗舰模型里定价算合理的。

三个旗舰模型怎么选

  • 超长文档(>200K token)、视频理解、抽象推理:Gemini 3.1 Pro
  • 综合均衡、Computer Use、OpenAI 生态工具链:GPT-5.4
  • 代码工程、精确遵循复杂指令:Claude Opus 4.6

GPT-5.4 接入方式见GPT-5.4 API 国内调用指南,Claude 接入见Claude API 国内怎么用

常见报错

403 / PERMISSION_DENIED:模型 ID 写错了。检查是否完整写成 google/gemini-3.1-pro-preview

429 RESOURCE_EXHAUSTED:超速率限制。ofox.ai 标准 200 RPM,加指数退避重试。

context_length_exceeded:输入超过 1M token。Gemini 3.1 Pro 的 1M 上下文已经是目前最大的,超了只能分块。

更多报错排查见AI API 报错大全

小结

Gemini 3.1 Pro 抽象推理目前最强,1M 上下文 + 原生视频理解是它的差异化。国内接入改两行代码,价格比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%。

代码工程首选 Claude Opus 4.6,超长文档或视频理解选 Gemini 3.1 Pro。