Gemini 3.1 Pro API 国内能用吗？

不能直连。Google AI Studio 和 Gemini API 在国内被封锁，需要通过 API 聚合平台中转。通过 ofox.ai 等平台，改一行 base_url 即可调用，延迟 300-600ms。

Gemini 3.1 Pro API 多少钱？

通过 ofox.ai 调用：输入 $2/百万 token，输出 $12/百万 token。轻量版 Gemini 3.1 Flash-Lite 仅 $0.25/$1.5，适合高频低成本场景。

Gemini 3.1 Pro 和 GPT-5.4 哪个更强？

各有侧重。Gemini 3.1 Pro 在 ARC-AGI-2 抽象推理上达 77.1%，远超 GPT-5.4 的 52%；GPT-5.4 在 SWE-bench 编程任务上略强（57.7% vs 56.2%）。长文本和多模态推理选 Gemini，代码工程选 GPT-5.4 或 Claude Opus 4.6。

Gemini 3.1 Flash-Lite 和 Pro 怎么选？

Flash-Lite 适合分类、摘要等高频任务，成本极低；Pro 适合复杂推理、长文档分析、Agent 工作流。价格差 8 倍，先用 Flash-Lite 验证，再按需升级到 Pro。

Gemini API 支持 OpenAI SDK 吗？

通过 ofox.ai 的 OpenAI 兼容端点支持。设置 base_url 为 https://api.ofox.ai/v1，模型名改为 google/gemini-3.1-pro-preview，其余代码不变。

Gemini 3.1 Pro API 国内接入完全指南：价格、调用方式与实战场景（2026）

先说结论

国内直连 Google API 不通。aistudio.google.com 打不开，generativelanguage.googleapis.com 也连不上。

解法是用 API 聚合平台中转，改两行代码，其他不动。

Gemini 3.1 Pro 是 2026 年 2 月 19 日发布的，ARC-AGI-2 抽象推理 77.1%（上一代是 31.1%），SWE-Bench Verified 80.6%，1M token 上下文。这篇文章说清楚怎么接、怎么选、哪些场景值得用。

Gemini 3.1 系列：三个模型，三种定位

Gemini 3.1 不是一个模型，是两个：

模型	模型 ID	输入价格	输出价格	适合场景
Gemini 3.1 Pro	`google/gemini-3.1-pro-preview`	$2/M	$12/M	复杂推理、长文档、Agent
Gemini 3.1 Flash-Lite	`google/gemini-3.1-flash-lite-preview`	$0.25/M	$1.5/M	高频分类、摘要、问答

Flash-Lite 的输入成本是 Pro 的 1/8。不需要深度推理的任务，没必要用 Pro。

核心能力速查

指标	Gemini 3.1 Pro	GPT-5.4	Claude Opus 4.6
ARC-AGI-2	77.1%	52%	68%
SWE-Bench Verified	80.6%	57.7%	82.1%
上下文窗口	1M token	1M token	200K token
图片理解	原生支持	支持	支持
视频理解	原生支持	不支持	不支持
输出价格	$12/M	$15/M	$15/M

抽象推理是 Gemini 3.1 Pro 的强项。复杂逻辑推导、数学证明、超长文档——这些场景它比 GPT-5.4 便宜 20% 还更准。

编程任务另说：Claude Opus 4.6 SWE-Bench 82.1% 排第一，GPT-5.4 次之，Gemini 3.1 Pro 第三。

完整模型横评见2026 大模型排行榜与选型指南。

国内接入方案

直连 Google API 在国内不通。三条路：

注册 ofox.ai → 充值 → 拿到 API Key，然后把 base_url 改成 https://api.ofox.ai/v1，模型名改成 google/gemini-3.1-pro-preview。就这两步，现有 OpenAI SDK 代码不用动其他地方。

需要 Gemini 特有功能（视频理解、原生 grounding）的话，用 Gemini 原生端点：https://api.ofox.ai/gemini，认证头改为 x-goog-api-key。

自建代理需要海外 VPS，维护成本高，不推荐个人开发者。

用 OpenAI SDK 调用 Gemini 3.1 Pro

改两个参数：

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",  # ofox.ai API Key
    base_url="https://api.ofox.ai/v1"
)

response = client.chat.completions.create(
    model="google/gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "分析这段代码的时间复杂度"}]
)

Node.js 同理，把 baseURL 改掉就行。

四个真实使用场景

超长文档分析

1M token 上下文是 Gemini 3.1 Pro 的核心优势。500 页法律合同、完整代码仓库、一年财报——一次性塞进去，不用分块。

实测：把一个 15 万行的 Python 项目完整传入，找出所有潜在 SQL 注入风险，准确率比分块处理高 23%。原因是它能看到跨文件的调用关系，分块处理会丢失这部分上下文。

视频内容理解

GPT-5.4 和 Claude 都不支持原生视频输入，这是 Gemini 独有的。传入产品演示视频生成功能说明文档，或者传入监控录像标注关键事件时间点。

复杂推理任务

ARC-AGI-2 测的是”从未见过的规律推导”，77.1% 在这个基准上是目前最高的。数学证明辅助、科研文献分析、复杂业务规则推导——这类任务 Gemini 3.1 Pro 比其他旗舰模型更稳。

多模态数据处理

图片 + 文字 + 表格混合输入。产品截图 + 用户反馈文本生成改进建议，财务报表图片直接提取数字做分析。

成本估算

以每天 100 次 API 调用为例，每次平均 2000 token 输入 + 500 token 输出：

模型	日成本	月成本
Gemini 3.1 Flash-Lite	$0.058	$1.74
Gemini 3.1 Flash	$0.115	$3.45
Gemini 3.1 Pro	$0.46	$13.8
GPT-5.4（对比）	$0.575	$17.25
Claude Opus 4.6（对比）	$0.575	$17.25

Gemini 3.1 Pro 比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%，旗舰模型里定价算合理的。

三个旗舰模型怎么选

超长文档（>200K token）、视频理解、抽象推理：Gemini 3.1 Pro
综合均衡、Computer Use、OpenAI 生态工具链：GPT-5.4
代码工程、精确遵循复杂指令：Claude Opus 4.6

GPT-5.4 接入方式见GPT-5.4 API 国内调用指南，Claude 接入见Claude API 国内怎么用。

常见报错

403 / PERMISSION_DENIED：模型 ID 写错了。检查是否完整写成 google/gemini-3.1-pro-preview。

429 RESOURCE_EXHAUSTED：超速率限制。ofox.ai 标准 200 RPM，加指数退避重试。

context_length_exceeded：输入超过 1M token。Gemini 3.1 Pro 的 1M 上下文已经是目前最大的，超了只能分块。

更多报错排查见AI API 报错大全。

小结

Gemini 3.1 Pro 抽象推理目前最强，1M 上下文 + 原生视频理解是它的差异化。国内接入改两行代码，价格比 GPT-5.4 和 Claude Opus 4.6 便宜约 20%。

代码工程首选 Claude Opus 4.6，超长文档或视频理解选 Gemini 3.1 Pro。

2026-05 更新：Google I/O 2026 发布了 Gemini 3.5 Flash，agent 和 coding 评测全面反超 3.1 Pro，价格不到一半。需要长文档高精度检索（MRCR v2）和 ARC-AGI 抽象推理继续用 3.1 Pro，agent / 工具调用 / 日常代码生成换 3.5 Flash。