DeepSeek 免费额度能用多久？

DeepSeek 注册后赠送免费额度，日常轻度使用（每天几十次对话）通常可以撑几周。额度用完后按量付费，价格在国产模型中属于最便宜的一档。

Google Gemini 免费 Tier 有什么限制？

Gemini API 免费 Tier 有 RPM（每分钟请求数）和 TPM（每分钟 token 数）限制，不适合高并发生产环境。但个人开发和测试完全够用，且没有总量上限，理论上可以一直免费用下去。

Groq 真的完全免费吗？

Groq 提供免费的 API 调用额度，支持 Llama、Mixtral 等开源模型。有速率限制（RPM/TPD），适合开发测试和轻度使用。重度使用需要升级付费计划。

本地跑 Ollama 需要什么配置？

最低 8GB 内存可以跑 7B 参数的小模型（如 Llama 3.3 8B、Qwen2.5 7B）。如果要跑 70B 级别的模型，建议 32GB+ 内存或有独立显卡（NVIDIA 16GB+ 显存）。Mac M 系列芯片对 Ollama 支持很好，16GB 统一内存就能流畅跑 14B 模型。

这些免费方案能用于生产环境吗？

不建议。免费方案普遍有速率限制、不保证 SLA、可能随时调整政策。生产环境建议用付费 API（如 Ofox 聚合平台），保证稳定性和响应速度。免费方案适合开发、测试、学习和个人项目。

免费额度用完了怎么办？

推荐混合策略：多个免费方案轮换使用延长免费期；确认效果后过渡到付费方案。付费方案中，DeepSeek V3.2 价格极低（约 ¥2/百万输入 token），日常使用月成本可控制在 30 元以内。

Ofox 注册送的免费额度能用什么模型？

Ofox 注册赠送的免费额度不限模型，GPT、Claude、Gemini、DeepSeek 等平台上所有模型都可以使用。这是它和其他免费方案的最大区别——一份额度覆盖 100+ 模型。

OpenClaw 怎么配置免费 API？

运行 openclaw onboard 进入配置向导，填入 API 提供商的 base_url 和 API Key 即可。例如用 DeepSeek：base_url 填 https://api.deepseek.com，model 填 deepseek-chat。不同方案只是这两个参数不同。

免费方案的模型效果和付费的差很多吗？

不一定。DeepSeek V3.2 免费额度内的效果和付费完全一样；Gemini 3 Flash 免费 Tier 也是同一个模型。差异主要在速率限制和稳定性，而非模型能力本身。Groq 上的 Llama 3.3 70B 效果也接近 GPT-4o 水平。

有没有办法一直免费用下去？

理论上可以。Gemini 免费 Tier 没有总量上限，Ollama 本地部署完全免费。但如果你需要高质量模型（Claude Opus、GPT-5.4）处理复杂任务，这些模型目前没有免费方案，需要付费。务实的建议是：简单任务用免费方案，复杂任务用付费模型，整体成本可以控制得很低。

Mar 17, 2026

OpenClaw 免费 API 方案：零成本跑通 AI Agent 的 5 种方法（2026）

Q: OpenClaw 本身要花钱吗？

不要。OpenClaw 是完全开源免费的软件，安装和使用不收任何费用。花钱的部分是后端 AI 模型的 API 调用——但通过本文介绍的 5 种方案，你可以零成本或极低成本跑通。

摘要

OpenClaw 是 2026 年最火的开源 AI Agent（GitHub 25 万+ Star），软件本身完全免费——但它需要调用 AI 模型的 API，这部分通常要花钱。好消息是，至少有 5 种方案可以让你零成本跑通 OpenClaw：DeepSeek 免费额度、Google Gemini 免费 Tier、Ofox 注册赠送额度、Groq 免费调用、本地部署 Ollama。本文逐一拆解每种方案的配置步骤、适用场景和限制，附横向对比表格，帮你找到最适合自己的免费组合。

先搞清楚：OpenClaw 免费，API 不免费
方案一：DeepSeek 免费额度
方案二：Google Gemini 免费 Tier
方案三：Ofox 注册赠送额度
方案四：Groq 免费调用
方案五：本地部署 Ollama
5 种方案横向对比
混合策略：免费 + 付费怎么搭配
从免费到付费：什么时候该花钱
常见问题（FAQ）
总结
参考资料

先搞清楚：OpenClaw 免费，API 不免费

很多人第一次接触 OpenClaw 会困惑：不是说开源免费吗，怎么还要花钱？

这里有个关键区别——OpenClaw 是执行框架，AI 模型是大脑。框架免费，大脑要钱。

打个比方：OpenClaw 像一台没装 SIM 卡的手机，硬件免费送你，但打电话需要买套餐。不同的 API 提供商就是不同的运营商，有的送免费通话时长，有的按分钟计费。

所以问题变成了：有没有”免费套餐”？

有，而且不止一种。

方案一：DeepSeek 免费额度

推荐指数：⭐⭐⭐⭐⭐（首选方案）

DeepSeek 是目前国产模型中综合效果最好的，注册即送免费 API 额度。对于 OpenClaw 的日常使用场景，这份额度非常实用。

配置步骤

前往 DeepSeek 开放平台注册账号
在控制台创建 API Key
配置 OpenClaw：

openclaw onboard
# 选择 Custom API Provider
# base_url: https://api.deepseek.com
# API Key: 填入你的 Key
# model: deepseek-chat

或者直接编辑 ~/.openclaw/config.yaml：

ai:
  provider: custom
  base_url: https://api.deepseek.com
  api_key: sk-xxxxx
  model: deepseek-chat

优势

中文理解和生成能力在国产模型中最强
国内直连，延迟低（< 200ms）
API 兼容 OpenAI 协议，OpenClaw 原生支持
代码能力接近 GPT-4o 水平

限制

免费额度有上限，用完按量计费（但价格极低，约 ¥2/百万输入 token）
高峰期可能排队
只有 DeepSeek 自家模型可用

适合谁

刚接触 OpenClaw 的新手、主要处理中文任务的用户、预算敏感的个人开发者。

方案二：Google Gemini 免费 Tier

推荐指数：⭐⭐⭐⭐⭐（长期免费首选）

Google 的 Gemini API 提供免费 Tier，最大的优势是没有总量上限——只要你不超过每分钟的速率限制，理论上可以一直免费用。

配置步骤

前往 Google AI Studio 获取 API Key
配置 OpenClaw：

openclaw onboard
# 选择 Custom API Provider
# base_url: https://generativelanguage.googleapis.com/v1beta/openai
# API Key: 填入你的 Key
# model: gemini-2.0-flash

免费 Tier 额度参考

模型	免费 RPM	免费 TPM	适用场景
Gemini 3 Flash	15	100 万	日常对话、简单任务
Gemini 3 Pro	2	32,000	复杂推理（慢但免费）
Gemini 3.1 Flash-Lite	30	100 万	批量简单任务

RPM = 每分钟请求数，TPM = 每分钟 token 数

优势

无总量限制，不会”用完”
Gemini Flash 速度极快
多模态支持（图片、视频理解）
超长上下文（Gemini 3 Pro 支持 200 万 token）

限制

速率限制较严（免费 Tier 的 RPM 不高）
国内访问可能有延迟
中文能力不如 DeepSeek
免费 Tier 的请求数据可能被 Google 用于模型改进

适合谁

需要长期免费方案的个人用户、英文为主的任务场景、需要多模态能力的项目。

方案三：Ofox 注册赠送额度

推荐指数：⭐⭐⭐⭐（模型最全）

Ofox 是 API 聚合平台，注册赠送免费额度。和前两种方案最大的区别是：一份额度可以用所有模型——GPT、Claude、Gemini、DeepSeek，100+ 模型随便切换。

配置步骤

前往 Ofox 注册账号，获取 API Key
配置 OpenClaw：

openclaw onboard
# 选择 Custom API Provider
# base_url: https://api.ofox.ai/v1
# API Key: 填入你的 Ofox Key
# model: claude-sonnet-4-6（或任意支持的模型）

优势

一个 Key 用所有模型，不用到处注册
可以在免费额度内体验 Claude、GPT 等海外模型
国内阿里云/火山云加速节点，延迟低
人民币结算，支付方便
OpenAI 兼容协议，配置零门槛

限制

免费额度有限，用完需充值
依赖第三方平台

适合谁

想一次体验多种模型的用户、需要使用海外模型（Claude/GPT）的开发者、不想到处注册账号的懒人。

方案四：Groq 免费调用

推荐指数：⭐⭐⭐⭐（速度之王）

Groq 是做 AI 推理加速芯片的公司，提供免费的 API 调用。它的杀手锏是速度——Groq 的推理速度是普通 GPU 方案的 10 倍以上，体感上几乎是瞬间出结果。

配置步骤

前往 Groq Console 注册账号
创建 API Key
配置 OpenClaw：

openclaw onboard
# 选择 Custom API Provider
# base_url: https://api.groq.com/openai/v1
# API Key: 填入你的 Groq Key
# model: llama-3.3-70b-versatile

免费额度参考

模型	免费 RPM	每日 token 限制	推理速度
Llama 3.3 70B	30	14,400 请求/天	极快
Mixtral 8x7B	30	14,400 请求/天	极快
Gemma 2 9B	30	14,400 请求/天	极快

优势

推理速度碾压所有云 API（token 生成速度 500+ token/s）
Llama 3.3 70B 效果接近 GPT-4o
免费额度对个人使用足够

限制

只支持开源模型（无 GPT、Claude、Gemini）
有每日请求次数限制
国内直连可能有延迟
模型选择相对有限

适合谁

对响应速度有极致要求的场景、开源模型拥护者、需要实时交互体验的项目。

方案五：本地部署 Ollama

推荐指数：⭐⭐⭐⭐（完全离线免费）

终极方案——把模型跑在自己电脑上，彻底告别 API 费用。Ollama 让本地运行大模型变得和安装 App 一样简单。

配置步骤

安装 Ollama：

# macOS
brew install ollama

# Linux
curl -fsSL https://ollama.com/install.sh | sh

下载模型：

# 推荐：Qwen2.5 14B（中文最好的本地模型）
ollama pull qwen2.5:14b

# 或者：Llama 3.3 8B（英文全能）
ollama pull llama3.3:8b

启动 Ollama 并配置 OpenClaw：

ollama serve  # Ollama 默认监听 http://localhost:11434

openclaw onboard
# 选择 Custom API Provider
# base_url: http://localhost:11434/v1
# API Key: ollama（随便填，本地不校验）
# model: qwen2.5:14b

模型	参数量	最低内存	效果	中文能力
Qwen2.5 7B	7B	8GB	中	强
Qwen2.5 14B	14B	16GB	中高	强
Llama 3.3 8B	8B	8GB	中	中
Llama 3.3 70B	70B	48GB	高	中高
DeepSeek Coder V2 Lite	16B	16GB	中高（代码）	强

优势

永久免费，无任何 API 费用
完全离线，断网也能用
隐私最好，数据不出本机
无速率限制，想跑多少跑多少

限制

依赖硬件配置，低配电脑只能跑小模型
小模型效果和云端大模型差距明显
占用本机计算资源，跑模型时电脑会变慢
不支持 GPT、Claude 等闭源模型

适合谁

有高配电脑（尤其是 Mac M 系列）的用户、对数据隐私有严格要求的场景、想离线使用 AI Agent 的人。

5 种方案横向对比

对比维度	DeepSeek 免费额度	Gemini 免费 Tier	Ofox 注册赠送	Groq 免费	Ollama 本地
可用模型	DeepSeek 系列	Gemini 系列	100+ 全模型	开源模型	开源模型
额度上限	有限（注册赠送）	无总量限制	有限（注册赠送）	有日限制	无限
速率限制	高峰期排队	RPM 较低	正常	RPM 30	无限制
配置难度	简单	简单	简单	简单	中等（需下载模型）
国内延迟	< 200ms	中等	300-800ms	中等	0ms（本地）
中文效果	最强	中等	取决于模型	中等	取决于模型
能否长期免费	额度用完需付费	可以	额度用完需付费	限制内可以	永久免费
硬件要求	无	无	无	无	8GB+ 内存
适合阶段	入门首选	长期开发	多模型体验	实时交互	离线/隐私

混合策略：免费 + 付费怎么搭配

免费 API 混合策略：按场景选择方案和从免费到付费的过渡路径

聪明的做法不是只用一种方案，而是组合使用，让免费额度覆盖尽可能多的场景。

纯免费组合（适合个人/学习）

日常中文对话 → DeepSeek 免费额度（效果好）
简单英文任务 → Gemini 免费 Tier（无限量）
需要快速响应 → Groq（速度快）
离线或隐私场景 → Ollama 本地（零成本）

这套组合可以覆盖 90% 的日常使用场景，完全不花钱。

免费 + 低成本组合（适合日常办公）

日常任务 → Gemini Flash 免费 Tier（不限量，够用）
中文重任务 → DeepSeek V3.2（免费额度 + 按量付费，极便宜）
复杂推理 → Ofox 调用 Claude Sonnet（注册赠送额度 + 按需充值）

这套组合月成本通常在 30 元以内，大部分场景不花钱。

OpenClaw 多模型配置示例

OpenClaw 支持 fallback 模型链，自动在多个模型间切换：

ai:
  # 主模型：Gemini 免费 Tier（日常使用）
  provider: custom
  base_url: https://generativelanguage.googleapis.com/v1beta/openai
  api_key: your-gemini-key
  model: gemini-2.0-flash

  # Fallback：DeepSeek（Gemini 限流时切换）
  fallback:
    - provider: custom
      base_url: https://api.deepseek.com
      api_key: your-deepseek-key
      model: deepseek-chat

从免费到付费：什么时候该花钱

免费方案很香，但它有明确的天花板。以下信号出现时，说明该考虑付费了：

该升级的信号

频繁触发速率限制：Gemini 免费 Tier 的 15 RPM 已经不够用了
任务复杂度上升：需要 Claude Opus 或 GPT-5.4 级别的推理能力
开始用于生产：免费方案没有 SLA 保障，宕机没人管
团队多人使用：免费额度被多人分摊，消耗加快
需要稳定性：免费政策随时可能变化

付费方案推荐路径

阶段 1（免费）→ DeepSeek + Gemini 免费 Tier，零成本跑通
阶段 2（低成本）→ DeepSeek 按量付费，月 30 元以内
阶段 3（日常办公）→ Ofox 聚合平台，混合模型策略，月 100-200 元
阶段 4（团队/生产）→ Ofox 团队版，统一管理，按团队规模付费

每个阶段都可以长期停留，不必急着升级。关键是根据自己的实际需求选择——够用就行，别为用不到的能力买单。

成本控制核心原则

80/20 法则：80% 的任务用便宜模型就够了，只有 20% 需要旗舰模型
模型分级：简单任务用 DeepSeek/Gemini Flash，复杂任务才上 Claude/GPT
设置预算上限：OpenClaw 支持配置 token 预算，避免 Agent 循环调用导致成本失控
定期复盘：每月检查 API 用量，砍掉不必要的高成本调用

常见问题（FAQ）

OpenClaw 本身要花钱吗？

不要。OpenClaw 是完全开源免费的软件。需要花钱的是后端 AI 模型的 API 调用费，但通过本文的 5 种方案可以零成本或极低成本使用。

5 种免费方案该优先用哪个？

推荐优先级：

DeepSeek 免费额度——中文最强、配置最简单、国内直连
Gemini 免费 Tier——无总量限制、可以长期免费
Ofox 注册赠送——模型最全、一个 Key 用所有
Groq——速度最快、适合需要实时响应的场景
Ollama 本地——完全离线、隐私最好、永久免费

免费额度用完了怎么过渡？

最平滑的路径：先用多个免费方案轮换延长免费期，确认哪个模型最适合自己的场景后，对应充值。DeepSeek 按量付费极便宜（¥2/百万输入 token），月成本通常不超过 30 元。如果需要海外模型，通过 Ofox 充值即可继续使用。

Gemini 免费 Tier 能一直免费吗？

目前可以。Google Gemini 免费 Tier 没有总量上限，只有速率限制（RPM/TPM）。只要不超过每分钟的请求限制，理论上可以永久免费使用。但 Google 有权调整政策，建议不要完全依赖单一方案。

本地跑 Ollama 效果和云端 API 差多少？

差距取决于你的硬件和选择的模型。14B 参数的本地模型（如 Qwen2.5 14B）效果大约相当于 GPT-3.5 到 GPT-4 之间。70B 参数模型效果接近 GPT-4o，但需要 48GB+ 内存。总体来说，本地模型在简单对话和基础编程上够用，复杂推理仍有差距。

能把这些免费方案同时配在 OpenClaw 里吗？

可以。OpenClaw 支持 fallback 模型链，你可以设置主模型为 Gemini 免费 Tier，备用模型为 DeepSeek，本地模型为最后兜底。当主模型触发速率限制时，自动切换到备用模型，实现无感降级。

这些方案有安全风险吗？

云端 API 方案（DeepSeek、Gemini、Ofox、Groq）的数据会经过第三方服务器，敏感数据需要注意。Ollama 本地部署数据完全不出机器，安全性最高。如果处理敏感信息，建议本地模型处理敏感部分，云端模型处理非敏感部分。

企业团队能用免费方案吗？

不建议。企业生产环境需要 SLA 保障、稳定性和技术支持，免费方案都不提供这些。建议企业用户通过 Ofox 等平台统一管理 API 调用，支持团队成员管理、用量统计、预算控制。

总结

OpenClaw 是免费的，API 调用也可以是免费的——关键是选对方案。

快速行动清单：

5 分钟跑通：注册 DeepSeek，拿到 API Key，配置 OpenClaw，开始对话
长期免费：再注册 Gemini API，配置为 fallback 模型（无限量免费）
体验海外模型：注册 Ofox，用赠送额度试试 Claude 和 GPT
极致速度：注册 Groq，体验 500+ token/s 的推理速度
离线备用：装个 Ollama，下载 Qwen2.5，断网也能用

这五步全部做完，你就拥有了一个覆盖全场景的免费 AI Agent 方案。之后需不需要付费、什么时候付费，完全取决于你的实际需求。

别被”AI 很贵”的印象吓到——2026 年，跑通一个 AI Agent 的门槛已经低到零。

参考资料

OpenClaw 官方文档 - 安装、配置、API 参考
DeepSeek 开放平台 - 注册获取免费 API Key
Google AI Studio - Gemini API 免费 Tier
Ofox AI API 平台 - 聚合 100+ 模型，注册赠送免费额度
Groq Console - 高速推理免费 API
Ollama 官网 - 本地大模型部署
OpenClaw GitHub - 源码和社区讨论

OpenClaw 免费 API 方案：零成本跑通 AI Agent 的 5 种方法（2026）

摘要

目录

先搞清楚：OpenClaw 免费，API 不免费

方案一：DeepSeek 免费额度

配置步骤

优势

限制

适合谁

方案二：Google Gemini 免费 Tier

配置步骤

免费 Tier 额度参考

优势

限制

适合谁

方案三：Ofox 注册赠送额度

配置步骤

优势

限制

适合谁

方案四：Groq 免费调用

配置步骤

免费额度参考

优势

限制

适合谁

方案五：本地部署 Ollama

配置步骤

推荐本地模型

优势

限制

适合谁

5 种方案横向对比

混合策略：免费 + 付费怎么搭配

纯免费组合（适合个人/学习）

免费 + 低成本组合（适合日常办公）

OpenClaw 多模型配置示例

从免费到付费：什么时候该花钱

该升级的信号

付费方案推荐路径

成本控制核心原则

常见问题（FAQ）

OpenClaw 本身要花钱吗？

5 种免费方案该优先用哪个？

免费额度用完了怎么过渡？

Gemini 免费 Tier 能一直免费吗？

本地跑 Ollama 效果和云端 API 差多少？

能把这些免费方案同时配在 OpenClaw 里吗？

这些方案有安全风险吗？

企业团队能用免费方案吗？

总结

参考资料