Kimi / MiniMax 免费额度实测:$1 能跑多少 token?两大国产模型免费方案全拆解(2026)
TL;DR — Kimi API 充值 $1 才能开始调用,累计 $5 送 $5 代金券;MiniMax M2.7 按量付费 $0.30/百万 token,是 Kimi K2.5 的一半价格。两家都没有永久免费 API 层,但 MiniMax 起步成本更低。通过 ofox.ai 可以用支付宝统一接入两家模型。
先说结论
选 AI API 时,开发者第一个问题往往不是”哪个模型最强”,而是”我能不能先免费跑通再说”。
Kimi 和 MiniMax 是 2026 年国内开发者用得最多的两个模型系列。两家定价都算透明,但”免费额度”这件事,官方文档写得比较分散,容易踩坑。下面把两家的方案拆开来讲,顺便算一下 $1 预算能干多少事。
Kimi API 免费方案
网页版:真正免费,但不能编程调用
kimi.com 的网页界面可以免费使用 Kimi K2 模型,官方说明是”无 token 或时间限制”。手动测试、日常对话、文档处理完全够用。
但有一个硬限制:不能程序化调用。没法用 SDK 或 curl 批量发请求,也没法集成到自己的应用里。
API 层:$1 起步,$5 送 $5
Kimi 官方 API(platform.moonshot.ai)的规则:
- 最低充值 $1 才能激活 API 调用权限
- 累计充值达到 $5,平台赠送 $5 代金券
- 代金券不计入累计充值金额,不能用来升 Tier
花 $5,实际上有 $10 可用。跑通测试流程够了。
Kimi API 定价(2026 年 4 月)
| 模型 | 输入价格 | 输出价格 | 缓存命中 |
|---|---|---|---|
| Kimi K2.5(多模态) | $0.60/M | $3.00/M | $0.15/M |
| Kimi K2 | $0.60/M | $2.50/M | $0.15/M |
| Kimi K2 Turbo | $1.15/M | $8.00/M | — |
缓存命中价格 $0.15/M,比正常输入便宜 75%。请求里有大量重复的 system prompt 或上下文,开启缓存能省不少。
$1 能跑多少?
以 Kimi K2.5 为例:
- 纯输入:$1 ÷ $0.60/M = 约 167 万 token(相当于 100 万汉字)
- 纯输出:$1 ÷ $3.00/M = 约 33 万 token
- 典型对话(输入:输出 = 3:1):约 100 万 token 总量
跑通一个 RAG 原型、测试 function calling、批量处理几百份文档,$1 够用。
Rate Limit 分级
Kimi 按累计充值金额分 Tier,Tier 越高并发和 RPM 越大:
| Tier | 累计充值 | 并发数 | RPM |
|---|---|---|---|
| Tier 0 | $1 | 低 | 低 |
| Tier 1 | $10 | 中 | 中 |
| Tier 5 | $3,000+ | 高 | 高 |
测试阶段 Tier 0 够用,生产环境需要充值到更高 Tier。
MiniMax API 免费方案
新用户赠送额度
MiniMax 官方平台(platform.minimax.io)对新注册用户有免费 token 赠送,具体金额以注册时平台显示为准,会随活动调整。注册后第一件事是去「账户余额」页面确认当前赠送金额。
按量付费:比 Kimi 便宜一半
MiniMax 的按量付费定价(2026 年 4 月):
| 模型 | 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|---|
| MiniMax M2.7 | $0.30/M | $1.20/M | $0.06/M |
| MiniMax M2.7 Highspeed | $0.60/M | $2.40/M | $0.06/M |
| MiniMax M2.5 | $0.30/M | $1.20/M | $0.06/M |
M2.7 标准版输入价格是 Kimi K2.5 的一半,输出价格低 60%。大量输入的场景(文档分析、RAG 检索),MiniMax 的成本优势很明显。
$1 能跑多少?
以 MiniMax M2.7 为例:
- 纯输入:$1 ÷ $0.30/M = 约 333 万 token
- 纯输出:$1 ÷ $1.20/M = 约 83 万 token
- 典型对话(输入:输出 = 3:1):约 200 万 token 总量
同样 $1,MiniMax 能处理的 token 量约是 Kimi K2.5 的 2 倍。
Token Plan 订阅
用量稳定的话,MiniMax 还有月度订阅方案:
| 方案 | 价格 | M2.7 请求配额(5小时内) |
|---|---|---|
| Starter | $10/月 | 1,500 次 |
| Plus | $20/月 | 4,500 次 |
| Max | $50/月 | 15,000 次 |
订阅方案适合稳定调用量,按量付费适合测试和不规律使用。
两家对比
| 维度 | Kimi K2.5 | MiniMax M2.7 |
|---|---|---|
| 起步门槛 | 充值 $1 | 新用户赠送额度 |
| 输入价格 | $0.60/M | $0.30/M |
| 输出价格 | $3.00/M | $1.20/M |
| $1 能处理的输入 | ~167 万 token | ~333 万 token |
| 缓存价格 | $0.15/M | $0.06/M |
| 多模态支持 | 图片+视频(K2.5/K2.6) | 文本为主(M2.7) |
| 上下文窗口 | 256K | 204K |
纯文本处理场景,MiniMax 性价比更高。需要多模态(图片/视频理解)的场景,Kimi K2.5 或 K2.6 是唯一选择。
通过 ofox 统一接入
同时用 Kimi 和 MiniMax,分别注册两个平台、管理两套 API Key 比较麻烦。ofox.ai 同时上架了两家的全系模型,一个 Key 搞定:
Kimi 模型:moonshotai/kimi-k2.6(最新,支持视频理解)、moonshotai/kimi-k2.5(多模态)
MiniMax 模型:minimax/minimax-m2.7、minimax/minimax-m2.7-highspeed、minimax/minimax-m2.5、minimax/minimax-m2.5-lightning
from openai import OpenAI
client = OpenAI(
api_key="your-ofox-api-key",
base_url="https://api.ofox.ai/v1"
)
response = client.chat.completions.create(
model="minimax/minimax-m2.7", # 或 moonshotai/kimi-k2.5
messages=[{"role": "user", "content": "你好"}]
)
ofox 支持支付宝充值,省去境外支付的麻烦。模型列表和价格见 ofox.ai/zh/models。
怎么最大化免费额度
开启 prompt caching:Kimi 和 MiniMax 都支持缓存。system prompt 超过 1000 token 的话,把它放在消息列表最前面,后续请求命中缓存后价格降 75-80%。
先用网页版验证思路:Kimi 网页版完全免费,适合在花钱调 API 之前先验证 prompt 效果。MiniMax 也有网页版(hailuo.ai),同样可以免费体验。
选对模型:不是所有任务都需要旗舰模型。MiniMax M2.5 Lightning 和 M2.7 Highspeed 在速度和价格上有不同取舍,简单任务用轻量版能省一半以上。
控制并发:Kimi Tier 0 的并发限制比较严,建议用队列控制并发数,加指数退避重试,避免 429 报错浪费配额。


