Kimi / MiniMax 免费额度实测:$1 能跑多少 token?两大国产模型免费方案全拆解(2026)

Kimi / MiniMax 免费额度实测:$1 能跑多少 token?两大国产模型免费方案全拆解(2026)

TL;DR — Kimi API 充值 $1 才能开始调用,累计 $5 送 $5 代金券;MiniMax M2.7 按量付费 $0.30/百万 token,是 Kimi K2.5 的一半价格。两家都没有永久免费 API 层,但 MiniMax 起步成本更低。通过 ofox.ai 可以用支付宝统一接入两家模型。

先说结论

选 AI API 时,开发者第一个问题往往不是”哪个模型最强”,而是”我能不能先免费跑通再说”。

Kimi 和 MiniMax 是 2026 年国内开发者用得最多的两个模型系列。两家定价都算透明,但”免费额度”这件事,官方文档写得比较分散,容易踩坑。下面把两家的方案拆开来讲,顺便算一下 $1 预算能干多少事。

Kimi API 免费方案

网页版:真正免费,但不能编程调用

kimi.com 的网页界面可以免费使用 Kimi K2 模型,官方说明是”无 token 或时间限制”。手动测试、日常对话、文档处理完全够用。

但有一个硬限制:不能程序化调用。没法用 SDK 或 curl 批量发请求,也没法集成到自己的应用里。

API 层:$1 起步,$5 送 $5

Kimi 官方 API(platform.moonshot.ai)的规则:

  • 最低充值 $1 才能激活 API 调用权限
  • 累计充值达到 $5,平台赠送 $5 代金券
  • 代金券不计入累计充值金额,不能用来升 Tier

花 $5,实际上有 $10 可用。跑通测试流程够了。

Kimi API 定价(2026 年 4 月)

模型输入价格输出价格缓存命中
Kimi K2.5(多模态)$0.60/M$3.00/M$0.15/M
Kimi K2$0.60/M$2.50/M$0.15/M
Kimi K2 Turbo$1.15/M$8.00/M

缓存命中价格 $0.15/M,比正常输入便宜 75%。请求里有大量重复的 system prompt 或上下文,开启缓存能省不少。

$1 能跑多少?

以 Kimi K2.5 为例:

  • 纯输入:$1 ÷ $0.60/M = 约 167 万 token(相当于 100 万汉字)
  • 纯输出:$1 ÷ $3.00/M = 约 33 万 token
  • 典型对话(输入:输出 = 3:1):约 100 万 token 总量

跑通一个 RAG 原型、测试 function calling、批量处理几百份文档,$1 够用。

Rate Limit 分级

Kimi 按累计充值金额分 Tier,Tier 越高并发和 RPM 越大:

Tier累计充值并发数RPM
Tier 0$1
Tier 1$10
Tier 5$3,000+

测试阶段 Tier 0 够用,生产环境需要充值到更高 Tier。

MiniMax API 免费方案

新用户赠送额度

MiniMax 官方平台(platform.minimax.io)对新注册用户有免费 token 赠送,具体金额以注册时平台显示为准,会随活动调整。注册后第一件事是去「账户余额」页面确认当前赠送金额。

按量付费:比 Kimi 便宜一半

MiniMax 的按量付费定价(2026 年 4 月):

模型输入价格输出价格缓存读取
MiniMax M2.7$0.30/M$1.20/M$0.06/M
MiniMax M2.7 Highspeed$0.60/M$2.40/M$0.06/M
MiniMax M2.5$0.30/M$1.20/M$0.06/M

M2.7 标准版输入价格是 Kimi K2.5 的一半,输出价格低 60%。大量输入的场景(文档分析、RAG 检索),MiniMax 的成本优势很明显。

$1 能跑多少?

以 MiniMax M2.7 为例:

  • 纯输入:$1 ÷ $0.30/M = 约 333 万 token
  • 纯输出:$1 ÷ $1.20/M = 约 83 万 token
  • 典型对话(输入:输出 = 3:1):约 200 万 token 总量

同样 $1,MiniMax 能处理的 token 量约是 Kimi K2.5 的 2 倍。

Token Plan 订阅

用量稳定的话,MiniMax 还有月度订阅方案:

方案价格M2.7 请求配额(5小时内)
Starter$10/月1,500 次
Plus$20/月4,500 次
Max$50/月15,000 次

订阅方案适合稳定调用量,按量付费适合测试和不规律使用。

两家对比

维度Kimi K2.5MiniMax M2.7
起步门槛充值 $1新用户赠送额度
输入价格$0.60/M$0.30/M
输出价格$3.00/M$1.20/M
$1 能处理的输入~167 万 token~333 万 token
缓存价格$0.15/M$0.06/M
多模态支持图片+视频(K2.5/K2.6)文本为主(M2.7)
上下文窗口256K204K

纯文本处理场景,MiniMax 性价比更高。需要多模态(图片/视频理解)的场景,Kimi K2.5 或 K2.6 是唯一选择。

通过 ofox 统一接入

同时用 Kimi 和 MiniMax,分别注册两个平台、管理两套 API Key 比较麻烦。ofox.ai 同时上架了两家的全系模型,一个 Key 搞定:

Kimi 模型:moonshotai/kimi-k2.6(最新,支持视频理解)、moonshotai/kimi-k2.5(多模态)

MiniMax 模型:minimax/minimax-m2.7minimax/minimax-m2.7-highspeedminimax/minimax-m2.5minimax/minimax-m2.5-lightning

from openai import OpenAI

client = OpenAI(
    api_key="your-ofox-api-key",
    base_url="https://api.ofox.ai/v1"
)

response = client.chat.completions.create(
    model="minimax/minimax-m2.7",  # 或 moonshotai/kimi-k2.5
    messages=[{"role": "user", "content": "你好"}]
)

ofox 支持支付宝充值,省去境外支付的麻烦。模型列表和价格见 ofox.ai/zh/models

怎么最大化免费额度

开启 prompt caching:Kimi 和 MiniMax 都支持缓存。system prompt 超过 1000 token 的话,把它放在消息列表最前面,后续请求命中缓存后价格降 75-80%。

先用网页版验证思路:Kimi 网页版完全免费,适合在花钱调 API 之前先验证 prompt 效果。MiniMax 也有网页版(hailuo.ai),同样可以免费体验。

选对模型:不是所有任务都需要旗舰模型。MiniMax M2.5 Lightning 和 M2.7 Highspeed 在速度和价格上有不同取舍,简单任务用轻量版能省一半以上。

控制并发:Kimi Tier 0 的并发限制比较严,建议用队列控制并发数,加指数退避重试,避免 429 报错浪费配额。

相关阅读