GLM-4.7 API 接入指南:开源编程 SOTA,Flash 版完全免费,国内怎么用(2026)

GLM-4.7 API 接入指南:开源编程 SOTA,Flash 版完全免费,国内怎么用(2026)

GLM-4.7 是 Z.ai(智谱 AI)2025 年 12 月发布的编程专用模型。SWE-Bench Verified 73.8%,开源模型里排第一。Flash 版本完全免费,30B 参数跑出 59.2%,同规模里没有对手。

国内直连,开源可审计,下面说怎么接。

三个版本,定位不同

模型参数规模激活参数上下文定价(输入/输出)适用场景
GLM-4.7358B~32B200K$0.4 / $2 /百万 token复杂代码任务、Agent 工作流
GLM-4.7-FlashX30B~3B200K$0.072 / $0.43 /百万 token代码补全、高频调用
GLM-4.7-Flash30B~3B200K完全免费个人开发、试用、预算有限

Flash 和 FlashX 是同一个模型,区别只在计费方式:Flash 免费但有速率限制,FlashX 付费但更稳定,适合生产环境。

为什么编程能力强

GLM-4.7 的训练目标是 Agentic Coding,不是单纯的代码补全。

  • SWE-Bench Verified 73.8%:测的是模型能否独立修复 GitHub 真实 issue,73.8% 是 2025 年底开源模型的最高分
  • LiveCodeBench 84.9%:竞赛级代码题,覆盖算法、数据结构、系统设计
  • τ²-Bench 84.7:多步骤工具调用基准,测 Agent 场景下的工具使用稳定性

Flash 版本虽然参数少 10 倍,但 SWE-Bench 59.2% 在 30B 级别里是 SOTA。日常代码补全、单文件修改、写脚本,Flash 够用。

GLM-4.7 和 GLM-5 怎么选

两个模型不是替代关系,是不同定位。

GLM-5 是 2026 年 2 月发布的通用旗舰,744B 参数,SWE-Bench 77.8%,比 GLM-4.7 高 4 个点,但价格更高,而且是通用模型,不是专门针对代码优化的。

选 GLM-4.7 的场景:

  • 纯代码任务(生成、调试、重构)
  • 成本敏感,高频调用
  • 需要 Agent 工具调用稳定性
  • 想先用免费版试试

选 GLM-5 的场景:

  • 需要通用推理能力(不只是代码)
  • 多模态任务
  • 对绝对编程能力要求最高

详细的模型横评可以看 2026 大模型排行榜与选型指南,GLM 系列和 Claude、GPT、Qwen 的对比都在里面。GLM-5 的完整介绍在 GLM-5 API 接入指南

通过 OfoxAI 接入

官方 API 在智谱 AI 开放平台,需要注册、实名认证,流程繁琐。

通过 OfoxAI 更直接,国内直连,OpenAI 协议兼容,微信支付宝充值,三个版本都有:

base_url: https://api.ofox.ai/v1
model: z-ai/glm-4.7             # 旗舰版
model: z-ai/glm-4.7-flashx      # 付费快速版
model: z-ai/glm-4.7-flash:free  # 完全免费版

Python 调用:

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="你的Key")
resp = client.chat.completions.create(
    model="z-ai/glm-4.7-flash:free",
    messages=[{"role": "user", "content": "帮我写一个二分查找函数"}]
)
print(resp.choices[0].message.content)

换旗舰版只改 model 参数,其他代码不动。

配置到常用工具

Roo Code:Settings → API Provider 选 OpenAI Compatible,Base URL 填 https://api.ofox.ai/v1,API Key 填 OfoxAI 的 Key,Model ID 填 z-ai/glm-4.7。详细步骤参考 Roo Code API 配置指南

Cline:配置方式和 Roo Code 一样,Provider 选 OpenAI Compatible,填同样的 base_url 和 model ID。

OpenClaw:API Provider 选 OpenAI Compatible,填 OfoxAI 接口地址和 Key,model 填 z-ai/glm-4.7。GLM-4.7 的 function calling 和 OpenClaw 的工具调用协议完全兼容。各工具的选型建议看 OpenClaw 模型推荐与排行

实际使用体验

Flash 免费版日常够用。代码补全、写测试、改 bug,速度和质量都不错,免费额度没有明显限制,个人项目完全够用。

中文注释是真的自然。GLM 系列中文训练数据量大,生成的注释、文档字符串、错误信息都是地道中文,不是机翻腔。国内团队的代码库用起来顺手很多。

工具调用稳定性不错。τ²-Bench 84.7 不是虚的,在 Roo Code 和 OpenClaw 里调工具,参数格式出错的情况很少。

多文件重构、大型代码库理解、需要长上下文的 Agent 任务,Flash 有时候会”忘记”前面的上下文,这时候切旗舰版更稳。

和其他编程模型比

模型SWE-Bench价格(输入/输出)国内访问开源
GLM-4.773.8%$0.4 / $2直连
GLM-4.7-Flash59.2%免费直连
Qwen3-Coder Plus~73%$1.8 / $9直连
Claude Sonnet 4.6~80%$3 / $15需中转
DeepSeek V4~70%$0.27 / $1.10直连

GLM-4.7 在开源编程模型里性价比最高。Flash 免费版是目前唯一免费且 SWE-Bench 超过 59% 的选项。

更完整的编程工具对比,看 AI 编程工具横评

总结

旗舰版性价比高,Flash 版完全免费,国内直连,OpenAI 协议兼容。先用 Flash 免费版试几个任务,成本为零。

通过 OfoxAI 一个 Key 同时管 GLM、Claude、Qwen,切换只改一个参数。