GLM-4.7 和 GLM-4.7-Flash 有什么区别？

GLM-4.7 是旗舰版，358B 总参数（约 32B 激活），SWE-Bench Verified 73.8%，适合复杂代码任务和 Agent 工作流；GLM-4.7-Flash 是轻量版，30B 总参数（约 3B 激活），速度快 3-4 倍，完全免费，适合日常代码补全和高频调用。

GLM-4.7-Flash 真的免费吗？

是的。通过 OfoxAI 调用 z-ai/glm-4.7-flash:free，输入输出均为 $0，没有隐藏费用。适合个人开发者和预算有限的团队试用。

国内能直接调用 GLM-4.7 API 吗？

可以。通过 OfoxAI 平台，国内开发者无需翻墙，用 OpenAI 兼容协议直接调用 GLM-4.7 系列，支持微信支付宝充值，按量付费。

GLM-4.7 API 接入指南：开源编程 SOTA，Flash 版完全免费，国内怎么用（2026）

Q: GLM-4.7 和 GLM-5 怎么选？

GLM-4.7 专注编程，SWE-Bench 73.8%，价格更低（$0.4/$2）；GLM-5 是通用旗舰，744B 参数，SWE-Bench 77.8%，但价格更高。纯代码任务选 GLM-4.7，需要通用推理和多模态选 GLM-5。

GLM-4.7 是 Z.ai（智谱 AI）2025 年 12 月发布的编程专用模型。SWE-Bench Verified 73.8%，开源模型里排第一。Flash 版本完全免费，30B 参数跑出 59.2%，同规模里没有对手。

国内直连，开源可审计，下面说怎么接。

三个版本，定位不同

模型	参数规模	激活参数	上下文	定价（输入/输出）	适用场景
GLM-4.7	358B	~32B	200K	$0.4 / $2 /百万 token	复杂代码任务、Agent 工作流
GLM-4.7-FlashX	30B	~3B	200K	$0.072 / $0.43 /百万 token	代码补全、高频调用
GLM-4.7-Flash	30B	~3B	200K	完全免费	个人开发、试用、预算有限

Flash 和 FlashX 是同一个模型，区别只在计费方式：Flash 免费但有速率限制，FlashX 付费但更稳定，适合生产环境。

为什么编程能力强

GLM-4.7 的训练目标是 Agentic Coding，不是单纯的代码补全。

SWE-Bench Verified 73.8%：测的是模型能否独立修复 GitHub 真实 issue，73.8% 是 2025 年底开源模型的最高分
LiveCodeBench 84.9%：竞赛级代码题，覆盖算法、数据结构、系统设计
τ²-Bench 84.7：多步骤工具调用基准，测 Agent 场景下的工具使用稳定性

Flash 版本虽然参数少 10 倍，但 SWE-Bench 59.2% 在 30B 级别里是 SOTA。日常代码补全、单文件修改、写脚本，Flash 够用。

GLM-4.7 和 GLM-5 怎么选

两个模型不是替代关系，是不同定位。

GLM-5 是 2026 年 2 月发布的通用旗舰，744B 参数，SWE-Bench 77.8%，比 GLM-4.7 高 4 个点，但价格更高，而且是通用模型，不是专门针对代码优化的。

选 GLM-4.7 的场景：

纯代码任务（生成、调试、重构）
成本敏感，高频调用
需要 Agent 工具调用稳定性
想先用免费版试试

选 GLM-5 的场景：

需要通用推理能力（不只是代码）
多模态任务
对绝对编程能力要求最高

详细的模型横评可以看 2026 大模型排行榜与选型指南，GLM 系列和 Claude、GPT、Qwen 的对比都在里面。GLM-5 的完整介绍在 GLM-5 API 接入指南。

通过 OfoxAI 接入

官方 API 在智谱 AI 开放平台，需要注册、实名认证，流程繁琐。

通过 OfoxAI 更直接，国内直连，OpenAI 协议兼容，微信支付宝充值，三个版本都有：

base_url: https://api.ofox.ai/v1
model: z-ai/glm-4.7             # 旗舰版
model: z-ai/glm-4.7-flashx      # 付费快速版
model: z-ai/glm-4.7-flash:free  # 完全免费版

Python 调用：

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="你的Key")
resp = client.chat.completions.create(
    model="z-ai/glm-4.7-flash:free",
    messages=[{"role": "user", "content": "帮我写一个二分查找函数"}]
)
print(resp.choices[0].message.content)

换旗舰版只改 model 参数，其他代码不动。

配置到常用工具

Roo Code：Settings → API Provider 选 OpenAI Compatible，Base URL 填 https://api.ofox.ai/v1，API Key 填 OfoxAI 的 Key，Model ID 填 z-ai/glm-4.7。详细步骤参考 Roo Code API 配置指南。

Cline：配置方式和 Roo Code 一样，Provider 选 OpenAI Compatible，填同样的 base_url 和 model ID。

OpenClaw：API Provider 选 OpenAI Compatible，填 OfoxAI 接口地址和 Key，model 填 z-ai/glm-4.7。GLM-4.7 的 function calling 和 OpenClaw 的工具调用协议完全兼容。各工具的选型建议看 OpenClaw 模型推荐与排行。

实际使用体验

Flash 免费版日常够用。代码补全、写测试、改 bug，速度和质量都不错，免费额度没有明显限制，个人项目完全够用。Flash 国内接入的完整步骤、限速细节和 OpenClaw 配置看 GLM-4.7-Flash 免费 API 国内接入完全指南。

中文注释是真的自然。GLM 系列中文训练数据量大，生成的注释、文档字符串、错误信息都是地道中文，不是机翻腔。国内团队的代码库用起来顺手很多。

工具调用稳定性不错。τ²-Bench 84.7 不是虚的，在 Roo Code 和 OpenClaw 里调工具，参数格式出错的情况很少。

多文件重构、大型代码库理解、需要长上下文的 Agent 任务，Flash 有时候会”忘记”前面的上下文，这时候切旗舰版更稳。

和其他编程模型比

模型	SWE-Bench	价格（输入/输出）	国内访问	开源
GLM-4.7	73.8%	$0.4 / $2	直连	✅
GLM-4.7-Flash	59.2%	免费	直连	✅
Qwen3-Coder Plus	~73%	$1.8 / $9	直连	✅
Claude Sonnet 4.6	~80%	$3 / $15	需中转	❌
DeepSeek V4	~70%	$0.27 / $1.10	直连	✅

GLM-4.7 在开源编程模型里性价比最高。Flash 免费版是目前唯一免费且 SWE-Bench 超过 59% 的选项。

更完整的编程工具对比，看 AI 编程工具横评。

总结

旗舰版性价比高，Flash 版完全免费，国内直连，OpenAI 协议兼容。先用 Flash 免费版试几个任务，成本为零。

通过 OfoxAI 一个 Key 同时管 GLM、Claude、Qwen，切换只改一个参数。

三个版本，定位不同

为什么编程能力强

GLM-4.7 和 GLM-5 怎么选

通过 OfoxAI 接入

配置到常用工具

实际使用体验

和其他编程模型比

总结

相关文章

GLM-4.7-Flash 免费 API 国内接入完全指南：200K 上下文、零成本调用（2026）

Kimi / MiniMax 免费额度实测：$1 能跑多少 token？两大国产模型免费方案全拆解（2026）

Qwen3-Coder API 接入指南：480B 编程模型实测，国内开发者怎么用（2026）