Dify 接入 ofox API 完全指南:一个 Key 在 Dify 里跑通所有主流模型
TL;DR — 在 Dify「模型供应商」里安装 OpenAI-API-compatible 插件,base_url 写 https://api.ofox.ai/v1,API Key 用 ofox 的,模型 ID 按 ofox 模型广场显示的填(如 anthropic/claude-sonnet-4.6、openai/gpt-5.4、deepseek/deepseek-v4-pro)。一份配置就能在 Dify 的 Chatflow、Agent、Workflow 里同时调度 Claude、GPT、Gemini、DeepSeek、Kimi 等 100+ 模型,不用再注册海外厂商、不用绑海外信用卡。
为什么 Dify + ofox 是国内最省事的组合
Dify 是这两年中文开发者圈最常出现的 LLM 应用平台。可视化拖拽搭 Chatflow、内置 RAG 管线、Agent 调用工具、Workflow 编排多步骤任务,产品形态对标的是 LangChain + n8n + 一点 ChatGPT 玩家社区。国内的中小团队大量用它快速搭客服机器人、知识库、内部 AI 工具。
Dify 自己不训模型,它只是个调度层。所有 LLM 能力都来自背后挂的模型供应商。官方插件列表里能看到几十个:OpenAI、Anthropic、Google、Ollama、AWS Bedrock、Azure OpenAI……单独接每一个都得走一遍那家的开户、绑卡、Key 管理流程,麻烦不说,海外厂商对中国开发者还有各种水土不服的地方。
ofox.ai 是 OpenAI 兼容的 AI API 聚合平台,一份 Key 解锁 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro、DeepSeek、Kimi、Qwen 这些主流模型。Dify 这边只要把 ofox 作为「OpenAI-API-compatible」供应商加一次,后面想用什么模型就在节点里下拉切换,不再有第二次配置成本。
更现实的理由:海外厂商账号在国内场景里随时可能因为支付、地区限制、合规问题挂掉。把上游统一抽象到 ofox 这一层,Dify 应用本身就不需要为单家厂商的变动改配置。
准备工作
需要两样东西:
Dify 实例。云版去 cloud.dify.ai 注册即可;自部署看官方 docker-compose 仓库,国内开发者一般部 1-2 台 4GB 内存的机器就够小团队跑。本文用云版演示,自部署的配置路径完全一致。
ofox API Key。在 ofox.ai 注册账号,控制台「API Keys」里点 Create,复制出来妥善保存(页面关闭后看不到完整值)。新账号自带一些试用额度,先跑通了再充值。如果你之前用过 Kimi、Claude 之类的中转方案,可以参考 Kimi API Key 获取 + Moonshot API 全流程 对比注册体验。
第一步:在 Dify 添加 OpenAI-API-compatible 供应商
打开 Dify 工作区 → 右上头像 → 设置 → 模型供应商。在「待添加」列表里找 OpenAI-API-compatible。点 Install 安装插件。装完它会出现在「已添加」一栏,旁边有「添加模型」按钮。
点「添加模型」,会弹出一个表单。各字段填法:
| 字段 | 填什么 | 说明 |
|---|---|---|
| 模型类型 | LLM | 后面要加 Embedding、Rerank 时再分别建条目 |
| 模型名称 | 任意,建议跟 model id 一致 | 显示在 Dify 节点下拉里,方便区分 |
| 模型 ID(Model Name) | anthropic/claude-sonnet-4.6 | 必须跟 ofox 模型广场显示的一致 |
| API Key | 你的 ofox Key | 复制粘贴时小心别带空格 |
| API endpoint URL | https://api.ofox.ai/v1 | 末尾不要带 /chat/completions |
| 模型上下文长度 | 1000000 | Sonnet 4.6 是 1M,按你接的模型实际值填 |
| 最大 token 上限 | 8192 | 按模型实际 max_tokens 填 |
| 流式支持 | 开 | ofox 全模型支持流式 |
| 视觉能力 | 按模型支持情况选 | Claude / Gemini / GPT 视觉模型勾上 |
| Function Call | Tool Call | Claude 4.6 系列、GPT-5.4 都支持 |
保存。Dify 会做一次连通性测试,成功的话会在「已添加」里多出这条模型。这时打开任意一个 Chatflow / Agent,模型下拉里就能选到它。
这一步如果遇到
Connection refused或verification failed,多半是 base_url 写错了。Dify 会自动在 base_url 后面拼/chat/completions,你只填到/v1就行。常见报错可参考 AI API 报错大全。
第二步:批量加入主流模型
第一次只加了 Claude Sonnet 4.6 一个。Dify 的好处是「同一个供应商可以加 N 个模型」,你不用每接一个模型重装一次插件,重复「添加模型」按钮即可。
推荐的初始模型组合(按场景选,不必都加):
推理 / 编程主力:
anthropic/claude-sonnet-4.6 —— 综合性价比最高
openai/gpt-5.4 —— OpenAI 旗舰,工具调用稳
视觉 / 多模态:
google/gemini-3.1-pro-preview —— 1M context + 强视觉
google/gemini-3.1-flash-lite-preview —— 便宜的快模型
经济模型(路由到简单任务):
deepseek/deepseek-v4-flash —— 国产开源最强 + 极致便宜
moonshotai/kimi-k2.6 —— 长上下文 256K + 中文优势
Embedding(RAG 用):
在 ofox 模型广场搜「embedding」,按需添加
每条都按上面的字段模板填一遍即可。模型 ID 拼写一定要去 ofox.ai/zh/models 复制,凭印象敲容易抄错。Claude Opus 跟 Sonnet 的选型纠结可以看 Claude Opus 4.6 vs Sonnet 4.6 怎么选 这篇拆解。
第三步:在 Chatflow 里调用
新建一个 Chatflow 应用,拖一个 LLM 节点出来。点节点 → 模型下拉 → 选刚才加的 anthropic/claude-sonnet-4.6。System Prompt 框里随便写一段,比如「你是一个简洁的技术写作助手,只用 200 字以内回答」。
右上「调试和预览」试一下。能正常流式输出文字就说明连通了。
如果你想做模型 fallback(主模型超时切备用),Dify 的做法是在 LLM 节点的「错误处理」里挂一个备选节点,备选节点选另一个模型供应商的模型。因为你已经把多个 ofox 模型都加进来了,备选用 GPT-5.4 或 DeepSeek 都行,无需新增供应商。
第四步:在 Workflow 里做模型路由(省钱关键)
Workflow 是 Dify 比单纯 Chatflow 多的一层。它支持 If/Else 分支、循环、并行节点、多个 LLM 串联,本质是 BPMN 风格的可视化任务编排。
真正能省钱的用法:按任务复杂度路由到不同价位的模型。一个典型的工单处理 Workflow:
[用户输入]
↓
[LLM 节点 1:分类] ← deepseek/deepseek-v4-flash (便宜,分类够用)
↓
[If/Else:是否技术问题?]
├─ 是 → [LLM 节点 2A:技术回复] ← anthropic/claude-sonnet-4.6
└─ 否 → [LLM 节点 2B:客服回复] ← moonshotai/kimi-k2.6
↓
[输出]
实际项目里大多数请求都能跑在便宜模型上,复杂场景才落到 Claude。一个内部知识库 Workflow 跑混合路由后,月费用降了大半,回答质量人工抽查没有明显下降。前提是分类节点要足够准,不然便宜模型接到难题会拖后腿。
Workflow 之所以能玩得起来,本质前提是「同一份配置里多个模型随便切」。这就是为什么聚合平台 + Dify 比单一厂商接入要灵活得多。
第五步:Agent 应用接工具
Dify 的 Agent 应用本质是「LLM + 一组工具 + 自动规划循环」。配置流程跟 Chatflow 一样,区别是顶部要选一个支持 Function Calling / Tool Use 的模型,Claude Sonnet 4.6 和 GPT-5.4 是默认选择。
模型选好后在「工具」面板里挂上要用的工具(Dify 自带 Google Search、Wikipedia、DALL-E、计算器等几十个)。Agent 自己决定什么时候调什么工具,调用结果回传给模型继续推理。
一个常见的踩坑:有些模型在 ofox 上虽然能调用,但 Dify 这边没把 Function Call 字段勾上,Agent 调用会报 Tool calling is not supported。回模型供应商配置页面,把那个 Function Call 选项改成 Tool Call 即可。
进阶:Embedding 模型怎么配
Dify 的知识库(RAG)需要单独配 Embedding 模型。在「添加模型」时把「模型类型」改成 Text Embedding。模型 ID 用 openai/text-embedding-3-large 这种 OpenAI 兼容的就行;ofox 也代理了 BGE 这类国产 embedding。
base_url 还是 https://api.ofox.ai/v1,API Key 还是同一个。Dify 会自动调用 /embeddings 端点。
常见报错速查
| 报错 | 原因 | 解决 |
|---|---|---|
401 Unauthorized | Key 错 / 末尾有空格 / 账号余额为 0 | 重新粘贴 Key,去 ofox 控制台核对账号状态 |
404 Not Found | base_url 写到了 /chat/completions | 改回 https://api.ofox.ai/v1 |
Model not found | 模型 ID 拼写错 / 漏了 provider 前缀 | 去 ofox 模型广场复制完整 ID |
Tool calling is not supported | 没开启 Function Call 选项 | 模型供应商配置里把 Function Call 改成 Tool Call |
| Dify 一直转圈不返回 | 流式选项没开 / 网络中断 | 打开 streaming,或换网络环境再测 |
Request timeout | 上游模型负载高 | 配 Workflow fallback 节点;用 ofox 的备份模型 |
更全的 LLM API 错误码对照可以看 AI API 报错大全。
跟 LobeChat、Cherry Studio 这些选谁?
Dify、LobeChat、Cherry Studio 都能接 ofox,但定位不同:
- LobeChat / Cherry Studio:偏个人桌面 ChatGPT 替代品,聊天体验好,插件丰富。如果你只是想找个聊天客户端,参考 LobeChat 完全配置指南。
- Dify:偏团队应用平台,要做产品、要接业务系统、要分发给客户使用,选 Dify。
- 直接调 API:自己写代码、不需要可视化,直接用 SDK 最干净。
三者不是互斥关系。常见组合是:开发期用 Dify 快速搭原型给业务方看,原型跑通后再决定要不要重写成代码。
ofox 都在 OpenAI 兼容协议这一层,三个平台共享同一个 Key,不需要重复对接。中转站之间的差异参考 AI API 中转站推荐 2026。
写在最后
Dify + ofox 真正值的是灵活度。省钱和方便都是副产品。Workflow 节点能任意切模型,意味着 Claude 涨价、某个国产模型突然冒头、新一代 Gemini 上线,你都不用改 Dify 应用本身,只在「模型供应商」面板里加一个新条目,应用里下拉就能用上。
国内做 AI 应用最头疼的就是上游模型变化太快。这套架构把变化都吸收在 ofox 这一层,Dify 应用本身只管业务逻辑,不用再追新模型。


