Dify 能直接接 ofox 吗？

可以。Dify 的「模型供应商」里安装「OpenAI-API-compatible」插件，base_url 填 https://api.ofox.ai/v1，API Key 填你在 ofox 注册的 Key，模型名按 ofox 模型广场显示的 ID（如 anthropic/claude-sonnet-4.6、openai/gpt-5.4）填即可。

为什么不直接接 Claude/OpenAI 官方？

一个 ofox Key 同时用 Claude、GPT、Gemini、DeepSeek、Kimi 等 100+ 模型，省去注册海外厂商、绑定海外信用卡、维护多套 Key 的工作。国内访问稳定，计费统一，对企业还能集中管控费用。

Dify Workflow 能不能按节点切不同模型？

能。Workflow 里每个 LLM 节点独立选模型。把分类、抽取、改写这种简单任务路由到 DeepSeek、Kimi 等便宜模型，复杂推理用 Claude Opus 或 GPT-5.4。接 ofox 这种聚合层就能在一份 Dify 配置里跑混合策略。

添加 ofox 模型后报错 401 / 404 / Model not found 怎么办？

401 通常是 Key 错或末尾粘了空格；404 多半是 base_url 末尾写到了 /chat/completions，应该只填到 /v1；Model not found 是模型 ID 拼写跟 ofox 模型广场不一致，注意 provider 前缀（openai/、anthropic/、google/）。详细排查参考 AI API 报错大全。

May 17, 2026

difyapi-setuptutorialmodel-routing

Dify 接入 ofox API 完全指南：一个 Key 在 Dify 里跑通所有主流模型

TL;DR — 在 Dify「模型供应商」里安装 OpenAI-API-compatible 插件，base_url 写 https://api.ofox.ai/v1，API Key 用 ofox 的，模型 ID 按 ofox 模型广场显示的填（如 anthropic/claude-sonnet-4.6、openai/gpt-5.4、deepseek/deepseek-v4-pro）。一份配置就能在 Dify 的 Chatflow、Agent、Workflow 里同时调度 Claude、GPT、Gemini、DeepSeek、Kimi 等 100+ 模型，不用再注册海外厂商、不用绑海外信用卡。

为什么 Dify + ofox 是国内最省事的组合

Dify 是这两年中文开发者圈最常出现的 LLM 应用平台。可视化拖拽搭 Chatflow、内置 RAG 管线、Agent 调用工具、Workflow 编排多步骤任务，产品形态对标的是 LangChain + n8n + 一点 ChatGPT 玩家社区。国内的中小团队大量用它快速搭客服机器人、知识库、内部 AI 工具。

Dify 自己不训模型，它只是个调度层。所有 LLM 能力都来自背后挂的模型供应商。官方插件列表里能看到几十个：OpenAI、Anthropic、Google、Ollama、AWS Bedrock、Azure OpenAI……单独接每一个都得走一遍那家的开户、绑卡、Key 管理流程，麻烦不说，海外厂商对中国开发者还有各种水土不服的地方。

ofox.ai 是 OpenAI 兼容的 AI API 聚合平台，一份 Key 解锁 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro、DeepSeek、Kimi、Qwen 这些主流模型。Dify 这边只要把 ofox 作为「OpenAI-API-compatible」供应商加一次，后面想用什么模型就在节点里下拉切换，不再有第二次配置成本。

更现实的理由：海外厂商账号在国内场景里随时可能因为支付、地区限制、合规问题挂掉。把上游统一抽象到 ofox 这一层，Dify 应用本身就不需要为单家厂商的变动改配置。

准备工作

需要两样东西：

Dify 实例。云版去 cloud.dify.ai 注册即可；自部署看官方 docker-compose 仓库，国内开发者一般部 1-2 台 4GB 内存的机器就够小团队跑。本文用云版演示，自部署的配置路径完全一致。

ofox API Key。在 ofox.ai 注册账号，控制台「API Keys」里点 Create，复制出来妥善保存（页面关闭后看不到完整值）。新账号自带一些试用额度，先跑通了再充值。如果你之前用过 Kimi、Claude 之类的中转方案，可以参考 Kimi API Key 获取 + Moonshot API 全流程对比注册体验。

第一步：在 Dify 添加 OpenAI-API-compatible 供应商

打开 Dify 工作区 → 右上头像 → 设置 → 模型供应商。在「待添加」列表里找 OpenAI-API-compatible。点 Install 安装插件。装完它会出现在「已添加」一栏，旁边有「添加模型」按钮。

点「添加模型」，会弹出一个表单。各字段填法：

字段	填什么	说明
模型类型	LLM	后面要加 Embedding、Rerank 时再分别建条目
模型名称	任意，建议跟 model id 一致	显示在 Dify 节点下拉里，方便区分
模型 ID（Model Name）	`anthropic/claude-sonnet-4.6`	必须跟 ofox 模型广场显示的一致
API Key	你的 ofox Key	复制粘贴时小心别带空格
API endpoint URL	`https://api.ofox.ai/v1`	末尾不要带 `/chat/completions`
模型上下文长度	`1000000`	Sonnet 4.6 是 1M，按你接的模型实际值填
最大 token 上限	`8192`	按模型实际 max_tokens 填
流式支持	开	ofox 全模型支持流式
视觉能力	按模型支持情况选	Claude / Gemini / GPT 视觉模型勾上
Function Call	Tool Call	Claude 4.6 系列、GPT-5.4 都支持

保存。Dify 会做一次连通性测试，成功的话会在「已添加」里多出这条模型。这时打开任意一个 Chatflow / Agent，模型下拉里就能选到它。

这一步如果遇到 Connection refused 或 verification failed，多半是 base_url 写错了。Dify 会自动在 base_url 后面拼 /chat/completions，你只填到 /v1 就行。常见报错可参考 AI API 报错大全。

第二步：批量加入主流模型

第一次只加了 Claude Sonnet 4.6 一个。Dify 的好处是「同一个供应商可以加 N 个模型」，你不用每接一个模型重装一次插件，重复「添加模型」按钮即可。

推荐的初始模型组合（按场景选，不必都加）：

推理 / 编程主力：
  anthropic/claude-sonnet-4.6     —— 综合性价比最高
  openai/gpt-5.4                  —— OpenAI 旗舰，工具调用稳

视觉 / 多模态：
  google/gemini-3.1-pro-preview         —— 1M context + 强视觉
  google/gemini-3.1-flash-lite-preview  —— 便宜的快模型

经济模型（路由到简单任务）：
  deepseek/deepseek-v4-flash      —— 国产开源最强 + 极致便宜
  moonshotai/kimi-k2.6            —— 长上下文 256K + 中文优势

Embedding（RAG 用）：
  在 ofox 模型广场搜「embedding」，按需添加

每条都按上面的字段模板填一遍即可。模型 ID 拼写一定要去 ofox.ai/zh/models 复制，凭印象敲容易抄错。Claude Opus 跟 Sonnet 的选型纠结可以看 Claude Opus 4.6 vs Sonnet 4.6 怎么选这篇拆解。

第三步：在 Chatflow 里调用

新建一个 Chatflow 应用，拖一个 LLM 节点出来。点节点 → 模型下拉 → 选刚才加的 anthropic/claude-sonnet-4.6。System Prompt 框里随便写一段，比如「你是一个简洁的技术写作助手，只用 200 字以内回答」。

右上「调试和预览」试一下。能正常流式输出文字就说明连通了。

如果你想做模型 fallback（主模型超时切备用），Dify 的做法是在 LLM 节点的「错误处理」里挂一个备选节点，备选节点选另一个模型供应商的模型。因为你已经把多个 ofox 模型都加进来了，备选用 GPT-5.4 或 DeepSeek 都行，无需新增供应商。

第四步：在 Workflow 里做模型路由（省钱关键）

Workflow 是 Dify 比单纯 Chatflow 多的一层。它支持 If/Else 分支、循环、并行节点、多个 LLM 串联，本质是 BPMN 风格的可视化任务编排。

真正能省钱的用法：按任务复杂度路由到不同价位的模型。一个典型的工单处理 Workflow：

[用户输入]
    ↓
[LLM 节点 1：分类] ← deepseek/deepseek-v4-flash  （便宜，分类够用）
    ↓
[If/Else：是否技术问题？]
    ├─ 是 → [LLM 节点 2A：技术回复] ← anthropic/claude-sonnet-4.6
    └─ 否 → [LLM 节点 2B：客服回复] ← moonshotai/kimi-k2.6
    ↓
[输出]

实际项目里大多数请求都能跑在便宜模型上，复杂场景才落到 Claude。一个内部知识库 Workflow 跑混合路由后，月费用降了大半，回答质量人工抽查没有明显下降。前提是分类节点要足够准，不然便宜模型接到难题会拖后腿。

Workflow 之所以能玩得起来，本质前提是「同一份配置里多个模型随便切」。这就是为什么聚合平台 + Dify 比单一厂商接入要灵活得多。

第五步：Agent 应用接工具

Dify 的 Agent 应用本质是「LLM + 一组工具 + 自动规划循环」。配置流程跟 Chatflow 一样，区别是顶部要选一个支持 Function Calling / Tool Use 的模型，Claude Sonnet 4.6 和 GPT-5.4 是默认选择。

模型选好后在「工具」面板里挂上要用的工具（Dify 自带 Google Search、Wikipedia、DALL-E、计算器等几十个）。Agent 自己决定什么时候调什么工具，调用结果回传给模型继续推理。

一个常见的踩坑：有些模型在 ofox 上虽然能调用，但 Dify 这边没把 Function Call 字段勾上，Agent 调用会报 Tool calling is not supported。回模型供应商配置页面，把那个 Function Call 选项改成 Tool Call 即可。

进阶：Embedding 模型怎么配

Dify 的知识库（RAG）需要单独配 Embedding 模型。在「添加模型」时把「模型类型」改成 Text Embedding。模型 ID 用 openai/text-embedding-3-large 这种 OpenAI 兼容的就行；ofox 也代理了 BGE 这类国产 embedding。

base_url 还是 https://api.ofox.ai/v1，API Key 还是同一个。Dify 会自动调用 /embeddings 端点。

常见报错速查

报错	原因	解决
`401 Unauthorized`	Key 错 / 末尾有空格 / 账号余额为 0	重新粘贴 Key，去 ofox 控制台核对账号状态
`404 Not Found`	base_url 写到了 `/chat/completions`	改回 `https://api.ofox.ai/v1`
`Model not found`	模型 ID 拼写错 / 漏了 provider 前缀	去 ofox 模型广场复制完整 ID
`Tool calling is not supported`	没开启 Function Call 选项	模型供应商配置里把 Function Call 改成 Tool Call
Dify 一直转圈不返回	流式选项没开 / 网络中断	打开 streaming，或换网络环境再测
`Request timeout`	上游模型负载高	配 Workflow fallback 节点；用 ofox 的备份模型

更全的 LLM API 错误码对照可以看 AI API 报错大全。

跟 LobeChat、Cherry Studio 这些选谁？

Dify、LobeChat、Cherry Studio 都能接 ofox，但定位不同：

LobeChat / Cherry Studio：偏个人桌面 ChatGPT 替代品，聊天体验好，插件丰富。如果你只是想找个聊天客户端，参考 LobeChat 完全配置指南。
Dify：偏团队应用平台，要做产品、要接业务系统、要分发给客户使用，选 Dify。
直接调 API：自己写代码、不需要可视化，直接用 SDK 最干净。

三者不是互斥关系。常见组合是：开发期用 Dify 快速搭原型给业务方看，原型跑通后再决定要不要重写成代码。

ofox 都在 OpenAI 兼容协议这一层，三个平台共享同一个 Key，不需要重复对接。中转站之间的差异参考 AI API 中转站推荐 2026。

写在最后

Dify + ofox 真正值的是灵活度。省钱和方便都是副产品。Workflow 节点能任意切模型，意味着 Claude 涨价、某个国产模型突然冒头、新一代 Gemini 上线，你都不用改 Dify 应用本身，只在「模型供应商」面板里加一个新条目，应用里下拉就能用上。

国内做 AI 应用最头疼的就是上游模型变化太快。这套架构把变化都吸收在 ofox 这一层，Dify 应用本身只管业务逻辑，不用再追新模型。