Dify 接入 ofox API 完全指南:一个 Key 在 Dify 里跑通所有主流模型

Dify 接入 ofox API 完全指南:一个 Key 在 Dify 里跑通所有主流模型

TL;DR — 在 Dify「模型供应商」里安装 OpenAI-API-compatible 插件,base_url 写 https://api.ofox.ai/v1,API Key 用 ofox 的,模型 ID 按 ofox 模型广场显示的填(如 anthropic/claude-sonnet-4.6openai/gpt-5.4deepseek/deepseek-v4-pro)。一份配置就能在 Dify 的 Chatflow、Agent、Workflow 里同时调度 Claude、GPT、Gemini、DeepSeek、Kimi 等 100+ 模型,不用再注册海外厂商、不用绑海外信用卡。

为什么 Dify + ofox 是国内最省事的组合

Dify 是这两年中文开发者圈最常出现的 LLM 应用平台。可视化拖拽搭 Chatflow、内置 RAG 管线、Agent 调用工具、Workflow 编排多步骤任务,产品形态对标的是 LangChain + n8n + 一点 ChatGPT 玩家社区。国内的中小团队大量用它快速搭客服机器人、知识库、内部 AI 工具。

Dify 自己不训模型,它只是个调度层。所有 LLM 能力都来自背后挂的模型供应商。官方插件列表里能看到几十个:OpenAI、Anthropic、Google、Ollama、AWS Bedrock、Azure OpenAI……单独接每一个都得走一遍那家的开户、绑卡、Key 管理流程,麻烦不说,海外厂商对中国开发者还有各种水土不服的地方。

ofox.ai 是 OpenAI 兼容的 AI API 聚合平台,一份 Key 解锁 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro、DeepSeek、Kimi、Qwen 这些主流模型。Dify 这边只要把 ofox 作为「OpenAI-API-compatible」供应商加一次,后面想用什么模型就在节点里下拉切换,不再有第二次配置成本。

更现实的理由:海外厂商账号在国内场景里随时可能因为支付、地区限制、合规问题挂掉。把上游统一抽象到 ofox 这一层,Dify 应用本身就不需要为单家厂商的变动改配置。

准备工作

需要两样东西:

Dify 实例。云版去 cloud.dify.ai 注册即可;自部署看官方 docker-compose 仓库,国内开发者一般部 1-2 台 4GB 内存的机器就够小团队跑。本文用云版演示,自部署的配置路径完全一致。

ofox API Key。在 ofox.ai 注册账号,控制台「API Keys」里点 Create,复制出来妥善保存(页面关闭后看不到完整值)。新账号自带一些试用额度,先跑通了再充值。如果你之前用过 Kimi、Claude 之类的中转方案,可以参考 Kimi API Key 获取 + Moonshot API 全流程 对比注册体验。

第一步:在 Dify 添加 OpenAI-API-compatible 供应商

打开 Dify 工作区 → 右上头像 → 设置 → 模型供应商。在「待添加」列表里找 OpenAI-API-compatible。点 Install 安装插件。装完它会出现在「已添加」一栏,旁边有「添加模型」按钮。

点「添加模型」,会弹出一个表单。各字段填法:

字段填什么说明
模型类型LLM后面要加 Embedding、Rerank 时再分别建条目
模型名称任意,建议跟 model id 一致显示在 Dify 节点下拉里,方便区分
模型 ID(Model Name)anthropic/claude-sonnet-4.6必须跟 ofox 模型广场显示的一致
API Key你的 ofox Key复制粘贴时小心别带空格
API endpoint URLhttps://api.ofox.ai/v1末尾不要带 /chat/completions
模型上下文长度1000000Sonnet 4.6 是 1M,按你接的模型实际值填
最大 token 上限8192按模型实际 max_tokens 填
流式支持ofox 全模型支持流式
视觉能力按模型支持情况选Claude / Gemini / GPT 视觉模型勾上
Function CallTool CallClaude 4.6 系列、GPT-5.4 都支持

保存。Dify 会做一次连通性测试,成功的话会在「已添加」里多出这条模型。这时打开任意一个 Chatflow / Agent,模型下拉里就能选到它。

这一步如果遇到 Connection refusedverification failed,多半是 base_url 写错了。Dify 会自动在 base_url 后面拼 /chat/completions,你只填到 /v1 就行。常见报错可参考 AI API 报错大全

第二步:批量加入主流模型

第一次只加了 Claude Sonnet 4.6 一个。Dify 的好处是「同一个供应商可以加 N 个模型」,你不用每接一个模型重装一次插件,重复「添加模型」按钮即可。

推荐的初始模型组合(按场景选,不必都加):

推理 / 编程主力:
  anthropic/claude-sonnet-4.6     —— 综合性价比最高
  openai/gpt-5.4                  —— OpenAI 旗舰,工具调用稳

视觉 / 多模态:
  google/gemini-3.1-pro-preview         —— 1M context + 强视觉
  google/gemini-3.1-flash-lite-preview  —— 便宜的快模型

经济模型(路由到简单任务):
  deepseek/deepseek-v4-flash      —— 国产开源最强 + 极致便宜
  moonshotai/kimi-k2.6            —— 长上下文 256K + 中文优势

Embedding(RAG 用):
  在 ofox 模型广场搜「embedding」,按需添加

每条都按上面的字段模板填一遍即可。模型 ID 拼写一定要去 ofox.ai/zh/models 复制,凭印象敲容易抄错。Claude Opus 跟 Sonnet 的选型纠结可以看 Claude Opus 4.6 vs Sonnet 4.6 怎么选 这篇拆解。

第三步:在 Chatflow 里调用

新建一个 Chatflow 应用,拖一个 LLM 节点出来。点节点 → 模型下拉 → 选刚才加的 anthropic/claude-sonnet-4.6。System Prompt 框里随便写一段,比如「你是一个简洁的技术写作助手,只用 200 字以内回答」。

右上「调试和预览」试一下。能正常流式输出文字就说明连通了。

如果你想做模型 fallback(主模型超时切备用),Dify 的做法是在 LLM 节点的「错误处理」里挂一个备选节点,备选节点选另一个模型供应商的模型。因为你已经把多个 ofox 模型都加进来了,备选用 GPT-5.4 或 DeepSeek 都行,无需新增供应商。

第四步:在 Workflow 里做模型路由(省钱关键)

Workflow 是 Dify 比单纯 Chatflow 多的一层。它支持 If/Else 分支、循环、并行节点、多个 LLM 串联,本质是 BPMN 风格的可视化任务编排。

真正能省钱的用法:按任务复杂度路由到不同价位的模型。一个典型的工单处理 Workflow:

[用户输入]

[LLM 节点 1:分类] ← deepseek/deepseek-v4-flash  (便宜,分类够用)

[If/Else:是否技术问题?]
    ├─ 是 → [LLM 节点 2A:技术回复] ← anthropic/claude-sonnet-4.6
    └─ 否 → [LLM 节点 2B:客服回复] ← moonshotai/kimi-k2.6

[输出]

实际项目里大多数请求都能跑在便宜模型上,复杂场景才落到 Claude。一个内部知识库 Workflow 跑混合路由后,月费用降了大半,回答质量人工抽查没有明显下降。前提是分类节点要足够准,不然便宜模型接到难题会拖后腿。

Workflow 之所以能玩得起来,本质前提是「同一份配置里多个模型随便切」。这就是为什么聚合平台 + Dify 比单一厂商接入要灵活得多。

第五步:Agent 应用接工具

Dify 的 Agent 应用本质是「LLM + 一组工具 + 自动规划循环」。配置流程跟 Chatflow 一样,区别是顶部要选一个支持 Function Calling / Tool Use 的模型,Claude Sonnet 4.6 和 GPT-5.4 是默认选择。

模型选好后在「工具」面板里挂上要用的工具(Dify 自带 Google Search、Wikipedia、DALL-E、计算器等几十个)。Agent 自己决定什么时候调什么工具,调用结果回传给模型继续推理。

一个常见的踩坑:有些模型在 ofox 上虽然能调用,但 Dify 这边没把 Function Call 字段勾上,Agent 调用会报 Tool calling is not supported。回模型供应商配置页面,把那个 Function Call 选项改成 Tool Call 即可。

进阶:Embedding 模型怎么配

Dify 的知识库(RAG)需要单独配 Embedding 模型。在「添加模型」时把「模型类型」改成 Text Embedding。模型 ID 用 openai/text-embedding-3-large 这种 OpenAI 兼容的就行;ofox 也代理了 BGE 这类国产 embedding。

base_url 还是 https://api.ofox.ai/v1,API Key 还是同一个。Dify 会自动调用 /embeddings 端点。

常见报错速查

报错原因解决
401 UnauthorizedKey 错 / 末尾有空格 / 账号余额为 0重新粘贴 Key,去 ofox 控制台核对账号状态
404 Not Foundbase_url 写到了 /chat/completions改回 https://api.ofox.ai/v1
Model not found模型 ID 拼写错 / 漏了 provider 前缀去 ofox 模型广场复制完整 ID
Tool calling is not supported没开启 Function Call 选项模型供应商配置里把 Function Call 改成 Tool Call
Dify 一直转圈不返回流式选项没开 / 网络中断打开 streaming,或换网络环境再测
Request timeout上游模型负载高配 Workflow fallback 节点;用 ofox 的备份模型

更全的 LLM API 错误码对照可以看 AI API 报错大全

跟 LobeChat、Cherry Studio 这些选谁?

Dify、LobeChat、Cherry Studio 都能接 ofox,但定位不同:

  • LobeChat / Cherry Studio:偏个人桌面 ChatGPT 替代品,聊天体验好,插件丰富。如果你只是想找个聊天客户端,参考 LobeChat 完全配置指南
  • Dify:偏团队应用平台,要做产品、要接业务系统、要分发给客户使用,选 Dify。
  • 直接调 API:自己写代码、不需要可视化,直接用 SDK 最干净。

三者不是互斥关系。常见组合是:开发期用 Dify 快速搭原型给业务方看,原型跑通后再决定要不要重写成代码。

ofox 都在 OpenAI 兼容协议这一层,三个平台共享同一个 Key,不需要重复对接。中转站之间的差异参考 AI API 中转站推荐 2026

写在最后

Dify + ofox 真正值的是灵活度。省钱和方便都是副产品。Workflow 节点能任意切模型,意味着 Claude 涨价、某个国产模型突然冒头、新一代 Gemini 上线,你都不用改 Dify 应用本身,只在「模型供应商」面板里加一个新条目,应用里下拉就能用上。

国内做 AI 应用最头疼的就是上游模型变化太快。这套架构把变化都吸收在 ofox 这一层,Dify 应用本身只管业务逻辑,不用再追新模型。