基于Qwen3的代码生成模型,继承Qwen3-Coder-Plus的coding agent能力,支持多轮工具交互,重点优化仓库级别理解能力并增加工具调用稳定性。
1M 上下文窗口
64K 最大输出 token
发布日期: 2025-08-05
支持的协议:openaianthropic
可用供应商:Aliyun
能力:函数调用推理提示缓存
定价
| 类型 | 价格 |
|---|---|
| 输入 Token | $0.5/M |
| 输出 Token | $2.5/M |
| 缓存读取 | $0.06/M |
| 缓存写入 | $0.27/M |
代码示例
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="bailian/qwen3-coder-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
相关模型
常见问题
Qwen3 Coder Flash 在 Ofox.ai 上的价格为输入 $0.5/M/百万 Token,输出 $2.5/M/百万 Token。按量计费,无月费。
Qwen3 Coder Flash 支持 1M Token 的上下文窗口,最大输出 64K Token,可处理大型文档并维持长对话。
只需将 base URL 设置为 https://api.ofox.ai/v1,并使用你的 Ofox API Key。API 兼容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Qwen3 Coder Flash 支持以下能力:函数调用, 推理, 提示缓存。通过 Ofox.ai 统一 API 访问所有功能。

