Qwen3 Coder Flash
Chatbailian/qwen3-coder-flash基于Qwen3的代码生成模型,继承Qwen3-Coder-Plus的coding agent能力,支持多轮工具交互,重点优化仓库级别理解能力并增加工具调用稳定性。
1M kontextfenster
64K max. ausgabe-tokens
Veröffentlicht: 2025-08-05
Unterstützte Protokolle:openaianthropic
Verfügbare Anbieter:Aliyun
Fähigkeiten:Function CallingReasoningPrompt Caching
Preise
| Typ | Preis |
|---|---|
| Eingabe-Tokens | $0.5/M |
| Ausgabe-Tokens | $2.5/M |
| Cache-Lesen | $0.06/M |
| Cache-Schreiben | $0.27/M |
Code-Beispiele
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="bailian/qwen3-coder-flash",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Verwandte Modelle
Häufig gestellte Fragen
Qwen3 Coder Flash auf Ofox.ai kostet $0.5/M pro Million Eingabe-Tokens und $2.5/M pro Million Ausgabe-Tokens. Pay-as-you-go, keine monatlichen Gebühren.
Qwen3 Coder Flash unterstützt ein Kontextfenster von 1M Tokens mit max. Ausgabe von 64K Tokens, was die Verarbeitung großer Dokumente und lange Konversationen ermöglicht.
Einfach Ihre Base-URL auf https://api.ofox.ai/v1 setzen und Ihren Ofox API Key verwenden. Die API ist OpenAI-kompatibel — einfach Base-URL und API Key in Ihrem bestehenden Code ändern.
Qwen3 Coder Flash unterstützt folgende Fähigkeiten: Function Calling, Reasoning, Prompt Caching. Zugriff auf alle Features über die einheitliche Ofox.ai API.