Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。
1M fenêtre de contexte
64K tokens de sortie max
Publié: 2026-02-16
Protocoles supportés:openaianthropic
Fournisseurs disponibles:Aliyun
Capacités:VisionFunction CallingRaisonnementPrompt CachingEntrée vidéo
Tarifs
| Type | Prix |
|---|---|
| Tokens d'entrée | $0.4/M |
| Tokens de sortie | $2.4/M |
| Lecture cache | $0.04/M |
| Écriture cache | $0.4/M |
| Recherche web | $0.01/R |
Exemples de code
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="bailian/qwen3.5-plus",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modèles associés
Questions fréquentes
Qwen3.5 Plus sur Ofox.ai coûte $0.4/M par million de tokens d'entrée et $2.4/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
Qwen3.5 Plus supporte une fenêtre de contexte de 1M tokens avec un maximum de 64K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
Qwen3.5 Plus supporte les capacités suivantes : Vision, Function Calling, Raisonnement, Prompt Caching, Entrée vidéo. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.