Z.ai: GLM-4.6
Chatz-ai/glm-4.6Zhipu GLM-4.6 with 128K context and strong instruction following. Excellent balance of performance and cost for Chinese language tasks.
200K kontextfenster
128K max. ausgabe-tokens
Veröffentlicht: 2025-09-30
Unterstützte Protokolle:openaianthropic
Verfügbare Anbieter:Zhipu
Fähigkeiten:Function CallingReasoningPrompt CachingWebsuche
Preise
| Typ | Preis |
|---|---|
| Eingabe-Tokens | $0.4/M |
| Ausgabe-Tokens | $1.9/M |
| Cache-Lesen | $0.11/M |
| Websuche | $0.005/R |
Code-Beispiele
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="z-ai/glm-4.6",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Verwandte Modelle
Häufig gestellte Fragen
Z.ai: GLM-4.6 auf Ofox.ai kostet $0.4/M pro Million Eingabe-Tokens und $1.9/M pro Million Ausgabe-Tokens. Pay-as-you-go, keine monatlichen Gebühren.
Z.ai: GLM-4.6 unterstützt ein Kontextfenster von 200K Tokens mit max. Ausgabe von 128K Tokens, was die Verarbeitung großer Dokumente und lange Konversationen ermöglicht.
Einfach Ihre Base-URL auf https://api.ofox.ai/v1 setzen und Ihren Ofox API Key verwenden. Die API ist OpenAI-kompatibel — einfach Base-URL und API Key in Ihrem bestehenden Code ändern.
Z.ai: GLM-4.6 unterstützt folgende Fähigkeiten: Function Calling, Reasoning, Prompt Caching, Websuche. Zugriff auf alle Features über die einheitliche Ofox.ai API.