How much does Z.ai: GLM-4.7-Flash (Free) cost on Ofox?

Z.ai: GLM-4.7-Flash (Free) on Ofox.ai costs $0/M per million input tokens and $0/M per million output tokens. Pay-as-you-go, no monthly fees.

What is Z.ai: GLM-4.7-Flash (Free)'s context window?

Z.ai: GLM-4.7-Flash (Free) supports a context window of 200,000 tokens, allowing you to process large documents and maintain long conversations.

How to use Z.ai: GLM-4.7-Flash (Free) API via Ofox?

Simply set your base URL to https://api.ofox.ai/v1 and use your Ofox API key. The API is OpenAI-compatible — just change the base URL and API key in your existing code.

What capabilities does Z.ai: GLM-4.7-Flash (Free) support?

Z.ai: GLM-4.7-Flash (Free) supports the following capabilities: function calling, prompt caching, web search. Access all features through the Ofox.ai unified API.

Z.ai: GLM-4.7-Flash (Free)

Name: Z.ai: GLM-4.7-Flash (Free)
Brand: z-ai
Availability: InStock
Rating: 5 (1 reviews)

ChatFREE

z-ai/glm-4.7-flash:free

ComparerCommencer

GLM-4.7-Flash est le modèle de classe 30B de Z.ai qui équilibre performances et efficacité. Il est en outre optimisé pour le codage agentique, avec des capacités de codage, une planification de tâches sur le long terme et une collaboration avec les outils renforcées, et il atteint des performances de premier plan parmi les modèles open source de même taille sur plusieurs classements publics de benchmarks. Il prend en charge l'appel de fonctions (utilisation d'outils), la mise en cache des prompts et la recherche web. Fenêtre de contexte : 200K tokens, sortie : 128K. Cette variante est gratuite : les tokens en entrée comme en sortie sont facturés $0. Disponible via les protocoles OpenAI et Anthropic sur Ofox.

Fenêtre de contexte

200K

Tokens de sortie max

128K

Publié

2026-01-19

Capacités

Function CallingPrompt CachingRecherche web

Fournisseurs disponibles

Zhipu

Protocoles supportés

openaianthropic

Tarifs

Type	Prix
Tokens d'entrée	$0/M
Tokens de sortie	$0/M
Recherche web	$0.01/R

Exemples de code

from openai import OpenAI

client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="YOUR_OFOX_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-4.7-flash:free",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
)

print(response.choices[0].message.content)

Benchmarks

LMArena ↗Évalué en tant que glm-4.7-flash

Z.ai: GLM-4.7-Flash (Free) obtient 1368 dans la catégorie générale du classement texte LMArena (contrôle de style), se classant 162e sur 374 modèles sur la base de 11 720 votes de préférence humaine (mis à jour le 2026-07-12).

Scores de benchmark de glm-4.7-flash sur LMArena
Catégorie	Score Arena	IC à 95 %	Rang	Votes
Général	1368	1362–1374	162e sur 374	11 720
Prompts difficiles	1387	1379–1394	159e sur 374	6 515
Programmation	1423	1412–1435	154e sur 369	2 686
Mathématiques	1366	1345–1387	162e sur 362	715
Écriture créative	1313	1299–1327	183e sur 372	1 809
Suivi d'instructions	1351	1341–1361	167e sur 374	3 171
Chinois	1434	1406–1461	120e sur 344	442

Source : LMArena · CC BY 4.0 · Mis à jour le 2026-07-12 · Méthodologie ↗ · Les rangs comparent les modèles au sein de chaque catégorie du classement texte LMArena (contrôle de style). Les scores proviennent d'évaluations de préférence humaine tierces, et non d'OFOX.

Plus de GLM

Modèles similaires

Anthropic: Claude Opus 5

$5/M/$25/M

Google: Gemini 3.5 Flash Lite

$0.3/M/$2.5/M

Google: Gemini 3.6 Flash

$1.5/M/$7.5/M

Questions fréquentes

Z.ai: GLM-4.7-Flash (Free) sur Ofox.ai coûte $0 par million de tokens d'entrée et $0 par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.