How much does Z.ai: GLM-4.7-Flash (Free) cost on Ofox?

Z.ai: GLM-4.7-Flash (Free) on Ofox.ai costs $0/M per million input tokens and $0/M per million output tokens. Pay-as-you-go, no monthly fees.

What is Z.ai: GLM-4.7-Flash (Free)'s context window?

Z.ai: GLM-4.7-Flash (Free) supports a context window of 200,000 tokens, allowing you to process large documents and maintain long conversations.

How to use Z.ai: GLM-4.7-Flash (Free) API via Ofox?

Simply set your base URL to https://api.ofox.ai/v1 and use your Ofox API key. The API is OpenAI-compatible — just change the base URL and API key in your existing code.

What capabilities does Z.ai: GLM-4.7-Flash (Free) support?

Z.ai: GLM-4.7-Flash (Free) supports the following capabilities: function calling, prompt caching, web search. Access all features through the Ofox.ai unified API.

Z.ai: GLM-4.7-Flash (Free)

Name: Z.ai: GLM-4.7-Flash (Free)
Brand: z-ai
Availability: InStock
Rating: 5 (1 reviews)

ChatFREE

z-ai/glm-4.7-flash:free

CompararEmpezar

GLM-4.7-Flash es el modelo de clase 30B de Z.ai que equilibra rendimiento y eficiencia. Está optimizado además para la programación con agentes, reforzando la capacidad de codificación, la planificación de tareas de largo alcance y la colaboración con herramientas, y logra un rendimiento líder entre los modelos de código abierto de su mismo tamaño en varias clasificaciones públicas de benchmarks. Admite llamada de funciones (uso de herramientas), caché de prompts y búsqueda web. Ventana de contexto: 200K tokens, salida: 128K. Esta variante es gratuita: los tokens de entrada y de salida se facturan a $0. Disponible a través de los protocolos OpenAI y Anthropic en Ofox.

Ventana de Contexto

200K

Tokens de Salida Máximos

128K

Lanzamiento

2026-01-19

Capacidades

Function CallingPrompt CachingBúsqueda Web

Proveedores Disponibles

Zhipu

Protocolos Soportados

openaianthropic

Precios

Tipo	Precio
Tokens de Entrada	$0/M
Tokens de Salida	$0/M
Búsqueda Web	$0.01/R

Ejemplos de Código

from openai import OpenAI

client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="YOUR_OFOX_API_KEY",
)

response = client.chat.completions.create(
    model="z-ai/glm-4.7-flash:free",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
)

print(response.choices[0].message.content)

Benchmarks

LMArena ↗Evaluado como glm-4.7-flash

Z.ai: GLM-4.7-Flash (Free) obtiene 1368 en la categoría general del ranking de texto de LMArena (control de estilo), ocupando el puesto 162 de 374 modelos según 11.720 votos de preferencia humana (actualizado el 2026-07-12).

Puntuaciones de benchmark de glm-4.7-flash en LMArena
Categoría	Puntuación Arena	IC del 95%	Puesto	Votos
General	1368	1362–1374	N.º 162 de 374	11.720
Prompts difíciles	1387	1379–1394	N.º 159 de 374	6515
Programación	1423	1412–1435	N.º 154 de 369	2686
Matemáticas	1366	1345–1387	N.º 162 de 362	715
Escritura creativa	1313	1299–1327	N.º 183 de 372	1809
Seguimiento de instrucciones	1351	1341–1361	N.º 167 de 374	3171
Chino	1434	1406–1461	N.º 120 de 344	442

Fuente: LMArena · CC BY 4.0 · Actualizado el 2026-07-12 · Metodología ↗ · Los puestos comparan modelos dentro de cada categoría del ranking de texto de LMArena (control de estilo). Las puntuaciones provienen de evaluaciones de preferencia humana de terceros, no de OFOX.

Más de GLM

Modelos Similares

Anthropic: Claude Opus 5

$5/M/$25/M

Google: Gemini 3.5 Flash Lite

$0.3/M/$2.5/M

Google: Gemini 3.6 Flash

$1.5/M/$7.5/M

Preguntas Frecuentes

Z.ai: GLM-4.7-Flash (Free) en Ofox.ai cuesta $0 por millón de tokens de entrada y $0 por millón de tokens de salida. Pago por uso, sin cuotas mensuales.