Mid-sized GPT-4.1 variant with GPT-4o performance at lower latency and cost. Features 1M context window, supports structured outputs and vision understanding at reduced pricing.
1M fenêtre de contexte
33K tokens de sortie max
Publié: 2025-04-14
Protocoles supportés:openai
Fournisseurs disponibles:Azure
Capacités:VisionFunction CallingPrompt Caching
Tarifs
| Type | Prix |
|---|---|
| Tokens d'entrée | $0.4/M |
| Tokens de sortie | $1.6/M |
| Lecture cache | $0.1/M |
| Recherche web | $0.01/R |
Exemples de code
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.ai/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="openai/gpt-4.1-mini",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modèles associés
Questions fréquentes
GPT-4.1 Mini sur Ofox.ai coûte $0.4/M par million de tokens d'entrée et $1.6/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
GPT-4.1 Mini supporte une fenêtre de contexte de 1M tokens avec un maximum de 33K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
GPT-4.1 Mini supporte les capacités suivantes : Vision, Function Calling, Prompt Caching. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.