Запуск GLM 5.2 локально (2026): 2-bit на 256 GB Mac или коробке с 4090

GLM 5.2 (753B) на своём железе: 2-bit влезает в Mac Studio на 256 GB, 4-bit просит 512 GB, ~3-9 tok/s. GGUF-кванты для llama.cpp, LM Studio и 4090.

Маршрутизация GLM-5.2, DeepSeek V4, MiniMax M3 и Kimi K2.6 через один API (2026)

4 модели за одним ключом ofox: blended от $0.19/M (V4 Flash) до $2.40/M (GLM-5.2), разрыв 12.86x. Таблица на 1,000 задач/день режет $4,205/мес до $1,453 (−65.5%). Python + Node.

Jun 23, 2026

model-comparisoncost-optimization

GLM-5.2 против GPT-5.5: стоимость токенов при 10K/100K/1M запросов в день (2026)

GLM-5.2 ($1.4/$4.4 за M) против GPT-5.5 ($5/$30): blended $2.40 против $13.33 за M, соотношение 5.56x. Счета в день при 10K/100K/1M запросов, влияние 50% cache, A/B обеих моделей через ofox одной заменой строки.

Jun 21, 2026

glmopenai

GLM 5.2 на своём железе в 2026: оборудование, vLLM и сравнение цен с облаком

Self-host GLM 5.2 (753B MIT, контекст 1M): 8x H200 на vLLM FP8, 4x H100 на Q4 GGUF или Mac Studio на 2-bit. Сайзинг GPU, $/час vs план Z.ai за $30/мес, 4 движка с первого дня.

Jun 17, 2026

glmopen-weights

Codex недельный лимит: 5 способов и API drop-in с потолком (2026)

Лимит Codex упал с 96% до 0% за день (17 мая)? 5 решений — банк сбросов (12 июня), реферальные кредиты, drop-in API, предоплаченный потолок, downgrade. wire_api='responses'.

Jun 15, 2026

codexopenai

Codex недельный лимит: 7 решений и drop-in API (2026)

Лимит Codex закончился на Plus ($20) или Pro ($100)? 7 решений: банк сбросов от 11 июня, /status, drop-in API $1.49/M (vs $1.75 OpenAI), сессии $0.40-$2.40. Сохраните тариф.

Jun 15, 2026

codex-clirate-limits

DeepSeek V3.2 prompt caching в ofox: 10 минут, до 80% экономии (2026)

DeepSeek V3.2: cache read $0.06/M против $0.29/M miss (в 4.8× дешевле), output $0.43/M, контекст 128K. Настройка в ofox за 10 минут. Стабильный префикс снижает счёт команды на 80%.

Jun 15, 2026

deepseekapi-access

Как получить доступ к GLM 5.2: цены, настройка API и план открытых весов MIT (2026)

Zhipu объявила о GLM 5.2 13 июня 2026 — контекст 1M токенов, MoE на 753B общих параметров, Coding Plan за $10–$80 в месяц. Z.ai API и открытые веса под MIT открываются на неделе 22 июня 2026 — это руководство и есть тот 10-минутный путь подключения, который вы развернёте, как только ключи появятся. Шаги настройки, 6 типичных ошибок, план self-host и управляемые альтернативы с открытыми весами, доступные на ofox уже сегодня.

Jun 15, 2026

glmopen-weights

MiniMax M3 vs Claude Opus 4.8: SWE-Bench и цена в 10× (2026)

MiniMax M3 — 59% на SWE-Bench Pro, Claude Opus 4.8 — 69,2%. M3 в 10 раз дешевле за токен, у обоих 1M контекста. Разбираем, какую модель брать на кодинг в 2026.

Jun 14, 2026

model-comparisonclaude

Claude Code /cd: смена директории без потери prompt cache (v2.1.169)

/cd в Claude Code v2.1.169 (2026-06-08) меняет рабочую директорию и сохраняет prompt cache (90% скидка на вход). 3 кейса, где кэш молча умирает: CLAUDE.md, MCP, /add-dir.

Jun 11, 2026

claude-codeclaude

Claude Code --safe-mode: один флаг отключает 5 слоёв кастомизации (2026)

В Claude Code v2.1.169 появился --safe-mode: один флаг отключает CLAUDE.md, плагины, skills, hooks и MCP-серверы. Чем он отличается от /clear, как запустить на Mac/Windows за 10 секунд, и три типичные ошибки при отладке.

Jun 11, 2026

claude-codetutorial