Настоящие деньги за поддельные модели: исследование системного мошенничества в AI API-ретрансляторах

Настоящие деньги за поддельные модели: исследование системного мошенничества в AI API-ретрансляторах

В марте 2026 года исследовательская группа из CISPA Helmholtz Center for Information Security опубликовала важную статью: Real Money, Fake Models: Deceptive Model Claims in Shadow APIs.

Это первый системный аудит AI API-ретрансляторов (в статье они названы «Shadow API»). Выводы шокируют: вы платите за GPT-5, а получаете ответы от GLM-4-9B.

Комикс о производстве, продаже, использовании и аудите Shadow API Иллюстрация из статьи: фабрика Shadow API заворачивает дешёвые модели в обёртку OpenAI и продаёт пользователям

Насколько серьёзна проблема?

Исследователи нашли 17 широко используемых Shadow API-сервисов в научной литературе. Это не мелкие операции — крупнейший из них процитирован в 187 научных публикациях и имеет 58 639 звёзд на GitHub.

Ещё поразительнее: 62% (116 статей) из этих публикаций вышли на ведущих конференциях — ACL, CVPR, ICLR. Иными словами, значительная часть экспериментальных данных в работах высшего уровня может быть основана на фальсифицированных ответах моделей.

Распределение статей с Shadow API по конференциям Сервисы Shadow API, цитируемые в научных работах, охватывают практически все ведущие AI-конференции

Кто пользуется Shadow API?

Географическое распределение красноречиво: 82,12% пользователей — из материкового Китая.

Географическое распределение пользователей Shadow API Более 80% авторов статей, использующих Shadow API, находятся в регионах с ограниченным доступом к API

Причина проста — API OpenAI, Anthropic, Google напрямую недоступны в материковом Китае. Разработчики и исследователи вынуждены обращаться к ретрансляторам. Само по себе это не проблема. Проблема в том, честен ли ваш ретранслятор.

17 ретрансляторов — у 15 даже нет бизнес-лицензии

В статье проведена проверка соответствия всех 17 сервисов:

  • 15 (88,2%) не имеют прозрачных идентификационных данных или верифицируемого происхождения
  • Только 1 имеет действующую корпоративную ICP-лицензию
  • 15 управляются физическими лицами, без регистрации юрлица
  • 2 прекратили работу в период исследования
  • Поставщики часто меняют источник моделей без уведомления пользователей

Цитируемость и звёзды GitHub 17 Shadow API 17 проверенных сервисов (анонимизированы как A-Q), отсортированы по цитируемости и звёздам на GitHub

Приложение Table 7 показывает полную картину соответствия всех 17 ретрансляторов — подавляющее большинство не проходит ни по одному ключевому критерию:

Результаты проверки соответствия 17 Shadow API Table 7: полная картина — почти сплошь индивидуальные операторы без юрлица, без ICP-лицензии

Данные очевидны: за исключением H и N, у остальных 15 во всех столбцах «Legal Entity», «Reg. ID», «ICP», «Biz. Registry» стоят прочерки. Способы оплаты — преимущественно личные кошельки Alipay/WeChat, некоторые принимают криптовалюту USDT.

Примечательно, что из 17 сервисов 11 построены на системах OneAPI/NewAPI с открытым кодом. Эти инструменты предназначены для управления API-ключами и маршрутизации запросов, но они же делают подмену моделей элементарной.

Главный вывод: вы платите за одно, а получаете другое

Исследователи использовали технологию идентификации отпечатков LLMmap для проверки 24 эндпоинтов. Результаты:

  • 45,83% эндпоинтов не прошли проверку (идентичность модели не совпадает с заявленной)
  • 12,50% показали значительное отклонение косинусного расстояния
  • Серии GPT и DeepSeek — зона наибольшего риска

Самый вопиющий случай: ретранслятор Shadow API A заявлял модель GPT-5, но отпечаток показал, что фактически возвращается GLM-4-9B-Chat — модель с открытым кодом и значительно меньшим числом параметров. DeepSeek-Reasoner также подменялся на обычный DeepSeek-Chat.

Ниже — ключевая таблица доказательств из статьи с цветовой маркировкой соответствия идентичности модели на каждом эндпоинте:

Результаты проверки отпечатков моделей Table 2: красный = несоответствие идентичности модели (подмена), жёлтый = аномально высокое косинусное расстояние, зелёный = совпадение с официальным

Чётко видно: Shadow API A и H — серия GPT практически полностью помечена красным. Вы вызываете GPT-5, а получаете GLM-4-9B или Qwen2.5-7B.

Какова разница в производительности?

Авторы сравнили официальный API и Shadow API на четырёх бенчмарках:

Математические рассуждения (AIME 2025) и научные вопросы (GPQA)

Сравнение производительности AIME 2025 и GPQA Shadow API A (красный) значительно уступает официальному API (серый) в сложных задачах рассуждения

Сравнение производительности GPQA Diamond В научных вопросах уровня PhD точность Shadow API также резко падает

Shadow API A на задачах математического рассуждения AIME 2025 показал точность на 40 процентных пунктов ниже официального API.

Медицина и право (сценарии высокого риска)

Бенчмарк MedQA В медицинских сценариях производительность Shadow API катастрофически падает

Данные по медицине самые пугающие: точность Gemini-2.5-Flash на MedQA (экзаменационные вопросы для лицензии врача США) упала с 83,82% до примерно 37% — разница 47,21%.

В статье приведён конкретный пример ошибки: в вопросе о методе диагностики ВИЧ официальный API правильно выбрал «иммуноанализ дифференциации антител ВИЧ-1/ВИЧ-2», а Shadow API ошибочно указал «генотипирование вируса».

Если ваше медицинское AI-приложение использует такой ретранслятор, последствия могут быть катастрофическими.

Безопасность тоже под угрозой

Оценка безопасности JailbreakBench Поведение Shadow API в области безопасности непредсказуемо — одни слишком мягкие, другие слишком строгие

Фильтрация безопасности в Shadow API не соответствует официальному API: оценка вредоносного контента то занижается примерно на 0,23, то почти удваивается. Это значит, что на политику безопасности ретранслятора нельзя полагаться для защиты вашего приложения.

Финансовые потери: заплатили $15, получили на $6

Авторы проанализировали экономику 1 273 запросов к GPT-5:

  • Пользователи заплатили $14,84 по официальному тарифу
  • Реальная стоимость полученных токенов — $5,70–$7,77
  • Прибыль ретранслятора на каждую партию запросов: $7,07–$9,14
  • Количество ошибок на доллар у Shadow API в 2–4 раза выше, чем у официального API

В статье выделены три схемы мошенничества:

СхемаМетодТипичное проявление
Наценка на информационной асимметрииБерут в 7 раз больше официальной цены, подменяют на дешёвую модельAPI A
Скрытая подмена при «честной» ценеЦена как у официального API, но модель заменена на более дешёвуюНа вид адекватная цена, по сути обман
Перепродажа с маржойНебольшая наценка + деградация модели на бэкендеТруднее всего обнаружить

Что это значит для разработчиков?

Статья даёт чёткие рекомендации — при выборе API-ретранслятора проверяйте как минимум четыре вещи:

  1. Проверка отпечатков: используйте инструменты типа LLMmap для идентификации модели
  2. Статистические тесты: тест эквивалентности модели на 500+ образцах
  3. Проверка на бенчмарках: верифицируйте точность на известных наборах данных
  4. Проверка юрлица: регистрация бизнеса и ICP-лицензия оператора

Авторы также рекомендуют исследователям заблаговременно фиксировать в публикациях URL эндпоинта API, заявленную версию модели, дату доступа и тарификацию для возможности аудита.

Ofox: прозрачный официальный прокси, а не чёрный ящик

Проблемы, описанные в этой статье, — именно то, что Ofox решает с первого дня.

Принципиальное отличие Ofox от Shadow API:

Shadow API (объекты аудита)Ofox
Источник моделейНеизвестный, возможна подмена на дешёвыеПрямое подключение к официальным API OpenAI / Anthropic / Google
Обработка запросовЧёрный ящик, возможна модификация запросов и ответовПрозрачный прокси, передаёт запросы без изменений
Совместимость протоколовОбычно только формат OpenAIОдновременная совместимость с тремя нативными SDK: OpenAI, Anthropic, Gemini
Юридический статус88% без регистрации, личные кошельки AlipayЗарегистрированное предприятие, легальная деятельность
Стабильность работы2 сервиса прекратили работу за период исследованияСтабильная работа, двойное ускорение через Alibaba Cloud / Volcengine
Прозрачность ценВозможна наценка в 7 разОткрытые цены, синхронизированные с официальными

Вызываете GPT-5 — получаете GPT-5. Вызываете Claude Opus — получаете Claude Opus. Без подмен, без деградации, без чёрного ящика.

Подход Ofox прост: прозрачный прокси-слой, помогающий разработчикам решить проблему сетевого доступа и при этом обеспечивающий 100% соответствие ответов официальному API. Используйте OpenAI SDK, Anthropic SDK или Google SDK — всё подключается напрямую, достаточно изменить один base_url.

Если вы сейчас пользуетесь сомнительным API-ретранслятором, рекомендуем проверить подлинность получаемой модели методами из этой статьи. Или просто перейдите на сервис, который проверять не нужно:

ofox.ai — один API Key, 100+ моделей, официальные оригиналы, прозрачно и надёжно.


Информация о статье:

  • Название: Real Money, Fake Models: Deceptive Model Claims in Shadow APIs
  • Авторы: Yage Zhang, Yukun Jiang, Zeyuan Chen, Michael Backes, Xinyue Shen, Yang Zhang
  • Институт: CISPA Helmholtz Center for Information Security
  • Ссылка: arxiv.org/abs/2603.01919

Все изображения в статье взяты из оригинальной публикации, авторские права принадлежат авторам статьи.