Skip to Content
변경 로그Changelog

업데이트 로그

OfoxAI 의 모든 발걸음 — 새로운 모델, 새로운 기능, 새로운 경험. 매주 업데이트됩니다.


v1.1.0-20260428

💰 예산 관리 출시 — 팀 / 멤버 / API Key 3 차원

“얼마나 쓸지” 를 구두 합의에서 시스템 단위의 강제 제약으로 바꿨습니다. 하나의 조직에서 3 가지 차원 × 3 가지 주기 의 소비 한도를 동시에 설정할 수 있습니다.

차원적용 시나리오
팀 (Organization)회사 / 프로젝트 전체 예산
멤버 (User)개별 직원의 월간 할당량
API Key개별 애플리케이션 / 서비스의 독립 예산

각 차원마다 일일 / 월간 / 누적 3 가지 주기 한도를 별도로 설정할 수 있으며, 한도 초과 시 요청이 자동으로 거부됩니다.

진행률 표시바는 3 단계 경고를 제공합니다.

  • 🟢 40% — 사용량 정상
  • 🟡 80% — 한도 임박
  • 🔴 110% — 한도 초과 (고동시성 순간 돌파를 막기 위한 버퍼 포함)

계층 제약은 자동으로 검증됩니다. API Key 한도 ≤ 멤버 한도 ≤ 팀 한도. 프론트엔드에서 상위 할당량을 실시간으로 안내해 잘못된 설정을 방지합니다.

진입 경로: 설정 → 할당량 

⏱️ 팀 단위 RPM 할당량

팀 단위 요청 속도 제한 (RPM) 을 새로 추가하여, 여러 API Key 가 누적되어 상위 공급사 할당량을 돌파하는 문제를 근본적으로 차단합니다.

  • 팀 전체를 합산하여 RPM 을 계산하며, 더 이상 Key 별로 따로 계산하지 않습니다
  • 기본값은 100 RPM 이며, 더 높은 빈도가 필요한 경우 [email protected] 으로 문의하세요
  • 한도 초과 요청은 자동으로 429 Too Many Requests 를 반환합니다

적용 시나리오: CI/CD 의 갑작스러운 트래픽, 배치 작업의 폭주 방지, 다인 협업 팀의 통합 속도 제한.

🪙 잔액 조회 OpenAPI

GET /v1/user/balance 를 새로 추가했습니다. OfoxAI API Key 하나만으로 계정의 사용 가능 잔액, 누적 입금액, 누적 차감액을 조회할 수 있습니다.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

응답 구조는 cc-switch  등의 서드파티 도구와 호환되어, 잔액 제공자로 바로 연동할 수 있습니다.

🧰 cc-switch 통합 지원

OfoxAI 는 이제 cc-switch  와 네이티브로 호환됩니다. cc-switch 에서 OfoxAI 로 전환하기만 하면 별도 개발 없이 실시간 잔액 상태를 확인할 수 있습니다.

cc-switch 에서 OfoxAI 잔액 조회 설정

4 단계로 설정 완료:

  1. 사용량 조회 설정 열기 — OfoxAI 공급자 카드 우상단의 📊 아이콘을 클릭합니다
  2. 사용량 조회 활성화 — 스위치를 켭니다
  3. API Key 입력 — 어떤 OfoxAI 사용자 단위 API Key 든 가능합니다 (Dashboard  에서 생성)
  4. 요청 주소 — “범용 템플릿” 을 선택하고 주소에 https://api.ofox.ai/v1 을 입력합니다

저장하면 공급자 카드에 잔여: 64.77 USD 와 같은 잔액 상태가 즉시 표시됩니다.

자세한 연동 단계: cc-switch 통합 가이드.


신규 모델 · 2026-04-24

🤖 신규 모델

  • GPT-5.5 (OpenAI) — 복잡한 전문 워크로드를 위한 새 플래그십, 1M+ 토큰 컨텍스트 (922K 입력 / 128K 출력), 추론 신뢰성과 토큰 효율이 GPT-5.4 대비 전반적으로 향상
  • DeepSeek V4 Pro (DeepSeek) — 1.6T 총 파라미터 / 49B 활성 MoE 플래그십, 1M 토큰 컨텍스트, 고급 추론·코드·장기 Agent 워크플로에 최적화
  • DeepSeek V4 Flash (DeepSeek) — 284B 총 파라미터 / 13B 활성 MoE 가속 버전, 1M 토큰 컨텍스트, 고처리량과 저지연 중심의 극강의 가성비

신규 모델 · 2026-04-21

🤖 신규 모델

  • Kimi K2.6 (Moonshot AI) — 역대 최강 Kimi, 코드·추론·시각 이해 모두 업그레이드
  • GPT Image 2 (OpenAI) — 차세대 이미지 모델, 더 풍부한 디테일과 더 정확한 재현

신규 모델 · 2026-04-16

🤖 신규 모델

  • Claude Opus 4.7 (Anthropic) — Anthropic 의 새 플래그십, 추론과 작문 능력이 한 단계 더 향상

이벤트 · 2026-04-15

🎁 GPT 4 월 사용액 리워드, 최대 $250 증정

  • 기간 — 4 월 15 일 ~ 25 일, 11 일 한정
  • 리워드 — GPT 전체 시리즈 사용액의 25% 리워드, 6 단계 선택 가능, 최대 $250 증정
  • 지급 — 리워드 크레딧은 영구 유효, 이벤트 종료 후 원클릭으로 교환
  • — 멤버의 사용액이 자동으로 합산되어 함께 더 높은 단계에 도전

이벤트 페이지: GPT 4 월 사용액 리워드 .


v1.0.55-20260407

🎁 기프트 카드 시스템 출시

지갑 페이지  에서 기프트 카드 코드를 입력하면 잔액이 즉시 충전됩니다. AI 를 친구에게 선물하는 가장 우아한 방법.

  • 프라이버시 보호 — 거래 내역에는 카드 번호의 마지막 4 자리만 표시
  • 보안 보장 — 다층 남용 방지와 종단간 암호화로 모든 카드를 안전하게

🔍 모델 검증 도구 출시

먼저 분명히 해 둡니다. OfoxAI 는 중계 사이트가 아닙니다.

  • 운영 주체 — NICE TALK PTE. LTD. (글로벌 LLM 플랫폼)
  • 모델 라이선스 — 공식 모델 제공자의 정식 라이선스
  • 하부 컴퓨팅 — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud 등 클라우드 사업자가 직접 제공
  • 호출 경로 — 엣지 CDN 이 클라우드 사업자에 직접 연결, 중계 없음, 교체 없음

어떤 LLM 게이트웨이에서도 모델의 진위를 검증할 수 있도록 무료 검사 도구를 공개했습니다. API Base 와 Key 만 입력하면 모델이 교체되었는지 원클릭으로 확인할 수 있습니다.

도구 진입 경로: 모델 검증 . 모든 플랫폼을 지원하며, OfoxAI 에 한정되지 않습니다.


v1.0.54-20260403

💳 결제 및 충전 업그레이드

  • Airwallex 결제 채널 추가 — Stripe 외에 또 하나의 선택지로, 해외 결제가 더 매끄러워졌습니다
  • USD / CNY / SGD 지원 — 익숙한 통화로 결제
  • 단일 충전 한도 $10,000 로 상향 — 대형 고객도 더 이상 제약 없이
  • 에이전트 추천 첫 충전 시 $3 추가 증정 — 에이전트 초대로 가입한 사용자는 첫 충전 시 자동으로 $3 추가 증정

🏢 엔터프라이즈 페이지 출시 — 많이 쓸수록 더 많이 절약

월 사용액이 기준에 도달하면 자동으로 리베이트, 신청 불필요, 별도 연결 불필요, 다음 달 초 입금.

등급월 사용액 기준리베이트 비율
Bronze$1,000+3%
Silver$5,000+4%
Gold$10,000+5%
Platinum$20,000+7%

함께 제공되는 엔터프라이즈 기능:

  • 0% 플랫폼 수수료 — 모델 공식 가격 그대로
  • 글로벌 가속 노드 — 도쿄 / 싱가포르 / 프랑크푸르트 다지역 배포
  • 99.99% 가용성 SLA — 다지역 이중화, 자동 페일오버
  • 콘텐츠 무보존 — Prompt 와 응답은 기본적으로 기록·학습하지 않음

자세히: 엔터프라이즈 서비스 .

🤖 신규 모델

  • GLM-5V-Turbo (Zhipu) — GLM 멀티모달 시리즈의 Turbo 가속 버전
  • Qwen3.6 Plus (Alibaba Bailian) — Qwen3.6 의 최신 Plus 사양

v1.0.47-20260327

🏷️ 한 모델, 여러 이름

모델에 짧은 이름을 붙이고 옛 ID 도 유지 — 플랫폼 전환 시 마이그레이션 비용 제로. 별칭은 즉시 반영되며 라우팅이 자동으로 인식합니다.

몇 가지 예시:

정식 ID사용 가능한 별칭
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

전체 별칭 목록은 GET https://api.ofox.ai/v1/models 로 조회할 수 있으며, 응답의 aliases 필드를 그대로 사용할 수 있습니다.

🖼️ 이미지 생성 — 장당 과금

이미지 API 는 생성된 이미지 수를 기준으로 과금되며, 장당 가격이 투명합니다. 표준 사이즈는 각 공급사의 네이티브 사이즈로 자동 매핑되어 클라이언트 코드를 변경할 필요가 없습니다.

📊 이미지 사용량 시각화

콘솔 홈, 사용량, 비용, 랭킹 페이지에 “이미지” 차원의 통계가 추가되어 매월 이미지 사용량을 한눈에 파악할 수 있습니다.

🤖 신규 모델

  • GLM 5.1 (Zhipu) — GLM 시리즈 차세대, 범용 능력 전반 업그레이드

🔗 더 짧아진 초대 링크

초대 링크가 긴 문자열에서 /x/내코드 형식으로 변경되어, 외우기 쉽고 공유하기 편해졌습니다.


v1.0.39-20260320

🔄 모델 Fallback — 메인 모델 장애 시 자동 전환

메인 모델이 4xx/5xx 오류를 반환하면 게이트웨이가 사용자가 설정한 백업 모델을 자동으로 시도하며, 최대 3 단계까지 안전망을 제공합니다. OpenAI / Anthropic / Gemini 3 가지 프로토콜 모두 지원하며 클라이언트 코드 변경이 필요 없습니다. 자세히: Fallback 문서.

⚔️ OfoxAI vs OpenRouter, 항목별 비교

OpenRouter 는 충전 시마다 5.5% 의 수수료를 부과하지만, OfoxAI 는 0% 입니다. 똑같이 100+ 모델을 커버하며, 월 사용액 $1,000 이상이면 종합 비용에서 10% 이상을 더 절약할 수 있습니다. 전체 비교: OfoxAI vs OpenRouter .

🤖 신규 모델

  • GLM-5-Turbo (Zhipu) — GLM-5 의 Turbo 가속 버전
  • GPT-5.4 Mini / Nano (OpenAI) — GPT-5.4 의 경량 두 가지 사양으로 호출 비용을 대폭 절감
  • MiniMax M2.7 / M2.7 Highspeed — MiniMax 차세대, Highspeed 버전은 저지연 시나리오에 특화

v1.0.36-20260313

🎊 3 월 Claude 리워드

전 등급 20% 리워드, 이벤트 팝업에서 쿠폰 코드 OFOXAI2603 을 원클릭 복사하세요.

충전리워드실수령
$20$4$24
$50$10$60
$100$20$120
$200$40$240
$500$100$600

이벤트 페이지: Claude Spring 2 차 .

🤖 신규 모델

🖼️ 임베딩, 전체 모달 커버

Gemini Embedding 은 텍스트 / 이미지 / 오디오 / 비디오 4 가지 모달을 지원합니다. Qwen, Volcano 의 멀티모달 임베딩도 직접 연결됩니다.

⚡ 사용량 데이터 — 시간 단위 업데이트

사용량 집계가 일 1 회에서 시간 1 회로 업그레이드되어, 사용 직후 빠르게 Dashboard 에서 확인할 수 있습니다.

💰 쿠폰 표시 개선

주문 목록에 각 주문의 할인 금액과 증정 금액이 모두 표시됩니다.


v1.0.32-20260303

🎉 3 월 Claude 이벤트 시작

Dashboard 에 이벤트 배너와 사용액 진행 바가 추가되었고, 쿠폰 오류 메시지가 한·영 이중 언어로 전면 로컬라이즈되었습니다. 이벤트 페이지: Claude Spring 1 차 .

🤖 신규 모델

🏷️ 내비게이션 리뉴얼


v1.0.30-20260226

🔒 GitHub 원클릭 로그인

로그인 페이지에 GitHub OAuth 진입점을 추가했습니다. 원클릭으로 가입/로그인이 완료되며, 시스템이 마지막으로 사용한 로그인 방식을 기억합니다. 설정 페이지에서 GitHub 계정 연결·해제 및 프로필 사진 동기화를 지원합니다.

🤖 신규 모델

📱 모바일 반응형

콘솔의 사용자, 조직, 주문 모듈이 모바일에 완전히 대응합니다. 사이드바 접기, 테이블 스마트 축소를 지원해 작은 화면에서도 부드러운 사용 경험을 제공합니다.


v1.0.27-20260217

📊 데이터 분석 대시보드

사용량, 비용, 요청 수의 인터랙티브 차트 3 종. 월별 트렌드를 확인하고 모델별 랭킹을 생성할 수 있으며, 필터는 Provider / Model / User / API Key / 기간을 자유롭게 조합할 수 있습니다. 당신의 주력 모델은 무엇인가요? 한눈에 알 수 있습니다.

🤖 신규 모델

  • Claude Sonnet 4.6 (Anthropic) — Sonnet 시리즈의 새 버전, 가성비 선택지
  • Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5 Plus 사양 출시
  • Doubao Seed 2.0 4 가지 사양 (Volcano) — Code  / Lite  / Mini  / Pro , Doubao Seed 2.0 풀 시리즈 동시 출시

🌐 OpenAI 동작에 정렬

chat/completions 에서 stream 을 전달하지 않으면 기본값이 비스트리밍이 되어, OpenAI 공식 동작과 완전히 일치합니다. 코드는 아무것도 바꿀 필요가 없습니다.


v1.0.24-20260212

🤖 신규 모델

  • GLM-5 (Zhipu) — GLM 시리즈의 차세대 플래그십
  • MiniMax M2.5 / M2.5 Lightning — MiniMax 두 가지 사양, Lightning 버전은 저지연에 최적화

🎊 첫 로그인 환영

첫 로그인 시 환영 팝업이 OpenAI / Anthropic / Gemini 3 가지 API 엔드포인트를 모두 표시하며 원클릭 복사를 지원합니다. 폭죽 애니메이션과 함께 개발자에게 작은 의식감을 선사합니다.

🧠 공급사 친화성 캐시

같은 사용자가 서로 다른 모델 간을 전환할 때, 게이트웨이가 같은 공급사를 우선 선택합니다. Prompt Cache 적중률이 높아져 응답이 더 빠르고 비용은 더 낮아집니다.

🎟️ 엔젤 초대 코드 시스템

완전한 초대 코드 체계 출시: 카드 형 UI, 가입 다이얼로그, 사용 기록 테이블 한눈에 보기. 양방향 보상 메커니즘과 원클릭 전용 공유 포스터 생성을 지원합니다.


v1.0.20-20260206

🤖 신규 모델

  • Claude Opus 4.6 (Anthropic) — Anthropic 의 새 플래그십, 추론과 작문 능력의 한계를 다시 한 번 돌파

🌍 한·영 원클릭 전환

1100+ 개의 번역으로 전 플랫폼 한·영 이중 언어가 매끄럽게 전환됩니다. 언어 설정은 쿠키가 기억해 줍니다.

🔍 Web Search 회당 과금

OpenAI / Anthropic / Gemini 3 가지 프로토콜의 Web Search 도구 호출이 모두 정확하게 과금됩니다.

📊 Dashboard 리뉴얼

  • 로그인 페이지에서 사용자명으로 개인화된 인사를 표시 (일반 “Hi” 대체)
  • 사용량 통계가 일 단위에서 주 단위로 업그레이드
  • API Key 표시는 3 단계로 전환 가능: 완전 숨김 / 마스킹 / 완전 표시

💵 가격 표시 개선

$0.6000 의 끝자리 0 을 자동 제거하여 $0.6 으로 표시. 잔액 부족 오류 메시지도 USD 형식으로 변경되어 머릿속에서 환산할 필요가 없습니다.

📚 문서 사이트 정식 오픈


v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 기반을 다진 2 주

출시 후 첫 2 주, 우리는 한순간도 쉬지 않았습니다. 매번의 릴리스가 플랫폼을 더 안정적이고, 더 정확하고, 더 쉽게 연동할 수 있게 만들었습니다.

💻 Claude Code 공식 대응

우리 자신이 Claude Code 로 코드를 씁니다. 1 월 21 일, 게이트웨이가 Claude Code 에 완전히 대응했습니다 — API Base 를 OfoxAI 로 가리키고 sk-*** Key 만 교체하면 모든 Claude 모델을 즉시 사용할 수 있습니다.

🧠 Thinking 추론 체인

Claude 와 Gemini 의 thinking block (모델의 “사고 과정”) 이 전 프로토콜을 관통합니다. 결과뿐만 아니라 모델이 어떻게 생각하는지도 볼 수 있습니다.

🌐 Gemini 네이티브 프로토콜 지원

OpenAI 호환 모드만이 아닙니다 — Gemini 의 네이티브 API generateContent 도 동작합니다. Google 공식 SDK 가 직접 연결되며 변환 손실이 없습니다.

💵 다통화 Stripe 결제

USD 외에 CNY / SGD 등 다통화 진입점을 추가했고, 환율 스냅샷이 주문에 함께 보존됩니다. 아시아 태평양 사용자는 자국 통화로 직접 결제할 수 있습니다.

🎯 청구서 정밀도 소수점 6 자리

NanoDollar 단위 정밀도 업그레이드. 단일 API 호출이 단지 몇 밀리달러를 소비하더라도 정확하게 기록되고 있는 그대로 과금됩니다. 대형 고객은 손해 보지 않고, 소형 고객도 억울하지 않습니다.


v1.0.0 · 2026-01-16 — The Gateway Goes Live

“오늘부터, 100+ 모델, 하나의 Key.”

OfoxAI  플랫폼이 정식으로 외부에 공개된 날입니다.

🚀 플랫폼 첫 공개 기능

  • 3 가지 프로토콜 네이티브 호환OpenAI / Anthropic / Gemini 3 대 프로토콜 직접 지원, 기존 코드 변경 없이 연동
  • 100+ 모델 통합 연결Claude , GPT , Gemini , DeepSeek , Qwen  등 100 여 개 모델을 하나의 Key 로 모두 연결. 전체 카탈로그: 모델 광장 
  • 스마트 라우팅 — Provider × Model 단위의 라우팅 알고리즘으로 가장 빠르고 안정적인 채널을 자동 선택. 자세히: Provider Routing
  • 셀프서비스 API Key 관리Dashboard  에서 원클릭으로 생성, 시작/중지, 사용량 추적
  • 사용량 기반 과금, 0% 플랫폼 수수료 — 모델 공식 가격 그대로. 가격 조회: Pricing
  • Stripe 신용카드 결제 — 충전 즉시 반영, 잔액 조회 가능
  • 글로벌 엣지 노드 — 도쿄 / 싱가포르 / 프랑크푸르트 다지역 배포로 가까운 노드로 라우팅

🌐 인프라 기반

중계 사이트가 아니라 플랫폼입니다. 요청은 엣지 CDN 을 통해 Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud 등 클라우드 사업자에 직접 도달합니다.


Day 1 · 2025-12-27 — How It Began

“개발자가 가장 단순한 방법으로, 세상에서 가장 똑똑한 모델을 호출하게 한다.”

🦊 첫 번째 코드

2025 년 말, 작은 commit 하나가 OfoxAI 의 첫 번째 코드 줄을 새겼습니다.

feat: initialize ofox-studio monorepo

⚡ 깨달음의 순간

3 일 후, 우리는 동시에 AWS Bedrock 의 ClaudeAzure 의 GPT 를 동작시켰습니다 — 두 거대 클라우드, 두 톱티어 모델, 중계 없는 직접 연결.

두 경로의 첫 응답이 동시에 터미널에 출력되던 순간, 우리는 알았습니다. 이건 해낼 수 있다.

이는 데모 수준의 호환이 아니라 진정한 멀티 클라우드 직접 연결이었습니다. 이후 Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Cloud 가 차례로 연결되었고 — “중계 사이트가 아니라 플랫폼” 이라는 포지셔닝은 Day 3 부터 이미 확립되었습니다.

🌱 시작점

commit 0001

한 줄의 코드, 하나의 방향. 세상에서 가장 똑똑한 지능을, 누구나 쓸 수 있게.

엔진, 점화.


Last updated on