업데이트 로그
OfoxAI 의 모든 발걸음 — 새로운 모델, 새로운 기능, 새로운 경험. 매주 업데이트됩니다.
v1.1.0-20260428
💰 예산 관리 출시 — 팀 / 멤버 / API Key 3 차원
“얼마나 쓸지” 를 구두 합의에서 시스템 단위의 강제 제약으로 바꿨습니다. 하나의 조직에서 3 가지 차원 × 3 가지 주기 의 소비 한도를 동시에 설정할 수 있습니다.
| 차원 | 적용 시나리오 |
|---|---|
| 팀 (Organization) | 회사 / 프로젝트 전체 예산 |
| 멤버 (User) | 개별 직원의 월간 할당량 |
| API Key | 개별 애플리케이션 / 서비스의 독립 예산 |
각 차원마다 일일 / 월간 / 누적 3 가지 주기 한도를 별도로 설정할 수 있으며, 한도 초과 시 요청이 자동으로 거부됩니다.
진행률 표시바는 3 단계 경고를 제공합니다.
- 🟢 40% — 사용량 정상
- 🟡 80% — 한도 임박
- 🔴 110% — 한도 초과 (고동시성 순간 돌파를 막기 위한 버퍼 포함)
계층 제약은 자동으로 검증됩니다. API Key 한도 ≤ 멤버 한도 ≤ 팀 한도. 프론트엔드에서 상위 할당량을 실시간으로 안내해 잘못된 설정을 방지합니다.
진입 경로: 설정 → 할당량
⏱️ 팀 단위 RPM 할당량
팀 단위 요청 속도 제한 (RPM) 을 새로 추가하여, 여러 API Key 가 누적되어 상위 공급사 할당량을 돌파하는 문제를 근본적으로 차단합니다.
- 팀 전체를 합산하여 RPM 을 계산하며, 더 이상 Key 별로 따로 계산하지 않습니다
- 기본값은 100 RPM 이며, 더 높은 빈도가 필요한 경우 [email protected] 으로 문의하세요
- 한도 초과 요청은 자동으로
429 Too Many Requests를 반환합니다
적용 시나리오: CI/CD 의 갑작스러운 트래픽, 배치 작업의 폭주 방지, 다인 협업 팀의 통합 속도 제한.
🪙 잔액 조회 OpenAPI
GET /v1/user/balance 를 새로 추가했습니다. OfoxAI API Key 하나만으로 계정의 사용 가능 잔액, 누적 입금액, 누적 차감액을 조회할 수 있습니다.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"응답 구조는 cc-switch 등의 서드파티 도구와 호환되어, 잔액 제공자로 바로 연동할 수 있습니다.
🧰 cc-switch 통합 지원
OfoxAI 는 이제 cc-switch 와 네이티브로 호환됩니다. cc-switch 에서 OfoxAI 로 전환하기만 하면 별도 개발 없이 실시간 잔액 상태를 확인할 수 있습니다.

4 단계로 설정 완료:
- 사용량 조회 설정 열기 — OfoxAI 공급자 카드 우상단의 📊 아이콘을 클릭합니다
- 사용량 조회 활성화 — 스위치를 켭니다
- API Key 입력 — 어떤 OfoxAI 사용자 단위 API Key 든 가능합니다 (Dashboard 에서 생성)
- 요청 주소 — “범용 템플릿” 을 선택하고 주소에
https://api.ofox.ai/v1을 입력합니다
저장하면 공급자 카드에 잔여: 64.77 USD 와 같은 잔액 상태가 즉시 표시됩니다.
자세한 연동 단계: cc-switch 통합 가이드.
신규 모델 · 2026-04-24
🤖 신규 모델
- GPT-5.5 (OpenAI) — 복잡한 전문 워크로드를 위한 새 플래그십, 1M+ 토큰 컨텍스트 (922K 입력 / 128K 출력), 추론 신뢰성과 토큰 효율이 GPT-5.4 대비 전반적으로 향상
- DeepSeek V4 Pro (DeepSeek) — 1.6T 총 파라미터 / 49B 활성 MoE 플래그십, 1M 토큰 컨텍스트, 고급 추론·코드·장기 Agent 워크플로에 최적화
- DeepSeek V4 Flash (DeepSeek) — 284B 총 파라미터 / 13B 활성 MoE 가속 버전, 1M 토큰 컨텍스트, 고처리량과 저지연 중심의 극강의 가성비
신규 모델 · 2026-04-21
🤖 신규 모델
- Kimi K2.6 (Moonshot AI) — 역대 최강 Kimi, 코드·추론·시각 이해 모두 업그레이드
- GPT Image 2 (OpenAI) — 차세대 이미지 모델, 더 풍부한 디테일과 더 정확한 재현
신규 모델 · 2026-04-16
🤖 신규 모델
- Claude Opus 4.7 (Anthropic) — Anthropic 의 새 플래그십, 추론과 작문 능력이 한 단계 더 향상
이벤트 · 2026-04-15
🎁 GPT 4 월 사용액 리워드, 최대 $250 증정
- 기간 — 4 월 15 일 ~ 25 일, 11 일 한정
- 리워드 — GPT 전체 시리즈 사용액의 25% 리워드, 6 단계 선택 가능, 최대 $250 증정
- 지급 — 리워드 크레딧은 영구 유효, 이벤트 종료 후 원클릭으로 교환
- 팀 — 멤버의 사용액이 자동으로 합산되어 함께 더 높은 단계에 도전
이벤트 페이지: GPT 4 월 사용액 리워드 .
v1.0.55-20260407
🎁 기프트 카드 시스템 출시
지갑 페이지 에서 기프트 카드 코드를 입력하면 잔액이 즉시 충전됩니다. AI 를 친구에게 선물하는 가장 우아한 방법.
- 프라이버시 보호 — 거래 내역에는 카드 번호의 마지막 4 자리만 표시
- 보안 보장 — 다층 남용 방지와 종단간 암호화로 모든 카드를 안전하게
🔍 모델 검증 도구 출시
먼저 분명히 해 둡니다. OfoxAI 는 중계 사이트가 아닙니다.
- 운영 주체 — NICE TALK PTE. LTD. (글로벌 LLM 플랫폼)
- 모델 라이선스 — 공식 모델 제공자의 정식 라이선스
- 하부 컴퓨팅 — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud 등 클라우드 사업자가 직접 제공
- 호출 경로 — 엣지 CDN 이 클라우드 사업자에 직접 연결, 중계 없음, 교체 없음
어떤 LLM 게이트웨이에서도 모델의 진위를 검증할 수 있도록 무료 검사 도구를 공개했습니다. API Base 와 Key 만 입력하면 모델이 교체되었는지 원클릭으로 확인할 수 있습니다.
도구 진입 경로: 모델 검증 . 모든 플랫폼을 지원하며, OfoxAI 에 한정되지 않습니다.
v1.0.54-20260403
💳 결제 및 충전 업그레이드
- Airwallex 결제 채널 추가 — Stripe 외에 또 하나의 선택지로, 해외 결제가 더 매끄러워졌습니다
- USD / CNY / SGD 지원 — 익숙한 통화로 결제
- 단일 충전 한도 $10,000 로 상향 — 대형 고객도 더 이상 제약 없이
- 에이전트 추천 첫 충전 시 $3 추가 증정 — 에이전트 초대로 가입한 사용자는 첫 충전 시 자동으로 $3 추가 증정
🏢 엔터프라이즈 페이지 출시 — 많이 쓸수록 더 많이 절약
월 사용액이 기준에 도달하면 자동으로 리베이트, 신청 불필요, 별도 연결 불필요, 다음 달 초 입금.
| 등급 | 월 사용액 기준 | 리베이트 비율 |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
함께 제공되는 엔터프라이즈 기능:
- 0% 플랫폼 수수료 — 모델 공식 가격 그대로
- 글로벌 가속 노드 — 도쿄 / 싱가포르 / 프랑크푸르트 다지역 배포
- 99.99% 가용성 SLA — 다지역 이중화, 자동 페일오버
- 콘텐츠 무보존 — Prompt 와 응답은 기본적으로 기록·학습하지 않음
자세히: 엔터프라이즈 서비스 .
🤖 신규 모델
- GLM-5V-Turbo (Zhipu) — GLM 멀티모달 시리즈의 Turbo 가속 버전
- Qwen3.6 Plus (Alibaba Bailian) — Qwen3.6 의 최신 Plus 사양
v1.0.47-20260327
🏷️ 한 모델, 여러 이름
모델에 짧은 이름을 붙이고 옛 ID 도 유지 — 플랫폼 전환 시 마이그레이션 비용 제로. 별칭은 즉시 반영되며 라우팅이 자동으로 인식합니다.
몇 가지 예시:
| 정식 ID | 사용 가능한 별칭 |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
전체 별칭 목록은 GET https://api.ofox.ai/v1/models 로 조회할 수 있으며, 응답의 aliases 필드를 그대로 사용할 수 있습니다.
🖼️ 이미지 생성 — 장당 과금
이미지 API 는 생성된 이미지 수를 기준으로 과금되며, 장당 가격이 투명합니다. 표준 사이즈는 각 공급사의 네이티브 사이즈로 자동 매핑되어 클라이언트 코드를 변경할 필요가 없습니다.
📊 이미지 사용량 시각화
콘솔 홈, 사용량, 비용, 랭킹 페이지에 “이미지” 차원의 통계가 추가되어 매월 이미지 사용량을 한눈에 파악할 수 있습니다.
🤖 신규 모델
- GLM 5.1 (Zhipu) — GLM 시리즈 차세대, 범용 능력 전반 업그레이드
🔗 더 짧아진 초대 링크
초대 링크가 긴 문자열에서 /x/내코드 형식으로 변경되어, 외우기 쉽고 공유하기 편해졌습니다.
v1.0.39-20260320
🔄 모델 Fallback — 메인 모델 장애 시 자동 전환
메인 모델이 4xx/5xx 오류를 반환하면 게이트웨이가 사용자가 설정한 백업 모델을 자동으로 시도하며, 최대 3 단계까지 안전망을 제공합니다. OpenAI / Anthropic / Gemini 3 가지 프로토콜 모두 지원하며 클라이언트 코드 변경이 필요 없습니다. 자세히: Fallback 문서.
⚔️ OfoxAI vs OpenRouter, 항목별 비교
OpenRouter 는 충전 시마다 5.5% 의 수수료를 부과하지만, OfoxAI 는 0% 입니다. 똑같이 100+ 모델을 커버하며, 월 사용액 $1,000 이상이면 종합 비용에서 10% 이상을 더 절약할 수 있습니다. 전체 비교: OfoxAI vs OpenRouter .
🤖 신규 모델
- GLM-5-Turbo (Zhipu) — GLM-5 의 Turbo 가속 버전
- GPT-5.4 Mini / Nano (OpenAI) — GPT-5.4 의 경량 두 가지 사양으로 호출 비용을 대폭 절감
- MiniMax M2.7 / M2.7 Highspeed — MiniMax 차세대, Highspeed 버전은 저지연 시나리오에 특화
v1.0.36-20260313
🎊 3 월 Claude 리워드
전 등급 20% 리워드, 이벤트 팝업에서 쿠폰 코드 OFOXAI2603 을 원클릭 복사하세요.
| 충전 | 리워드 | 실수령 |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
이벤트 페이지: Claude Spring 2 차 .
🤖 신규 모델
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — GPT-5.4 의 새 플래그십 두 가지 사양, Pro 는 더 높은 추론 한계 제공
- Gemini Embedding 2 Preview (Google) — Google 차세대 멀티모달 벡터 모델
🖼️ 임베딩, 전체 모달 커버
Gemini Embedding 은 텍스트 / 이미지 / 오디오 / 비디오 4 가지 모달을 지원합니다. Qwen, Volcano 의 멀티모달 임베딩도 직접 연결됩니다.
⚡ 사용량 데이터 — 시간 단위 업데이트
사용량 집계가 일 1 회에서 시간 1 회로 업그레이드되어, 사용 직후 빠르게 Dashboard 에서 확인할 수 있습니다.
💰 쿠폰 표시 개선
주문 목록에 각 주문의 할인 금액과 증정 금액이 모두 표시됩니다.
v1.0.32-20260303
🎉 3 월 Claude 이벤트 시작
Dashboard 에 이벤트 배너와 사용액 진행 바가 추가되었고, 쿠폰 오류 메시지가 한·영 이중 언어로 전면 로컬라이즈되었습니다. 이벤트 페이지: Claude Spring 1 차 .
🤖 신규 모델
- GPT-5.3 Chat (OpenAI) — GPT-5.3 의 대화 최적화 버전
- Gemini 3.1 Flash Lite Preview (Google) — Gemini 3.1 의 경량 프리뷰
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, 차세대 이미지 생성 모델
🏷️ 내비게이션 리뉴얼
v1.0.30-20260226
🔒 GitHub 원클릭 로그인
로그인 페이지에 GitHub OAuth 진입점을 추가했습니다. 원클릭으로 가입/로그인이 완료되며, 시스템이 마지막으로 사용한 로그인 방식을 기억합니다. 설정 페이지에서 GitHub 계정 연결·해제 및 프로필 사진 동기화를 지원합니다.
🤖 신규 모델
- Qwen3.5 패밀리 5 종 동시 출시 (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — GPT-5.3 의 코드 전용 모델
- Gemini 3.1 Pro Preview (Google) — Gemini 3.1 Pro 프리뷰
- Qwen3 Coder Next (Alibaba Bailian) — Qwen 의 새로운 코드 전용 모델
📱 모바일 반응형
콘솔의 사용자, 조직, 주문 모듈이 모바일에 완전히 대응합니다. 사이드바 접기, 테이블 스마트 축소를 지원해 작은 화면에서도 부드러운 사용 경험을 제공합니다.
v1.0.27-20260217
📊 데이터 분석 대시보드
사용량, 비용, 요청 수의 인터랙티브 차트 3 종. 월별 트렌드를 확인하고 모델별 랭킹을 생성할 수 있으며, 필터는 Provider / Model / User / API Key / 기간을 자유롭게 조합할 수 있습니다. 당신의 주력 모델은 무엇인가요? 한눈에 알 수 있습니다.
🤖 신규 모델
- Claude Sonnet 4.6 (Anthropic) — Sonnet 시리즈의 새 버전, 가성비 선택지
- Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5 Plus 사양 출시
- Doubao Seed 2.0 4 가지 사양 (Volcano) — Code / Lite / Mini / Pro , Doubao Seed 2.0 풀 시리즈 동시 출시
🌐 OpenAI 동작에 정렬
chat/completions 에서 stream 을 전달하지 않으면 기본값이 비스트리밍이 되어, OpenAI 공식 동작과 완전히 일치합니다. 코드는 아무것도 바꿀 필요가 없습니다.
v1.0.24-20260212
🤖 신규 모델
- GLM-5 (Zhipu) — GLM 시리즈의 차세대 플래그십
- MiniMax M2.5 / M2.5 Lightning — MiniMax 두 가지 사양, Lightning 버전은 저지연에 최적화
🎊 첫 로그인 환영
첫 로그인 시 환영 팝업이 OpenAI / Anthropic / Gemini 3 가지 API 엔드포인트를 모두 표시하며 원클릭 복사를 지원합니다. 폭죽 애니메이션과 함께 개발자에게 작은 의식감을 선사합니다.
🧠 공급사 친화성 캐시
같은 사용자가 서로 다른 모델 간을 전환할 때, 게이트웨이가 같은 공급사를 우선 선택합니다. Prompt Cache 적중률이 높아져 응답이 더 빠르고 비용은 더 낮아집니다.
🎟️ 엔젤 초대 코드 시스템
완전한 초대 코드 체계 출시: 카드 형 UI, 가입 다이얼로그, 사용 기록 테이블 한눈에 보기. 양방향 보상 메커니즘과 원클릭 전용 공유 포스터 생성을 지원합니다.
v1.0.20-20260206
🤖 신규 모델
- Claude Opus 4.6 (Anthropic) — Anthropic 의 새 플래그십, 추론과 작문 능력의 한계를 다시 한 번 돌파
🌍 한·영 원클릭 전환
1100+ 개의 번역으로 전 플랫폼 한·영 이중 언어가 매끄럽게 전환됩니다. 언어 설정은 쿠키가 기억해 줍니다.
🔍 Web Search 회당 과금
OpenAI / Anthropic / Gemini 3 가지 프로토콜의 Web Search 도구 호출이 모두 정확하게 과금됩니다.
📊 Dashboard 리뉴얼
- 로그인 페이지에서 사용자명으로 개인화된 인사를 표시 (일반 “Hi” 대체)
- 사용량 통계가 일 단위에서 주 단위로 업그레이드
- API Key 표시는 3 단계로 전환 가능: 완전 숨김 / 마스킹 / 완전 표시
💵 가격 표시 개선
$0.6000 의 끝자리 0 을 자동 제거하여 $0.6 으로 표시. 잔액 부족 오류 메시지도 USD 형식으로 변경되어 머릿속에서 환산할 필요가 없습니다.
📚 문서 사이트 정식 오픈
- 완전한 OpenAI / Anthropic / Gemini 프로토콜 레퍼런스
- 10+ 도구 연동 가이드 전부 커버: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode 등 — 설정부터 실행까지 완전 커버
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 기반을 다진 2 주
출시 후 첫 2 주, 우리는 한순간도 쉬지 않았습니다. 매번의 릴리스가 플랫폼을 더 안정적이고, 더 정확하고, 더 쉽게 연동할 수 있게 만들었습니다.
💻 Claude Code 공식 대응
우리 자신이 Claude Code 로 코드를 씁니다. 1 월 21 일, 게이트웨이가 Claude Code 에 완전히 대응했습니다 — API Base 를 OfoxAI 로 가리키고 sk-*** Key 만 교체하면 모든 Claude 모델을 즉시 사용할 수 있습니다.
🧠 Thinking 추론 체인
Claude 와 Gemini 의 thinking block (모델의 “사고 과정”) 이 전 프로토콜을 관통합니다. 결과뿐만 아니라 모델이 어떻게 생각하는지도 볼 수 있습니다.
🌐 Gemini 네이티브 프로토콜 지원
OpenAI 호환 모드만이 아닙니다 — Gemini 의 네이티브 API generateContent 도 동작합니다. Google 공식 SDK 가 직접 연결되며 변환 손실이 없습니다.
💵 다통화 Stripe 결제
USD 외에 CNY / SGD 등 다통화 진입점을 추가했고, 환율 스냅샷이 주문에 함께 보존됩니다. 아시아 태평양 사용자는 자국 통화로 직접 결제할 수 있습니다.
🎯 청구서 정밀도 소수점 6 자리
NanoDollar 단위 정밀도 업그레이드. 단일 API 호출이 단지 몇 밀리달러를 소비하더라도 정확하게 기록되고 있는 그대로 과금됩니다. 대형 고객은 손해 보지 않고, 소형 고객도 억울하지 않습니다.
v1.0.0 · 2026-01-16 — The Gateway Goes Live
“오늘부터, 100+ 모델, 하나의 Key.”
OfoxAI 플랫폼이 정식으로 외부에 공개된 날입니다.
🚀 플랫폼 첫 공개 기능
- 3 가지 프로토콜 네이티브 호환 — OpenAI / Anthropic / Gemini 3 대 프로토콜 직접 지원, 기존 코드 변경 없이 연동
- 100+ 모델 통합 연결 — Claude , GPT , Gemini , DeepSeek , Qwen 등 100 여 개 모델을 하나의 Key 로 모두 연결. 전체 카탈로그: 모델 광장
- 스마트 라우팅 — Provider × Model 단위의 라우팅 알고리즘으로 가장 빠르고 안정적인 채널을 자동 선택. 자세히: Provider Routing
- 셀프서비스 API Key 관리 — Dashboard 에서 원클릭으로 생성, 시작/중지, 사용량 추적
- 사용량 기반 과금, 0% 플랫폼 수수료 — 모델 공식 가격 그대로. 가격 조회: Pricing
- Stripe 신용카드 결제 — 충전 즉시 반영, 잔액 조회 가능
- 글로벌 엣지 노드 — 도쿄 / 싱가포르 / 프랑크푸르트 다지역 배포로 가까운 노드로 라우팅
🌐 인프라 기반
중계 사이트가 아니라 플랫폼입니다. 요청은 엣지 CDN 을 통해 Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud 등 클라우드 사업자에 직접 도달합니다.
Day 1 · 2025-12-27 — How It Began
“개발자가 가장 단순한 방법으로, 세상에서 가장 똑똑한 모델을 호출하게 한다.”
🦊 첫 번째 코드
2025 년 말, 작은 commit 하나가 OfoxAI 의 첫 번째 코드 줄을 새겼습니다.
feat: initialize ofox-studio monorepo⚡ 깨달음의 순간
3 일 후, 우리는 동시에 AWS Bedrock 의 Claude 와 Azure 의 GPT 를 동작시켰습니다 — 두 거대 클라우드, 두 톱티어 모델, 중계 없는 직접 연결.
두 경로의 첫 응답이 동시에 터미널에 출력되던 순간, 우리는 알았습니다. 이건 해낼 수 있다.
이는 데모 수준의 호환이 아니라 진정한 멀티 클라우드 직접 연결이었습니다. 이후 Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Cloud 가 차례로 연결되었고 — “중계 사이트가 아니라 플랫폼” 이라는 포지셔닝은 Day 3 부터 이미 확립되었습니다.
🌱 시작점
commit 0001
한 줄의 코드, 하나의 방향. 세상에서 가장 똑똑한 지능을, 누구나 쓸 수 있게.
엔진, 점화.