프로젝트 배경
1) 문제점 - AI 기능 도입 후 API 비용이 예측 불가능하게 급증, 월 지출 통제 불가 - 단일 고가 모델(GPT-4o)로 모든 작업 처리 → 쉬운 작업에도 고비용 낭비 - Silent fail 및 Rate limit 초과 시 원인 불명 중단으로 운영 시간 낭비 2) 프로젝트 목표 - 멀티 스테이지 파이프라인으로 작업 난이도별 모델 자동 분기, 비용 40~70% 절감 - 실행 전 사전 비용
프로젝트 성과
API 비용 60~80% 절감
미국 법률 테크 기업 프로덕션 적용. 문서당 처리 비용 $0.02~$0.15, 단일 고가 모델 대비 60~80% 절감 달성.
핵심 기능
진행 단계
설계 → 구현 → 납품
2025.10
멀티 스테이지 파이프라인 설계, Budget Guard 구현, 멀티모델 벤치마킹 리포트 작성 후 프로덕션 납품 완료.
프로젝트 상세
미국 법률 테크 기업의 대용량 문서 처리를 위한 멀티 스테이지 AI 비용 최적화 파이프라인 구축 프로젝트. 단일 고가 모델 하나로 모든 작업을 처리하던 구조를 멀티 스테이지로 재설계해 예산 상한 엄수 + 문서당 처리 비용 60~80% 절감을 달성했습니다. [핵심 구현] • 멀티 스테이지 라우팅: 쉬운 작업은 저가 모델(GPT-4o-mini), 어려운 작업만 고가 모델(GPT-4o/Claude) 자








