aeriis · 위시켓(Wishket)

프로젝트 배경

프로젝트를 통해 해결하려는 문제
기업과 조직은 방대한 양의 문서(PDF, 매뉴얼, 정책, 보고서 등)를 보유하고 있지만, 필요한 정보를 빠르게 찾기 어렵고, 검색 결과가 문장 단위 맥락을 반영하지 못하며, 기존 챗봇은 근거 없는 답변(환각) 을 자주 생성해 신뢰하기 어렵다는 문제가 있습니다.
특히 고객 상담, 내부 지식 검색, 교육/지원 등 실제 업무 현장에서는 “정확한 근거를 가진 답변”과 “문서 기반의 검증 가능한 정보”가 매우 중요하지만, 일반 LLM 기반 챗봇만으로는 이를 만족시키기 어렵습니다.

프로젝트를 통해 달성하고자 하는 목표
이 프로젝트는 RAG 기반 문서 챗봇을 통해 다음을 목표로 합니다.
- 업로드된 문서를 바탕으로 출처가 명확한 고신뢰성 답변을 제공
- 벡터 검색과 스마트 청킹을 활용해 문서 내에서 원하는 정보를 신속·정확하게 탐색
- 다중 LLM/임베딩 및 지능형 라우팅을 통해 성능·비용 균형이 최적화된 AI Q&A 플랫폼 구현
- 사람이 직접 문서를 일일이 찾고 읽는 시간을 줄여, 업무 효율과 사용자 만족도를 극대화하는 것

프로젝트 성과

문서 기반 답변 신뢰도 대폭 향상

RAG 시스템 및 고급 임베딩 검색을 적용하여 문서 기반 질의에 대해 평균 85% 이상의 답변 신뢰도를 확보했으며, 특정 도메인/시나리오에서는 99%에 근접한 정확도를 달성하여 LLM 환각 문제를 크게 완화했습니다

실시간 스트리밍 및 다단계 추론 엔진 구현

LLM 응답을 토큰 단위로 실시간 스트리밍하는 기능과 다단계 추론 엔진을 구현하여, 복잡한 질의에 대해서도 응답 품질과 응답 속도(사용자 체감 대기 시간)를 동시에 개선했습니다.

다중 LLM 지원 지능형 라우터 구축

여러 LLM 및 임베딩 모델을 연동하는 지능형 라우터를 설계·구현하여, 질의 유형·난이도·비용 제약에 따라 최적의 모델을 자동 선택할 수 있는 기반을 마련했습니다.

핵심 기능

고급 임베딩 벡터 검색 및 추론

스마트 청킹 후 고급 임베딩 기법을 적용하여 문서의 벡터를 저장하고, 다단계 추론 엔진을 통해 정확하고 맥락에 맞는 답변을 생성

다중 LLM 지원 지능형 라우터

여러 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 유형에 따라 최적의 모델을 자동으로 선택하여 응답

문서 OCR/편집 및 스마트 청킹

이미지 기반 문서에 OCR을 적용하고, 문서 편집 및 스마트 청킹을 통해 다양한 형식의 문서를 AI가 활용 가능한 지식 기반으로 만듦

진행 단계

기획

2025.08.

문서 기반 RAG 챗봇 서비스의 기능 및 목표 정의, 다중 LLM/임베딩 모델 지원을 위한 아키텍처 설계, 화면 설계 및 UI/UX 디자인 진행

개발

2025.08.

서버 구축, Front-end 개발, 고급 임베딩 검색 및 추론 로직, 스마트 청킹, 실시간 스트리밍 등 핵심 기능을 개발하고 관리자 페이지를 구현

테스트 및 런칭

2025.09.

RAG 답변 정확도, 다단계 추론 엔진의 성능, 실시간 스트리밍 응답 속도 등을 검증하고, 관리자 페이지를 통해 서비스 운영을 시작

타사 서비스 연계

2025.10.

기존 타사 시스템과 연동을 통해 실 서비스 환경에서 바로 사용 가능한 형태로 통합

프로젝트 상세

문서 기반 AI 챗봇 서비스로, RAG(Retrieval-Augmented Generation) 기술을 핵심으로 활용합니다. 사용자가 업로드한 문서를 벡터 검색으로 탐색하고, LLM이 해당 문서의 내용을 근거로 맥락에 맞는 정확하고 신뢰성 있는 답변을 실시간으로 제공합니다.

주요 특징
- RAG 기반 고신뢰성 답변
업로드된 문서의 실제 내용을 근거로 답변을 생성함으로써, LLM의 환각(hallucination) 문제를 완화하고 답변의 근거와 신뢰도를 크게 향상합니다. 사용자에게는 답변의 출처(문서, 위치 등)를 함께 제시하여 검증 가능성을 높입니다.

- 다중 LLM/임베딩 모델 및 지능형 라우팅
다양한 LLM과 임베딩 모델을 유연하게 교체·확장할 수 있도록 설계되어 있으며, 질의 유형·복잡도·비용 등을 고려해 최적의 모델을 자동으로 선택하는 지능형 라우터를 제공합니다. 이를 통해 성능과 비용 사이의 균형을 동적으로 조정할 수 있습니다.

- 고급 임베딩 검색 및 다단계 추론 엔진
스마트 청킹(Smart Chunking) 기법을 적용해 문서를 의미 단위로 분할하고, 고급 임베딩 검색을 통해 사용자 질의와 가장 관련성 높은 청크를 정밀하게 검색합니다. 검색된 결과는 다단계 추론 엔진에 의해 재구성되어, 복잡한 질의에 대해서도 일관성 있고 논리적인 답변을 제공합니다.

주요 기능
- AI 채팅 및 응답 기능
실시간 스트리밍 응답: LLM의 답변을 토큰 단위로 스트리밍하여 사용자 대기 시간을 최소화하고, 자연스럽고 몰입감 있는 채팅 경험을 제공합니다.
맞춤형 응답 및 맥락 유지: 사용자별 대화 이력과 세션 정보를 기반으로 맥락을 유지하며, 서비스 목적(예: 고객 상담, 사내 지식 검색 등)에 최적화된 맞춤형 응답을 생성합니다.
상담사 연결 기능: 모델의 신뢰도가 낮거나 복잡한 질의의 경우, 인간 상담사에게 자동으로 에스컬레이션하는 기능을 제공하여 서비스 안정성과 만족도를 높입니다.

- 문서 관리 및 전처리 기능
문서 업로드 및 관리: PDF, 이미지(스캔 문서 포함) 등 다양한 형식의 문서를 업로드·저장·버전 관리할 수 있으며, 기본적인 메타데이터 편집 및 문서 삭제 기능을 제공합니다.
OCR 및 스마트 청킹: 이미지 기반 문서에 대해 OCR(광학 문자 인식)을 수행하여 텍스트를 추출하고, 문맥 단위를 고려한 스마트 청킹을 통해 벡터 DB에 최적화된 형태로 임베딩합니다.

- 시스템 운영 및 관리 기능
회원 등급제 및 권한 관리: 사용자의 역할(일반 사용자, 파트너, 관리자 등)과 사용량에 따라 접근 권한 및 기능 제약을 설정하고, 등급별 요금제·쿼터 관리가 가능하도록 지원합니다.
관리자 페이지 및 모니터링:
문서 업로드/삭제, 인덱싱 상태 모니터링
채팅 내역 조회 및 품질 모니터링
모델·프롬프트 설정 튜닝, 벡터 DB/지식 기반 업데이트 관리

를 위한 관리자 전용 대시보드를 제공합니다.

다중 모델 설정 및 추가 가능

관리자 페이지