프로젝트 배경
프로젝트를 통해 해결하려는 문제 기업과 조직은 방대한 양의 문서(PDF, 매뉴얼, 정책, 보고서 등)를 보유하고 있지만, 필요한 정보를 빠르게 찾기 어렵고, 검색 결과가 문장 단위 맥락을 반영하지 못하며, 기존 챗봇은 근거 없는 답변(환각) 을 자주 생성해 신뢰하기 어렵다는 문제가 있습니다. 특히 고객 상담, 내부 지식 검색, 교육/지원 등 실제 업무 현장에서는 “정확한 근거를 가진 답변”과 “문서 기반의
프로젝트 성과
문서 기반 답변 신뢰도 대폭 향상
RAG 시스템 및 고급 임베딩 검색을 적용하여 문서 기반 질의에 대해 평균 85% 이상의 답변 신뢰도를 확보했으며, 특정 도메인/시나리오에서는 99%에 근접한 정확도를 달성하여 LLM 환각 문제를 크게 완화했습니다
실시간 스트리밍 및 다단계 추론 엔진 구현
LLM 응답을 토큰 단위로 실시간 스트리밍하는 기능과 다단계 추론 엔진을 구현하여, 복잡한 질의에 대해서도 응답 품질과 응답 속도(사용자 체감 대기 시간)를 동시에 개선했습니다.
다중 LLM 지원 지능형 라우터 구축
여러 LLM 및 임베딩 모델을 연동하는 지능형 라우터를 설계·구현하여, 질의 유형·난이도·비용 제약에 따라 최적의 모델을 자동 선택할 수 있는 기반을 마련했습니다.
핵심 기능
진행 단계
기획
2025.08.
문서 기반 RAG 챗봇 서비스의 기능 및 목표 정의, 다중 LLM/임베딩 모델 지원을 위한 아키텍처 설계, 화면 설계 및 UI/UX 디자인 진행
프로젝트 상세
문서 기반 AI 챗봇 서비스로, RAG(Retrieval-Augmented Generation) 기술을 핵심으로 활용합니다. 사용자가 업로드한 문서를 벡터 검색으로 탐색하고, LLM이 해당 문서의 내용을 근거로 맥락에 맞는 정확하고 신뢰성 있는 답변을 실시간으로 제공합니다. 주요 특징 - RAG 기반 고신뢰성 답변 업로드된 문서의 실제 내용을 근거로 답변을 생성함으로써, LLM의 환각(hallucin







