프로젝트 배경
문서 기반 AI 챗봇 서비스로, RAG(Retrieval-Augmented Generation) 기술을 핵심적으로 활용합니다. 사용자가 업로드한 문서 내에서 벡터 검색을 통해 정보를 탐색하고, LLM이 맥락에 맞는 정확하고 신뢰성 있는 답변을 실시간으로 제공.
특징
- RAG 기반 고신뢰성 답변: 업로드된 문서의 정보를 기반으로 답변을 생성하여 LLM의 환각 문제를 해결하고 답변의 근거와 신뢰성을 획기적으로 향상.
- 다중 LLM/임베딩 모델 및 지능형 라우터 지원: 다양한 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 성격에 따라 최적의 모델을 자동 선택하도록 설계되어 확장성과 효율성을 확보.
- 고급 임베딩 검색 및 다단계 추론 엔진: 스마트 청킹(Smart Chunking) 및 고급 임베딩 검색을 적용하여 검색 정확도를 높였으며, 다단계 추론 엔진을 통해 복잡한 질의에도 일관성 있는 답변을 생성.
주요 기능
- AI 채팅 및 응답 기능
실시간 스트리밍 응답: LLM의 응답을 실시간으로 스트리밍하여 사용자 대기 시간을 최소화하고 몰입도 높은 채팅 경험을 제공.
맞춤형 응답 및 맥락 유지: 사용자 과거 대화 내역을 기반으로 맥락을 유지하며, 서비스 목적에 맞는 맞춤형 응답을 생성.
상담사 연결 기능: AI가 답변하기 어려운 복잡한 질의에 대해 전문 상담사로 연결할 수 있는 기능을 제공합니다.
- 문서 관리 및 전처리 기능
문서 관리 및 편집 기능: PDF, 이미지 등 다양한 형식의 문서를 업로드, 저장, 관리하며, 간단한 문서 편집 기능을 제공.
OCR 및 스마트 청킹: 이미지 기반 문서에 대해 OCR(광학 문자 인식)을 수행하고, 효율적인 벡터 검색을 위해 문서 내용을 스마트 청킹하여 벡터 DB에 임베딩.
- 시스템 운영 및 관리 기능
회원 등급제 기능: 사용자의 접근 권한 및 사용량에 따라 회원 등급을 구분하고 관리하는 기능을 구현.
- 관리자 페이지 및 채팅/문서 관리: 문서 업로드/삭제, 채팅 내역 모니터링 및 관리, 모델 성능 튜닝 및 지식 기반 업데이트를 위한 관리자 페이지를 제공.
특징
- RAG 기반 고신뢰성 답변: 업로드된 문서의 정보를 기반으로 답변을 생성하여 LLM의 환각 문제를 해결하고 답변의 근거와 신뢰성을 획기적으로 향상.
- 다중 LLM/임베딩 모델 및 지능형 라우터 지원: 다양한 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 성격에 따라 최적의 모델을 자동 선택하도록 설계되어 확장성과 효율성을 확보.
- 고급 임베딩 검색 및 다단계 추론 엔진: 스마트 청킹(Smart Chunking) 및 고급 임베딩 검색을 적용하여 검색 정확도를 높였으며, 다단계 추론 엔진을 통해 복잡한 질의에도 일관성 있는 답변을 생성.
주요 기능
- AI 채팅 및 응답 기능
실시간 스트리밍 응답: LLM의 응답을 실시간으로 스트리밍하여 사용자 대기 시간을 최소화하고 몰입도 높은 채팅 경험을 제공.
맞춤형 응답 및 맥락 유지: 사용자 과거 대화 내역을 기반으로 맥락을 유지하며, 서비스 목적에 맞는 맞춤형 응답을 생성.
상담사 연결 기능: AI가 답변하기 어려운 복잡한 질의에 대해 전문 상담사로 연결할 수 있는 기능을 제공합니다.
- 문서 관리 및 전처리 기능
문서 관리 및 편집 기능: PDF, 이미지 등 다양한 형식의 문서를 업로드, 저장, 관리하며, 간단한 문서 편집 기능을 제공.
OCR 및 스마트 청킹: 이미지 기반 문서에 대해 OCR(광학 문자 인식)을 수행하고, 효율적인 벡터 검색을 위해 문서 내용을 스마트 청킹하여 벡터 DB에 임베딩.
- 시스템 운영 및 관리 기능
회원 등급제 기능: 사용자의 접근 권한 및 사용량에 따라 회원 등급을 구분하고 관리하는 기능을 구현.
- 관리자 페이지 및 채팅/문서 관리: 문서 업로드/삭제, 채팅 내역 모니터링 및 관리, 모델 성능 튜닝 및 지식 기반 업데이트를 위한 관리자 페이지를 제공.
프로젝트 성과
RAG 기반 답변 신뢰도 85% 확보
RAG 시스템 및 고급 임베딩 검색을 통해 문서 기반 정보의 답변 신뢰도를 99% 이상 확보, LLM 환각 문제를 근본적으로 해소
실시간 스트리밍 및 다단계 추론 엔진 구현
LLM 응답을 실시간 스트리밍하고 다단계 추론 엔진을 적용하여 응답 품질과 사용자 경험을 동시에 극대화
다중 LLM 지원 지능형 라우터 구축
여러 LLM 및 임베딩 모델을 지원하는 지능형 라우터를 설계하여 서비스 확장성을 확보하고 비용 효율적인 모델 운영 기반을 마련
핵심 기능
고급 임베딩 벡터 검색 및 추론
스마트 청킹 후 고급 임베딩 기법을 적용하여 문서의 벡터를 저장하고, 다단계 추론 엔진을 통해 정확하고 맥락에 맞는 답변을 생성
다중 LLM 지원 지능형 라우터
여러 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 유형에 따라 최적의 모델을 자동으로 선택하여 응답
문서 OCR/편집 및 스마트 청킹
이미지 기반 문서에 OCR을 적용하고, 문서 편집 및 스마트 청킹을 통해 다양한 형식의 문서를 AI가 활용 가능한 지식 기반으로 만듦
진행 단계
기획
2025.08.
문서 기반 RAG 챗봇 서비스의 기능 및 목표 정의, 다중 LLM/임베딩 모델 지원을 위한 아키텍처 설계, 화면 설계 및 UI/UX 디자인 진행
개발
2025.08.
서버 구축, Front-end 개발, 고급 임베딩 검색 및 추론 로직, 스마트 청킹, 실시간 스트리밍 등 핵심 기능을 개발하고 관리자 페이지를 구현
테스트 및 런칭
2025.09.
RAG 답변 정확도, 다단계 추론 엔진의 성능, 실시간 스트리밍 응답 속도 등을 검증하고, 관리자 페이지를 통해 서비스 운영을 시작
프로젝트 상세
문서 기반 AI 챗봇 서비스로, RAG(Retrieval-Augmented Generation) 기술을 핵심적으로 활용하며, 사용자가 업로드한 문서 내에서 벡터 검색을 통해 정보를 탐색하고, LLM이 맥락에 맞는 정확하고 신뢰성 있는 답변을 실시간으로 제공.
특징
RAG 기반 고신뢰성 답변: 업로드된 문서의 정보를 기반으로 답변을 생성하여 LLM의 환각 문제를 해결하고 답변의 근거와 신뢰성을 획기적으로 향상.
다중 LLM/임베딩 모델 및 지능형 라우터 지원: 다양한 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 성격에 따라 최적의 모델을 자동 선택하도록 설계되어 확장성과 효율성을 확보.
고급 임베딩 검색 및 다단계 추론 엔진: 스마트 청킹(Smart Chunking) 및 고급 임베딩 검색을 적용하여 검색 정확도를 높였으며, 다단계 추론 엔진을 통해 복잡한 질의에도 일관성 있는 답변을 생성.
주요 기능
- AI 채팅 및 응답 기능
실시간 스트리밍 응답: LLM의 응답을 실시간으로 스트리밍하여 사용자 대기 시간을 최소화하고 몰입도 높은 채팅 경험을 제공.
맞춤형 응답 및 맥락 유지: 사용자 과거 대화 내역을 기반으로 맥락을 유지하며, 서비스 목적에 맞는 맞춤형 응답을 생성.
상담사 연결 기능: AI가 답변하기 어려운 복잡한 질의에 대해 전문 상담사로 연결할 수 있는 기능을 제공.
- 문서 관리 및 전처리 기능
문서 관리 및 편집 기능: PDF, 이미지 등 다양한 형식의 문서를 업로드, 저장, 관리하며, 간단한 문서 편집 기능을 제공.
OCR 및 스마트 청킹: 이미지 기반 문서에 대해 OCR(광학 문자 인식)을 수행하고, 효율적인 벡터 검색을 위해 문서 내용을 스마트 청킹하여 벡터 DB에 임베딩.
- 시스템 운영 및 관리 기능
회원 등급제 기능: 사용자의 접근 권한 및 사용량에 따라 회원 등급을 구분하고 관리하는 기능을 구현.
관리자 페이지 및 채팅/문서 관리: 문서 업로드/삭제, 채팅 내역 모니터링 및 관리, 모델 성능 튜닝 및 지식 기반 업데이트를 위한 관리자 페이지를 제공.
특징
RAG 기반 고신뢰성 답변: 업로드된 문서의 정보를 기반으로 답변을 생성하여 LLM의 환각 문제를 해결하고 답변의 근거와 신뢰성을 획기적으로 향상.
다중 LLM/임베딩 모델 및 지능형 라우터 지원: 다양한 LLM 및 임베딩 모델을 유연하게 지원하며, 지능형 라우터가 질의 성격에 따라 최적의 모델을 자동 선택하도록 설계되어 확장성과 효율성을 확보.
고급 임베딩 검색 및 다단계 추론 엔진: 스마트 청킹(Smart Chunking) 및 고급 임베딩 검색을 적용하여 검색 정확도를 높였으며, 다단계 추론 엔진을 통해 복잡한 질의에도 일관성 있는 답변을 생성.
주요 기능
- AI 채팅 및 응답 기능
실시간 스트리밍 응답: LLM의 응답을 실시간으로 스트리밍하여 사용자 대기 시간을 최소화하고 몰입도 높은 채팅 경험을 제공.
맞춤형 응답 및 맥락 유지: 사용자 과거 대화 내역을 기반으로 맥락을 유지하며, 서비스 목적에 맞는 맞춤형 응답을 생성.
상담사 연결 기능: AI가 답변하기 어려운 복잡한 질의에 대해 전문 상담사로 연결할 수 있는 기능을 제공.
- 문서 관리 및 전처리 기능
문서 관리 및 편집 기능: PDF, 이미지 등 다양한 형식의 문서를 업로드, 저장, 관리하며, 간단한 문서 편집 기능을 제공.
OCR 및 스마트 청킹: 이미지 기반 문서에 대해 OCR(광학 문자 인식)을 수행하고, 효율적인 벡터 검색을 위해 문서 내용을 스마트 청킹하여 벡터 DB에 임베딩.
- 시스템 운영 및 관리 기능
회원 등급제 기능: 사용자의 접근 권한 및 사용량에 따라 회원 등급을 구분하고 관리하는 기능을 구현.
관리자 페이지 및 채팅/문서 관리: 문서 업로드/삭제, 채팅 내역 모니터링 및 관리, 모델 성능 튜닝 및 지식 기반 업데이트를 위한 관리자 페이지를 제공.

다중 모델 설정 및 추가 가능

관리자 페이지



