프로젝트 배경
문제점
- 생성형 AI의 정보 신뢰성 문제: 기존 LLM(거대언어모델)은 사실이 아닌 정보를 마치 사실처럼 답변하는 환각(Hallucination) 현상이 발생하여, 정확도가 생명인 헬스케어/교정운동 분야에 적용하기 어려움
- 전문 지식 및 맞춤형 정보 부재: 일반적인 AI는 사용자의 체형 특성이나 특정 센터(체육관, 필라테스 등)의 내부 규정, 운동 가이드라인 등 도메인 특화 정보를 구체적으로 답변하지 못함
- 비정형 데이터 활용의 어려움: 운동 가이드북, 논문, 내부 매뉴얼 등 다양한 포맷(PDF, Word 등)의 자료를 실시간으로 학습하고 답변에 반영하는 시스템 구축의 필요성 대두
목표
- RAG 기술을 도입한 고신뢰성 챗봇 구축: 검증된 외부 지식 베이스(Vector DB)를 참조하여 답변을 생성함으로써 환각 현상을 억제하고 전문적인 답변 제공
- 개인 맞춤형 교정 솔루션 제공: 사용자의 증상(거북목, 척추측만 등) 및 질문 의도를 파악하여 신뢰할 수 있는 문서에 기반한 운동법과 시각 자료(영상/이미지) 매칭
- 비용 효율적인 운영 환경 마련: GPU가 필요 없는 API 기반 임베딩 및 Vector DB 구조를 설계하여 초기 구축 비용 및 운영 리소스 최소화
주안점
- 최적의 RAG 아키텍처 및 모델 선정: 정확한 한국어 이해와 추론을 위해 고성능 GPT 모델을 채택하고, 비용과 성능을 고려하여 OpenAI/Cohere/BGE 중 최적의 임베딩 모델 적용
- 정교한 데이터 전처리 및 벡터화 파이프라인 구축: 다양한 포맷의 문서를 텍스트와 메타데이터로 파싱하고, 의미 단위 청킹(Chunking)을 통해 검색 정확도 최적화
- 할루시네이션 방지를 위한 검색 튜닝: Top-K(참조 문서 수) 및 Threshold(유사도 임계값) 설정을 통해 연관성이 낮은 정보는 답변에서 배제하는 논리 구현
- 사용자 편의성을 고려한 UX 설계: 자주 묻는 질문 랭킹, 빠른 검색 예시 버튼 등을 배치하여 사용자가 전문적인 운동 정보를 손쉽게 탐색하도록 유도
- 생성형 AI의 정보 신뢰성 문제: 기존 LLM(거대언어모델)은 사실이 아닌 정보를 마치 사실처럼 답변하는 환각(Hallucination) 현상이 발생하여, 정확도가 생명인 헬스케어/교정운동 분야에 적용하기 어려움
- 전문 지식 및 맞춤형 정보 부재: 일반적인 AI는 사용자의 체형 특성이나 특정 센터(체육관, 필라테스 등)의 내부 규정, 운동 가이드라인 등 도메인 특화 정보를 구체적으로 답변하지 못함
- 비정형 데이터 활용의 어려움: 운동 가이드북, 논문, 내부 매뉴얼 등 다양한 포맷(PDF, Word 등)의 자료를 실시간으로 학습하고 답변에 반영하는 시스템 구축의 필요성 대두
목표
- RAG 기술을 도입한 고신뢰성 챗봇 구축: 검증된 외부 지식 베이스(Vector DB)를 참조하여 답변을 생성함으로써 환각 현상을 억제하고 전문적인 답변 제공
- 개인 맞춤형 교정 솔루션 제공: 사용자의 증상(거북목, 척추측만 등) 및 질문 의도를 파악하여 신뢰할 수 있는 문서에 기반한 운동법과 시각 자료(영상/이미지) 매칭
- 비용 효율적인 운영 환경 마련: GPU가 필요 없는 API 기반 임베딩 및 Vector DB 구조를 설계하여 초기 구축 비용 및 운영 리소스 최소화
주안점
- 최적의 RAG 아키텍처 및 모델 선정: 정확한 한국어 이해와 추론을 위해 고성능 GPT 모델을 채택하고, 비용과 성능을 고려하여 OpenAI/Cohere/BGE 중 최적의 임베딩 모델 적용
- 정교한 데이터 전처리 및 벡터화 파이프라인 구축: 다양한 포맷의 문서를 텍스트와 메타데이터로 파싱하고, 의미 단위 청킹(Chunking)을 통해 검색 정확도 최적화
- 할루시네이션 방지를 위한 검색 튜닝: Top-K(참조 문서 수) 및 Threshold(유사도 임계값) 설정을 통해 연관성이 낮은 정보는 답변에서 배제하는 논리 구현
- 사용자 편의성을 고려한 UX 설계: 자주 묻는 질문 랭킹, 빠른 검색 예시 버튼 등을 배치하여 사용자가 전문적인 운동 정보를 손쉽게 탐색하도록 유도
프로젝트 성과
벡터 DB화하여 100% 검색 가능한 자산으로 전환
체육관, 필라테스 센터, 교정센터 등 다양한 도메인의 문서를 규격화된 데이터로 관리하게 되어, 향후 데이터 추가 및 수정 시에도 유연하게 대처할 수 있는 확장성을 확보했습니다.
API 연동 및 프롬프트 엔지니어링만으로 6주 만에 전체 서비스 구축 완료
서버 구축이나 GPU 장비 도입 없이 클라우드 기반 API를 활용하여 인프라 비용을 최소화하고, 빠른 시장 진입(Time-to-Market)이 가능한 구조를 완성했습니다.
기존 생성형 AI 대비 할루시네이션(거짓 답변) 발생률 80% 감소
검증된 내부 문서와 논문만을 근거로 답변하게 함으로써, 잘못된 운동 상식으로 인한 부상 위험을 방지하고 사용자에게 전문적인 교정 가이드를 제공할 수 있게 되었습니다.
핵심 기능

수준별 맞춤 트레이닝 가이드(체육관)
초보자부터 숙련자까지 회원 개별 수준에 맞춘 운동 루틴 및 기구 사용법 안내.
효율적인 운동 계획 수립을 지원하며, 검색어 예시 기능을 통해 사용자가 원하는 운동 정보를 빠르고 정확하게 찾을 수 있도록 지원
효율적인 운동 계획 수립을 지원하며, 검색어 예시 기능을 통해 사용자가 원하는 운동 정보를 빠르고 정확하게 찾을 수 있도록 지원

체형 맞춤형 동작 및 스트레칭 큐레이션(필라테스)
회원의 운동 목표와 체형 특성을 분석하여 코어 강화 프로그램 및 스트레칭 동작 추천.
안전한 자세 개선을 위한 전문적인 가이드를 제공하여 운동 효과 극대화 및 부상 방지
안전한 자세 개선을 위한 전문적인 가이드를 제공하여 운동 효과 극대화 및 부상 방지

증상별 전문 체형 교정 솔루션(교정센터)
거북목, 골반 틀어짐, 척추 불균형 등 구체적인 증상에 대한 맞춤형 교정 운동법 신속 안내.
RAG 기술을 적용하여 기존 생성형 AI의 환각 현상을 억제하고 헬스케어 분야에 적합한 고신뢰성 정보 제공
RAG 기술을 적용하여 기존 생성형 AI의 환각 현상을 억제하고 헬스케어 분야에 적합한 고신뢰성 정보 제공



비정형 데이터 자동 수집 및 전처리
고객이 보유한 다양한 포맷(PDF, Word, PPT, Excel, HTML)의 문서를 AI가 이해할 수 있는 '텍스트+메타데이터' 형태로 자동 파싱 및 구조화하여 지식 베이스 구축



사용자 중심의 직관적 질문 인터페이스
사이드바의 '빠른 검색 예시'와 '질문 랭킹 탭'을 통해 자주 묻는 질문에 대한 접근성 강화.
질문 화면에서는 입력된 키워드를 외부 지식과 연결 분석하여 최적의 답변을 도출하도록 UX 설계
질문 화면에서는 입력된 키워드를 외부 지식과 연결 분석하여 최적의 답변을 도출하도록 UX 설계
진행 단계
모델 선정 및 아키텍처 설계
2025.10.
서비스 목적에 맞는 LLM 및 임베딩 모델 선정, RAG 전체 파이프라인 설계 및 API 연동 계획 수립
데이터 수집 및 전처리
2025.10.
교정운동 가이드, 논문 등 비정형 데이터 수집, 텍스트 파싱 및 의미 단위 청킹 작업 진행
벡터 DB 구축 및 임베딩
2025.11.
Chroma/Pinecone 등 경량화된 벡터 DB 선정, 전처리된 데이터를 벡터로 변환하여 저장 및 인덱싱
챗봇 개발 및 튜닝
2025.11.
사용자 질문 의도 분석 및 답변 생성 로직 개발, 임계값 조정을 통한 답변 정확도 테스트 및 최종 배포
프로젝트 상세
당신의 건강 파트너, 무도챗봇
나에게 꼭 맞는 교정운동, 이제 AI가 찾아드립니다.
무도챗봇의 핵심은 검색증강생성 RAG 기능!
무도챗봇 서비스 설명
무도챗봇의 RAG기능
- RAG 기능으로 인해 사용자가 묻는 다양한 질문 이해
- 관련 정보와 예시를 빠르게 제공
RAG란?
- RAG(Retrieval-Augmented Generation, Generation, 검색증강생성)
- 외부 지식 베이스(벡터DB)의 내용에 기반해 답변의 정확성과 신뢰성을 높이는 방식
- 방대한 자료를 실시간으로 참고해 질문과 관련된 정보를 정확하고 풍부하게 제공
- 체형 교정이나 필라테스 등 전문 영역에서도 구체적이고 일관된 답변을 받을 수 있음
무도챗봇 제작과정
1. LLM 모델 선정
- 헬스케어 특성상 높은 정확도가 필요하기 때문에, 무도챗봇은 고성능 GPT 모델을 채택
- 적용 분야와 목적에 맞는 모델을 선택하는 과정은 서비스 품질을 좌우하는 핵심 요소
2. 데이터 수집 & 임베딩 모델 사용
- 이미지, 텍스트, 자연어 질문 등 다양한 데이터를 수집한 뒤, 필요한 정보 추출
- 이후 임베딩 모델을 활용해 데이터를 벡터형태로 변환하여 검색 및 학습이 가능한 구조로 만듦
3. 벡터 기반 데이터 검색
- 임베딩된 데이터는 벡터 DB에 저장되며, 사용자의 질문도 동일하게 벡터로 변환
- 벡터 DB는 두 벡터의 유사도를 비교해 가장 연관성이 높은 정보를 빠르게 찾아 제공
4. 검색 결과 기반의 답변 생성
- AI는 벡터DB에서 반한된 관련 정보를 조합해, 질문의 의도에 맞는 답변을 생성
- 정확한 데이터 기반 응답을 통해 기존 생성형 AI 할루시네이션 문제를 크게 줄일 수 있음
LLM 모델선정 - 높은 정확도의 핵심
- 무도챗봇은 단순한 챗봇이 아니라 문서 기반으로 정확한 답변을 제공하는 RAG 챗봇
- 모델 선정을 위해서는 정확도·안정성·한국어 성능 등을 고려할 수 있음
우수한 GPT 계열 모델을 사용하는 무도챗봇
1. 우수한 자연어 이해도
- 복잡한 정책, 방대한 규정·약관을 이해
- 사용자가 쉽게 이해할 수 있도록 자연스럽게 안내
2. 긴 문맥 기반 정교한 답변
- 장문 질의도 맥락을 유지하며, 정확한 정보 추출 및 요약 가능
3. 서버 구축 없이 가능한 운영
- API 기반의 서비스로 인프라 부담을 최소화
4. 낮은 개발 난이도와 빠른 구축
- 별도 모델 학습 없이도 챗봇 개발 및 RAG 연결이 용이
데이터 수집 & 전처리
- 고객이 제공하는 문서(PDF, Word, PPT, Excel, HTML)를 자동으로 파싱하여 AI가 이해할 수 있는 “텍스트+메타데이터” 형태로 정리
임베딩 모델 선정
- 문서를 AI가 이해하려면 먼저 임베딩(벡터화)이 필요
- 임베딩 모델이 따라 검색 정확도와 답변 품질이 크게 달라지기 때문에, 무도챗봇은 OpenAI, cohere, BGE/E5 3개의 모델 중 LLM모델과 가장 적합한 임베딩 모델을 선택
· GPT와 같은 회사의 엔진 → 의미 해석 호환성 최고
· 한국어/영어 혼합 문서도 문제 없음
· 파싱한 문서를 재정리 없이 바로 벡터화 가능
· GPU 없이 API 호출만으로 처리 → 초기비용 거의 없음
· 검색 정확도(Recall/Precision)가 현재 시점에서 가장 안정적
임베딩 처리 과정
- API로 처리하기 때문에 GPU 불필요
- 문서수집 → 텍스트추출 → 청킹 → 메타데이터 부여 → 임베딩 모델 호출 → 벡터DB에 저장
전처리 과정 - 데이터 파싱
- 글자 깨짐, 줄바꿈, 공백정리, 표를 텍스트로 변환, 특수문자 등 정리
- 유지관리 방법
· 새 문서가 생기면 주기적 재임베딩(수동/자동)
· 오래된 문서는 아카이빙
· 오래된 문서는 아카이빙
벡터 기반 데이터 검색 – 벡터DB 선정
- 문서가 임베딩되면, 이를 저장하고 검색하는 벡터DB가 필요합니다.
- 벡터DB는 챗봇의 보안·속도·운영비를 좌우하기 때문에 무도챗봇은 Weviate, Pinecone, Chroma 솔루션을 비교하여 최적의 구조를 선택
· 고객사 문서 기반 RAG
· 사내용&고객용 Q&A 으로, 로컬/단일 서버로 구현 가능
· 초기비용·운영비 최소화가 핵심
· Python 기반의 가벼운 구조로 (GPT+Open임베딩) 과 조합이 좋음
· 개발난이도가 낮음
· 확장성(문서의 추가/삭제)이 좋음
· 보안·비용·성능을 모두 고려했을 때 최적의 선택
· 데이터가 외부로 업로드되지 않아 보안 우려 없음
검색결과 기반의 답변 생성
1. 고품질 검색을 위한 Retrieval 튜닝 : 검색 결과의 정확도를 높이기 위함
- Top-K : 몇 개의 문서를 GPT가 볼 것인지. 지속적인 테스트를 통해 도출해야 함. 기본 3-5개
- Threshold : 유사값(임계값)을 설정해, 유사도(벡터)가 낮으면 관련 문서 없음으로 처리.
ex) 유사도 < 0.70 이면 검색결과 표출X, 할루시네이션 방지
- 카테고리의 하위 문서만 검색하도록 설정
2. 청킹 품질의 최적화 : 정확한 청킹이 검색+답변의 품질 개선
- 의미 단위로 청킹 : 문단, 섹션, 표, 항목 등
- 300-800자 권장 : 너무 짧으면 정확도가 떨어지고, 길면 정보의 섞임 우려
3. 프롬프트 설계
- ‘제공된 문서에 근거해’, ‘해당 정보는 문서에 없습니다’ 등 근거 중심의 답변을 강제하는 방법
- 키워드 검색+벡터 검색 혼용, 키워드 검색은 단순한 검색일 경우 효과적
개발일정
- 본 개발은 총 6주간 단계별로 진행. 이는 선정한 모델과 API 사용량(토큰 단위)에 따라 상이 할 수 있음
1. LLM 모델 선정&RAG 아키텍처 설계
- 모델 선정 및 기획 1~3일
- API 사용료(사용량에 따라 상이)
2. 데이터 수집 & 임베딩 모델 사용
- 데이터 수집, 청킹작업 1~2주(문서량에 따라 작업량 상이)
3. 벡터DB선정, 벡터DB화
- 데이터 벡터DB화 작업 약 1주
- DB모델에 따라 세팅 비용 상이
4. 검색 결과 기반 답변 생성
- 챗봇 프로그램 개발 2~3주
RAG 기능 챗봇 개발 체크리스트
- 검색 및 정보 인덱싱 능력
- 언어 모델 활용 능력
- 시스템 통합 및 파이프라인 설계 능력
사용방법
1. 질문하기
- 거북목, 라운드숄더, 굽은등, 척추측만증처럼 불편한 부위가 있다면 자유롭게 질문하세요.
- 증상 설명이나 간단한 키워드만으로도 바로 관련 정보를 안내받을 수 있습니다.
2. 검색 결과
- RAG 기능을 활용하여 외부 문서, 논문, 가이드 자료 등 방대한 정보를 자동으로 검색하고 분석합니다
- 그 과정에서 가장 신뢰도 높고 관련성 있는 자료를 선별하여, 정확하고 체계적인 답변을 받을 수 있습니다.
3. 정보활용
- 검색 결과에서 제공되는 동영상·이미지·논문·가이드 자료를 통해 자세 교정에 필요한 내용을 더 깊이 있게 확인하고 바로 활용할 수 있습니다.
분야별 RAG기능 활용 사례
1. 체육관
- 체육관에서 챗봇 활용은 운동 루틴 안내, 기구 사용법 설명, 근력·유산소 프로그램 추천 등 기능이 있습니다.
- 특히, 초보자와 회원 개별 수준에 맞춰 효율적인 운동 계획을 안내할 수 있습니다.
· 회원 개별 수준에 맞는 여러 동작을 추천 받기
· 사용자의 질문을 이해하고 정확한 답변 도출(RAG기능)
· 검색어 예시를 이용하여 검색 효율 향상 시킴
2. 필라테스
- 필라테스에서 챗봇 활용은 동작 가이드 제공, 스트레칭 추천, 코어 강화 프로그램 안내 등 기능이 있습니다.
- 회원 목표와 체형 특성에 맞춰 안전하게 자세를 개선하는 방법을 안내할 수 있습니다.
3. 교정센터
- 자세교정센터에서 챗봇 활용은 체형 분석, 맞춤 운동 안내 등 기능이 있습니다.
- 거북목, 골반 틀어짐, 척추 불균형 등 문제 유형에 맞춘 교정법을 신속하게 안내할 수 있습니다.
· RAG기능으로 기존 생성형 AI가 가진 환각 문제를 크게 줄이고, 헬스케어 분야에 적합한 신뢰도 높은 응답 제공
무도챗봇 사용자 화면
1. 빠른 검색 예시 버튼
- 메인 화면은 채팅에 중점을 두며 사이드바에 어떤 질문을 가장 많이 하였는지 질문 또는 예시들을 통해 빠르게 질문할 수 있도록 합니다.
2. 질문 랭킹 탭
- 질문 랭킹은 사용자들이 자주 묻는 주제를 RAG가 우선적으로 참고할 수 있게 만들어 더 많은 데이터가 축적된 영역에서 더욱 정확하고 정교한 답변을 제공할 수 있게 해줍니다.
3. 질문 화면
- RAG 기반 질문화면에서는 사용자가 입력한 키워드를 외부 지식과 연결해 분석하고, 그 중 가장 신뢰도 높은 정보를 골라 최적의 답변으로 제공합니다.
나에게 꼭 맞는 교정운동, 이제 AI가 찾아드립니다.
무도챗봇의 핵심은 검색증강생성 RAG 기능!
무도챗봇 서비스 설명
무도챗봇의 RAG기능
- RAG 기능으로 인해 사용자가 묻는 다양한 질문 이해
- 관련 정보와 예시를 빠르게 제공
RAG란?
- RAG(Retrieval-Augmented Generation, Generation, 검색증강생성)
- 외부 지식 베이스(벡터DB)의 내용에 기반해 답변의 정확성과 신뢰성을 높이는 방식
- 방대한 자료를 실시간으로 참고해 질문과 관련된 정보를 정확하고 풍부하게 제공
- 체형 교정이나 필라테스 등 전문 영역에서도 구체적이고 일관된 답변을 받을 수 있음
무도챗봇 제작과정
1. LLM 모델 선정
- 헬스케어 특성상 높은 정확도가 필요하기 때문에, 무도챗봇은 고성능 GPT 모델을 채택
- 적용 분야와 목적에 맞는 모델을 선택하는 과정은 서비스 품질을 좌우하는 핵심 요소
2. 데이터 수집 & 임베딩 모델 사용
- 이미지, 텍스트, 자연어 질문 등 다양한 데이터를 수집한 뒤, 필요한 정보 추출
- 이후 임베딩 모델을 활용해 데이터를 벡터형태로 변환하여 검색 및 학습이 가능한 구조로 만듦
3. 벡터 기반 데이터 검색
- 임베딩된 데이터는 벡터 DB에 저장되며, 사용자의 질문도 동일하게 벡터로 변환
- 벡터 DB는 두 벡터의 유사도를 비교해 가장 연관성이 높은 정보를 빠르게 찾아 제공
4. 검색 결과 기반의 답변 생성
- AI는 벡터DB에서 반한된 관련 정보를 조합해, 질문의 의도에 맞는 답변을 생성
- 정확한 데이터 기반 응답을 통해 기존 생성형 AI 할루시네이션 문제를 크게 줄일 수 있음
LLM 모델선정 - 높은 정확도의 핵심
- 무도챗봇은 단순한 챗봇이 아니라 문서 기반으로 정확한 답변을 제공하는 RAG 챗봇
- 모델 선정을 위해서는 정확도·안정성·한국어 성능 등을 고려할 수 있음
우수한 GPT 계열 모델을 사용하는 무도챗봇
1. 우수한 자연어 이해도
- 복잡한 정책, 방대한 규정·약관을 이해
- 사용자가 쉽게 이해할 수 있도록 자연스럽게 안내
2. 긴 문맥 기반 정교한 답변
- 장문 질의도 맥락을 유지하며, 정확한 정보 추출 및 요약 가능
3. 서버 구축 없이 가능한 운영
- API 기반의 서비스로 인프라 부담을 최소화
4. 낮은 개발 난이도와 빠른 구축
- 별도 모델 학습 없이도 챗봇 개발 및 RAG 연결이 용이
데이터 수집 & 전처리
- 고객이 제공하는 문서(PDF, Word, PPT, Excel, HTML)를 자동으로 파싱하여 AI가 이해할 수 있는 “텍스트+메타데이터” 형태로 정리
임베딩 모델 선정
- 문서를 AI가 이해하려면 먼저 임베딩(벡터화)이 필요
- 임베딩 모델이 따라 검색 정확도와 답변 품질이 크게 달라지기 때문에, 무도챗봇은 OpenAI, cohere, BGE/E5 3개의 모델 중 LLM모델과 가장 적합한 임베딩 모델을 선택
· GPT와 같은 회사의 엔진 → 의미 해석 호환성 최고
· 한국어/영어 혼합 문서도 문제 없음
· 파싱한 문서를 재정리 없이 바로 벡터화 가능
· GPU 없이 API 호출만으로 처리 → 초기비용 거의 없음
· 검색 정확도(Recall/Precision)가 현재 시점에서 가장 안정적
임베딩 처리 과정
- API로 처리하기 때문에 GPU 불필요
- 문서수집 → 텍스트추출 → 청킹 → 메타데이터 부여 → 임베딩 모델 호출 → 벡터DB에 저장
전처리 과정 - 데이터 파싱
- 글자 깨짐, 줄바꿈, 공백정리, 표를 텍스트로 변환, 특수문자 등 정리
- 유지관리 방법
· 새 문서가 생기면 주기적 재임베딩(수동/자동)
· 오래된 문서는 아카이빙
· 오래된 문서는 아카이빙
벡터 기반 데이터 검색 – 벡터DB 선정
- 문서가 임베딩되면, 이를 저장하고 검색하는 벡터DB가 필요합니다.
- 벡터DB는 챗봇의 보안·속도·운영비를 좌우하기 때문에 무도챗봇은 Weviate, Pinecone, Chroma 솔루션을 비교하여 최적의 구조를 선택
· 고객사 문서 기반 RAG
· 사내용&고객용 Q&A 으로, 로컬/단일 서버로 구현 가능
· 초기비용·운영비 최소화가 핵심
· Python 기반의 가벼운 구조로 (GPT+Open임베딩) 과 조합이 좋음
· 개발난이도가 낮음
· 확장성(문서의 추가/삭제)이 좋음
· 보안·비용·성능을 모두 고려했을 때 최적의 선택
· 데이터가 외부로 업로드되지 않아 보안 우려 없음
검색결과 기반의 답변 생성
1. 고품질 검색을 위한 Retrieval 튜닝 : 검색 결과의 정확도를 높이기 위함
- Top-K : 몇 개의 문서를 GPT가 볼 것인지. 지속적인 테스트를 통해 도출해야 함. 기본 3-5개
- Threshold : 유사값(임계값)을 설정해, 유사도(벡터)가 낮으면 관련 문서 없음으로 처리.
ex) 유사도 < 0.70 이면 검색결과 표출X, 할루시네이션 방지
- 카테고리의 하위 문서만 검색하도록 설정
2. 청킹 품질의 최적화 : 정확한 청킹이 검색+답변의 품질 개선
- 의미 단위로 청킹 : 문단, 섹션, 표, 항목 등
- 300-800자 권장 : 너무 짧으면 정확도가 떨어지고, 길면 정보의 섞임 우려
3. 프롬프트 설계
- ‘제공된 문서에 근거해’, ‘해당 정보는 문서에 없습니다’ 등 근거 중심의 답변을 강제하는 방법
- 키워드 검색+벡터 검색 혼용, 키워드 검색은 단순한 검색일 경우 효과적
개발일정
- 본 개발은 총 6주간 단계별로 진행. 이는 선정한 모델과 API 사용량(토큰 단위)에 따라 상이 할 수 있음
1. LLM 모델 선정&RAG 아키텍처 설계
- 모델 선정 및 기획 1~3일
- API 사용료(사용량에 따라 상이)
2. 데이터 수집 & 임베딩 모델 사용
- 데이터 수집, 청킹작업 1~2주(문서량에 따라 작업량 상이)
3. 벡터DB선정, 벡터DB화
- 데이터 벡터DB화 작업 약 1주
- DB모델에 따라 세팅 비용 상이
4. 검색 결과 기반 답변 생성
- 챗봇 프로그램 개발 2~3주
RAG 기능 챗봇 개발 체크리스트
- 검색 및 정보 인덱싱 능력
- 언어 모델 활용 능력
- 시스템 통합 및 파이프라인 설계 능력
사용방법
1. 질문하기
- 거북목, 라운드숄더, 굽은등, 척추측만증처럼 불편한 부위가 있다면 자유롭게 질문하세요.
- 증상 설명이나 간단한 키워드만으로도 바로 관련 정보를 안내받을 수 있습니다.
2. 검색 결과
- RAG 기능을 활용하여 외부 문서, 논문, 가이드 자료 등 방대한 정보를 자동으로 검색하고 분석합니다
- 그 과정에서 가장 신뢰도 높고 관련성 있는 자료를 선별하여, 정확하고 체계적인 답변을 받을 수 있습니다.
3. 정보활용
- 검색 결과에서 제공되는 동영상·이미지·논문·가이드 자료를 통해 자세 교정에 필요한 내용을 더 깊이 있게 확인하고 바로 활용할 수 있습니다.
분야별 RAG기능 활용 사례
1. 체육관
- 체육관에서 챗봇 활용은 운동 루틴 안내, 기구 사용법 설명, 근력·유산소 프로그램 추천 등 기능이 있습니다.
- 특히, 초보자와 회원 개별 수준에 맞춰 효율적인 운동 계획을 안내할 수 있습니다.
· 회원 개별 수준에 맞는 여러 동작을 추천 받기
· 사용자의 질문을 이해하고 정확한 답변 도출(RAG기능)
· 검색어 예시를 이용하여 검색 효율 향상 시킴
2. 필라테스
- 필라테스에서 챗봇 활용은 동작 가이드 제공, 스트레칭 추천, 코어 강화 프로그램 안내 등 기능이 있습니다.
- 회원 목표와 체형 특성에 맞춰 안전하게 자세를 개선하는 방법을 안내할 수 있습니다.
3. 교정센터
- 자세교정센터에서 챗봇 활용은 체형 분석, 맞춤 운동 안내 등 기능이 있습니다.
- 거북목, 골반 틀어짐, 척추 불균형 등 문제 유형에 맞춘 교정법을 신속하게 안내할 수 있습니다.
· RAG기능으로 기존 생성형 AI가 가진 환각 문제를 크게 줄이고, 헬스케어 분야에 적합한 신뢰도 높은 응답 제공
무도챗봇 사용자 화면
1. 빠른 검색 예시 버튼
- 메인 화면은 채팅에 중점을 두며 사이드바에 어떤 질문을 가장 많이 하였는지 질문 또는 예시들을 통해 빠르게 질문할 수 있도록 합니다.
2. 질문 랭킹 탭
- 질문 랭킹은 사용자들이 자주 묻는 주제를 RAG가 우선적으로 참고할 수 있게 만들어 더 많은 데이터가 축적된 영역에서 더욱 정확하고 정교한 답변을 제공할 수 있게 해줍니다.
3. 질문 화면
- RAG 기반 질문화면에서는 사용자가 입력한 키워드를 외부 지식과 연결해 분석하고, 그 중 가장 신뢰도 높은 정보를 골라 최적의 답변으로 제공합니다.




