프로젝트 배경
1) 문제점: 설비사업 예산기획팀에서 입찰 견적을 작성할 때, 정부 품셈집(약 982페이지 분량의 PDF 문서)에서 품목별 공량을 하나하나 수작업으로 찾고 있었습니다. 품목 수가 많을수록 상당한 시간이 소요되는 반복적인 업무였습니다. 2) 프로젝트 목표: 5단계 하이브리드 RAG 매칭 파이프라인(NL 규격 추론 → 부문 분류 → 쿼리 확장 → Dense+BM25 하이브리드 검색 → LLM 재랭킹)
프로젝트 성과
5단계 하이브리드 매칭 파이프라인 구축
982페이지 분량의 품셈집 PDF 전체를 AI가 검색할 수 있는 상태로 자동 변환하는 시스템을 구축했습니다.
대량 품목 일괄 자동 매칭
3,000건 품목을 한 번에 자동 매칭하며, 처리 중 진행률을 화면에서 실시간으로 확인할 수 있습니다.
현장 용어 자동 인식
현장에서 쓰는 용어와 품셈집의 표준 용어가 달라도, AI가 의미를 파악하여 올바른 항목을 찾아줍니다.
웹 기반 결과 검수 화면
결과를 표 형태로 확인하고, 틀린 부분은 화면에서 바로 수정할 수 있는 검수 화면을 개발했습니다.
핵심 기능
진행 단계
환경 준비 + 데이터 구조 설계
2026.02.
시스템 기본 구조 구축, 데이터 저장 방식 설계, 기본 기능 연결
프로젝트 상세
1) 포트폴리오 소개 : 설비사업 예산기획팀을 위한 AI 기반 입찰 견적 보조 시스템 PoC입니다. 정부 품셈집(PDF 982페이지)을 하이브리드 파싱(Camelot + Vision)으로 벡터 인덱싱하고, 5단계 매칭 파이프라인(NL규격추론 → 부문분류 → 쿼리확장 → Dense+BM25 하이브리드검색 → LLM재랭킹)으로 품목명-품셈 항목을 의미론적 매칭하여 공량 데이터를 자동 추출합니다. 기존






