프로젝트 배경
1) 문제점 - 정부 품셈집 PDF는 표·이미지·각주가 혼재된 비정형 구조여서, LangChain TextSplitter 설정만으로는 공량 항목 경계가 뒤섞이는 문제가 발생해 섹션 헤더 패턴 기반 전처리 파서를 별도 구현해야 했습니다. - FAISS 벡터 검색 결과의 신뢰도 점수가 품목명 표기 방식(한자·약어·단위 포함 여부)에 따라 동일 항목임에도 크게 달라져, 프론트엔드에서 임계값 기반 색상 배지와 경
프로젝트 성과
품목 대량 입력 파싱 파이프라인 설계
Textarea 개행 파싱 → Zod 스키마 검증 → useReducer 청크 큐 흐름을 Custom Hook(useItemQueue) 하나로 추상화, 단일 책임 원칙 기반 컴포넌트 구조 구축
AG Grid 신뢰도 배지 동적 렌더러 구현
cellRendererFramework로 신뢰도 점수 배지·PDF 페이지 링크·편집 하이라이팅을 14개 컬럼 정의 내에서 조합, 인라인 편집 diff 추적 상태 관리 설계
SSE 기반 RAG 인덱싱 실시간 진행률 구조 구축
Server-Sent Events 수신 훅으로 LangChain + FAISS 인덱싱 단계별 상태 배지를 실시간 갱신, 폴링 주기 관리와 상태 전환 로직 캡슐화
검수 상태 전환 가드 설계
XState 경량 상태 머신으로 미검수→검토중→확정→반려 전환 규칙을 코드로 명시, Optimistic UI + 서버 오류 롤백 패턴으로 비정상 상태 진입 구조적 차단
품셈집 챕터 계층 트리 뷰어 구현
재귀 트리 컴포넌트로 PDF 챕터·섹션·항목 3단계 계층 렌더링, 검색 키워드 하이라이팅 및 react-dropzone 업로드 진행률 표시 통합 구현
핵심 기능
진행 단계
품셈집 RAG 파이프라인 설계
2025.03.
정부 품셈집 PDF 구조 분석 후 LangChain + FAISS 기반 청크 분할·임베딩 파이프라인 설계, Node.js 인덱싱 API 엔드포인트 3개 정의
프로젝트 상세
1) 포트폴리오 소개 건설 공사 입찰 시 필요한 자재 단가 산출 업무를 자동화하기 위해, AI 기반 품목 매칭 엔진과 검수 워크플로우를 갖춘 웹 시스템을 React + Node.js 기반으로 설계·구현하였습니다. 정부 품셈집 PDF를 LangChain RAG 파이프라인으로 인덱싱하고, 사용자가 입력한 품목명을 벡터 유사도 검색으로 자동 매핑하는 의미론적 매칭 UI를 구현하였습니다. 2) 작업 범위 -







