프로젝트 배경
1) 문제점 - 한국 공공조달 시장은 연간 약 200조 원 규모이나, G2B OpenAPI의 데이터 구조가 복잡하여 일반 기업이 직접 활용하기 어려움 - 입찰 카테고리가 건설·용역·물품·외국용역 4종으로 분기되고, 카테고리마다 필드가 240개 이상으로 평탄하게 펼쳐져 있음 - 첨부 서류가 PDF, HWP, Excel, Word로 혼재되어 수십 페이지를 직접 읽어야 내용 파악 가능 - 하나의 공고가 차수
프로젝트 성과
15개월간 입찰 공고 663,207건 수집·정제
투찰 참여 29,971,251행(14GB), 낙찰 결과 497,090건, 조달 참여 기업 888,615개사, 전체 DB 약 19GB, 누적 낙찰 금액 약 80.4조 원 규모의 프로덕션 데이터를 무중단으로 수집·운영
한국어 부분 일치 검색 100ms 이하 응답 달성
PostgreSQL 인덱스 193개, Materialized View 3종, GIN(trigram) 인덱스 4개를 조합하여 3,000만 행 규모의 투찰 테이블에서 복합 집계 쿼리를 밀리초 단위로 응답하도록 설계
핵심 기능
진행 단계
백엔드 및 데이터 파이프라인 개발
2025.07.
NestJS 11 기반 API 서버 구축, G2B OpenAPI 수집 배치 개발, Job/JobPage/JobLog 3단계 배치 추적 모델 구현, PostgreSQL 인덱스 전략 설계
프로젝트 상세
[프로젝트 배경] 한국 공공조달 시장은 연간 약 200조 원 규모로, 조달청 나라장터를 통해 매일 수천 건의 입찰 공고가 발행됩니다. 그러나 공공데이터포털의 G2B OpenAPI는 입찰 카테고리가 4종으로 분기되고 카테고리마다 필드가 240개 이상이며, 첨부 서류가 PDF/HWP/Excel/Word로 혼재되어 있어 일반 기업이 직접 활용하기 매우 어렵습니다. JodalN은 이러한 원시 데이터의 복잡성을 해소







