프로젝트 배경
1) 문제점 - 담당자가 여러 지자체 고시공고 게시판을 반복 방문해야 했습니다. - 공고 상세 페이지와 첨부파일을 수작업으로 열어 주소를 확인해야 했습니다. - HWP, HWPX, PDF, Excel 등 문서 형식이 섞여 있어 반복 업무 시간이 길었습니다. - 이미지 기반 스캔 PDF는 일반 텍스트 파싱만으로 처리하기 어려웠습니다. 2) 프로젝트 목표 - 지자체 게시판 검색, 페이지 순회, 상세
프로젝트 성과
30페이지 대량 탐색 및 주소 추출 검증
포항시 30페이지 전체 탐색에서 공고 300건·첨부 415개를 확인하고, 별도 첨부 분석으로 주소 336건 지도/CSV 검수까지 확인했습니다.
핵심 기능
진행 단계
MVP 검증 및 제품화 구조 설계
2026.06.
실제 호출 기반 MVP를 제작해 크롤링, 문서 파싱, 지오코딩, 지도/목록 검수 흐름을 검증했습니다.
프로젝트 상세
지자체 홈페이지 고시공고 첨부파일을 자동 탐색하고, HWP/HWPX/PDF/Excel 문서에서 주소 데이터를 추출해 지도와 테이블로 검수하는 Windows 기반 업무 자동화 MVP입니다. 핵심 과업은 포항·구미·김천·경주 고시공고 게시판 검색/페이지 순회, 상세 페이지 진입, 첨부파일 식별·다운로드, 문서 텍스트 추출, 도로명·지번 주소 Regex 추출, 주소 정규화, 네이버 지오코딩, 지도 마커 표시,







