프로젝트 배경
1) 문제점 - 법령·판례·재결례가 law.go.kr에 산재되어 자체 DB 구축이 어려움 - HTML·PDF·HWP 등 비정형 포맷으로 제공되어 구조화 작업이 복잡 - 대량 수집 시 IP 차단 위험으로 안정적인 수집 환경 구축이 필요 2) 프로젝트 목표 - law.go.kr 법령·판례·재결례 전수 수집 - sample.sql 구조대로 MariaDB 적재 - 표·각주·이미지 비정
프로젝트 성과
법령 본문 301건 DB 적재 완료
근로기준법 시행령 전체 조문을
chapter 1건·article 60건·content 240건으로
계층 구조 분리하여 MariaDB 적재 완료
chapter 1건·article 60건·content 240건으로
계층 구조 분리하여 MariaDB 적재 완료
수집→파싱→DB 적재 전 자동화
PyQt6 UI에서 버튼 하나로
4단계 파이프라인 자동 순차 실행.
코드 없이 UI만으로 전체 운영 가능
4단계 파이프라인 자동 순차 실행.
코드 없이 UI만으로 전체 운영 가능
3포맷 파싱 동시 구현
HTML·PDF·HWP 3포맷을
동일한 구조로 파싱하여
비정형 데이터 처리 완료
동일한 구조로 파싱하여
비정형 데이터 처리 완료
핵심 기능
진행 단계
요구사항 분석
2026.06.
발주처 제공 sample.sql 분석.
테이블 구조·계층 관계·네이밍 규칙 파악.
law.go.kr URL 패턴 및 HTML 구조 분석
테이블 구조·계층 관계·네이밍 규칙 파악.
law.go.kr URL 패턴 및 HTML 구조 분석
프로젝트 상세
영상 데모 링크 : https://naver.me/51uLsopC 1) 포트폴리오 소개 본 포트폴리오는 귀사 공고의 요구사항에 맞춰 직접 구현한 샘플 데모입니다. 국가법령정보센터(law.go.kr)에서 법령·판례·재결례를 수집하여 제공하신 sample.sql 구조대로 MariaDB에 적재하는 전 과정을 구현했습니다. 2) 작업 범위 - law.go.kr 실제 크롤링 및 Raw 데이터






