프로젝트 배경
공공 및 민간 정책 수립 시 활용 가능한 사회 이슈 기반 수요예측 데이터를 확보하기 위해, 크롤링 기반 텍스트 수집 → 불용어 제거 → 연관 키워드 분석 → 시각화까지의 전처리 자동화 시스템을 구축하였습니다. 실제 사용자(지자체/정책입안자/연구자)가 텍스트마이닝 결과를 직관적으로 확인할 수 있도록 워드클라우드, 키워드 맵, 연관 분석 기반 UI를 구성하였습니다.
프로젝트 성과
• 데이터 구매 비용 절감
데이터마트 외부 구매 대비 약 60% 예산 절감
(텍스트마이닝 전용 DB 연동, 커스텀 사전 관리 구조 도입)
(텍스트마이닝 전용 DB 연동, 커스텀 사전 관리 구조 도입)
• 정책 대응형 키워드 분석 체계 구축
비정형 텍스트 기반 이슈 감지→키워드 그룹화→이벤트별 자동 태깅까지 자동화
• 활용성 중심의 분석 시각화 UI 구축
키워드 연관도 그래프/워드클라우드/분석통계 등을 시각적으로 제공하여 비전문가도 해석 가능
핵심 기능
진행 단계
데이터 수요 도출 및 키워드 정의
2024.11.
• 텍스트마이닝 수요 기관 대상 인터뷰 및 분석 대상 키워드 구조 정의
• 주제별 키워드 클러스터링 모델 도출
• 주제별 키워드 클러스터링 모델 도출
프로젝트 상세
• 포트폴리오 소개 본 프로젝트는 지자체 및 공공기관의 수요예측을 돕기 위해 설계된 데이터 기반 정책지원 시스템입니다. 일반 텍스트 자료로부터 사회적 관심사를 자동으로 추출하고 시각화하며, 이를 통해 향후 정책 수립의 참고 지표로 활용 가능하도록 구현하였습니다. 이를 통해 인감증명서 온라인 발급 수요의 타당성을 확인, 인감증명서 온라인 발급이 진행되었습니다. • 작업 범위 • 기획: 크롤링 대상







