
등록 일자 2026.03.17.
개발
기획
웹
SaaSㆍ솔루션, 스크래핑ㆍAPI, LLM 구축
예상 금액
20,000,000원
금액 조율 가능
예상 기간
80일
기간 조율 가능
지원자 수
45명
모집 마감일
2026년 03월 19일

프로젝트 문의 9
안녕하세요. 크롤링 대상 기업 홈페이지가 대략 몇 개 정도 규모인지 궁금합니다. IP 차단 방지를 위한 딜레이 외에 프록시 로테이션도 고려하고 계신지, 그리고 LLM으로 키워드 추출 시 GPT-4 수준의 모델을 사용할 건지 비용 최적화를 위해 경량 모델도 검토 중이신지 알고 싶습니다.
개인정보 필터링 부분이 꽤 까다로울 수 있는데요. 크롤링한 HTML에서 이메일/전화번호 패턴을 정규식으로 탐지하는 것까진 쉽지만, 이미지로 박혀있는 연락처나 JavaScript로 동적 렌더링되는 경우까지 커버하려면 headless 브라우저 기반 크롤링이 필요합니다. 개인정보보호법 컴플라이언스가 핵심이라고 하셨는데, 크롤링 결과를 DB에 쓰기 전에 LLM으로 한 번 더 개인정보 포함 여부를 검증하는 이중 필터 구조도 고려해보시면 좋을 것 같습니다.
비밀 댓글입니다.
비밀 댓글입니다.
비밀 댓글입니다.
비밀 댓글입니다.
비밀 댓글입니다.
디자인
웹 외 1개
SaaSㆍ솔루션 외 2개
개발 · 기획
웹 외 1개
기타(IT 서비스 구축)
개발 · 디자인 · 기획
웹
홈페이지ㆍ게시판 외 2개
개발 · 기획
웹 외 1개
업무자동화ㆍRPA
개발 · 기획
웹
SaaSㆍ솔루션 외 2개
비밀 댓글입니다.