프로젝트 배경
1. 해결하려는 문제 (The Problem) AI 학습 데이터 부재: 클라이언트(Y사)는 인테리어 자동 설계 AI 모델을 개발하고자 했으나, 학습에 필수적인 도면 및 마감재(벽지, 바닥재 등) 이미지 데이터가 전무했습니다. 수집의 비효율성: 10만 건 이상의 데이터를 사람이 일일이 수집/정리하는 것은 물리적으로 불가능했으며, 각기 다른 소스(쇼핑몰, 제조사)에서 가져온 데이터는 **규격과 해상도가
프로젝트 성과
목표 데이터 초과 달성및 사업성공
당초 목표였던 5만 건을 200% 초과하여, 총 10만 건 이상의 고품질 인테리어 자재 이미지 및 메타데이터 구축 완료및 최종 감리에서 '적합(성공)' 판정
핵심 기능
진행 단계
설계, 수집, 가공, 감리 통과
2022.06.
착수/설계 → 크롤링 봇 개발(Python) → 대규모 데이터 수집(10만건) 및 전처리(OpenCV) → 품질 검수(QA) 및 라벨링 → 최종 납품 및 정부 감리 '적합' 판정(성공)
프로젝트 상세
1) 포트폴리오 소개 - 정부 데이터바우처 지원사업으로 수행된 '인테리어 AI 자동 설계를 위한 학습용 도면 및 마감재 이미지 데이터셋 10만 건 구축' 프로젝트입니다. 2) 작업 범위 기획: 수집 대상 사이트 분석 및 데이터 스키마(Schema) 정의 개발: Python 기반 웹 크롤링 봇(Bot) 개발 및 이미지 전처리 자동화 시스템 구축 가공: 비정형 데이터(이미지)의 규격화(Res







