안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.
플러스
Google Apps Scripts 기반 이벤트 참가자 데이터 통합·중복 제거 시스템
개발 · 디자인 · 기획
웹 · PC프로그램
SaaSㆍ솔루션, 데이터 분석ㆍBI, 업무자동화ㆍRPA
프로젝트 배경
1) 문제점
1-1. 여러 채널(Google Form, Typeform 등)에서 이벤트 신청 데이터가 분산 수집되어 통합 관리 어려움
1-2. 전화번호 형식이 통일되지 않아 중복 신청자 확인이 불가능
1-3. 수작업으로 데이터 정리 시 하루 2시간 이상 소요되어 비효율 발생
1-4. 중복 신청자로 인한 리소스낭비 및 중복 안내 메일 발송 실수


2) 프로젝트 목표
2-1. 다중 소스 데이터 자동 통합: 여러 채널의 데이터를 하나로 병합하는 시스템 구축
2-2. 전화번호 표준화: 다양한 형식을 숫자만 추출하여 통일된 형식으로 정규화
2-3. 중복 제거 자동화: 전화번호 일치 + 이름 유사도 분석으로 정확한 중복 판정
2-4. 완전 자동화: 트리거 기반 일일 자동 실행으로 사람의 개입 최소화


3) 주안점
3-1. 알고리즘 정확도: Levenshtein Distance로 이름 오타 및 변형 감지
3-2. 데이터 품질: 유효성 검증을 통한 정제된 데이터 확보
3-3. 운영 효율성: 로그 기록 및 모니터링으로 시스템 안정성 확보
3-4. 확장 가능성: CONFIG 객체로 설정 관리하여 쉬운 커스터마이징
프로젝트 성과
데이터 정리 시간 단축
수작업으로 하루 2시간 소요되던 데이터 정리 작업이 자동화 후 10초로 단축. 마케팅 팀이 데이터 정리 대신 전략 수립에 집중 가능.
중복 발견율 향상
사람 눈으로 확인 시 60% 발견율에서 Levenshtein Distance 알고리즘 도입 후 95% 이상으로 향상. 중복 신청 누락 최소화.
처리 빈도 증가
업무 부담으로 주 1회만 처리하던 것을 매일 자동 실행으로 변경. 실시간에 가까운 데이터 관리로 고객 응대 품질 향상.
리소스 낭비 감소
중복 참가자로 인한 굿즈 및 자료 낭비가 30% 감소. 중복 안내 메일 발송 실수 방지로 고객 경험 개선.
핵심 기능
다중 소스 데이터 자동 통합
RawData_A, RawData_B 시트의 데이터를 자동으로 병합. 각 데이터의 출처(Source_A, Source_B)를 추적하여 데이터 이력 관리.
전화번호 표준화
다양한 형식을 숫자만 추출하여 통일. 10-11자리 유효성 검증 포함.
원본 데이터 vs 정제 데이터 비교
전화번호 일치 시 이름 유사도 계산. 편집 거리 알고리즘으로 "김철수" vs "김철수님" 등 변형 감지. 유사도 70% 이상이면 중복 판정.
트리거 기반 자동 실행
매일 오전 9시 자동 실행 트리거 설정. 사람의 개입 없이 완전 자동화된 데이터 처리 파이프라인 구축.
실행 로그 및 모니터링
처리 건수, 중복 제거 수, 실행 시간, 성공/실패 상태를 Logs 시트에 자동 기록. 시스템 성능 추적 및 이슈 모니터링.
진행 단계
기획 및 요구사항 정의
2025.09.
비즈니스 문제 분석, 데이터 소스 파악, 중복 판정 기준 설정. 시스템 아키텍처 설계 및 기술 스택 선정.
알고리즘 설계 및 구현
2025.09.
Levenshtein Distance 알고리즘 구현, 전화번호 정규화 로직 개발. 동적 프로그래밍 기법으로 성능 최적화.
데이터 파이프라인 개발
2025.09.
데이터 통합, 정제, 중복 제거 파이프라인 구축. 4개 시트(RawData_A/B, MergedData, Logs) 구조 설계 및 구현.
자동화 및 모니터링
2025.10.
트리거 기반 자동 실행 설정, 실행 로그 기록 시스템 구축. 성공/실패 알림 및 오류 처리 로직 구현.
테스트 및 배포
2025.10.
샘플 데이터로 테스트 (10건 → 7건 중복 제거 검증). 문서화 완료 후 실제 운영 환경에 배포.
프로젝트 상세
1) 포트폴리오 소개 : 서비스 카테고리(ex. 커머스, AI 등)와 메인 타깃(ex. 주부, 청소년) 등을 포함한 간략한 소개

여러 채널(Google Form, Typeform 등)에서
수집된 이벤트 신청 데이터를 Google Apps Script로 자동 통합하고,
전화번호 표준화 및 Levenshtein Distance 알고리즘 기반 이름 유사도 분석을 통해
중복 신청자를 정확하게 제거하는 자동화 시스템입니다.


2) 작업 범위 : 개발에 참여한 범위 및 지원환경
- 예시) 화면 설계, UI/UX 디자인, 서버 구축, Front-end 개발, 관리자 페이지 개발 등
- 예시) 반응형 웹, Android, iOS 등

3) 주요 업무 : 해당 서비스의 주요 기능 및 주요 페이지
- 예시) 회원등급제 기능, 숙소 추천 로직 구성, GPS 기반 숙소 리스트, 실시간 예약 및 결제 페이지 등

4) 주안점 : 서비스 구축 시 중점이 되었던 사항
- 예시) 개인 정보에 대한 보안, 트렌디한 디자인 등
4개의 시트로 구성된 체계적인 데이터 파이프라인: 원본 데이터 수집(RawData_A/B) → 통합·정제(MergedData) → 실행 로그(Logs)
서로 다른 이벤트 신청 채널에서 수집된 원본 데이터. 전화번호 형식이 통일되지 않았고, 중복 신청자가 포함되어 있음.
중복 제거 및 표준화 완료된 최종 데이터. 10건의 원본 데이터에서 3건의 중복을 제거하여 7건의 유효 데이터 확보.
자동화 실행 이력을 체계적으로 기록. 처리 건수, 중복 제거 수, 실행 시간 등을 추적하여 시스템 성능 모니터링."
Levenshtein Distance 알고리즘을 활용한 이름 유사도 계산 로직. 동적 프로그래밍 기법으로 효율적인 문자열 비교 구현.
매일 오전 9시 자동 실행 트리거 설정. 사람의 개입 없이 완전 자동화된 데이터 처리 파이프라인 구축.

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

작업한 파트너 프로필 보기

02******
개발 · 개인사업자

프로젝트 정보

참여 기간
2025.09. ~ 2025.10.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
고객사
자체 프로젝트
역할
TurnKey 방식
관련 기술
JavaScript
Levenshtein Distance
동적 프로그래밍
중복 제거 알고리즘
데이터 정제
Google Sheets API
Google Apps Script