프로젝트 배경
문제점 및 현황 (Pain Points) 물류 프로세스의 병목 현상 발생: 글로벌 풀필먼트 센터 및 배송 현장에서 매일 수만 건 이상의 운송장이 발생하지만, 이를 수기로 시스템에 입력하거나 바코드 스캔에만 의존하는 방식은 처리 속도 저하와 인건비 상승의 주원인이었습니다. 비정형 데이터 처리의 한계: 국가 및 현지 배송사(Carrier)마다 운송장 레이아웃, 용어, 표기 방식이 모두 상이하여 기존의 규칙 기반(Rule-based) OCR 소프트웨어로는 인식률 확보가 불가능했습니다. 데이터 정합성 오류: 수기 입력 과정에서 발생하는 오타(Human Error)로 인해 오배송이 발생하거나, 잘못된 주소/전화번호 형식으로 인해 CS 비용이 증가하는 문제가 있었습니다.
프로젝트 목표 (Project Goal) End-to-End 자동화 파이프라인 구축: 다양한 형태의 운송장 이미지를 입력받아 별도의 사람 개입 없이 수취인 정보(이름, 주소, 연락처)와 운송장 번호를 즉시 추출하는 AI 모델 개발을 목표로 했습니다. 데이터 구조화 및 표준화: 단순 텍스트 추출을 넘어, 비정형 텍스트를 국제 표준 포맷(JSON)으로 파싱하여 클라이언트의 레거시 시스템(ERP/WMS)에 즉시 연동 가능한 형태의 API 서버를 구축하고자 했습니다.
개발 주안점 (Key Focus Areas) 저품질 이미지 대응력 확보: 물류 창고 특성상 조명이 어둡거나, 운송장이 구겨지고 훼손된 상태에서 촬영되는 경우가 많습니다. 이에 대응하기 위해 강력한 전처리(Preprocessing) 알고리즘과 노이즈 제거 기술을 적용하여 악조건 속에서도 안정적인 인식률을 확보하는 데 집중했습니다. 스몰 데이터 한계 극복을 위한 합성 데이터 전략: 보안 문제로 인해 확보 가능한 실데이터 샘플이 제한적이었습니다. 이를 극복하고자 실제 운송장과 유사한 폰트, 배경, 노이즈를 적용한 합성 데이터(Synthetic Data) 생성 파이프라인을 구축하여 모델의 기초 성능을 비약적으로 향상시켰습니다. 비즈니스 로직 기반의 데이터 검증: AI 모델의 예측값에만 의존하지 않고, 국제 전화번호 규격(E.164) 및 국가별 우편번호 체계 등 명확한 비즈니스 룰을 후처리 로직에 탑재하여 데이터의 신뢰도를 보장했습니다.
프로젝트 목표 (Project Goal) End-to-End 자동화 파이프라인 구축: 다양한 형태의 운송장 이미지를 입력받아 별도의 사람 개입 없이 수취인 정보(이름, 주소, 연락처)와 운송장 번호를 즉시 추출하는 AI 모델 개발을 목표로 했습니다. 데이터 구조화 및 표준화: 단순 텍스트 추출을 넘어, 비정형 텍스트를 국제 표준 포맷(JSON)으로 파싱하여 클라이언트의 레거시 시스템(ERP/WMS)에 즉시 연동 가능한 형태의 API 서버를 구축하고자 했습니다.
개발 주안점 (Key Focus Areas) 저품질 이미지 대응력 확보: 물류 창고 특성상 조명이 어둡거나, 운송장이 구겨지고 훼손된 상태에서 촬영되는 경우가 많습니다. 이에 대응하기 위해 강력한 전처리(Preprocessing) 알고리즘과 노이즈 제거 기술을 적용하여 악조건 속에서도 안정적인 인식률을 확보하는 데 집중했습니다. 스몰 데이터 한계 극복을 위한 합성 데이터 전략: 보안 문제로 인해 확보 가능한 실데이터 샘플이 제한적이었습니다. 이를 극복하고자 실제 운송장과 유사한 폰트, 배경, 노이즈를 적용한 합성 데이터(Synthetic Data) 생성 파이프라인을 구축하여 모델의 기초 성능을 비약적으로 향상시켰습니다. 비즈니스 로직 기반의 데이터 검증: AI 모델의 예측값에만 의존하지 않고, 국제 전화번호 규격(E.164) 및 국가별 우편번호 체계 등 명확한 비즈니스 룰을 후처리 로직에 탑재하여 데이터의 신뢰도를 보장했습니다.
프로젝트 성과
업무 처리 속도 30배 향상 및 자동화
건당 평균 30초 소요되던 수기 입력 프로세스를 AI 자동화를 통해 1초 미만으로 단축시킴. 전체 운송장 처리 업무의 90% 이상을 완전 자동화하여 운영 인건비 및 리소스 획기적 절감.
악조건 하의 인식 강건성(Robustness) 확보
조명 반사, 구겨짐, 저해상도 등 열악한 현장 이미지를 복원하는 전처리 기술과 합성 데이터 학습을 통해, 기존 상용 OCR 솔루션 대비 저품질 이미지 인식률을 40% 이상 향상시킴.
핵심 기능
지능형 이미지 전처리 및 보정 (Smart Pre-processing)
OpenCV 기반의 투시 변환 및 이진화 기술을 적용하여, 구겨짐이나 기울어짐, 조명 반사가 심한 저품질 현장 이미지에서도 최적의 인식률을 확보하도록 화질을 자동 개선하고 노이즈 제거.
레이아웃 분석 및 ROI 정밀 탐지
배송사별 상이한 운송장 양식을 자동으로 식별하고, 수취인 정보, 주소, 운송장 번호 등 핵심 데이터가 위치한 영역(ROI)만을 정밀하게 타겟팅하여 불필요한 배경 텍스트 인식을 원천 차단하고 처리 속도를 향상
데이터 구조화 및 정합성 검증
비정형 OCR 텍스트를 정규식(Regex) 엔진을 통해 JSON으로 파싱하고, 전화번호 및 주소 체계 유효성 검증 로직을 통해 오인식된 문자(예: 0/O, 1/l)를 자동으로 교정하여 데이터 무결성 보장
프로젝트 상세
포트폴리오 소개 프로젝트명: 글로벌 물류 운송장 이미지 정보 추출 및 자동 정형화 솔루션 서비스
카테고리: AI / Global Logistics Tech (물류 자동화)
메인 타깃: 해외 풀필먼트 센터 운영사, 크로스보더 이커머스 셀러, 물류 시스템 관리자
한줄 소개: 다양한 국가와 배송사가 발행하는 비정형 영문 운송장 이미지에서 수취인 정보(이름, 주소, Zip Code 등)를 정밀하게 추출하여 JSON 데이터로 변환해 주는 AI API 솔루션입니다.
작업 범위 참여도: 100% (PM, AI 모델링, 백엔드 개발, 인프라 구축 전 과정 단독 수행)
수행 범위: 데이터 셋업: 원본 데이터 라벨링 및 영문/숫자 혼합 합성 데이터(Synthetic Data) 생성 파이프라인 구축 AI 모델링: 다국어 지원 OCR 모델 선정 및 도메인 특화 미세 조정(Fine-tuning)
백엔드 개발: 추출된 텍스트의 파싱 및 국가별 주소/번호 유효성 검증 로직 개발, RESTful API
구현 인프라: Docker 컨테이너 패키징 및 클라우드 배포 환경 구성
Language: Python AI/ML: PyTorch, OpenCV, Hugging Face (Transformer) Backend: FastAPI
Infra: Docker, Linux
주요 업무 및 기능 해당 솔루션은 국가별로 상이한 운송장 양식에서 의미 있는 배송 정보를 표준화하여 추출하는 데 초점을 맞추었습니다.
지능형 이미지 전처리: 다양한 스캐너 및 모바일 환경에서 촬영된 이미지의 기울기 보정 (Perspective Transform) 해외 물류 창고의 조명 간섭, 구겨짐, 저해상도 노이즈 제거 및 이진화 처리
핵심 정보 영역 탐지 및 추출: 글로벌 주요 배송사 및 로컬 캐리어의 다양한 레이아웃 패턴 자동 식별 전체 텍스트가 아닌 Recipient Name, Shipping Address, Tracking Number 등 핵심 영역(ROI) 집중 추출
데이터 정형화 및 유효성 검증: OCR 결과 텍스트를 정규식 엔진을 통해 국제 표준 포맷으로 분류 전화번호 파싱: 국가 코드(Country Code) 포함 형식(예: +1-xxx-xxx-xxxx) 자동 인식 및 하이픈 정규화 주소지 파싱: 주(State), 도시(City), 우편번호(Zip Code) 단위로 분리하여 구조화
경량화 API 서버 제공: GPU가 없는 일반 서버 환경에서도 1초 이내 처리가 가능한 경량 모델(Quantization 적용) 서빙
주안점 본 프로젝트는 해외 클라이언트의 요구사항에 맞춰 다양한 양식 대응과 데이터 신뢰성 확보에 중점을 두었습니다.
스몰 데이터 한계 극복 및 다국어 대응: 초기 확보된 실데이터 부족을 해결하기 위해, 영문 알파벳과 숫자가 혼용된 다양한 폰트의 합성 데이터를 대량 생성하여 모델을 사전 학습시켰습니다. 이를 통해 적은 샘플만으로도 높은 영문 인식률을 확보했습니다.
비즈니스 로직 기반의 정밀도 향상: AI 모델의 확률값에만 의존하지 않고, 국제 전화번호 규격(E.164)이나 국가별 우편번호 자리수 검증 등 비즈니스 규칙을 후처리 단계에 결합하여 데이터 무결성을 보장했습니다.
배포 용이성 및 호환성: 해외 현지의 다양한 서버 인프라 환경에 구애받지 않고 즉시 도입 가능하도록, 모든 의존성을 포함한 Docker Image 형태로 결과물을 모듈화하여 원격으로 납품 및 배포했습니다.
카테고리: AI / Global Logistics Tech (물류 자동화)
메인 타깃: 해외 풀필먼트 센터 운영사, 크로스보더 이커머스 셀러, 물류 시스템 관리자
한줄 소개: 다양한 국가와 배송사가 발행하는 비정형 영문 운송장 이미지에서 수취인 정보(이름, 주소, Zip Code 등)를 정밀하게 추출하여 JSON 데이터로 변환해 주는 AI API 솔루션입니다.
작업 범위 참여도: 100% (PM, AI 모델링, 백엔드 개발, 인프라 구축 전 과정 단독 수행)
수행 범위: 데이터 셋업: 원본 데이터 라벨링 및 영문/숫자 혼합 합성 데이터(Synthetic Data) 생성 파이프라인 구축 AI 모델링: 다국어 지원 OCR 모델 선정 및 도메인 특화 미세 조정(Fine-tuning)
백엔드 개발: 추출된 텍스트의 파싱 및 국가별 주소/번호 유효성 검증 로직 개발, RESTful API
구현 인프라: Docker 컨테이너 패키징 및 클라우드 배포 환경 구성
Language: Python AI/ML: PyTorch, OpenCV, Hugging Face (Transformer) Backend: FastAPI
Infra: Docker, Linux
주요 업무 및 기능 해당 솔루션은 국가별로 상이한 운송장 양식에서 의미 있는 배송 정보를 표준화하여 추출하는 데 초점을 맞추었습니다.
지능형 이미지 전처리: 다양한 스캐너 및 모바일 환경에서 촬영된 이미지의 기울기 보정 (Perspective Transform) 해외 물류 창고의 조명 간섭, 구겨짐, 저해상도 노이즈 제거 및 이진화 처리
핵심 정보 영역 탐지 및 추출: 글로벌 주요 배송사 및 로컬 캐리어의 다양한 레이아웃 패턴 자동 식별 전체 텍스트가 아닌 Recipient Name, Shipping Address, Tracking Number 등 핵심 영역(ROI) 집중 추출
데이터 정형화 및 유효성 검증: OCR 결과 텍스트를 정규식 엔진을 통해 국제 표준 포맷으로 분류 전화번호 파싱: 국가 코드(Country Code) 포함 형식(예: +1-xxx-xxx-xxxx) 자동 인식 및 하이픈 정규화 주소지 파싱: 주(State), 도시(City), 우편번호(Zip Code) 단위로 분리하여 구조화
경량화 API 서버 제공: GPU가 없는 일반 서버 환경에서도 1초 이내 처리가 가능한 경량 모델(Quantization 적용) 서빙
주안점 본 프로젝트는 해외 클라이언트의 요구사항에 맞춰 다양한 양식 대응과 데이터 신뢰성 확보에 중점을 두었습니다.
스몰 데이터 한계 극복 및 다국어 대응: 초기 확보된 실데이터 부족을 해결하기 위해, 영문 알파벳과 숫자가 혼용된 다양한 폰트의 합성 데이터를 대량 생성하여 모델을 사전 학습시켰습니다. 이를 통해 적은 샘플만으로도 높은 영문 인식률을 확보했습니다.
비즈니스 로직 기반의 정밀도 향상: AI 모델의 확률값에만 의존하지 않고, 국제 전화번호 규격(E.164)이나 국가별 우편번호 자리수 검증 등 비즈니스 규칙을 후처리 단계에 결합하여 데이터 무결성을 보장했습니다.
배포 용이성 및 호환성: 해외 현지의 다양한 서버 인프라 환경에 구애받지 않고 즉시 도입 가능하도록, 모든 의존성을 포함한 Docker Image 형태로 결과물을 모듈화하여 원격으로 납품 및 배포했습니다.



