프로젝트 배경
자막정보가 없는 동영상파일에서 OCR을 이용하여 자막과 음원을 추출하는것 결과물로 LLM모델의 학습을 위한 데이터셋 구성
프로젝트 성과
한글 및 영문 등의 자막정보를 높은 정확도로 수집가능
동영상을 보면서 수동으로 진행하던 자막수집 작업을 자동화하였다
편집기능을 추가하여 자동추출결과를 수정하여 데이터셋구성에 충분하도록 완성하였다
편집기능을 추가하여 자동추출결과를 수정하여 데이터셋구성에 충분하도록 완성하였다
핵심 기능
진행 단계
기획 > 디자인 > 개발 > 테스트 > 런칭
2024.10.
자동추출만으로 개발된 콘솔 프로젝트를 완성된 데이터셋구성을 위해 UI를 추가하고 편집기능을 추가하여 필수적인 프로젝트로 완성
프로젝트 상세
1) 포트폴리오 소개 : 서비스 카테고리(ex. 커머스, AI 등)와 메인 타깃(ex. 주부, 청소년) 등을 포함한 간략한 소개 - 예시 : 주부들을 위한 생활용품 커머스 개발 2) 작업 범위 : 개발에 참여한 범위 및 지원환경 - 예시) 서버 구축, Front-end 개발, 관리자 페이지 개발 등 - 예시) 반응형 웹, Android, iOS 등 3) 주요 업무 : 해당 서비스의 주요 기능






