john_eric · 위시켓(Wishket)

프로젝트 배경

자막정보가 없는 동영상파일에서 OCR을 이용하여 자막과 음원을 추출하는것 결과물로 LLM모델의 학습을 위한 데이터셋 구성

로그인하고 프로젝트 배경 확인하기

프로젝트 성과

한글 및 영문 등의 자막정보를 높은 정확도로 수집가능

동영상을 보면서 수동으로 진행하던 자막수집 작업을 자동화하였다
편집기능을 추가하여 자동추출결과를 수정하여 데이터셋구성에 충분하도록 완성하였다

핵심 기능

로그인하고 핵심 기능 확인하기

OCR

검증된 오픈소스를 이용해서 검출의 정확도를 높였다

진행 단계

기획 > 디자인 > 개발 > 테스트 > 런칭

2024.10.

자동추출만으로 개발된 콘솔 프로젝트를 완성된 데이터셋구성을 위해 UI를 추가하고 편집기능을 추가하여 필수적인 프로젝트로 완성

로그인하고 진행 단계 확인하기

프로젝트 상세

1) 포트폴리오 소개 : 서비스 카테고리(ex. 커머스, AI 등)와 메인 타깃(ex. 주부, 청소년) 등을 포함한 간략한 소개 - 예시 : 주부들을 위한 생활용품 커머스 개발 2) 작업 범위 : 개발에 참여한 범위 및 지원환경 - 예시) 서버 구축, Front-end 개발, 관리자 페이지 개발 등 - 예시) 반응형 웹, Android, iOS 등 3) 주요 업무 : 해당 서비스의 주요 기능

로그인하고 프로젝트 상세 확인하기