프로젝트 배경
1) 문제점 - 소프트웨어 시연 영상은 음성이 없어서 기존 편집기(CapCut, Vrew)의 자동 자막 기능 사용 불가 - 포트폴리오 영상마다 수십 개 자막을 수동 입력해야 하는 반복 작업 발생 - 장면 전환 시점을 눈으로 찾아 일일이 타임스탬프 지정하는 비효율 2) 프로젝트 목표 - AI Vision으로 화면을 직접 분석하여 자막을 자동 생성하는 편집기 개발 - 장면 전환을 AI가 자동 감지하
프로젝트 성과
자막 작업 시간 90% 단축
4분 시연 영상 기준, 수동 자막 입력 약 40분 → AI 자동 생성 약 3분으로 단축. 비용 약 $0.43
핵심 기능
진행 단계
기획 및 설계
2026.03.
기존 편집기 STT 한계 분석, 컷=제거 방식 UX 설계, 2-Pass AI 아키텍처 설계
프로젝트 상세
1) 포트폴리오 소개 음성 없는 소프트웨어 시연 영상에서 AI Vision이 화면을 직접 보고 자막을 자동 생성하는 영상 편집기. 개발자, 프리랜서 등 포트폴리오 시연 영상 제작이 필요한 사용자 대상. 2) 작업 범위 UI/UX 디자인 및 프론트엔드 개발, 백엔드 API 서버 구축, AI Vision API 연동, FFmpeg 영상 처리, PWA 웹앱. 1인 풀스택 개발. 3) 주요 업무 -







