dvvb4b · 위시켓(Wishket)

프로젝트 배경

1) 문제점 - 소프트웨어 시연 영상은 음성이 없어서 기존 편집기(CapCut, Vrew)의 자동 자막 기능 사용 불가 - 포트폴리오 영상마다 수십 개 자막을 수동 입력해야 하는 반복 작업 발생 - 장면 전환 시점을 눈으로 찾아 일일이 타임스탬프 지정하는 비효율 2) 프로젝트 목표 - AI Vision으로 화면을 직접 분석하여 자막을 자동 생성하는 편집기 개발 - 장면 전환을 AI가 자동 감지하

로그인하고 프로젝트 배경 확인하기

프로젝트 성과

자막 작업 시간 90% 단축

4분 시연 영상 기준, 수동 자막 입력 약 40분 → AI 자동 생성 약 3분으로 단축. 비용 약 $0.43

핵심 기능

로그인하고 핵심 기능 1개 더 확인하기

3-Pass Vision AI 자막 생성

화면 캡처 영상을 AI가 직접 보고 자막 자동 생성. 맥락 파악 → 장면 경계 감지 → 장면별 자막 생성 3단계 분리

진행 단계

기획 및 설계

2026.03.

기존 편집기 STT 한계 분석, 컷=제거 방식 UX 설계, 2-Pass AI 아키텍처 설계

로그인하고 진행 단계 확인하기

프로젝트 상세

1) 포트폴리오 소개 음성 없는 소프트웨어 시연 영상에서 AI Vision이 화면을 직접 보고 자막을 자동 생성하는 영상 편집기. 개발자, 프리랜서 등 포트폴리오 시연 영상 제작이 필요한 사용자 대상. 2) 작업 범위 UI/UX 디자인 및 프론트엔드 개발, 백엔드 API 서버 구축, AI Vision API 연동, FFmpeg 영상 처리, PWA 웹앱. 1인 풀스택 개발. 3) 주요 업무 -

로그인하고 프로젝트 상세 확인하기