프로젝트 배경
* 문제점
- 영상 제작 프로그램 중 파이널 컷 프로 사용자들에게 자막 작업은 고된 작업 중 하나
- 자막 작업은 싱크는 물론 한글자 한글자씩 입력해야 하며 여기에 예능형 자막이라면 그야 말로 지옥행
- 영상이나 음성 파일에서 음성만 추려내서 이를 파이널 컷 프로 자막으로 자동 생성에 대한 필요성 대두
- 이에 Whisper CPP 프로젝트를 알고 부터 이를 탑재하여 맥용 어플리케이션 개발에 착수
- 영상 제작 프로그램 중 파이널 컷 프로 사용자들에게 자막 작업은 고된 작업 중 하나
- 자막 작업은 싱크는 물론 한글자 한글자씩 입력해야 하며 여기에 예능형 자막이라면 그야 말로 지옥행
- 영상이나 음성 파일에서 음성만 추려내서 이를 파이널 컷 프로 자막으로 자동 생성에 대한 필요성 대두
- 이에 Whisper CPP 프로젝트를 알고 부터 이를 탑재하여 맥용 어플리케이션 개발에 착수
프로젝트 성과
후원 문의 증가
- 파이널 컷 프로 자막을 바로 지원하는 관계로 직업 시간 단축에 대한 감사 인사와 함께 후원 증가
핵심 기능

반응형 자막 지원
- 파이널 컷 프로에서 사용자가 만든 자막이나 무료로 배로하는 반응형 자막을 지원하여 자막 작업 속도 획기적으로 단축

선처리 후처리 기능 강화
- Whisper AI 인식이전에 VAD 기능을 이용 음성 인식률을 높이거나 생성한 SRT 파일을 시간 등 보정 필터등을 제공하여 프로그램 신뢰도 향상

대규모 모델 및 양자화 모델 지원, 모델 폴더 지정 기정 기능
- Large L3까지 현재 제공되는 최신 모델 및 양자화 모델 전부 지원,
- 모델 데이터는 2-3G 정도로 용량이 큰 관게로 외부 저장 위치 지원 및 관리 기능 가능
- 모델 데이터는 2-3G 정도로 용량이 큰 관게로 외부 저장 위치 지원 및 관리 기능 가능
프로젝트 상세
* 프로젝트 주요 개발 포인트
- 사용자 편의성 증대 목표
- 파이널 컷 프로 영상작업에서 자막 작업 최소화
- SRT 포맷 제공 및 사용자 지정 반응형 자막 지원
* 주요 기능 소개
- 영상에서 자동 FPS 체크
- 다양한 음성(wav, mp3, ogg) 및 영상(mp4), SRT, ITT 파일 지원
- 타언어 -> 영어 번역 옵션 제공
- 토큰이란 단어로 자막의 길이 조절 옵션 제공
- 파이널 컷 프로 내장 자막 및 사용자 생성 반응형 자막 지원
- Intel 및 Apple Silicon 완벽 지원 (MacOS 13 ventura 부터 지원)
- Metal 라이브러리 및 CoreML 지원
- 파이널 컷 프로 설치 시 직접 프로그램 호출
- VAD (Voice Activity Detection) 기능 제공 및 옵션 제공으로 기본 음성 인식율 향상
- Whisper AI 주요 버전 1.7.2 및 최신 버전 탑재로 사용자 기기에 맞게 합리적 선택 가능
- SRT 파일 생성시 시간 교정 및 중복 문장 제거 등 후처리 필터 기능 탑재
- Large v3까지 최신 모델 및 양자화 모델 전부 지원
- 용량이 많은 모델 저장 위치 지정 및 관리 가능
- 사용자 편의성 증대 목표
- 파이널 컷 프로 영상작업에서 자막 작업 최소화
- SRT 포맷 제공 및 사용자 지정 반응형 자막 지원
* 주요 기능 소개
- 영상에서 자동 FPS 체크
- 다양한 음성(wav, mp3, ogg) 및 영상(mp4), SRT, ITT 파일 지원
- 타언어 -> 영어 번역 옵션 제공
- 토큰이란 단어로 자막의 길이 조절 옵션 제공
- 파이널 컷 프로 내장 자막 및 사용자 생성 반응형 자막 지원
- Intel 및 Apple Silicon 완벽 지원 (MacOS 13 ventura 부터 지원)
- Metal 라이브러리 및 CoreML 지원
- 파이널 컷 프로 설치 시 직접 프로그램 호출
- VAD (Voice Activity Detection) 기능 제공 및 옵션 제공으로 기본 음성 인식율 향상
- Whisper AI 주요 버전 1.7.2 및 최신 버전 탑재로 사용자 기기에 맞게 합리적 선택 가능
- SRT 파일 생성시 시간 교정 및 중복 문장 제거 등 후처리 필터 기능 탑재
- Large v3까지 최신 모델 및 양자화 모델 전부 지원
- 용량이 많은 모델 저장 위치 지정 및 관리 가능

프로그램 초기 실행 화면

음성인식 완료 후 자동으로 SRT 파일 생성 및 다운로드 가능, 직접 FCP 호출도 가능

주요 설정 화면

컴퓨터 용량을 고려하여 모델 취사 선택가능



