안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.
플러스
Whisper AutoCaptions for Mac App
개발
PC프로그램 · 기타
기타(AIㆍ머신러닝)
프로젝트 배경
* 문제점
- 영상 제작 프로그램 중 파이널 컷 프로 사용자들에게 자막 작업은 고된 작업 중 하나
- 자막 작업은 싱크는 물론 한글자 한글자씩 입력해야 하며 여기에 예능형 자막이라면 그야 말로 지옥행
- 영상이나 음성 파일에서 음성만 추려내서 이를 파이널 컷 프로 자막으로 자동 생성에 대한 필요성 대두
- 이에 Whisper CPP 프로젝트를 알고 부터 이를 탑재하여 맥용 어플리케이션 개발에 착수
프로젝트 성과
후원 문의 증가
- 파이널 컷 프로 자막을 바로 지원하는 관계로 직업 시간 단축에 대한 감사 인사와 함께 후원 증가
핵심 기능
반응형 자막 지원
- 파이널 컷 프로에서 사용자가 만든 자막이나 무료로 배로하는 반응형 자막을 지원하여 자막 작업 속도 획기적으로 단축
선처리 후처리 기능 강화
- Whisper AI 인식이전에 VAD 기능을 이용 음성 인식률을 높이거나 생성한 SRT 파일을 시간 등 보정 필터등을 제공하여 프로그램 신뢰도 향상
대규모 모델 및 양자화 모델 지원, 모델 폴더 지정 기정 기능
- Large L3까지 현재 제공되는 최신 모델 및 양자화 모델 전부 지원,
- 모델 데이터는 2-3G 정도로 용량이 큰 관게로 외부 저장 위치 지원 및 관리 기능 가능
프로젝트 상세
* 프로젝트 주요 개발 포인트
- 사용자 편의성 증대 목표
- 파이널 컷 프로 영상작업에서 자막 작업 최소화
- SRT 포맷 제공 및 사용자 지정 반응형 자막 지원

* 주요 기능 소개
- 영상에서 자동 FPS 체크
- 다양한 음성(wav, mp3, ogg) 및 영상(mp4), SRT, ITT 파일 지원
- 타언어 -> 영어 번역 옵션 제공
- 토큰이란 단어로 자막의 길이 조절 옵션 제공
- 파이널 컷 프로 내장 자막 및 사용자 생성 반응형 자막 지원
- Intel 및 Apple Silicon 완벽 지원 (MacOS 13 ventura 부터 지원)
- Metal 라이브러리 및 CoreML 지원
- 파이널 컷 프로 설치 시 직접 프로그램 호출
- VAD (Voice Activity Detection) 기능 제공 및 옵션 제공으로 기본 음성 인식율 향상
- Whisper AI 주요 버전 1.7.2 및 최신 버전 탑재로 사용자 기기에 맞게 합리적 선택 가능
- SRT 파일 생성시 시간 교정 및 중복 문장 제거 등 후처리 필터 기능 탑재
- Large v3까지 최신 모델 및 양자화 모델 전부 지원
- 용량이 많은 모델 저장 위치 지정 및 관리 가능
프로그램 초기 실행 화면
음성인식 완료 후 자동으로 SRT 파일 생성 및 다운로드 가능, 직접 FCP 호출도 가능
주요 설정 화면
컴퓨터 용량을 고려하여 모델 취사 선택가능

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

작업한 파트너 프로필 보기

ch******
개발 · 개인

프로젝트 정보

참여 기간
2024.08. ~ 2026.08.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
역할
개발
관련 기술
Swift
AI 솔루션
macOS