안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.
플러스
macOS 로컬 AI 음성입력 앱
개발
PC프로그램
Gen AI 서비스, AI 모델 구축
프로젝트 배경
macOS에서 음성입력을 업무에 쓰려는 시도는 꾸준히 있지만, 실제로 정착하는 경우는 드뭅니다. 가장 큰 장벽은 프라이버시입니다. 법무팀의 계약서 검토, 의료진의 진료 기록 작성, 경영진의 내부 보고서 초안 — 이런 업무에서 음성 데이터가 외부 서버로 전송된다는 사실만으로 사용이 차단됩니다. Apple 내장 Dictation도, 대부분의 서드파티 앱도 클라우드 처리 구조라 이 문제를 해결하지 못하고 있습니다.
프로젝트 성과
프라이버시 100% 로컬 처리
음성 데이터가 네트워크를 통해 외부로 전송되지 않습니다. NDA 적용 환경, 의료·법률 업무에서도 제한 없이 사용 가능합니다.
음성→텍스트 체감 지연 320ms
말을 멈추고 텍스트가 입력되기까지 사실상 즉각적입니다. 타이핑과 음성을 번갈아 쓰는 워크플로우가 자연스럽게 이어집니다.
일일 타이핑량 40% 절감
이메일, 메신저, 문서 초안 작성을 음성으로 대체합니다. 2주간 베타 테스트에서 측정한 실사용 기준 수치입니다.
한영 혼용 인식 정확도 94%
개발 용어, 의학 약어, 영문 고유명사가 섞인 한국어 문장에서 측정했습니다. 별도 사전 등록 없이 달성한 정확도입니다.
설치 후 1분 내 첫 사용
DMG 설치, 권한 허용, Ctrl 더블탭 — 세 단계로 끝. 서버 설정이나 API 키 없이 바로 사용합니다.
핵심 기능
어떤 앱에서든 Ctrl 더블탭으로 즉시 시작
브라우저, IDE, 메신저, 워드 — 현재 사용 중인 앱을 떠나지 않고 Ctrl 더블탭으로 녹음을 시작합니다. 한 번 더 누르면 인식 결과가 커서 위치에 바로 입력됩니다.
진행 단계
macOS 메뉴바 앱 + 전역 핫키 시스템
2025.01.
SwiftUI 기반 메뉴바 앱 개발. Ctrl 더블탭 전역 감지, 접근성 권한 요청 흐름 구현.
프로젝트 상세
macOS에서 음성입력이 보편화되지 못하는 가장 큰 이유는 '쓸 수 있는 상황이 제한적'이라는 점입니다. 내장 Dictation은 짧은 문장 받아쓰기에는 쓸 만하지만, 연속 5분 이상의 긴 음성이나 전문 용어가 섞이면 인식률이 급격히 떨어집니다. 결정적으로 음성 데이터가 Apple 서버로 전송되기 때문에, 기밀 계약서를 다루는 법무팀이나 환자 정보를 작성하는 의료진은 사용 자체가 불가능합니다. Super

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

작업한 파트너 프로필 보기

in******
개발 · 개인사업자

프로젝트 정보

참여 기간
2025.01. ~ 2025.12.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
고객사
T사 (클라이언트 비공개)
역할
풀스택 개발
관련 기술
swiftUI
WebSocket
python3
avfoundation
macOS
CoreAudio
Qwen3-ASR