프로젝트 배경
macOS에서 음성입력을 업무에 쓰려는 시도는 꾸준히 있지만, 실제로 정착하는 경우는 드뭅니다. 가장 큰 장벽은 프라이버시입니다. 법무팀의 계약서 검토, 의료진의 진료 기록 작성, 경영진의 내부 보고서 초안 — 이런 업무에서 음성 데이터가 외부 서버로 전송된다는 사실만으로 사용이 차단됩니다. Apple 내장 Dictation도, 대부분의 서드파티 앱도 클라우드 처리 구조라 이 문제를 해결하지 못하고 있습니다.
프로젝트 성과
프라이버시 100% 로컬 처리
음성 데이터가 네트워크를 통해 외부로 전송되지 않습니다. NDA 적용 환경, 의료·법률 업무에서도 제한 없이 사용 가능합니다.
음성→텍스트 체감 지연 320ms
말을 멈추고 텍스트가 입력되기까지 사실상 즉각적입니다. 타이핑과 음성을 번갈아 쓰는 워크플로우가 자연스럽게 이어집니다.
일일 타이핑량 40% 절감
이메일, 메신저, 문서 초안 작성을 음성으로 대체합니다. 2주간 베타 테스트에서 측정한 실사용 기준 수치입니다.
한영 혼용 인식 정확도 94%
개발 용어, 의학 약어, 영문 고유명사가 섞인 한국어 문장에서 측정했습니다. 별도 사전 등록 없이 달성한 정확도입니다.
설치 후 1분 내 첫 사용
DMG 설치, 권한 허용, Ctrl 더블탭 — 세 단계로 끝. 서버 설정이나 API 키 없이 바로 사용합니다.
핵심 기능
진행 단계
macOS 메뉴바 앱 + 전역 핫키 시스템
2025.01.
SwiftUI 기반 메뉴바 앱 개발. Ctrl 더블탭 전역 감지, 접근성 권한 요청 흐름 구현.
프로젝트 상세
macOS에서 음성입력이 보편화되지 못하는 가장 큰 이유는 '쓸 수 있는 상황이 제한적'이라는 점입니다. 내장 Dictation은 짧은 문장 받아쓰기에는 쓸 만하지만, 연속 5분 이상의 긴 음성이나 전문 용어가 섞이면 인식률이 급격히 떨어집니다. 결정적으로 음성 데이터가 Apple 서버로 전송되기 때문에, 기밀 계약서를 다루는 법무팀이나 환자 정보를 작성하는 의료진은 사용 자체가 불가능합니다. Super







