프로젝트 배경
기존에는 화면을 보면서 직접 검색하거나 질문을 입력해야 하는 번거로움이 있었습니다. 이 과정을 줄이기 위해 음성과 화면 정보를 동시에 활용하는 프로그램을 개발하게 되었습니다. 특히 반복적인 질문이나 단순 작업을 빠르게 처리할 수 있도록 하는 것을 목표로 했습니다.
프로젝트 성과
응답 과정 단축 (기존 수동 검색 대비 약 50% 이상 시간 절약)
음성 기반 입력으로 사용 편의성 개선
단일 프로그램 내에서 입력 → 분석 → 출력까지 자동화 구현
단일 프로그램 내에서 입력 → 분석 → 출력까지 자동화 구현
핵심 기능
진행 단계
프로토타입 v1.0 완성
2026.02.
기획 → 구조 설계 → 기능 개발 → 테스트 → 개선
프로젝트 상세
1) 프로젝트 소개 음성 입력과 화면 캡처를 기반으로 사용자 질문에 맞는 답변을 제공하는 AI 비서 프로그램입니다. 반복적인 작업이나 화면 기반 질문에 대해 빠르게 대응할 수 있도록 설계했습니다. 2) 작업 범위 - Python 기반 PC 프로그램 개발 - 음성 인식 기능 구현 (SpeechRecognition) - 화면 캡처 기능 구현 (MSS 라이브러리) - OpenA







