프로젝트 배경
1) 문제점
- 회의 후 회의록 작성에 많은 시간 소요
- 중요 액션 아이템 누락 발생
- 회의 내용 기억에 의존하여 정확도 저하
2) 프로젝트 목표
- 음성 녹음 파일을 텍스트로 자동 변환
- AI 기반 구조화된 회의록 생성
- 액션 아이템 자동 추출
3) 주안점
- 빠른 처리 속도와 높은 인식 정확도
- 깔끔하고 읽기 쉬운 회의록 포맷
- 회의 후 회의록 작성에 많은 시간 소요
- 중요 액션 아이템 누락 발생
- 회의 내용 기억에 의존하여 정확도 저하
2) 프로젝트 목표
- 음성 녹음 파일을 텍스트로 자동 변환
- AI 기반 구조화된 회의록 생성
- 액션 아이템 자동 추출
3) 주안점
- 빠른 처리 속도와 높은 인식 정확도
- 깔끔하고 읽기 쉬운 회의록 포맷
프로젝트 성과
실사용 중
현재 팀 내에서 활용 중
실제 사용 영상 : https://youtu.be/tC-oORecEcc
실제 사용 영상 : https://youtu.be/tC-oORecEcc
회의록 작성 시간 단축
수동 작성 대비 시간 절약
핵심 기능

음성 변환
Whisper API로 다양한 오디오 포맷 지원

회의록 생성
Claude API로 구조화된 회의록 작성

액션 아이템 추출
할 일, 담당자, 기한 자동 추출
진행 단계
기획
2025.10.
회의록 자동화 범위 정의
STT 연동
2025.10.
Whisper API 연동
AI 연동
2025.11.
Claude API로 회의록 생성
테스트
2025.11.
실제 회의 녹음으로 검증
프로젝트 상세
포트폴리오 소개
서비스 분야: AI / 업무 자동화 / 생산성 도구
타겟 사용자: 정기 미팅을 진행하는 비즈니스 팀, 프로젝트 관리자
서비스 개요:
회의 음성 녹음을 AI로 분석하여 구조화된 회의록을 자동 생성하고 Notion에 저장하는 업무 자동화 솔루션 개발. 기존 2시간 소요되던 회의록 작성을 10분으로 단축.
---
작업 범위
개발 참여 범위:
- 시스템 아키텍처 설계
- 음성 처리 파이프라인 구현 (Whisper + VAD)
- LLM 프롬프트 엔지니어링 (Gemini Pro)
- Notion API 연동 개발
- 웹 UI 개발 (Streamlit)
- TDD 기반 테스트 코드 작성
지원 환경:
- 웹 기반 (Streamlit, 반응형)
- Windows GPU 서버 (CUDA)
- macOS 클라이언트 접속
---
주요 업무
핵심 기능:
- 음성 파일 업로드 및 자동 포맷 변환 (m4a, mp3, wav)
- AI 음성 인식 및 텍스트 변환 (Whisper large-v3)
- 4섹션 구조화 회의록 생성 (요약, 업데이트, 논의사항, 할 일)
- Notion 데이터베이스 자동 저장
- 장시간 오디오 분할 처리 (1시간+ 녹음 지원)
- 실시간 처리 진행률 표시
주요 화면:
- 오디오 업로드 + 수기 노트 입력 화면
- 처리 진행률 표시 화면
- 회의록 결과 확인 및 편집 화면
- Notion 저장 완료 화면
---
주안점
성능 최적화:
- GPU 가속 처리 (CUDA)
- 모델 메모리 자동 관리 및 폴백
안정성:
- 에러 발생 시 작업 내용 보존
- 자동 모델 폴백 (large-v3 → large-v2 → medium)
사용자 경험:
- 직관적 UI, 원클릭 저장
- 저장 전 결과 편집 기능
코드 품질:
- TDD 방법론, 37개 테스트
- 5개 기술 명세서 (SPEC) 문서화
---
기술 스택: Python, Streamlit, OpenAI Whisper, Google Gemini Pro, Notion API, PyTorch (CUDA), silero-VAD
서비스 분야: AI / 업무 자동화 / 생산성 도구
타겟 사용자: 정기 미팅을 진행하는 비즈니스 팀, 프로젝트 관리자
서비스 개요:
회의 음성 녹음을 AI로 분석하여 구조화된 회의록을 자동 생성하고 Notion에 저장하는 업무 자동화 솔루션 개발. 기존 2시간 소요되던 회의록 작성을 10분으로 단축.
---
작업 범위
개발 참여 범위:
- 시스템 아키텍처 설계
- 음성 처리 파이프라인 구현 (Whisper + VAD)
- LLM 프롬프트 엔지니어링 (Gemini Pro)
- Notion API 연동 개발
- 웹 UI 개발 (Streamlit)
- TDD 기반 테스트 코드 작성
지원 환경:
- 웹 기반 (Streamlit, 반응형)
- Windows GPU 서버 (CUDA)
- macOS 클라이언트 접속
---
주요 업무
핵심 기능:
- 음성 파일 업로드 및 자동 포맷 변환 (m4a, mp3, wav)
- AI 음성 인식 및 텍스트 변환 (Whisper large-v3)
- 4섹션 구조화 회의록 생성 (요약, 업데이트, 논의사항, 할 일)
- Notion 데이터베이스 자동 저장
- 장시간 오디오 분할 처리 (1시간+ 녹음 지원)
- 실시간 처리 진행률 표시
주요 화면:
- 오디오 업로드 + 수기 노트 입력 화면
- 처리 진행률 표시 화면
- 회의록 결과 확인 및 편집 화면
- Notion 저장 완료 화면
---
주안점
성능 최적화:
- GPU 가속 처리 (CUDA)
- 모델 메모리 자동 관리 및 폴백
안정성:
- 에러 발생 시 작업 내용 보존
- 자동 모델 폴백 (large-v3 → large-v2 → medium)
사용자 경험:
- 직관적 UI, 원클릭 저장
- 저장 전 결과 편집 기능
코드 품질:
- TDD 방법론, 37개 테스트
- 5개 기술 명세서 (SPEC) 문서화
---
기술 스택: Python, Streamlit, OpenAI Whisper, Google Gemini Pro, Notion API, PyTorch (CUDA), silero-VAD

회의록 자동화 시스템에 접속한 화면입니다

입력한 음성 파일과 메모를 기반으로 회의록을 생성합니다.

회의록 생성 결과물입니다. 노션으로 자동 생성됩니다.



