프로젝트 배경
프로젝트 배경
전화 상담 업무는 인력 의존도가 높고, 반복적인 문의 대응으로 인해
비용과 운영 부담이 지속적으로 증가하는 문제가 있습니다.
특히 소규모 매장이나 자영업자의 경우,
전담 상담 인력을 두거나 외주 콜센터를 이용하기에는 현실적인 제약이 큽니다.
이 프로젝트는 이러한 문제를 해결하기 위해,
소규모 매장이나 1인 사업자도 부담 없이 사용할 수 있는 AI 전화 상담 서비스를 제공하고자 시작되었습니다.
간단한 문의 응대, 기본 안내와 같은 반복 업무를
AI가 대신 처리해준다면, 매장 운영자는 본업에 더 집중할 수 있을 것이라 판단했습니다.
이를 위해 단순 자동 응답이 아닌,
VoIP 기반 전화 통화 환경에서 사람과 AI가 실제로 대화할 수 있는 구조를 구현하고,
기존 Telephony 시스템과도 연동 가능한 실사용 가능한 서비스를 목표로 설계하였습니다.
궁극적으로는 대형 기업만 사용할 수 있었던 전화 상담 자동화를
소규모 매장과 자영업자도 활용할 수 있는 형태로 제공하는 것,
그리고 운영 부담을 줄이면서도 확장 가능한
AI 음성 상담 인프라를 구축하는 것이 이 프로젝트의 핵심 목표였습니다.
전화 상담 업무는 인력 의존도가 높고, 반복적인 문의 대응으로 인해
비용과 운영 부담이 지속적으로 증가하는 문제가 있습니다.
특히 소규모 매장이나 자영업자의 경우,
전담 상담 인력을 두거나 외주 콜센터를 이용하기에는 현실적인 제약이 큽니다.
이 프로젝트는 이러한 문제를 해결하기 위해,
소규모 매장이나 1인 사업자도 부담 없이 사용할 수 있는 AI 전화 상담 서비스를 제공하고자 시작되었습니다.
간단한 문의 응대, 기본 안내와 같은 반복 업무를
AI가 대신 처리해준다면, 매장 운영자는 본업에 더 집중할 수 있을 것이라 판단했습니다.
이를 위해 단순 자동 응답이 아닌,
VoIP 기반 전화 통화 환경에서 사람과 AI가 실제로 대화할 수 있는 구조를 구현하고,
기존 Telephony 시스템과도 연동 가능한 실사용 가능한 서비스를 목표로 설계하였습니다.
궁극적으로는 대형 기업만 사용할 수 있었던 전화 상담 자동화를
소규모 매장과 자영업자도 활용할 수 있는 형태로 제공하는 것,
그리고 운영 부담을 줄이면서도 확장 가능한
AI 음성 상담 인프라를 구축하는 것이 이 프로젝트의 핵심 목표였습니다.
프로젝트 성과
VoIP 기반 실시간 AI 전화 상담 시스템 구현
실제 전화 통화 환경에서 AI가 전화를 수신하고, 음성을 인식·응답하는 전체 파이프라인을 구축
실시간 음성 스트리밍 처리 구조 완성
통화 중 음성을 Streaming STT → AI 처리 → TTS로 연결하여
지연을 최소화한 양방향 음성 통화 구조 구현
지연을 최소화한 양방향 음성 통화 구조 구현
Telephony 시스템과 AI API의 안정적 연동
VoIP 환경과 AI 시스템을 분리된 모듈로 구성하여,
장애 발생 시에도 전체 시스템에 영향을 최소화하는 구조 검증
장애 발생 시에도 전체 시스템에 영향을 최소화하는 구조 검증
소규모 매장 환경을 고려한 서비스 가능성 검증
복잡한 인프라 없이도 AI가 기본 전화 응대를 수행할 수 있음을 확인하여,
소상공인 대상 서비스로의 확장 가능성 확보
소상공인 대상 서비스로의 확장 가능성 확보
핵심 기능
VoIP 기반 AI 전화 수신 및 응대 기능
사람이 전화를 걸면 AI가 실제 전화 통화 환경에서 전화를 받고 상담을 수행
실시간 음성 스트리밍 처리
통화 중 음성을 실시간으로 Streaming STT → AI 처리 → TTS로 연결하여 자연스러운 대화 흐름 구현
FreeSWITCH 연동 통화 제어
전화 수신, 통화 유지, 종료 등 Telephony 제어를 FreeSWITCH와 연동하여 처리
C 기반 실시간 TTS 플러그인
통화 지연을 최소화하기 위해 FreeSWITCH와 직접 연동되는 TTS 플러그인 개발
마이크로서비스 기반 AI 연동 구조
STT, LLM, TTS를 독립 서비스로 분리하여 확장성과 안정성을 고려한 구조 설계
진행 단계
요구사항 정의 및 전체 아키텍처 설계
2023.12.
VoIP 기반 AI 상담 서비스의 전체 흐름을 정의하고,
Telephony 시스템, 음성 스트리밍, AI 처리 영역을 분리한
마이크로서비스 아키텍처 설계
Telephony 시스템, 음성 스트리밍, AI 처리 영역을 분리한
마이크로서비스 아키텍처 설계
FreeSWITCH 환경 구축 및 통화 흐름 설계
2024.01.
FreeSWITCH 설치 및 설정을 통해 VoIP 통화 수신 환경 구성
전화 수신부터 음성 스트리밍 처리까지의 통화 플로우 정의
전화 수신부터 음성 스트리밍 처리까지의 통화 플로우 정의
실시간 TTS 플러그인(C 기반) 개발
2024.02.
FreeSWITCH와 연동 가능한 C 기반 실시간 TTS 플러그인 개발
통화 중 AI 음성을 지연 없이 재생할 수 있도록 구조 구현
통화 중 AI 음성을 지연 없이 재생할 수 있도록 구조 구현
AI 연동 마이크로서비스 개발
2024.02.
Streaming STT, LLM, TTS를 각각 분리된 서비스로 구성
Golang 백엔드를 중심으로 실시간 음성 데이터 처리 및 AI 응답 파이프라인 구축
Golang 백엔드를 중심으로 실시간 음성 데이터 처리 및 AI 응답 파이프라인 구축
통합 테스트 및 실시간 통화 검증
2024.03.
실제 전화 통화를 통해 AI 응답 품질, 지연 시간, 안정성 테스트
네트워크 오류 및 예외 상황에 대한 대응 로직 보완
네트워크 오류 및 예외 상황에 대한 대응 로직 보완
프로젝트 상세
AI 기반 VoIP 상담사 시스템 개발
1) 포트폴리오 소개
인터넷 전화(VoIP)를 통해 AI가 실제 사람처럼 전화를 받고 응대하는 AI 상담사 시스템 개발
사람이 직접 전화를 받지 않아도, AI가 실시간 음성 통화를 통해 상담을 수행할 수 있도록 설계된 서비스입니다.
일반적인 음성 인식이나 챗봇 수준을 넘어,
전화 통화 환경에서 사람과 AI가 자연스럽게 대화할 수 있는 구조 구현을 목표로 한 프로젝트입니다.
2) 작업 범위
• Telephony(VoIP) 시스템 연동 및 통화 흐름 설계
• 음성 스트리밍 처리 및 실시간 데이터 파이프라인 구성
• Golang 기반 백엔드 서버 개발
• Telephony 연동을 위한 C 기반 모듈 개발
• Microservice 아키텍처 설계 및 구성
• AI API 및 Streaming STT 연동
• 전체 시스템 설계부터 구현까지 단독 개발
3) 주요 업무
• 전화 수신부터 통화 종료까지의 VoIP 통화 플로우 설계 및 구현
• 실시간 음성 스트리밍을 처리하고 AI API와 연동하는 백엔드 로직 개발
• Telephony 시스템과 상호작용하기 위한 C 기반 모듈 개발
• Golang 백엔드를 중심으로 한 서비스 간 통신 구조 설계
• AI 응답을 전화 통화 형태로 전달하기 위한 음성 처리 로직 구현
• 사용자에게 서비스를 제공하기 위한 프론트 페이지 개발 (진행 중)
4) 주안점
이 프로젝트의 핵심은
Telephony 시스템과 AI를 실시간으로 연결하여 ‘실제 전화 통화 경험’을 구현하는 것이었습니다.
이를 위해 다음 사항에 중점을 두었습니다.
• 지연(latency)을 최소화한 실시간 음성 스트리밍 처리
• Telephony 시스템과 AI API 간의 안정적인 인터페이스 설계
• 통화 중 끊김, 오류 발생 시에도 시스템이 비정상 종료되지 않도록 한 구조 설계
• 향후 상담 시나리오 확장 및 서비스 확장을 고려한 마이크로서비스 구조
결과적으로,
사람이 전화를 걸면 AI가 직접 전화를 받고 대화를 이어갈 수 있는 음성 기반 상담 시스템을 구현하였습니다.
1) 포트폴리오 소개
인터넷 전화(VoIP)를 통해 AI가 실제 사람처럼 전화를 받고 응대하는 AI 상담사 시스템 개발
사람이 직접 전화를 받지 않아도, AI가 실시간 음성 통화를 통해 상담을 수행할 수 있도록 설계된 서비스입니다.
일반적인 음성 인식이나 챗봇 수준을 넘어,
전화 통화 환경에서 사람과 AI가 자연스럽게 대화할 수 있는 구조 구현을 목표로 한 프로젝트입니다.
2) 작업 범위
• Telephony(VoIP) 시스템 연동 및 통화 흐름 설계
• 음성 스트리밍 처리 및 실시간 데이터 파이프라인 구성
• Golang 기반 백엔드 서버 개발
• Telephony 연동을 위한 C 기반 모듈 개발
• Microservice 아키텍처 설계 및 구성
• AI API 및 Streaming STT 연동
• 전체 시스템 설계부터 구현까지 단독 개발
3) 주요 업무
• 전화 수신부터 통화 종료까지의 VoIP 통화 플로우 설계 및 구현
• 실시간 음성 스트리밍을 처리하고 AI API와 연동하는 백엔드 로직 개발
• Telephony 시스템과 상호작용하기 위한 C 기반 모듈 개발
• Golang 백엔드를 중심으로 한 서비스 간 통신 구조 설계
• AI 응답을 전화 통화 형태로 전달하기 위한 음성 처리 로직 구현
• 사용자에게 서비스를 제공하기 위한 프론트 페이지 개발 (진행 중)
4) 주안점
이 프로젝트의 핵심은
Telephony 시스템과 AI를 실시간으로 연결하여 ‘실제 전화 통화 경험’을 구현하는 것이었습니다.
이를 위해 다음 사항에 중점을 두었습니다.
• 지연(latency)을 최소화한 실시간 음성 스트리밍 처리
• Telephony 시스템과 AI API 간의 안정적인 인터페이스 설계
• 통화 중 끊김, 오류 발생 시에도 시스템이 비정상 종료되지 않도록 한 구조 설계
• 향후 상담 시나리오 확장 및 서비스 확장을 고려한 마이크로서비스 구조
결과적으로,
사람이 전화를 걸면 AI가 직접 전화를 받고 대화를 이어갈 수 있는 음성 기반 상담 시스템을 구현하였습니다.

AI가 VoIP 전화를 받아 실시간 음성 인식과 응답을 수행하는 상담 시스템의 전체 구조를 시각화한 이미지



