qute012 · 위시켓(Wishket) - 파트너스

프로젝트 배경

1) 배경 - 고객사들이 음성 합성 시 더 좋은 퀄리티의 음성을 듣고 싶어합니다 - 고객사들이 스트리밍에서 더 빠른 응답 시간을 원합니다 2) 개선 사항 - 음성 복제를 더욱 더 잘 할 수 있도록 Classifier-free guidance 기술을 적용하였습니다 - 특히 사용자가 스트리밍 모드에서 처음 음성을 듣는 속도를 기존 1초 이상 걸리던 걸 400ms까지 단축하여, 일레븐랩스와 같은 경쟁사

로그인하고 프로젝트 배경 확인하기

프로젝트 성과

스트리밍 응답 시간을 400ms까지 단축

서버의 동시성이 증가되며, 스트리밍 이용자들의 만족도가 크게 향상됨

핵심 기능

로그인하고 핵심 기능 확인하기

스트리밍 음성 복제

스트리밍으로 본인 또는 타인의 음성을 복제할 수 있는 서비스를 고도화하였습니다. 재생 버튼을 누르면 체감 상 거의 바로 음성을 들을 수 있습니다.

진행 단계

문제점 파악

2025.04.

해당 서비스의 문제점 및 개선 방안 수립하였습니다.

로그인하고 진행 단계 확인하기

프로젝트 상세

1) 포트폴리오 소개 사용자 음성을 복제해서 TTS(Text-to-Speech)로 음성을 합성할 수 있게하는 엔진 개발에 기여하였습니다. 2) 작업 범위 - 모델 퀄리티 개선 - 스트리밍 모델 서빙 고도화

로그인하고 프로젝트 상세 확인하기

전문성 높은 포트폴리오를 확인해 보세요. 583/1,468

채널톡 FAQ 자동 생성 코어 엔진 개발

음성 복제 모델 제품 개발 (TTS / Voice Cloning / STT)

컨퍼런스 S-BERT AI 모델 기반 매칭 WEB

네트워크 보안취약점 빅데이터 분석 서비스 - SecureCAST

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

프로젝트 정보

참여 기간

2025.03. ~ 2025.09.

참여율

30%

고객사

Resemble AI

역할

프리랜서 개발자

관련 기술

Python

결과물 확인하기