안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.
플러스
stable diffuison, TTS를 활용한 가상 인간 생성
개발 · 기획
기타
Gen AI 서비스, AI 모델 구축
프로젝트 배경
1) 문제점 실존 인물을 기반으로 한 고품질 가상 영상 제작은 높은 비용과 전문 지식이 요구되며, 표정·포즈·음성의 자유로운 조작이 어렵다. 2) 프로젝트 목표 LoRA·TTS·ControlNet 등을 결합한 자동화 파이프라인을 구축하여, 특정 인물 스타일의 음성+영상 콘텐츠를 저비용으로 생성 가능하게 한다. 3) 주안점 인물의 표정·포즈·배경·음성을 정밀하게 제어 실제 인물에 유사한 외형·
프로젝트 성과
가상 인물 제작 시간 70% 단축
기존 수작업 대비 가상 인물 영상 제작 시간이 평균 10시간 → 3시간 이내로 감소
음성·영상 합성 일관성 향상
TTS 립싱크 적용으로 영상 내 입모양 일치도 평균 85% 이상 달성
콘텐츠 다양성 확보
ControlNet 기반 포즈·표정 변화로 약 50가지 이상의 상황/감정 표현 가능한 템플릿 확보
자동화 파이프라인 구축
ComfyUI 기반 영상 생성 플로우 구축으로 반복 제작 효율 3배 향상
핵심 기능
Flux 기반 로라 제작으로 이제훈 가상인간 이미지 생성
Flux 기반 로라 제작과 Comfyui 기반 이제훈 가상인간 이미지 생성
가상 인물의 상황, 영상, 배경 모두 제어 가능.
진행 단계
데이터 수집 및 모델 설계
2024.02.
이미지 및 음성 학습용 데이터셋 정리 및 LoRA, TTS, ControlNet 설계
프로젝트 상세
1. 포트폴리오 소개 Stable Diffusion 및 TTS 모델을 기반으로 가상의 인물(이제훈 스타일)을 생성하고, 음성과 립싱크까지 결합한 영상 콘텐츠를 제작. 상황, 표정, 포즈, 배경 등을 자유롭게 조정할 수 있어 광고, 행사, 홍보용 영상 콘텐츠 자동화에 활용 가능. 2. 작업 범위 1) 가상 인물 이미지 및 영상 제작 - Flux 기반 LoRA로 특정 인물 스타일 생성 - ComfyU

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

작업한 파트너 프로필 보기

wa******
개발 · 개인사업자

프로젝트 정보

참여 기간
2024.02. ~ 2024.05.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
고객사
MadeM
역할
개발
관련 기술
TTS(Text-To-Speech)
stable diffusion