W-Okada 보이스 체인저를 이용한 디스코드 목소리 변조
RVC 와 w-okada를 이용한 실시간 음성 변조
W-Okada Voice Changer 설치
VB - Audio Cable 설치
Discord 및 w-okada 세팅
윈도우 + 엔비디아 그래픽 카드 기준으로 설명
1. W-Okada Voice Changer 설치
1. 다운로드
https://github.com/w-okada/voice-changer/
에 들어가서 Usage 탭 아래 download 탭을 찾는다
- 가장 최신 버전에서 자신의 운영체제와 환경에 맞는 프레임워크의 링크로 들어간다
- 윈도우 + 엔비디아 그래픽 카드 사용중이라면 : ONNX(cpu, cuda), PyTorch(cpu, cuda) 를 다운로드
- 윈도우 + 내장 그래픽 카드라면 : ONNX(cpu, DirectML), Pytorch(cpu, cuda)를 다운로드
- 내장 그래픽 카드는 ONNX 모델을 사용할때만 적용됨
- 자세한 설명은 README.md 참조
2. 설치
압축을 풀고 start_http.bat
파일을 실행한다
초기 실행 시, 여러 데이터를 다운로드하므로 시간이 어느정도 걸린다
다운로드가 완료되면 브라우저가 실행된다
뒤에서 실행되는 터미널창은 종료하면 안된다!
3. 사용법
- 보이스 모델을 선택
- Edit으로 원하는 보이스 모델 추가 가능
- 선택된 보이스 모델의 일반 세팅
- start, stop : 시작 정지.
- passthru : 본 목소리 그대로 출력
- Gain - in : 본 목소리가 VC Client 로 들어갈 떄의 음량 지정
- Gain - out : 변환된 목소리가 출력될 때의 음량 지정
- Tune : 목소리의 피치 조절
- Index : Index 파일 참조 비율 지정
- 세부 세팅
- 세세한 세팅을 할 수 있는 부분
- F0 Det : 피치 식별 기술을 선택. 음성이 잘린다면 이부분은 이것저것 바꿔볼 것
Chunk : 목소리 변환의 지연시간. 청크가 클수록 품질은 증가하지만 지연시간이 늘어남. 반대로 청크가 작을수록 지연은 줄어들지만, 품질은 낮다
- Audio : 오디오 구성 방식을 지정. Client와 Server방식이 있음
- Client 방식에서는 입출력을 내컴퓨터로 지정해서 녹음할 수 있음
- 디스코드 출력을 위해서는 Server 방식을 사용함
4. 모델 적용
Ai 음성 모델은 자신이 직접 만들거나 다른사람이 만든 RVC 파일을 추가하면 된다
RVC 파일 기준으로 받은 파일을 .pth
파일은 Model에, .index
파일은 Index에 넣어주면 된다
https://discord.com/invite/voiceai
이외에도 다양한 사이트들이 있다
2. VB - Audio Cable 설치
VB - Cable이란?
윈도우에 실재하지 않는 가상 오디오 입력, 출력 장치를 추가해줌
입출력의 방향을 바꿀 수 있다
https://vb-audio.com/Cable/index.htm
위 링크에서 윈도우 버전 다운로드 후 설치
설치 후 재부팅 하면 하단과 같이 CABLE input, output에 VB - Audio virtual cable이 추가된다
3. Discord 및 w-okada 세팅
1. Discord 설정법
디스코드 설정 > 음성 및 비디오에서
녹음 장치를 CABLE Output(VB-Audio Virtual Cable)
로 설정한다
2. w-okada 세팅
w-okada를 실행 후 하단의 Audio 모드를 Server로 변경한다
input 은 자신의 마이크를
output은 CABLE Input(VB-Audio Virtual Cable)
로 지정해준다
서버 모드로 설정하면 Client 와는 다르게 자신의 목소리가 루프백 되지 않음
제대로 적용되었는지 확인하기 위해서는 Discord의 마이크 테스트를 확인해본다
마이크 입력이 감지된다면 정상적으로 적용된 것이다
참조
https://k66google.tistory.com/838
Jarods Journey 이분은 이쪽 전문 유튜버인듯