audio_id 사용)와 달리, 이 API는 공개적으로 접근 가능한 audio_url 즉, 사용자의 음성 녹음을 입력으로 받습니다. 본 문서는 음성 클론 API 연동 방법을 설명합니다.
1단계: 음성 캐릭터 생성
이 API는 세 가지 입력 파라미터를 받습니다:audio_url(필수), 공개적으로 접근 가능한 MP3 또는 WAV 형식의 단일 인물 명확한 음성이 포함된 오디오 파일 URL; name과 description(선택 사항)은 음성 캐릭터의 이름과 설명입니다.
오디오 파일 요구사항:
- 형식: MP3 또는 WAV
- 길이: 최소 10초 이상
- 내용: 단일 인물 명확한 음성, 배경 소음이나 음악은 최대한 적게
data의 persona_id 필드가 생성된 음성 캐릭터 ID입니다. is_public 필드는 항상 false로, 업로드한 오디오로 생성된 음성 캐릭터는 비공개입니다.
2단계: 음성 캐릭터를 사용한 음악 생성
음성 캐릭터 ID를 획득한 후, Suno Audios Generation API를 사용해 음악을 생성할 수 있습니다.action을 generate로 설정하고, persona_id를 위에서 반환된 음성 캐릭터 ID로 지정하면, 생성된 곡은 클론된 음성으로 노래합니다.
주의: 음성 클론은chirp-v4-5이상 모델(예:chirp-v4-5,chirp-v5,chirp-v5-5)만 지원하며,chirp-v4는 지원하지 않습니다.
persona_id는 cover 액션과 함께 사용하여 클론된 음성으로 기존 곡을 리메이크하는 데도 활용할 수 있습니다.
