audio_id)不同,该 API 接受一个公开可访问的 audio_url,即你自己的人声录音。本文档讲解声音克隆 API 的对接方法。
第一步:创建声音角色
该 API 有三个输入参数:audio_url(必填),为一个公开可访问的 MP3 或 WAV 格式音频文件 URL,其中包含单人清晰人声;name 和 description(可选),为声音角色的名称和描述。
音频文件要求:
- 格式:MP3 或 WAV
- 时长:至少 10 秒
- 内容:单人清晰人声,尽量减少背景噪音或音乐
data 的 persona_id 字段就是创建的声音角色 ID。is_public 字段始终为 false,因为通过上传音频创建的声音角色是私有的。
第二步:使用声音角色生成音乐
有了声音角色 ID 之后,我们便可以使用 Suno Audios Generation API 来进行音乐生成了。将action 设为 generate,并将 persona_id 设为上面返回的声音角色 ID,生成的歌曲将使用克隆的声音进行演唱。
注意: 声音克隆仅支持chirp-v4-5及以上模型(如chirp-v4-5、chirp-v5、chirp-v5-5),不支持chirp-v4。
persona_id 也可以与 cover 动作配合使用,用克隆的声音翻唱已有歌曲。
