audio_id)不同,該 API 接受一個公開可訪問的 audio_url,即你自己的人聲錄音。本文檔講解聲音克隆 API 的對接方法。
第一步:建立聲音角色
該 API 有三個輸入參數:audio_url(必填),為一個公開可訪問的 MP3 或 WAV 格式音頻檔案 URL,其中包含單人清晰人聲;name 和 description(可選),為聲音角色的名稱和描述。
音頻檔案要求:
- 格式:MP3 或 WAV
- 時長:至少 10 秒
- 內容:單人清晰人聲,盡量減少背景噪音或音樂
data 的 persona_id 欄位就是建立的聲音角色 ID。is_public 欄位始終為 false,因為透過上傳音頻建立的聲音角色是私有的。
第二步:使用聲音角色生成音樂
有了聲音角色 ID 之後,我們便可以使用 Suno Audios Generation API 來進行音樂生成了。將action 設為 generate,並將 persona_id 設為上面返回的聲音角色 ID,生成的歌曲將使用克隆的聲音進行演唱。
注意: 聲音克隆僅支援chirp-v4-5及以上模型(如chirp-v4-5、chirp-v5、chirp-v5-5),不支援chirp-v4。
persona_id 也可以與 cover 動作配合使用,用克隆的聲音翻唱已有歌曲。
