audio_id を使用)とは異なり、本 API は公開アクセス可能な audio_url、すなわち自身の人声録音を受け入れます。本ドキュメントでは音声クローン API の接続方法を解説します。
ステップ1:音声キャラクターの作成
本 API は3つの入力パラメータを持ちます:audio_url(必須)、公開アクセス可能な MP3 または WAV 形式の音声ファイル URL で、単一人物のクリアな人声を含むもの;name と description(任意)は音声キャラクターの名前と説明です。
音声ファイルの要件:
- 形式:MP3 または WAV
- 長さ:最低10秒以上
- 内容:単一人物のクリアな人声、背景ノイズや音楽はできるだけ少なく
data の persona_id フィールドが作成された音声キャラクターの ID です。is_public フィールドは常に false で、アップロード音声から作成された音声キャラクターはプライベートであるためです。
ステップ2:音声キャラクターを使用した音楽生成
音声キャラクター ID を取得したら、Suno Audios Generation API を使って音楽生成が可能です。action を generate に設定し、persona_id に上記で得た音声キャラクター ID を指定すると、生成される楽曲はクローンされた音声で歌唱されます。
注意: 音声クローンはchirp-v4-5以上のモデル(例:chirp-v4-5、chirp-v5、chirp-v5-5)のみ対応し、chirp-v4は非対応です。
persona_id は cover アクションと組み合わせて使用することもでき、クローン音声で既存の楽曲をカバーすることも可能です。
