Documentation de l'API de génération d'audios Fish

Cet article présentera une documentation sur l’API de génération d’audios Fish, qui permet de cloner sa propre voix en entrant des mots-clés.

Processus de demande

Pour utiliser l’API, vous devez d’abord vous rendre sur la page correspondante de l’API de génération d’audios Fish pour demander le service correspondant. Une fois sur la page, cliquez sur le bouton « Acquire », comme indiqué dans l’image ci-dessous :

Si vous n’êtes pas encore connecté ou inscrit, vous serez automatiquement redirigé vers la page de connexion pour vous inviter à vous inscrire et à vous connecter. Après vous être connecté ou inscrit, vous serez automatiquement renvoyé à la page actuelle. Lors de la première demande, un quota gratuit sera offert, vous permettant d’utiliser l’API gratuitement.

Utilisation de base

Tout d’abord, comprenons la méthode d’utilisation de base, qui consiste à entrer un mot-clé prompt, une action de clonage action, un ID de voix voice_id et un modèle model, afin d’obtenir le résultat traité. Vous devez d’abord transmettre un champ action, dont la valeur est generate, puis nous devons également entrer le modèle model, qui est principalement le modèle fish-tts, comme indiqué ci-dessous :

Nous pouvons voir ici que nous avons défini les en-têtes de requête, y compris :

accept : le format de réponse souhaité, ici rempli avec application/json, c’est-à-dire au format JSON.
authorization : la clé d’API pour appeler l’API, que vous pouvez sélectionner directement après la demande.

De plus, nous avons défini le corps de la requête, y compris :

model : le modèle de clonage de voix, principalement le modèle fish-tts.
action : l’action de la tâche de clonage de voix.
prompt : le mot-clé à cloner.
voice_id : l’ID de voix à cloner.
callback_url : l’URL pour recevoir le résultat.

Après avoir fait votre sélection, vous pouvez voir que le code correspondant a également été généré à droite, comme indiqué dans l’image ci-dessous :

Cliquez sur le bouton « Try » pour effectuer un test, comme indiqué ci-dessus, et nous avons obtenu le résultat suivant :

{
  "success": true,
  "task_id": "5872ab00-3cf4-4040-a798-8510aaa16756",
  "trace_id": "5eda3694-448a-4b72-af33-2acb3851ffe1",
  "data": [
    {
      "audio_url": "https://platform.r2.fish.audio/task/8a72ff9840234006a9f74cb2fa04f978.mp3"
    }
  ]
}

Le résultat de retour contient plusieurs champs, décrits comme suit :

success, l’état de la tâche de clonage de voix.
- data, le résultat de la tâche de clonage de voix
  - audio_url, le lien audio du résultat de la tâche de clonage de voix.

Nous pouvons voir que nous avons obtenu des informations vocales satisfaisantes, et nous n’avons qu’à récupérer la voix clonée à partir de l’adresse du lien musical dans data. De plus, si vous souhaitez générer le code d’intégration correspondant, vous pouvez le copier directement, par exemple, le code CURL est le suivant :

curl -X POST 'https://api.acedata.cloud/fish/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "speech",
  "prompt": "a white siamese cat",
  "model": "fish-tts",
  "voice_id": "d7900c21663f485ab63ebdb7e5905036"
}'

Rappel asynchrone

Étant donné que le temps de génération de l’API de génération d’audios Fish est relativement long, environ 1 à 2 minutes, si l’API ne répond pas pendant longtemps, la requête HTTP maintiendra la connexion, entraînant une consommation supplémentaire de ressources système. Par conséquent, cette API propose également un support de rappel asynchrone. Le processus global est le suivant : lorsque le client initie une demande, il spécifie un champ callback_url supplémentaire. Après que le client ait lancé la demande API, l’API renverra immédiatement un résultat contenant un champ task_id, représentant l’ID de la tâche actuelle. Lorsque la tâche est terminée, le résultat de la tâche générée sera envoyé au callback_url spécifié par le client sous forme de POST JSON, incluant également le champ task_id, permettant ainsi de relier le résultat de la tâche par ID. Voyons maintenant un exemple pour comprendre comment procéder. Tout d’abord, le rappel Webhook est un service capable de recevoir des requêtes HTTP, et le développeur doit le remplacer par l’URL de son propre serveur HTTP. Pour des raisons de démonstration, nous utiliserons un site d’exemple Webhook public https://webhook.site/, en ouvrant ce site, vous obtiendrez une URL Webhook, comme indiqué dans l’image ci-dessous :

Copiez cette URL, qui peut être utilisée comme Webhook, l’exemple ici est https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34. Ensuite, nous pouvons définir le champ callback_url sur l’URL Webhook ci-dessus, tout en remplissant les paramètres correspondants, comme indiqué dans l’image ci-dessous :

Cliquez sur Exécuter, et vous verrez immédiatement un résultat, comme suit :

{
  "task_id": "2725a2d3-f87e-4905-9c53-9988d5a7b2f5"
}

Après un moment, nous pouvons observer le résultat de la tâche générée sur https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34, comme indiqué dans l’image ci-dessous :

Le contenu est le suivant :

{
    "success": true,
    "task_id": "2725a2d3-f87e-4905-9c53-9988d5a7b2f5",
    "trace_id": "e2d308bc-4df8-4c69-9369-a60f3c54f2b3",
    "data": [
        {
            "audio_url": "https://platform.r2.fish.audio/task/b627c2f7d38a4083a837570ba6d0962f.mp3"
        }
    ]
}

Nous pouvons voir qu’il y a un champ task_id dans le résultat, et les autres champs sont similaires à ceux mentionnés précédemment, permettant de relier la tâche via ce champ.

Gestion des erreurs

Lors de l’appel de l’API, si une erreur se produit, l’API renverra le code d’erreur et les informations correspondantes. Par exemple :

400 token_mismatched : Mauvaise requête, probablement en raison de paramètres manquants ou invalides.
400 api_not_implemented : Mauvaise requête, probablement en raison de paramètres manquants ou invalides.
401 invalid_token : Non autorisé, jeton d’autorisation invalide ou manquant.
429 too_many_requests : Trop de requêtes, vous avez dépassé la limite de taux.
500 api_error : Erreur interne du serveur, quelque chose s’est mal passé sur le serveur.

Exemple de réponse d’erreur

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

Conclusion

Grâce à ce document, vous avez compris comment utiliser l’API de génération de sons Fish en clonant des voix à partir de mots-clés d’entrée. Nous espérons que ce document vous aidera à mieux intégrer et utiliser cette API. Si vous avez des questions, n’hésitez pas à contacter notre équipe de support technique.

Démarrage

Chat IA

Image IA

Vidéo IA

Audio IA

Web & Données

CAPTCHA

Identité

Proxy

Avancé

Documentation de l'API de génération d'audios Fish

Processus de demande

Utilisation de base

Rappel asynchrone

Gestion des erreurs

Exemple de réponse d’erreur

Conclusion

Démarrage

Chat IA

Image IA

Vidéo IA

Audio IA

Web & Données

CAPTCHA

Identité

Proxy

Avancé

​Processus de demande

​Utilisation de base

​Rappel asynchrone

​Gestion des erreurs

​Exemple de réponse d’erreur

​Conclusion

Processus de demande

Utilisation de base

Rappel asynchrone

Gestion des erreurs

Exemple de réponse d’erreur

Conclusion