Saltar al contenido principal
Este documento presentará una guía sobre la integración de la API de generación de audios de Fish, que permite clonar su propio tono de voz mediante la entrada de palabras clave.

Proceso de solicitud

Para utilizar la API, primero debe ir a la página correspondiente de la API de generación de audios de Fish para solicitar el servicio correspondiente. Una vez en la página, haga clic en el botón “Acquire”, como se muestra en la imagen: Si aún no ha iniciado sesión o registrado, será redirigido automáticamente a la página de inicio de sesión, invitándolo a registrarse e iniciar sesión. Después de registrarse e iniciar sesión, será redirigido automáticamente a la página actual. En la primera solicitud, se le otorgará un crédito gratuito, lo que le permitirá utilizar la API de forma gratuita.

Uso básico

Primero, debe comprender la forma básica de uso, que consiste en ingresar la palabra clave prompt, la acción de clonación action, el ID de voz voice_id y el modelo model, para obtener el resultado procesado. Primero, necesita pasar un campo action, cuyo valor será generate, luego también necesitamos ingresar el modelo model, que actualmente es principalmente el modelo fish-tts, el contenido específico es el siguiente:

Aquí podemos ver que hemos configurado los encabezados de la solicitud, que incluyen:
  • accept: el formato de respuesta que desea recibir, aquí se llena como application/json, es decir, formato JSON.
  • authorization: la clave para llamar a la API, que puede seleccionarse directamente después de la solicitud.
Además, se configuró el cuerpo de la solicitud, que incluye:
  • model: el modelo para clonar la voz, principalmente el modelo fish-tts.
  • action: la acción de la tarea de clonación de voz.
  • prompt: la palabra clave que necesita ser clonada.
  • voice_id: el ID de voz para realizar la clonación.
  • callback_url: la URL donde se necesita recibir el resultado.
Después de seleccionar, puede notar que también se generó el código correspondiente a la derecha, como se muestra en la imagen:

Haga clic en el botón “Try” para realizar la prueba, como se muestra en la imagen anterior, y obtendremos el siguiente resultado:
{
  "success": true,
  "task_id": "5872ab00-3cf4-4040-a798-8510aaa16756",
  "trace_id": "5eda3694-448a-4b72-af33-2acb3851ffe1",
  "data": [
    {
      "audio_url": "https://platform.r2.fish.audio/task/8a72ff9840234006a9f74cb2fa04f978.mp3"
    }
  ]
}
El resultado devuelto tiene varios campos, que se describen a continuación:
  • success, el estado de la tarea de clonación de voz en este momento.
    • data, el resultado de la tarea de clonación de voz
      • audio_url, el enlace de audio del resultado de la tarea de clonación de voz.
Como puede ver, hemos obtenido información de voz satisfactoria, solo necesitamos obtener la voz clonada según la dirección del enlace musical en data. Además, si desea generar el código de integración correspondiente, puede copiarlo directamente, por ejemplo, el código de CURL es el siguiente:
curl -X POST 'https://api.acedata.cloud/fish/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "speech",
  "prompt": "a white siamese cat",
  "model": "fish-tts",
  "voice_id": "d7900c21663f485ab63ebdb7e5905036"
}'

Callback asíncrono

Dado que el tiempo de generación de la API de generación de audios de Fish es relativamente largo, aproximadamente de 1 a 2 minutos, si la API no responde durante mucho tiempo, la solicitud HTTP mantendrá la conexión, lo que provocará un consumo adicional de recursos del sistema. Por lo tanto, esta API también ofrece soporte para callbacks asíncronos. El proceso general es: cuando el cliente inicia la solicitud, debe especificar un campo adicional callback_url. Después de que el cliente inicia la solicitud a la API, la API devolverá inmediatamente un resultado que incluye un campo task_id, que representa el ID de la tarea actual. Cuando la tarea se complete, el resultado de la tarea generada se enviará al callback_url especificado por el cliente en formato JSON POST, que también incluirá el campo task_id, de modo que el resultado de la tarea se pueda asociar mediante el ID. A continuación, entenderemos cómo operar a través de un ejemplo. Primero, el callback de Webhook es un servicio que puede recibir solicitudes HTTP, y el desarrollador debe reemplazarlo con la URL de su propio servidor HTTP. Para facilitar la demostración, utilizamos un sitio web de muestra de Webhook público https://webhook.site/, al abrir este sitio obtendrá una URL de Webhook, como se muestra en la imagen: Copie esta URL y podrá usarla como Webhook, el ejemplo aquí es https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34. A continuación, podemos establecer el campo callback_url como la URL de Webhook anterior, al mismo tiempo que ingresamos los parámetros correspondientes, el contenido específico es como se muestra en la imagen:

Haga clic en ejecutar, y puede notar que recibirá inmediatamente un resultado, como el siguiente:
{
  "task_id": "2725a2d3-f87e-4905-9c53-9988d5a7b2f5"
}
Después de un momento, podemos observar el resultado de la tarea generada en https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34, como se muestra en la imagen: El contenido es el siguiente:
{
    "success": true,
    "task_id": "2725a2d3-f87e-4905-9c53-9988d5a7b2f5",
    "trace_id": "e2d308bc-4df8-4c69-9369-a60f3c54f2b3",
    "data": [
        {
            "audio_url": "https://platform.r2.fish.audio/task/b627c2f7d38a4083a837570ba6d0962f.mp3"
        }
    ]
}
Como puede ver, el resultado contiene un campo task_id, y los otros campos son similares a los mencionados anteriormente, a través de este campo se puede lograr la asociación de tareas.

Manejo de errores

Al llamar a la API, si se encuentra con un error, la API devolverá el código de error y la información correspondiente. Por ejemplo:
  • 400 token_mismatched: Solicitud incorrecta, posiblemente debido a parámetros faltantes o inválidos.
  • 400 api_not_implemented: Solicitud incorrecta, posiblemente debido a parámetros faltantes o inválidos.
  • 401 invalid_token: No autorizado, token de autorización inválido o faltante.
  • 429 too_many_requests: Demasiadas solicitudes, ha superado el límite de tasa.
  • 500 api_error: Error interno del servidor, algo salió mal en el servidor.

Ejemplo de respuesta de error

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

Conclusión

A través de este documento, usted ha aprendido cómo utilizar la API de Generación de Audios de Fish para clonar voces mediante la entrada de palabras clave. Esperamos que este documento le ayude a integrar y utilizar mejor esta API. Si tiene alguna pregunta, no dude en ponerse en contacto con nuestro equipo de soporte técnico.