메인 콘텐츠로 건너뛰기
본 문서에서는 입력된 오디오 링크를 통해 자신의 음색을 생성할 수 있는 Fish Voices Generation API 연동 방법을 소개합니다.

신청 절차

API를 사용하려면 먼저 Fish Voices Generation API 해당 페이지에서 서비스를 신청해야 합니다. 페이지에 들어가면 「Acquire」 버튼을 클릭합니다, 아래 그림과 같이: 로그인이나 등록이 되어 있지 않으면 자동으로 로그인 페이지로 이동하여 등록 및 로그인을 요청합니다. 로그인 및 등록 후에는 자동으로 현재 페이지로 돌아옵니다. 첫 신청 시 무료 사용량이 제공되어 해당 API를 무료로 사용할 수 있습니다.

기본 사용

먼저 기본 사용 방법을 이해해야 합니다. 음색의 오디오 링크 voice_url을 입력하면 처리된 결과를 얻을 수 있습니다. 구체적인 내용은 다음과 같습니다:

여기서 설정한 Request Headers는 다음과 같습니다:
  • accept: 어떤 형식의 응답 결과를 받을지, 여기서는 application/json으로 JSON 형식으로 입력합니다.
  • authorization: API 호출을 위한 키, 신청 후 바로 드롭다운에서 선택할 수 있습니다.
또한 Request Body를 설정합니다:
  • voice_url: 업로드된 음색 오디오 링크.
  • title: 해당 음색의 제목 정보.
  • image_urls: 해당 음색의 커버 이미지.
  • description: 해당 음색의 설명 정보.
  • callback_url: 결과를 회신받을 URL.
선택 후, 오른쪽에 해당 코드가 생성된 것을 확인할 수 있습니다, 아래 그림과 같이:

「Try」 버튼을 클릭하면 테스트를 진행할 수 있습니다, 위 그림과 같이, 여기서 다음과 같은 결과를 얻었습니다:
{
  "success": true,
  "task_id": "b01db503-dd9e-4f92-861a-344f14756217",
  "trace_id": "8731a2f1-7736-4a47-98e7-da942f9346a7",
  "data": {
    "_id": "d5d21261512b4852b9ccd709facf93f3",
    "type": "tts",
    "title": "test",
    "description": "test",
    "cover_image": "coverimage/d5d21261512b4852b9ccd709facf93f3",
    "train_mode": "fast",
    "state": "trained",
    "tags": [],
    "samples": [
      {
        "title": "Default Sample",
        "text": "장기간 관찰을 통해 산호초 생태계의 어류가 복잡한 집단 행동 패턴을 가지고 있음을 발견했습니다. 이들은 색상 변화와 특정한 수영 자세를 이용해 정보를 전달하며, 이러한 정교한 비언어적 소통 시스템은 해양 생물의 적응 지혜를 보여줍니다.",
        "task_id": "4ae961828fc94c07b2103dc039a8466b",
        "audio": "task/4ae961828fc94c07b2103dc039a8466b.mp3"
      }
    ],
    "created_at": "2025-09-21T07:29:41.058506Z",
    "updated_at": "2025-09-21T07:29:41.057917Z",
    "languages": [
      "zh"
    ],
    "visibility": "public",
    "lock_visibility": false,
    "default_text": "장기간 관찰을 통해 산호초 생태계의 어류가 복잡한 집단 행동 패턴을 가지고 있음을 발견했습니다. 이들은 색상 변화와 특정한 수영 자세를 이용해 정보를 전달하며, 이러한 정교한 비언어적 소통 시스템은 해양 생물의 적응 지혜를 보여줍니다.",
    "like_count": 0,
    "mark_count": 0,
    "shared_count": 0,
    "task_count": 0,
    "unliked": false,
    "liked": false,
    "marked": false,
    "author": {
      "_id": "7ecad23df62a4174acd6a2a6cb5201ee",
      "nickname": "Matthew Garcia",
      "avatar": "avatars/7ecad23df62a4174acd6a2a6cb5201ee.jpg"
    }
  }
}
반환 결과는 여러 필드로 구성되어 있으며, 다음과 같이 설명됩니다:
  • success: 이 시점에서 음색 생성 작업의 상태.
    • data: 음악 작업의 결과
      • _id: 이 시점에서 음색 생성 작업 ID, 이후 이 ID를 사용하여 음성을 복제하는 작업을 진행합니다.
      • title: 음색의 제목.
      • image_url: 음색의 커버 정보.
      • description: 음색의 설명 정보.
      • train_mode: 이 시점에서 음색 생성 작업에 사용된 모드.
      • tags: 음색의 스타일.
      • default_text: 이 시점에서 음색 생성 작업의 음성 텍스트 정보.
우리는 만족스러운 음색 정보를 얻었으며, 결과의 data_id를 기반으로 음성 복제 작업을 진행하면 됩니다. 또한 해당 연동 코드를 생성하고 싶다면, 생성된 코드를 직접 복사할 수 있습니다. 예를 들어 CURL의 코드는 다음과 같습니다:
curl -X POST 'https://api.acedata.cloud/fish/voices' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "voice_url": "https://platform.r2.fish.audio/task/604133d7b3c7430385382470f67770e8.mp3",
  "title": "test",
  "description": "test"
}'

비동기 콜백

Fish Voices Generation API 생성 시간이 상대적으로 길어 약 1-2분이 소요됩니다. API가 오랜 시간 응답하지 않으면 HTTP 요청이 계속 연결을 유지하여 추가 시스템 자원 소모를 초래할 수 있으므로, 본 API는 비동기 콜백 지원도 제공합니다. 전체 프로세스는: 클라이언트가 요청을 시작할 때 추가로 callback_url 필드를 지정합니다. 클라이언트가 API 요청을 시작하면 API는 즉시 결과를 반환하며, 현재 작업 ID를 나타내는 task_id 필드 정보를 포함합니다. 작업이 완료되면 생성 작업의 결과가 POST JSON 형식으로 클라이언트가 지정한 callback_url로 전송되며, 여기에도 task_id 필드가 포함되어 있어 작업 결과를 ID로 연결할 수 있습니다. 아래 예제를 통해 구체적인 작업 방법을 알아보겠습니다. 먼저, Webhook 콜백은 HTTP 요청을 수신할 수 있는 서비스로, 개발자는 자신이 구축한 HTTP 서버의 URL로 교체해야 합니다. 여기서는 편리한 시연을 위해 공개 Webhook 샘플 사이트인 https://webhook.site/를 사용합니다. 해당 사이트를 열면 Webhook URL을 얻을 수 있습니다, 아래 그림과 같이: 이 URL을 복사하여 Webhook으로 사용할 수 있으며, 여기서의 샘플은 https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34입니다. 다음으로, 필드 callback_url을 위의 Webhook URL로 설정하고, 해당 매개변수를 입력합니다. 구체적인 내용은 아래 그림과 같습니다:

실행 버튼을 클릭하면 즉시 다음과 같은 결과를 얻을 수 있습니다:
{
  "task_id": "9f626a13-96ec-4dec-8846-dc5aab7362a8"
}
잠시 기다려 주시면, 우리는 https://webhook.site/4815f79f-a40f-4078-ac85-1cc126b6bb34에서 생성 작업의 결과를 관찰할 수 있습니다. 아래와 같이: 내용은 다음과 같습니다:
{
    "success": true,
    "task_id": "9f626a13-96ec-4dec-8846-dc5aab7362a8",
    "trace_id": "3fcdea82-7c1c-4a0a-b8d8-f7616f722d8f",
    "data": {
        "_id": "fa75e7c3f02f42e79a6aa622b6cf075e",
        "type": "tts",
        "title": "test",
        "description": "test",
        "cover_image": "coverimage/fa75e7c3f02f42e79a6aa622b6cf075e",
        "train_mode": "fast",
        "state": "trained",
        "tags": [],
        "samples": [
            {
                "title": "Default Sample",
                "text": "돌고래는 에코로케이션 시스템을 통해 바다에서 항해하며, 이 정밀한 음파 기술은 그들이 주변 환경을 탐지하고, 음식을 찾고, 위험을 피할 수 있게 해줍니다. 이는 해양 생물의 적응 능력을 보여줄 뿐만 아니라, 자연의 경이로운 설계를 드러냅니다.",
                "task_id": "68cdda24d26e4794bae177e20da740db",
                "audio": "task/68cdda24d26e4794bae177e20da740db.mp3"
            }
        ],
        "created_at": "2025-09-21T07:36:20.200865Z",
        "updated_at": "2025-09-21T07:36:20.200353Z",
        "languages": [
            "zh"
        ],
        "visibility": "public",
        "lock_visibility": false,
        "default_text": "돌고래는 에코로케이션 시스템을 통해 바다에서 항해하며, 이 정밀한 음파 기술은 그들이 주변 환경을 탐지하고, 음식을 찾고, 위험을 피할 수 있게 해줍니다. 이는 해양 생물의 적응 능력을 보여줄 뿐만 아니라, 자연의 경이로운 설계를 드러냅니다.",
        "like_count": 0,
        "mark_count": 0,
        "shared_count": 0,
        "task_count": 0,
        "unliked": false,
        "liked": false,
        "marked": false,
        "author": {
            "_id": "7ecad23df62a4174acd6a2a6cb5201ee",
            "nickname": "Matthew Garcia",
            "avatar": "avatars/7ecad23df62a4174acd6a2a6cb5201ee.jpg"
        }
    }
}
결과에서 task_id 필드가 있으며, 다른 필드들은 위와 유사합니다. 이 필드를 통해 작업의 연관성을 실현할 수 있습니다.

오류 처리

API를 호출할 때 오류가 발생하면, API는 해당 오류 코드와 정보를 반환합니다. 예를 들어:
  • 400 token_mismatched : 잘못된 요청, 누락되었거나 잘못된 매개변수 때문일 수 있습니다.
  • 400 api_not_implemented : 잘못된 요청, 누락되었거나 잘못된 매개변수 때문일 수 있습니다.
  • 401 invalid_token : 권한 없음, 잘못되었거나 누락된 인증 토큰입니다.
  • 429 too_many_requests : 너무 많은 요청, 비율 제한을 초과했습니다.
  • 500 api_error : 내부 서버 오류, 서버에서 문제가 발생했습니다.

오류 응답 예시

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

결론

이 문서를 통해, 여러분은 Fish Voices Generation API를 사용하여 입력 음색의 오디오 연결을 통해 자신의 음색을 생성하는 방법을 이해하게 되었습니다. 이 문서가 API를 더 잘 연동하고 사용하는 데 도움이 되기를 바랍니다. 질문이 있으시면 언제든지 기술 지원 팀에 문의해 주십시오.