Przejdź do głównej treści
Główną funkcją Midjourney Describe API jest uzyskiwanie opisu obrazów poprzez przesyłanie zdjęć. Korzystając z tego API, wystarczy przekazać adres pliku obrazu, a API zwróci szczegółowy opis obrazu. Nie ma potrzeby skomplikowanego ustawiania parametrów, aby uzyskać wysokiej jakości opisy obrazów. Obsługuje wiele formatów obrazów: niezależnie od tego, czy jest to JPEG, PNG, czy GIF, wszystkie popularne formaty obrazów są łatwo rozpoznawane i przetwarzane. Dokument ten szczegółowo opisuje integrację z Midjourney Describe API, aby pomóc Ci łatwo zintegrować i w pełni wykorzystać potężne możliwości tego API. Dzięki Midjourney Describe API możesz łatwo zautomatyzować opisywanie obrazów, zwiększając efektywność biznesową.

Proces aplikacji

Aby korzystać z Midjourney Describe API, należy najpierw przejść do strony aplikacji Midjourney Describe API, aby ubiegać się o odpowiednią usługę. Po wejściu na stronę kliknij przycisk „Acquire”, jak pokazano na obrazku: Strona aplikacji Jeśli nie jesteś zalogowany lub zarejestrowany, automatycznie zostaniesz przekierowany na stronę logowania, aby zarejestrować się i zalogować. Po zalogowaniu lub rejestracji automatycznie wrócisz na bieżącą stronę. Podczas pierwszej aplikacji otrzymasz darmowy limit, który pozwala na bezpłatne korzystanie z tego API.

Przykład żądania

Weźmy jako przykład jedno zdjęcie, aby pokazać, jak korzystać z tego API. Załóżmy, że mamy zdjęcie krajobrazu, a następnie pokażemy, jak przesłać to zdjęcie i uzyskać opis.

Przykład żądania

Przykładowe zdjęcie

Ustawienia nagłówków żądania i ciała żądania

Nagłówki żądania obejmują:
  • accept: określa, że oczekiwany jest wynik w formacie JSON, tutaj wpisz application/json.
  • authorization: klucz do wywołania API, po aplikacji można go bezpośrednio wybrać z rozwijanej listy.
Ciało żądania obejmuje:
  • image_url: adres pliku obrazu do przesłania.
Ustawienia są pokazane na poniższym obrazku:

Przykład kodu

Można zauważyć, że po prawej stronie strony automatycznie wygenerowano kod w różnych językach, jak pokazano na obrazku:

Niektóre przykłady kodu są następujące:

CURL

curl -X POST 'https://api.acedata.cloud/midjourney/describe' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "image_url": "https://cdn.acedata.cloud/kg7xp3.png"
}'

Python

import requests

url = "https://api.acedata.cloud/midjourney/describe"

headers = {
    "accept": "application/json",
    "authorization": "Bearer {token}",
    "content-type": "application/json"
}

payload = {
    "image_url": "https://cdn.acedata.cloud/kg7xp3.png"
}

response = requests.post(url, json=payload, headers=headers)
print(response.json())

Przykład odpowiedzi

Po pomyślnym złożeniu żądania API zwróci 4 opisy obrazu. Na przykład:
{
  "descriptions": [
    "Na środku parku na świeżym powietrzu stoi znak drogowy w kształcie krzyża, otoczony drzewami i łąkami. Tło jest słoneczne z ciepłymi kolorami. Promienie słońca przeświecają przez liście na część znaku. Z jednej strony tego słupa drogowego znajdował się również inny znak z napisem \"Kunming Park\", który wyglądał bardzo pięknie. To zdjęcie pokazuje, jak wspaniała może być natura. Daje ludziom uczucia relaksu lub spokoju w stylu natury. --ar 75:44",
    "Zdjęcie znaku drogowego \"K鬥\" w parku, z drzewami i trawą po obu stronach. Z przodu znajduje się jasnobeżowy metalowy słup z dwoma znakami przymocowanymi do niego. Tło przedstawia promienie słońca przeświecające przez zielone liście na jedną stronę ulicy, tworząc ciepłą atmosferę. Wokół unosi się również mgła wodna. Zostało zrobione w stylu aparatu Sony A7R IV z użyciem obiektywu Leica M. Ta scena przekazuje spokój i harmonię między naturą a ludzkim stworzeniem. --ar 75:44",
    "Znak drogowy w kształcie krzyża stoi w środku otwartego parku, otoczony drzewami i łąką. Słońce świeci przez liście na część znaku, tworząc ciepły efekt świetlny. Z przodu znajduje się droga prowadząca do innej zielonej przestrzeni. Na jednym boku tego słupa znajduje się również informacja o \"Wewnątrz Parku Shilin\". Ta scena daje ludziom uczucia spokoju i harmonii z naturą. Naturalne oświetlenie, renderowanie 3D w stylu Unreal Engine, realistyczny styl fotografii. --ar 75:44",
    "Znak drogowy w kształcie krzyża stoi w parku, otoczony bujnymi drzewami i żywą zieloną trawą pod słońcem. Znaki mówią \"VIDEO ANNattacks\" w nieznanym języku, tworząc atmosferę tajemnicy i intrygi. Scena została uchwycona w wysokiej rozdzielczości za pomocą aparatów Canon EOS R5, prezentując oszałamiający efekt wizualny, który ukazuje szczegółowe detale w stylu nowoczesnej fotografii. --ar 75:44"
  ]
}
Można zauważyć, że w wyniku znajduje się pole descriptions, które zawiera cztery wyniki, z których każdy jest kandydatem na opis.

Obsługa błędów

Podczas wywoływania API, jeśli wystąpi błąd, API zwróci odpowiedni kod błędu i informacje. Na przykład:
  • 400 token_mismatched: Złe żądanie, prawdopodobnie z powodu brakujących lub nieprawidłowych parametrów.
  • 400 api_not_implemented: Złe żądanie, prawdopodobnie z powodu brakujących lub nieprawidłowych parametrów.
  • 401 invalid_token: Nieautoryzowany, nieprawidłowy lub brakujący token autoryzacyjny.
  • 429 too_many_requests: Zbyt wiele żądań, przekroczono limit szybkości.
  • 500 api_error: Błąd wewnętrzny serwera, coś poszło nie tak na serwerze.

Przykład odpowiedzi błędu

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

Wnioski

Dzięki temu dokumentowi zrozumiałeś, jak korzystać z Midjourney Describe API do opisywania obrazów. Mamy nadzieję, że ten dokument pomoże Ci lepiej zintegrować i korzystać z tego API. W przypadku jakichkolwiek pytań, prosimy o kontakt z naszym zespołem wsparcia technicznego.