Zum Hauptinhalt springen
OpenAI ChatGPT ist ein sehr leistungsstarkes KI-Dialogsystem, das durch die Eingabe von Stichwörtern in nur wenigen Sekunden flüssige und natürliche Antworten generieren kann. ChatGPT hebt sich durch seine hervorragenden Sprachverständnis- und Generierungsfähigkeiten in der Branche hervor und wird mittlerweile in verschiedenen Branchen und Bereichen weit verbreitet eingesetzt, wobei sein Einfluss immer deutlicher wird. Egal ob im Alltag, beim kreativen Schreiben oder in der professionellen Beratung und Programmierung, ChatGPT kann erstaunliche intelligente Unterstützung bieten und die Effizienz und Kreativität der Menschen erheblich steigern. Dieses Dokument beschreibt hauptsächlich den Ablauf zur Nutzung der OpenAI Chat Completion 4o Image API, mit der wir die multimodalen Dialogfunktionen des offiziellen OpenAI ChatGPT einfach nutzen können.

Antragsprozess

Um die OpenAI Chat Completion 4o Image API zu nutzen, können Sie zunächst die Seite OpenAI Chat Completion 4o Image API besuchen und auf die Schaltfläche „Acquire“ klicken, um die benötigten Anmeldeinformationen zu erhalten: Wenn Sie noch nicht angemeldet oder registriert sind, werden Sie automatisch zur Anmeldeseite weitergeleitet, um sich zu registrieren und anzumelden. Nach der Anmeldung werden Sie automatisch zur aktuellen Seite zurückgeleitet. Bei der ersten Antragstellung gibt es ein kostenloses Kontingent, mit dem Sie die API kostenlos nutzen können.

GPT-4o Zeichnungsmodell

Generierung von Bildern basierend auf Referenzbildern

Hier ist ein Beispiel für die Generierung eines benutzerdefinierten Stils basierend auf einem Bild. Lassen Sie uns zunächst das Bild ansehen, das wir eingegeben haben, wie im folgenden Bild gezeigt: Das Referenzbild zeigt ein echtes Bild einer Person. Wir können es in einen bestimmten Stil ändern, zum Beispiel in einen Anime-Stil. Hier ist das spezifische Anfragebeispiel:
{
  "model": "gpt-4o-image",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "Generiere ein Bild im Anime-Stil und setze einen Hut darauf"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/qzx2z1.png"
          }
        }
      ]
    }
  ],
  "stream": false
}
Beispielergebnis:
{
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "> ❇️ Schlüsselwort: https://file.onechats.ai/tem/f7b8024b6f430a0a9d20174bcec1ad3a.png Generiere ein Bild im Anime-Stil und setze einen Hut darauf\n\n> ✨ Sora zeichnet das Bild...\n\n> 🏃 Fortschritt: 8.4%\n\n> 🏃 Fortschritt: 17.5%\n\n> 🏃 Fortschritt: 25.9%\n\n> 🏃 Fortschritt: 34.3%\n\n> 🏃 Fortschritt: 43.4%\n\n> 🏃 Fortschritt: 51.8%\n\n> 🏃 Fortschritt: 60.9%\n\n> 🏃 Fortschritt: 71.4%\n\n> 🏃 Fortschritt: 76.3%\n\n> 🏃 Fortschritt: 80.4%\n\n> 🏃 Fortschritt: 83.8%\n\n> 🏃 Fortschritt: 86.6%\n\n> 🏃 Fortschritt: 88.9%\n\n> 🏃 Fortschritt: 90.8%\n\n> 🏃 Fortschritt: 92.4%\n\n> ✅ Bild erfolgreich gezeichnet, bitte überprüfen Sie es~~~\n\n![](https://file.onechats.ai/tem/4abe605b362a9a59028bf7fafa5f2aff.png)\n\n"
      },
      "finish_reason": "stop"
    }
  ],
  "created": 1745152859,
  "id": "chatcmpl-7c43d1dd-17e3-4513-9aec-899b21be3c2a",
  "model": "gpt-4o-image",
  "object": "chat.completion.chunk",
  "usage": {
    "prompt_tokens": 68,
    "completion_tokens": 19,
    "total_tokens": 87
  }
}
Dabei ist die message in choices das vollständige Dialogergebnis, das Bildresultat ist ebenfalls im Dialogergebnis enthalten. Man kann sehen, dass das generierte Bild tatsächlich im Anime-Stil ist, wie im folgenden Bild gezeigt:

Generierung von Bildern nur mit Text

Wir können durch ein Stichwort ein Bild generieren lassen und es in einem dialogartigen Ergebnis zurückbekommen. Lassen Sie uns als Beispiel „Erstelle ein Bild von einer futuristischen Stadt bei Sonnenuntergang“ verwenden. Hier ist das spezifische Beispiel:
{
  "model": "gpt-4o-image",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "Generiere ein Bild im Anime-Stil und setze einen Hut darauf"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/qzx2z1.png"
          }
        }
      ]
    }
  ],
  "stream": false
}
Beispielergebnis:
{
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "> ❇️ Schlüsselwort: Erstelle ein Bild von einer futuristischen Stadt bei Sonnenuntergang\n\n> ✨ Sora zeichnet das Bild...\n\n> 🏃 Fortschritt: 9.8%\n\n> 🏃 Fortschritt: 19.6%\n\n> 🏃 Fortschritt: 30.1%\n\n> 🏃 Fortschritt: 39.9%\n\n> 🏃 Fortschritt: 50.4%\n\n> 🏃 Fortschritt: 60.2%\n\n> 🏃 Fortschritt: 69.3%\n\n> ✅ Bild erfolgreich gezeichnet, bitte überprüfen Sie es~~~\n\n![](https://file.onechats.ai/tem/4ab6f3cd886aaa6fd575dd37327fae59.png)\n\n"
      },
      "finish_reason": "stop"
    }
  ],
  "created": 1745153373,
  "id": "chatcmpl-29ed630a-c8fc-4a8a-a8e0-737fcc515192",
  "model": "gpt-4o-image",
  "object": "chat.completion.chunk",
  "usage": {
    "prompt_tokens": 32,
    "completion_tokens": 11,
    "total_tokens": 43
  }
}
Man kann sehen, dass das Ergebnis den Stichworten entspricht, wie im folgenden Bild gezeigt:

Generierung eines Bildes aus mehreren Bildern

Wir können auch mehrere Referenzbilder verwenden, um ein Bild zu generieren. Zum Beispiel können wir ein Bild eines attraktiven Mannes und eines Kaffees verwenden, um ein Bild eines attraktiven Mannes, der Kaffee trinkt, zu generieren. Hier sind die spezifischen Referenzbilder:

下面我们以生成男生举着咖啡,并且马上要喝的样子为示例,下面具体的示例:
{
  "model": "gpt-4o-image",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "生成男生举着咖啡,并且马上要喝的样子"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/pqquv3.jpg"
          }
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cdn.acedata.cloud/h8j2i0.jpg"
          }
        }
      ]
    }
  ],
  "stream": false
}
样例结果:
{
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "> ❇️ Schlüsselwörter:https://file.onechats.ai/tem/b5e2049e82ef071a804d6769e580b702.png https://file.onechats.ai/tem/78e9aa8a0dbd529f3904a6629329ebbe.png 生成男生举着咖啡,并且马上要喝的样子\n\n> ✨ Sora正在绘制图片中...\n\n> 🏃 Fortschritt:11.2%\n\n> 🏃 Fortschritt:25.9%\n\n> 🏃 Fortschritt:39.9%\n\n> 🏃 Fortschritt:47.6%\n\n> 🏃 Fortschritt:55.3%\n\n> 🏃 Fortschritt:73.3%\n\n> 🏃 Fortschritt:78.0%\n\n> 🏃 Fortschritt:81.8%\n\n> ✅ 图片绘制成功,请注意查收~~~\n\n![](https://file.onechats.ai/tem/6aa9ad6c26b9d4500ea84ea9f56e331b.png)\n\n"
      },
      "finish_reason": "stop"
    }
  ],
  "created": 1745154125,
  "id": "chatcmpl-d6e5fc71-4e33-4ad6-b259-357241d7c1ab",
  "model": "gpt-4o-image",
  "object": "chat.completion.chunk",
  "usage": {
    "prompt_tokens": 106,
    "completion_tokens": 12,
    "total_tokens": 118
  }
}
可以看到,生成的结果确实是结合了俩张图来生成的,下面是具体的结果:

Fehlerbehandlung

在调用 API 时,如果遇到错误,API 会返回相应的错误代码和信息。例如:
  • 400 token_mismatched:Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.
  • 400 api_not_implemented:Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.
  • 401 invalid_token:Unbefugt, ungültiger oder fehlender Autorisierungstoken.
  • 429 too_many_requests:Zu viele Anfragen, Sie haben das Kontingent überschritten.
  • 500 api_error:Interner Serverfehler, etwas ist auf dem Server schiefgelaufen.

Fehlerantwort Beispiel

{
  "success": false,
  "error": {
    "code": "api_error",
    "message": "fetch failed"
  },
  "trace_id": "2cf86e86-22a4-46e1-ac2f-032c0f2a4e89"
}

Fazit

通过本文档,您已经了解了如何使用 OpenAI Chat Completion 4o Image API 轻松实现官方 OpenAI ChatGPT 的多模态图像处理功能。希望本文档能帮助您更好地对接和使用该 API。如有任何问题,请随时联系我们的技术支持团队。