Antragsprozess
Um die Claude Chat Completion API zu nutzen, können Sie zunächst auf die Seite Claude Chat Completion API gehen und auf die Schaltfläche „Acquire“ klicken, um die benötigten Anmeldeinformationen zu erhalten:
Wenn Sie noch nicht angemeldet oder registriert sind, werden Sie automatisch zur Anmeldeseite weitergeleitet, um sich zu registrieren und anzumelden. Nach der Anmeldung werden Sie automatisch zur aktuellen Seite zurückgeleitet.
Bei der ersten Antragstellung gibt es ein kostenloses Kontingent, mit dem Sie die API kostenlos nutzen können.
Grundlegende Nutzung
Als Nächstes können Sie im Interface die entsprechenden Inhalte ausfüllen, wie im Bild gezeigt:
authorization, den Sie einfach aus der Dropdown-Liste auswählen können. Ein weiterer Parameter ist model, model ist die Modellkategorie, die wir von der Claude-Website auswählen. Hier haben wir hauptsächlich 20 Modelle zur Auswahl, die Details können Sie in den bereitgestellten Modellen einsehen. Der letzte Parameter ist messages, messages ist das Array der von uns eingegebenen Fragen, es handelt sich um ein Array, das mehrere Fragen gleichzeitig hochladen kann, wobei jede Frage role und content enthält, wobei role die Rolle des Fragestellers angibt. Wir bieten drei Identitäten an: user, assistant, system. Das andere content ist der spezifische Inhalt unserer Frage.
Gleichzeitig können Sie auf der rechten Seite den entsprechenden Code zur Aufrufgenerierung sehen, den Sie kopieren und direkt ausführen oder einfach auf die Schaltfläche „Try“ klicken können, um einen Test durchzuführen.
Häufig verwendete optionale Parameter:
max_tokens: Begrenzung der maximalen Token-Anzahl pro Antwort.temperature: Generierungsrandomisierung, zwischen 0-2, je höher der Wert, desto divergenter.n: Wie viele Antwortvorschläge auf einmal generiert werden.response_format: Einstellung des Rückgabeformats.

id, die ID der generierten Dialogaufgabe, die zur eindeutigen Identifizierung dieser Dialogaufgabe dient.model, das gewählte Claude-Modell von der Website.choices, die Antwortinformationen von Claude auf die Fragen.usage: Statistische Informationen zu den Tokens für diese Frage-Antwort-Paar.
choices die Antwortinformationen von Claude, und die choices darin sind die spezifischen Informationen, die Claude gegeben hat, wie im Bild zu sehen ist.

content in choices den spezifischen Inhalt der Antwort von Claude.
Stream-Antwort
Diese Schnittstelle unterstützt auch Stream-Antworten, was für die Integration in Webseiten sehr nützlich ist, da es ermöglicht, die Ergebnisse zeilenweise anzuzeigen. Wenn Sie eine Stream-Antwort zurückgeben möchten, können Sie denstream-Parameter im Header der Anfrage auf true ändern.
Die Änderung ist wie im Bild gezeigt, jedoch muss der Aufrufcode entsprechend geändert werden, um Stream-Antworten zu unterstützen.

stream auf true geändert haben, gibt die API die entsprechenden JSON-Daten zeilenweise zurück. Auf der Code-Ebene müssen wir entsprechende Änderungen vornehmen, um die zeilenweisen Ergebnisse zu erhalten.
Beispielaufrufcode in Python:
data enthält, wobei data die neuesten Antwortinhalte in choices sind, die mit den oben beschriebenen Inhalten übereinstimmen. choices sind die neuen Antwortinhalte, die Sie in Ihr System integrieren können. Das Ende der Streaming-Antwort wird anhand des Inhalts von data bestimmt; wenn der Inhalt [DONE] ist, bedeutet dies, dass die Streaming-Antwort vollständig beendet ist. Die zurückgegebenen data-Ergebnisse haben mehrere Felder, die wie folgt beschrieben werden:
id, die ID der generierten Dialogaufgabe, die zur eindeutigen Identifizierung dieser Dialogaufgabe verwendet wird.model, das gewählte Modell von Claude.choices, die Antwortinformationen von Claude auf die Fragen.
Mehrere Runden im Dialog
Wenn Sie die Funktion für mehrere Runden im Dialog integrieren möchten, müssen Sie mehrere Fragen im Feldmessages hochladen. Ein konkretes Beispiel für mehrere Fragen ist im folgenden Bild dargestellt:

choices enthält die Informationen, die mit dem grundlegenden Inhalt der Verwendung übereinstimmen. Dies umfasst die spezifischen Inhalte von Claudes Antworten auf mehrere Dialoge, sodass Fragen basierend auf mehreren Dialoginhalten beantwortet werden können.
Tiefes Denkmodell
Das Modell claude-opus-4-20250514-thinking und das Modell claude-sonnet-4-20250514-thinking unterscheiden sich von anderen Modellen, da sie in der Lage sind, basierend auf den Fragen tief zu denken und die Ergebnisse des Denkprozesses zurückzugeben. Dieser Artikel wird die Funktion des tiefen Denkens anhand eines konkreten Beispiels demonstrieren. Anschließend können Sie die entsprechenden Inhalte im Claude Chat Completion API-Bereich ausfüllen, wie im Bild gezeigt:

choices nach tiefem Denken erhalten wurden und auch die entsprechenden Inhalte des Denkprozesses angegeben sind, wobei in content reasoning_content den Denkprozess des Modells darstellt. Die Antwortinformationen in choices müssen mit markdown-Syntax gerendert werden, um die beste Erfahrung zu erzielen. Schließlich zeigt dies auch die starke Netzwerkfunktionalität unseres Modells.
Visuelles Modell
claude-sonnet-4-20250514 ist ein multimodales großes Sprachmodell, das von Claude entwickelt wurde und auf claude-4 basiert, wobei die visuelle Verständnisfähigkeit hinzugefügt wurde. Dieses Modell kann gleichzeitig Text- und Bilddaten verarbeiten und ermöglicht ein Verständnis und eine Generierung über Modalitäten hinweg. Die Textverarbeitung mit dem Modell claude-sonnet-4-20250514 ist mit dem oben beschriebenen grundlegenden Inhalt der Verwendung konsistent. Im Folgenden wird kurz erläutert, wie die Bildverarbeitungsfähigkeiten des Modells genutzt werden können. Die Bildverarbeitungsfähigkeiten des Modells claude-sonnet-4-20250514 werden hauptsächlich durch das Hinzufügen einestype-Feldes zur ursprünglichen content-Inhalt erreicht. Anhand dieses Feldes kann festgestellt werden, ob Text oder Bild hochgeladen wird, um die Bildverarbeitungsfähigkeiten des Modells claude-sonnet-4-20250514 zu nutzen. Im Folgenden werden hauptsächlich zwei Methoden zur Nutzung dieser Funktion beschrieben: Curl und Python.
- Curl-Skript-Methode
- Python-Skript-Methode
Fehlerbehandlung
Bei der API-Anruf, wenn ein Fehler auftritt, gibt die API den entsprechenden Fehlercode und die Informationen zurück. Zum Beispiel:400 token_mismatched: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.400 api_not_implemented: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.401 invalid_token: Unbefugt, ungültiges oder fehlendes Autorisierungstoken.429 too_many_requests: Zu viele Anfragen, Sie haben das Rate-Limit überschritten.500 api_error: Interner Serverfehler, etwas ist auf dem Server schiefgelaufen.

