Antragsprozess
Um die Claude Messages API zu nutzen, können Sie zunächst die Seite Claude Messages API besuchen und auf die Schaltfläche „Acquire“ klicken, um die erforderlichen Anmeldeinformationen zu erhalten:
Wenn Sie noch nicht angemeldet oder registriert sind, werden Sie automatisch zur Anmeldeseite weitergeleitet, um sich zu registrieren und anzumelden. Nach der Anmeldung werden Sie automatisch zur aktuellen Seite zurückgeleitet.
Bei der ersten Antragstellung gibt es ein kostenloses Kontingent, mit dem Sie die API kostenlos nutzen können.
Grundlegende Nutzung
Der Anfragepfad der Claude Messages API lautet/v1/messages und bleibt mit der offiziellen API von Anthropic konsistent. Wir müssen mindestens drei erforderliche Parameter bereitstellen:
model: Wählen Sie das zu verwendende Claude-Modell, wieclaude-opus-4-20250514,claude-sonnet-4-20250514usw.messages: Eingabemeldungsarray, wobei jede Nachrichtrole(Rolle) undcontent(Inhalt) enthält, wobeiroleuserundassistantunterstützt.max_tokens: Maximale Anzahl von Tokens für die Ausgabe, um die Länge der einzelnen Antwort zu begrenzen.
system: Systemaufforderung, um das Verhalten und die Rolle des Modells festzulegen.temperature: Generierungsrandomisierung, zwischen 0-1, je höher der Wert, desto divergenter die Antwort.stream: Ob die Streaming-Antwort verwendet werden soll, auftruegesetzt, um eine zeilenweise Rückgabe zu erreichen.stop_sequences: Benutzerdefinierte Stoppsequenzen, bei denen das Modell die Generierung stoppt, wenn es auf diesen Text trifft.top_p: Kernstichprobenparameter, der zusammen mit der Temperatur die Randomisierung der Generierung steuert.top_k: Nur aus den K wahrscheinlichsten Optionen stichprobenartig auswählen.tools: Werkzeugdefinition, um das Modell externe Funktionen aufrufen zu lassen.tool_choice: Steuert, wie das Modell die bereitgestellten Werkzeuge verwendet.
cURL Beispiel
Python Beispiel
id: Eindeutiger Identifikator für diese Nachricht.type: Immermessage.role: Immerassistant.content: Antwortinhaltsarray, wobei jedes Elementtype(z. B.text) und den entsprechenden Inhalt enthält.model: Name des Modells, das die Anfrage bearbeitet.stop_reason: Grund für das Stoppen, mögliche Werte sindend_turn(normal beendet),max_tokens(maximale Länge erreicht),stop_sequence(auf Stoppsequenz gestoßen),tool_use(Werkzeugaufruf).stop_sequence: Wenn aufgrund einer benutzerdefinierten Stoppsequenz gestoppt wurde, wird der übereinstimmende Stoppsequenztext angezeigt.usage: Token-Nutzungsstatistik, einschließlichinput_tokens(Anzahl der Eingabe-Tokens) undoutput_tokens(Anzahl der Ausgabe-Tokens).
Systemaufforderungen
Die Claude Messages API unterstützt die Festlegung von Systemaufforderungen über das Feldsystem, um das Verhalten, die Rolle und den Kontext des Modells zu definieren.
Python Beispiel
system-Aufforderung kann die Rolle und das Verhalten von Claude präzise gesteuert werden.
Streaming-Antwort
Diese Schnittstelle unterstützt auch Streaming-Antworten. Setzen Sie den Parameterstream auf true, um eine schrittweise Rückgabe zu erhalten, die sich hervorragend für die Implementierung einer zeilenweisen Anzeige auf Webseiten eignet.
Python Beispiel
event: und data: beginnt. Die Streaming-Ereignistypen umfassen:
message_start: Beginn der Nachricht, enthält grundlegende Informationen zur Nachricht und den Modellnamen.content_block_start: Beginn des Inhaltsblocks.content_block_delta: Inkrementelle Aktualisierung des Inhaltsblocks, enthält neu generierte Textabschnitte.content_block_stop: Ende des Inhaltsblocks.message_delta: Inkrementelle Aktualisierung auf Nachrichtenebene, enthältstop_reasonund endgültigeusage-Informationen.message_stop: Ende der Nachricht.
content_block_delta die schrittweise generierten Textinhalte enthält, und durch das Verketten aller text_delta kann die vollständige Antwort erhalten werden.
JavaScript Beispiel
Mehrere Runden im Dialog
Wenn Sie die Funktion für mehrere Runden im Dialog integrieren möchten, müssen Sie die Nachrichten der Rollenuser und assistant im messages-Array abwechselnd anordnen und die vorherige Gesprächshistorie mit übergeben.
Python Beispiel
messages kann Claude den Kontext für präzise Antworten nutzen.
Tiefes Denkmodell
Claude unterstützt die Funktion des Extended Thinking (tiefes Denken), die es dem Modell ermöglicht, vor der Antwort interne Überlegungen anzustellen, um die Genauigkeit bei der Bearbeitung komplexer Probleme zu erhöhen. Bei der Verwendung dieser Funktion muss derthinking-Parameter übergeben werden.
Python Beispiel
content-Array zwei Inhaltsblöcke enthält:
type: "thinking": Der interne Denkprozess des Modells, der die Überlegungsschritte zeigt.type: "text": Das endgültige Antwortergebnis.
- Bei der Verwendung von
thinkingmussmax_tokensgrößer alsbudget_tokenssein, dabudget_tokensdas Token-Budget für den Denkprozess ist. - Je größer
budget_tokens, desto mehr Raum hat das Modell für tiefere Überlegungen, was sich für die Bearbeitung komplexer Probleme eignet.
Visuelles Modell
Claude unterstützt multimodale Eingaben und kann gleichzeitig Text und Bilder verarbeiten. In der Messages API kann die visuelle Fähigkeit genutzt werden, indem dercontent als Array-Format festgelegt und Bildinhaltsblöcke übergeben werden.
Verwendung von Base64-kodierten Bildern
Verwendung von Bild-URLs
cURL Beispiel
image/jpeg, image/png, image/gif, image/webp.
Beispiel für eine Rückgabe:
Werkzeugaufruf (Tool Use)
Die Claude Messages API unterstützt nativ die Funktion des Werkzeugaufrufs, die es dem Modell ermöglicht, bei Bedarf vordefinierte Werkzeuge/Funktionen aufzurufen.Python Beispiel
content einen Inhaltstyp tool_use enthalten:
stop_reason auf tool_use gesetzt ist, was bedeutet, dass das Modell ein Werkzeug aufrufen muss. Nach Erhalt dieses Ergebnisses müssen Sie die Werkzeugfunktion ausführen und das Ergebnis in Form von tool_result an das Modell zurückgeben:
Unterschied zur Chat Completion API
Ace Data Cloud bietet zwei Formate der Claude API an, die Hauptunterschiede sind wie folgt:| Merkmal | Messages API (/v1/messages) | Chat Completion API (/v1/chat/completions) |
|---|---|---|
| Format | Anthropic natives Format | OpenAI kompatibles Format |
| System-Prompt | Unabhängiges system Feld | Über messages mit role: "system" übergeben |
| Antwortstruktur | content Array (unterstützt mehrere Typen) | choices Array (enthält message) |
| Streaming-Format | SSE-Ereignisse (mehrere Ereignistypen) | SSE data Zeilen |
| Tiefes Denken | Natives thinking Parameter | Durch spezielle Modellnamen ausgelöst (z.B. -thinking Nachsatz) |
| Werkzeugaufruf | Natives tools + input_schema | OpenAI kompatibles functions Format |
| Token-Zählung | input_tokens / output_tokens | prompt_tokens / completion_tokens |
Fehlerbehandlung
Bei der API-Anforderung, wenn ein Fehler auftritt, gibt die API den entsprechenden Fehlercode und die Informationen zurück. Zum Beispiel:400 token_mismatched: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.400 api_not_implemented: Ungültige Anfrage, möglicherweise aufgrund fehlender oder ungültiger Parameter.401 invalid_token: Unbefugt, ungültiger oder fehlender Autorisierungstoken.429 too_many_requests: Zu viele Anfragen, Sie haben das Rate-Limit überschritten.500 api_error: Interner Serverfehler, etwas ist auf dem Server schiefgelaufen.

