Fluxo de Solicitação
Para usar a API Claude Messages, primeiro você pode acessar a página Claude Messages API e clicar no botão “Acquire” para obter as credenciais necessárias para a solicitação:
Se você ainda não estiver logado ou registrado, será redirecionado automaticamente para a página de login, convidando-o a se registrar e fazer login. Após o registro e login, você será redirecionado de volta para a página atual.
Na primeira solicitação, haverá um crédito gratuito disponível, permitindo o uso gratuito dessa API.
Uso Básico
O caminho de solicitação da API Claude Messages é/v1/messages, mantendo a consistência com a API oficial da Anthropic. Precisamos fornecer pelo menos três parâmetros obrigatórios:
model: escolha o modelo Claude a ser utilizado, comoclaude-opus-4-20250514,claude-sonnet-4-20250514, etc.messages: array de mensagens de entrada, onde cada mensagem contémrole(papel) econtent(conteúdo), sendo querolesuportausereassistant.max_tokens: número máximo de tokens de saída, usado para limitar o comprimento da resposta única.
system: prompt do sistema, usado para definir o comportamento e o papel do modelo.temperature: aleatoriedade da geração, entre 0-1, quanto maior o valor, mais dispersa a resposta.stream: se deve usar resposta em fluxo, configurado comotruepara obter um efeito de retorno palavra por palavra.stop_sequences: sequência de parada personalizada, o modelo parará de gerar ao encontrar esses textos.top_p: parâmetro de amostragem nuclear, que, em conjunto com a temperatura, controla a aleatoriedade da geração.top_k: amostra apenas entre as K opções com maior probabilidade.tools: definição de ferramentas, para permitir que o modelo chame funções externas.tool_choice: controla como o modelo usa as ferramentas fornecidas.
Exemplo cURL
Exemplo Python
id: identificador único da mensagem atual.type: sempre serámessage.role: sempre seráassistant.content: array de conteúdo da resposta, onde cada elemento contémtype(comotext) e o conteúdo correspondente.model: nome do modelo que processou a solicitação.stop_reason: razão da parada, os valores possíveis incluemend_turn(término normal),max_tokens(alcance do comprimento máximo),stop_sequence(encontro de sequência de parada),tool_use(chamada de ferramenta).stop_sequence: se a parada foi devido a uma sequência de parada personalizada, exibe o texto correspondente da sequência de parada.usage: estatísticas de uso de tokens, incluindoinput_tokens(número de tokens de entrada) eoutput_tokens(número de tokens de saída).
Prompt do Sistema
A API Claude Messages suporta a definição de prompts do sistema através do camposystem, usado para definir o comportamento, papel e contexto do modelo.
Exemplo Python
system, é possível controlar com precisão o papel e o modo de atuação do Claude.
Resposta em Fluxo
Esta interface também suporta resposta em fluxo, definindo o parâmetrostream como true para obter um efeito de retorno passo a passo, ideal para exibição palavra por palavra em uma página da web.
Exemplo Python
event: e data:. Os tipos de eventos em fluxo incluem:
message_start: início da mensagem, contendo informações básicas da mensagem e nome do modelo.content_block_start: início do bloco de conteúdo.content_block_delta: atualização incremental do bloco de conteúdo, contendo novos trechos de texto gerados.content_block_stop: fim do bloco de conteúdo.message_delta: atualização incremental em nível de mensagem, contendostop_reasone informações finais deusage.message_stop: fim da mensagem.
content_block_delta que incluem o texto gerado passo a passo, e ao concatenar todos os text_delta, é possível obter a resposta completa.
Exemplo em JavaScript
Diálogo em várias rodadas
Se você deseja integrar a funcionalidade de diálogo em várias rodadas, deve alternar as mensagens dos papéisuser e assistant no array messages, incluindo o histórico de conversas anteriores.
Exemplo em Python
messages, Claude pode fornecer respostas precisas com base no contexto.
Modelo de Pensamento Profundo
Claude suporta a funcionalidade de Pensamento Estendido, que permite que o modelo realize raciocínios internos antes de responder, aumentando a precisão no tratamento de questões complexas. Para usar essa funcionalidade, é necessário passar o parâmetrothinking.
Exemplo em Python
content contém dois blocos de conteúdo:
type: "thinking": o processo de pensamento interno do modelo, mostrando os passos de raciocínio.type: "text": o resultado final da resposta.
- Ao usar
thinking,max_tokensdeve ser maior quebudget_tokens, poisbudget_tokensé o orçamento de tokens alocado para o processo de pensamento. - Quanto maior o
budget_tokens, maior será o espaço para o modelo realizar um raciocínio mais profundo, adequado para lidar com questões complexas.
Modelo Visual
Claude suporta entrada multimodal, podendo processar texto e imagens simultaneamente. Na API de Mensagens, você pode usar a capacidade visual definindocontent como um formato de array e incluindo blocos de conteúdo de imagem.
Usando Imagem Codificada em Base64
Usando Imagem por URL
Exemplo de cURL
image/jpeg, image/png, image/gif, image/webp.
Exemplo de resultado retornado:
Chamada de Ferramenta (Tool Use)
A API de Mensagens do Claude suporta nativamente a funcionalidade de chamada de ferramentas, permitindo que o modelo chame suas ferramentas/funções pré-definidas quando necessário.Exemplo em Python
content contendo um bloco de conteúdo do tipo tool_use:
stop_reason é tool_use, indicando que o modelo precisa chamar uma ferramenta. Após receber esse resultado, você deve executar a função da ferramenta e retornar o resultado na forma de tool_result para o modelo:
Diferença em Relação à API de Conclusão de Chat
A Ace Data Cloud oferece dois formatos de API do Claude, e as principais diferenças são as seguintes:| Característica | API de Mensagens (/v1/messages) | API de Conclusão de Chat (/v1/chat/completions) |
|---|---|---|
| Formato | Formato nativo da Anthropic | Formato compatível com OpenAI |
| Prompt do sistema | Campo system independente | Passado através de messages com role: "system" |
| Estrutura de resposta | Array content (suporta vários tipos) | Array choices (contém message) |
| Formato de streaming | Eventos SSE (vários tipos de eventos) | Linhas SSE data |
| Pensamento profundo | Parâmetro thinking nativo | Acionado por nome de modelo especial (como sufixo -thinking) |
| Chamada de ferramentas | tools nativo + input_schema | Formato functions compatível com OpenAI |
| Estatísticas de Token | input_tokens / output_tokens | prompt_tokens / completion_tokens |
Tratamento de Erros
Ao chamar a API, se ocorrer um erro, a API retornará o código de erro e a mensagem correspondente. Por exemplo:400 token_mismatched: Requisição inválida, possivelmente devido a parâmetros ausentes ou inválidos.400 api_not_implemented: Requisição inválida, possivelmente devido a parâmetros ausentes ou inválidos.401 invalid_token: Não autorizado, token de autorização inválido ou ausente.429 too_many_requests: Muitas requisições, você excedeu o limite de taxa.500 api_error: Erro interno do servidor, algo deu errado no servidor.

