POST https://api.acedata.cloud/webextrator/tasks
WebExtrator 任务查询 API 用于查询历史的 render / extract 任务结果。常见
用法:
- 异步任务完成后回查完整 envelope(除了
callback_url推送或主动轮询)。 - 审计自己提交过什么 —— 任务记录同时存了原始
request与最终response。 - 批量回填 —— 一次按
id或trace_id拉多条。
鉴权
请求参数
请求体是按action 区分的判别式联合,共两种动作:
action: "retrieve" —— 单条查询
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
action | const | ✅ | 固定 "retrieve"。 |
id | string | 二选一 | 任务 ID(出现在每次 render/extract envelope 的 task_id 字段)。 |
trace_id | string | 二选一 | 调用链 ID(envelope 的 trace_id 字段)。 |
id 与 trace_id 二选一传入。
action: "retrieve_batch" —— 批量查询
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
action | const | ✅ | 固定 "retrieve_batch"。 |
ids | string[] | 二选一 | 任务 ID 列表。 |
trace_ids | string[] | 二选一 | 调用链 ID 列表。 |
offset | number | ❌ | 分页偏移(默认 0)。 |
limit | number | ❌ | 单页大小,1–100(默认 50)。 |
ids 与 trace_ids 二选一传入。
单条响应
{ "task": null }(HTTP 200,不是 404)。
批量响应
tasks 中缺失。
示例
按 task_id 查询单条
按 trace_id 查询单条
批量查询
Python (requests) —— 轮询直到完成
Node.js (fetch) —— 收到回调后再拉完整 envelope
错误响应
| HTTP | error.code | 含义 |
|---|---|---|
| 400 | bad_request | 校验失败(缺 action、同时传 id 与 trace_id 等)。 |
| 401 | unauthorized | 缺失或无效的 Authorization: Bearer …。 |
提示与坑
- 能自定义
trace_id就自定义。 在原始 render/extract 请求上传?trace_id=…(QueryString),把它跟你自己的业务 ID(工作流 run id 等)对齐, 之后就能用业务 ID 查任务。没传时服务器自动生成 UUID。 - 保留期 7 天。 更早的任务返回
task: null—— 需要长期归档请自行落库。 - 任务查询免费。 想查多少次就查多少次,原始 render/extract 调用时费用已经付过。
- 优先用异步 + 回调,而不是轮询。 业务允许的话,在原请求里传
callback_url,让平台把 envelope 推送给你,比每 2 秒轮一次更高效。

