메인 콘텐츠로 건너뛰기
POST https://api.acedata.cloud/webextrator/extract /webextrator/render를 기반으로 콘텐츠 추출을 수행합니다. render 인터페이스의 모든 매개변수 외에 추가로 다음을 지원합니다:
필드타입필수기본값설명
expected_typestringmarkdown기대하는 추출 결과: markdown / article / text / links / structured
enable_llmbooleanfalseLLM 후처리 활성화 (article / structured에 적합)
instructionstring-LLM 추출 지시문, 예: “상품 제목, 가격, 사양 추출”

동기 응답

{
  "success": true,
  "task_id": "550e8400-...",
  "trace_id": "550e8400-...",
  "started_at": "2026-05-02T10:30:00.123Z",
  "finished_at": "2026-05-02T10:30:08.789Z",
  "elapsed": 8.666,
  "data": {
    "kind": "extract",
    "expected_type": "article",
    "url": "https://example.com/post/1",
    "title": "예시 문서",
    "author": "장삼",
    "published_at": "2026-05-01",
    "content": "# 예시 문서\n\n본문 ...",
    "summary": "이 문서에서는 ..."
  }
}
비동기 모드, 오류 코드, 과금 규칙은 /webextrator/render와 완전히 동일합니다.

예시: 기사 본문 추출 (LLM 활성화)

curl -X POST https://api.acedata.cloud/webextrator/extract \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com/news/1",
    "expected_type": "article",
    "enable_llm": true
  }'

예시: 비동기 + 사용자 정의 구조화 추출

curl -X POST https://api.acedata.cloud/webextrator/extract \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://shop.example.com/item/123",
    "expected_type": "structured",
    "enable_llm": true,
    "instruction": "상품 제목, 가격, 재고, 3장 메인 이미지 URL 추출",
    "callback_url": "https://your-domain.com/wbx-callback"
  }'