Data
Data 用于获取特定站点或特定页面类型的结构化数据。
按预定义的数据接口抓取目标站点内容
通过定制化数据接口获取目标数据
使用统一的
/data入口访问不同专用爬虫按具体 API 查看参数说明和响应字段
如果你要先确认当前已经整理了哪些数据接口,查看 支持的数据 API
如果你已经明确目标接口,可以直接进入左侧的 API 列表
请求入口
Data 模块统一使用 /data 接口。
/data 接口
使用方式
curl -s -X POST 'https://run.xcrawl.com/v1/data' \
-H 'Authorization: Bearer $XCRAWL_API_KEY'\
-H 'Content-Type: application/json' \
-d '{
"engine": "amazon_bestseller",
"location": "US",
"category_list": ["111111"],
"start_page": 1,
"pages": 1
}'响应示例
{
"result": [
{
"content": {
"url": "https://www.amazon.com/Best-Sellers/zgbs/x/1077068/?pg=1",
"page": 1,
"pages": 2,
"results": [
{
"pos": 1,
"asin": "B098WVKF19",
"price_str": "US$129.99",
"title": "REDTIGER 行车记录仪前置后置,4K / 2.5K 全高清行车记录仪...",
"rating": 4.5,
"ratings_count": 100
},
{
"_note": "其余结果已省略"
}
]
}
}
]
}使用说明
engine字段用于指定具体的数据接口- 不同 API 的必填参数和响应字段各不相同
- 具体字段说明请进入对应 API 页面查看
