OpenClaw
通过 OpenClaw 集成 XCrawl,可以让你的 Agent 直接获得网页抓取、URL 发现、站点爬取和搜索能力,并以本地 Skills 的方式复用。
当前 XCrawl 已提供 4 个兼容 OpenClaw 的 Skills:
xcrawl-scrapexcrawl-mapxcrawl-crawlxcrawl-search
这些 Skill 定义位于 xcrawl-skills 仓库中,并且已经带有 OpenClaw 可识别的 metadata.openclaw 配置。
对应的 ClawHub 页面:
为什么将 XCrawl 与 OpenClaw 结合使用
- 一个提供方同时覆盖 scrape、map、crawl、search 四类工作流
- Skill 文件以 API 为中心,适合直接用于生产场景
- 统一从本地配置文件读取凭证,不依赖临时 prompt 状态
- 输出尽量贴近 XCrawl 原始 API 响应,便于审计 Agent 的行为
配置方式
1. 前置条件
请先确保你已经具备:
- 已安装 OpenClaw
- 可用的 XCrawl 账号与 API Key
- OpenClaw 所在机器可用的
curl与node - 本地已克隆或下载
xcrawl-skills仓库
如果你还没有 XCrawl 账号,请前往 dash.xcrawl.com 注册并开通免费 1000 积分计划。
2. 配置 XCrawl API Key
所有 XCrawl Skills 都会读取同一个本地配置文件:
mkdir -p ~/.xcrawl
cat > ~/.xcrawl/config.json <<'EOF'
{
"XCRAWL_API_KEY": "<your_api_key>"
}
EOF当前所有 XCrawl OpenClaw Skills 都统一从 ~/.xcrawl/config.json 读取凭证。
3. 将 Skills 安装到 OpenClaw
OpenClaw 默认可以从以下位置加载 Skills:
~/.openclaw/skills<workspace>/skills- 通过
skills.load.extraDirs配置的额外目录
如果你希望将 XCrawl Skills 安装为当前机器共享 Skills,可以这样做:
git clone https://github.com/xcrawl-api/xcrawl-skills.git
mkdir -p ~/.openclaw/skills
cp -R xcrawl-skills/skills/xcrawl-* ~/.openclaw/skills/如果你只希望在当前工作区启用:
git clone https://github.com/xcrawl-api/xcrawl-skills.git
mkdir -p ./skills
cp -R xcrawl-skills/skills/xcrawl-* ./skills/如果你已经在本地维护了这个仓库,也可以直接从 xcrawl-skills/skills/ 里复制或软链接需要的 Skill 目录。
4. 重新加载 OpenClaw
启动一个新的 OpenClaw 会话,或者刷新 gateway,让它重新扫描 Skills 目录。重新加载后,OpenClaw 会自动发现这些 XCrawl Skills。
Skill 列表
| Skill | 用途 |
|---|---|
xcrawl-scrape | 单页面抽取、同步/异步抓取、JSON 提取 |
xcrawl-map | 站点 URL 发现与 Crawl 范围规划 |
xcrawl-crawl | 带边界的站点爬取与异步结果轮询 |
xcrawl-search | 带 location/language 控制的网页搜索 |
Prompt 示例
Scrape
Use xcrawl-scrape to fetch https://example.com in sync mode and return markdown and links.Map
Use xcrawl-map to list only /docs/ URLs under https://docs.xcrawl.com with a limit of 2000.Crawl
Use xcrawl-crawl to start a crawl for https://docs.xcrawl.com/doc/ with max depth 2 and limit 100, then poll until it completes.Search
Use xcrawl-search to search for "XCrawl API" in US English and return the top 10 results.说明
xcrawl-scrape和xcrawl-crawl都包含异步流程,因此 Agent 可能会先创建任务,再轮询结果。- 当前 XCrawl OpenClaw Skills 依赖
curl、node以及本地配置文件~/.xcrawl/config.json。 - 这些 Skills 默认倾向于直接返回 XCrawl 上游响应;如果你希望 Agent 做总结或二次加工,需要在 prompt 中明确说明。
