Firecrawl
OpenClaw 可以通过三种方式使用 Firecrawl:- 作为
web_search提供商 - 作为显式插件工具:
firecrawl_search和firecrawl_scrape - 作为
web_fetch的回退提取器
获取 API key
- 创建一个 Firecrawl 帐户并生成一个 API key。
- 将其存储在配置中或在网关环境中设置
FIRECRAWL_API_KEY。
配置 Firecrawl 搜索
- 在新手引导或
openclaw configure --section web中选择 Firecrawl 会自动启用捆绑的 Firecrawl 插件。 - 结合 Firecrawl 的
web_search支持query和count。 - 若要使用 Firecrawl 特定的控制(如
sources、categories或结果抓取),请使用firecrawl_search。
配置 Firecrawl 抓取 + web_fetch 回退
- 除非显式设置为
false,否则firecrawl.enabled默认为true。 - 仅在可使用 API key 时(
tools.web.fetch.firecrawl.apiKey或FIRECRAWL_API_KEY),才会运行 Firecrawl 回退尝试。 maxAgeMs控制缓存结果的最长保留时间(毫秒)。默认为 2 天。
firecrawl_scrape 重用相同的 tools.web.fetch.firecrawl.* 设置和 环境变量(环境变量)。
Firecrawl 插件工具
firecrawl_search
当您需要 Firecrawl 特定的搜索控制而不是通用的 web_search 时,请使用此项。
核心参数:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
将其用于纯 web_fetch 较弱的 JS 重型或受机器人保护的页面。
核心参数:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
隐身 / 机器人规避
Firecrawl 公开了一个用于规避机器人的 代理模式 参数(basic、stealth 或 auto)。
OpenClaw 始终对 Firecrawl 请求使用 proxy: "auto" 加上 storeInCache: true。
如果省略代理,Firecrawl 默认为 auto。如果基本尝试失败,auto 将使用隐身代理重试,这可能会比仅使用基本抓取消耗更多积分。
web_fetch 如何使用 Firecrawl
web_fetch 提取顺序:
- Readability(本地)
- Firecrawl(如果已配置)
- 基本 HTML 清理(最后的后备方案)
相关
- Web Search overview — 所有提供商和自动检测
- Web Fetch — 具有 Firecrawl 后备支持的 web_fetch 工具
- Tavily — 搜索和提取工具
本页面源自 openclaw/openclaw,由 BeaversLab 翻译,遵循 MIT 协议 发布。