Web Fetch
web_fetch 工具执行普通的 HTTP GET 请求并提取可读内容
(HTML 转 markdown 或文本)。它不执行 JavaScript。
对于重度依赖 JS 的网站或登录保护的页面,请改用
Web Browser。
快速开始
web_fetch 默认已启用 — 无需配置。Agent 可以
立即调用它:
工具参数
| 参数 | 类型 | 描述 |
|---|---|---|
url | string | 要获取的 URL(必填,仅限 http/https) |
extractMode | string | "markdown"(默认)或 "text" |
maxChars | number | 将输出截断为指定字符数 |
工作原理
配置
Firecrawl fallback
如果 Readability 提取失败,web_fetch 可以回退到
Firecrawl 以进行反爬虫并更好地提取内容:
tools.web.fetch.firecrawl.apiKey 支持 SecretRef 对象。
如果启用了 Firecrawl 且其 SecretRef 未解析且没有
FIRECRAWL_API_KEY 环境变量备用方案,
网关启动将快速失败。限制和安全
maxChars被限制为tools.web.fetch.maxCharsCap- 响应体在解析前被限制为
maxResponseBytes;超大的 响应将被截断并显示警告 - 私有/内部主机名被阻止
- 重定向会受到
maxRedirects的检查和限制 web_fetch是尽力而为的 —— 某些站点需要 Web Browser
工具配置文件
如果您使用工具配置文件或允许列表,请添加web_fetch 或 group:web:
相关
- Web Search — 使用多个提供商搜索网络
- Web Browser — 针对 JavaScript 重型网站的完整浏览器自动化
- Firecrawl — Firecrawl 搜索和抓取工具
本页面源自 openclaw/openclaw,由 BeaversLab 翻译,遵循 MIT 协议 发布。