Ollama
Ollama 是一个本地 LLM 运行时,可让您轻松在机器上运行开源模型。OpenClaw 与 Ollama 的原生 API (/api/chat) 集成,支持流式传输和 Ollama 调用,并且当您选择加入 OLLAMA_API_KEY(或身份验证配置文件)且未定义显式 models.providers.ollama 条目时,可以自动发现本地 Ollama 模型。
快速入门
新手引导(推荐)
设置 Ollama 最快的方法是通过新手引导:- 询问可访问您的实例的 Ollama 基础 URL(默认为
http://127.0.0.1:11434)。 - 让您选择 Cloud + Local(云端模型和本地模型)或 Local(仅本地模型)。
- 如果您选择 Cloud + Local 且尚未登录 ollama.com,则打开浏览器登录流程。
- 发现可用模型并建议默认模型。
- 如果所选模型在本地不可用,则自动拉取该模型。
手动设置
- 安装 Ollama:https://ollama.com/download
- 如果需要进行本地推理,请拉取一个本地模型:
- 如果您还需要云端模型,请登录:
- 运行新手引导并选择
Ollama:
Local:仅本地模型Cloud + Local:本地模型以及云端模型- Cloud models such as
kimi-k2.5:cloud,minimax-m2.5:cloud, andglm-5:clouddo not require a localollama pull
- 本地默认值:
glm-4.7-flash - 云默认值:
kimi-k2.5:cloud,minimax-m2.5:cloud,glm-5:cloud
- 如果您更喜欢手动设置,请直接为 Ollama 启用 OpenClaw(任何值均可;Ollama 不需要真实的密钥):
- 检查或切换模型:
- 或在配置中设置默认值:
模型发现(隐式提供商)
当您设置OLLAMA_API_KEY(或身份验证配置文件)并且不定义 models.providers.ollama 时,OpenClaw 会从位于 http://127.0.0.1:11434 的本地 Ollama 实例中发现模型:
- 查询
/api/tags - 尽力使用
/api/show查找来读取contextWindow(如果可用) - 使用模型名称启发式方法(
r1、reasoning、think)标记reasoning - 将
maxTokens设置为 Ollama 使用的默认 OpenClaw 最大令牌上限 - 将所有成本设置为
0
models.providers.ollama,则会跳过自动发现,您必须手动定义模型(见下文)。
配置
基本设置(隐式发现)
启用 Ollama 的最简单方法是通过环境变量:显式设置(手动模型)
在以下情况下使用显式配置:- Ollama 运行在其他主机/端口上。
- 您想要强制特定的上下文窗口或模型列表。
- 您想要完全手动的模型定义。
OLLAMA_API_KEY,则可以在提供商条目中省略 apiKey,OpenClaw 将自动填充它以进行可用性检查。
自定义基础 URL(显式配置)
如果 Ollama 在不同的主机或端口上运行(显式配置会禁用自动发现,因此请手动定义模型):模型选择
配置完成后,您的所有 Ollama 模型均可用:云端模型
云端模型允许您在本地模型旁边运行云端托管的模型(例如kimi-k2.5:cloud、minimax-m2.5:cloud、glm-5:cloud)。
要使用云模型,请在设置过程中选择 Cloud + Local 模式。向导会检查您是否已登录,并在需要时打开浏览器登录流程。如果无法验证身份,向导将回退到本地模型默认设置。
您也可以直接在 ollama.com/signin 登录。
高级
推理模型
OpenClaw 默认将名称如deepseek-r1、reasoning 或 think 的模型视为具备推理能力:
模型成本
Ollama 是免费的并且在本地运行,因此所有模型成本均设为 $0。流式传输配置
OpenClaw 的 Ollama 集成默认使用 原生 Ollama API (/api/chat),它完全支持同时进行流式传输和工具调用。无需特殊配置。
旧版 OpenAI 兼容模式
如果您需要改用 OpenAI 兼容的端点(例如,在仅支持 OpenAI 格式的代理后面),请显式设置api: "openai-completions":
params: { streaming: false }。
当 api: "openai-completions" 与 Ollama 一起使用时,OpenClaw 默认会注入 options.num_ctx,以防止 Ollama 默默回退到 4096 的上下文窗口。如果您的代理/上游拒绝未知的 options 字段,请禁用此行为:
上下文窗口
对于自动发现的模型,OpenClaw 优先使用 Ollama 报告的上下文窗口(如果可用),否则回退到 OpenClaw 默认使用的 Ollama 上下文窗口。您可以在显式提供商配置中覆盖contextWindow 和 maxTokens。
故障排除
未检测到 Ollama
请确保 Ollama 正在运行,并且您设置了OLLAMA_API_KEY(或身份验证配置文件),并且您没有定义显式的 models.providers.ollama 条目:
没有可用的模型
如果未列出您的模型,请执行以下操作之一:- 在本地拉取模型,或
- 在
models.providers.ollama中显式定义模型。
连接被拒绝
检查 Ollama 是否在正确的端口上运行:另请参阅
本页面源自 openclaw/openclaw,由 BeaversLab 翻译,遵循 MIT 协议 发布。