Hermes Agent 工具系统

工具(Tools)让 Hermes 从"会聊天"变成"会做事"。本章介绍内置工具、如何启用、以及命令在哪里执行。


工具是什么?

工具是 Hermes 可以调用的函数:搜索网页、读写文件、执行代码、生成图片……。模型在推理时决定调用哪个工具、传什么参数,Hermes 在选定的执行后端中运行它,再把结果回灌给模型。

模型推理 → "我需要搜索一下" → 调用 web_search 工具
        → 执行后端运行 → 返回结果 → 模型继续推理 → 给出答案

40+ 内置工具

Hermes 内置 40 余个工具,覆盖常见任务类别:

类别能力示例
Web网页搜索、浏览、截图
文件读取、写入、列目录、执行
代码运行 Python、Bash、Git 操作
时间定时任务、设置提醒
图像图像生成、分析、OCR
语音文本转语音(TTS)、语音转写
浏览器云浏览器控制(搜索/导航/视觉分析)
计算数学、数据处理

此外还内置了 MLOps、GitHub、绘图、笔记等场景化能力(部分以技能形式提供,见 技能使用)。


启用与配置工具

交互式配置:

hermes tools

它会列出全部工具,让你逐个开启/关闭。配置也会写入 config.yaml,可手动编辑工具开关与所需的 API Key。

最小权限原则:只开启你真正需要的工具。工具越多,潜在的误操作面越大。


执行后端:命令在哪里跑

工具中的命令并非只能在本机裸跑。Hermes 提供 6 种执行后端,在便捷与隔离之间灵活取舍:

后端隔离性适用
Local个人本机、最快
Docker隔离风险、可复现
SSH操作远程服务器
SingularityHPC 集群
Modal高(无服务器,空闲休眠)弹性省钱
Daytona高(无服务器,持久化)持久工作区

把高风险工具放进 Docker / 远程沙箱,是 Hermes 安全治理的核心手段之一。


工具网关(Nous Portal)

如果使用 Nous Portal,可在同一订阅下获得官方托管的工具网关,开箱即用:

  • Web 搜索
  • 图像生成
  • 文本转语音(TTS)
  • 云浏览器

无需自己逐个申请第三方 API Key,适合快速上手。


通过技能与脚本扩展

Hermes 的能力不止于内置工具:

  • 技能(Skills):把多步流程封装成可复用单元,甚至能自动生成,见 技能使用
  • Python 脚本调用工具:脚本可通过 RPC 调用工具,把多步流水线压缩成"零上下文"的一次调用
  • MCP:通过 Model Context Protocol 接入外部工具生态(详见官方文档的 MCP 章节)

实践建议

  • 先用 hermes tools 关掉一切非必需工具,按需逐步开启
  • 涉及 rm、网络写操作等高风险动作时,使用 Docker / SSH 后端 + 命令审批
  • 频繁重复的多步操作 → 沉淀为技能,减少 token 与出错率
  • 需要外部系统能力 → 优先看是否有现成 MCP / 社区技能

下一步