Hermes自主决策机制:Agent什么时候该自己做,什么时候该问人

Published on: 2026-05-17

Hermes的自主决策机制:Agent什么时候该自己做,什么时候该问人

hermes illustration

我见过很多Agent翻车的场景,归结起来就两类:该问的时候不问,自己瞎做;不该问的时候问了八百遍,用户烦了直接关掉。这两个问题本质上是同一个——Agent不知道什么时候该自主决策,什么时候该停下来请示。

Hermes设计了一套决策阈值机制,大体逻辑是:Agent拿到任务后先评估三个维度——确定性、风险度、不可逆性。确定性高且风险低的操作,直接做;确定性低或者风险中等的,先查知识库,知识库没有就问用户;风险高或者不可逆的操作,无条件停下来请求确认。

举几个具体场景。确定性高的:发一条固定格式的通知到群里、查询今天的日程、把昨天的数据导出成CSV——这类任务Agent直接做不需要问人,结果是确定性的,错了也容易撤回。确定性低但风险低的:写一封邮件的草稿、生成一份报告的大纲、给产品起几个备选名字——这类先做,用户确认方向后再展开。

最麻烦的是不可逆操作。典型的:删除文件、发送带附件的邮件、修改数据库记录、点击"确认下单"这类物理操作。Hermes在遇到这类操作时会强制触发确认流程——不是弹个框问"你确定吗",而是把决策依据和可能的后果一并呈现给用户。比如:"我要删除文件夹A,里面有三个文件,最后修改时间分别是5月3日、5月7日、5月12日。如果误删我可以帮你恢复,但需要你手动确认目标文件。是否继续?"

这套机制运行三个月下来,我们观察到两个明显变化。第一,用户对Agent的信任度在上升——不是因为Agent做的多了,是因为Agent问对了问题。之前有些用户说"你这Agent啥都不干,我让你做个啥都要问",现在变成"这Agent挺靠谱,该自己处理的自己处理了,问我的时候都是真需要确认的"。第二,人工干预的频率在下降——不是因为Agent不需要人管了,是因为每次人工介入都变成了训练数据,Agent下次遇到类似情况会处理得更好。

说白了,Agent的自主性不是越强越好,也不是越保守越好——是在正确的时间做正确的事。这套阈值机制不是一次性调好就完事的,是需要根据实际使用数据持续优化的。头一个月觉得"问太多"的场景,可能第三个月就变成"问少了",需要动态调整。

© KAIHE AI - Agent Computer Specialist