Agent Feedback Loops
X Article · Petra Donka · 2026-05-14

Agents Need Feedback Loops, Not Perfect Prompts

这篇文章真正讲的不是“怎样写一个更好的 prompt”,而是怎样把团队日常判断变成 agent 可吸收、可审查、可回滚的长期记忆。

Source Map

读了哪些材料,怎么确认

原帖本身只有一个短链。短链解析到 X Article;回复区又给出作者公开的 GitHub Gist,里面是 Buzz 的 `reply-learning` skill。

X status

`opencli twitter thread` 读取到原 status:`petradonka/status/2054897826149101588`,正文是短链;同一线程包含作者回复、读者追问和 gist 链接。

795 likes75 retweets2026-05-14

X Article

短链 `t.co/kI2B1isN4N` 解析到 X Article;`opencli twitter article` 通过 status ID 成功抽取完整正文,标题为《Agents Need Feedback Loops, Not Perfect Prompts》。

一手长文OpenCLI extracted

GitHub Gist

作者在回复中公开 `reply-learning` skill gist。raw 内容确认其目标是从反馈和例子中提取 durable patterns,并更新 `draft-warp-reply` skill。

reply-learningpublic gist
注意:Grok-Search 对这次查询没有返回可用内容,因此本文使用 OpenCLI 对 X 的一手提取、Tavily 对 Gist/LinkedIn 镜像的检索,以及 GitHub raw gist 内容作为依据。
Problem

问题不是 prompt 不够好,而是任务本身会变

作者的切入点很准确:很多 agent demo 能做到“差不多能用”,但无法达到“可以信任地放进生产工作流”。这个 gap 不是再加十条规则就能补上的。

代码型 agent 有外部检查

写代码时,agent 可以跑测试、build、浏览器检查和命令输出。失败信号相对明确,重试也便宜。

判断型 agent 没有即时真值

社媒回复、客户沟通、招聘消息、文档和 code review 评论都要求“知道什么时候说、说多少、何时不说”。不能先公开乱回一批,再用用户反应当 reward。

真正的问题从“怎样写完美 prompt”变成“怎样构建一个上线后还能继续从团队学习的 agent”。

对原文主旨的压缩概括
System

Buzz 的工作流:人仍负责最终判断,agent 负责筛选和起草

Buzz 是 Warp Developer Experience 团队用于处理社区提及的 agent。它不是替人公开发言,而是把分散平台上的 mentions 收敛到 Slack,并给出 triage 和 draft。

1. 监听Twitter、LinkedIn、Reddit、Bluesky 等渠道出现 Warp mention。
2. 判断决定 reply、like、note、skip,核心是“是否值得团队注意”。
3. 起草如果需要回复,生成 draft 并贴到 Slack,让团队不用从空白开始。
4. 人审最终公开回复仍由人写或确认,保留品牌和关系判断。
5. 学习每天收集 emoji、thread note、实际动作,提出 skill 更新 PR。
这里的关键设计是“最小额外反馈成本”:团队不需要进入一个专门标注系统,只需要在本来就使用的 Slack 里点 emoji 或补充 thread note。
Mechanism

从规则堆叠到原则学习:这一步最重要

Buzz 的第一个失败模式很典型:prompt 里列满 case-by-case 规则,结果越来越长、越来越机器人、越来越脆。作者的修正是把规则压缩成可迁移原则,再给 agent 一个学习这些原则的方法。

层级写法问题/价值例子
具体规则 遇到 A 就说 B;遇到 C 就不要说 D。 容易过拟合单个场景,prompt 变长,冲突规则越来越多。 “永远不要在第一句提价格。”
可迁移原则 描述判断方式,而不是固定动作。 能跨场景使用,适合判断密集型任务。 “用户在发泄时,先共情,不要先 pitch。”
学习原则的方法 从反馈中问 why,抽象 pattern,检查现有 skill,编辑/删除/新增。 防止 agent 把每次反馈机械地变成一个新规则。 `reply-learning` skill 的七步流程。
1

先定位具体偏差

例如 draft 太像营销话术、编造了产品上下文、接受了竞争对手的 framing。这里不急着改 prompt,先写清楚错在哪里。

2

追问底层原因

`reply-learning` gist 强调:具体失败只是症状。比如“编造已知 issue”背后可能是 agent 倾向于用 plausible filler 填补知识缺口。

3

判断是否可泛化

作者给了一个很实用的 test:这个 principle 能不能改变 3 个以上不同场景里的行为?如果不能,它很可能只是规则。

4

检查已有原则

正确动作不一定是新增。可能是 sharpen existing wording、删除误导性原则、合并重叠原则,避免 skill 持续膨胀。

5

以 PR 形式提交

学习 agent 不直接改生产行为,而是提交 skill diff,列出它 review 了哪些反馈、想改什么原则、为什么改。

Human correction / actual action
        ↓
Compare with agent recommendation
        ↓
Find failure cause or successful pattern
        ↓
Generalize into principle
        ↓
Edit skill file as code
        ↓
Open PR for human review
Evidence

文章给出的效果证据是产品经验型,不是 benchmark 型

这篇不是论文,没有对照实验、随机分组或标准指标。它的证据来自 Warp 的生产使用描述和系统形态,因此应该按工程 case study 理解。

规模

文章称 Warp 社区每周产生超过一千条 mentions;Buzz 现在每月处理数千条 mentions。

筛选价值

约一半 mentions 不需要回复,因此 triage 本身就能减少团队注意力消耗。

系统复杂度

Buzz 约有 15 个 skills,覆盖 triage、drafting、learning、analytics、reporting,并由 Oz 负责管理和编排。

可验证的强点

闭环设计具体:Slack 反馈、每日归纳、skill 文件 diff、PR review、版本历史和 rollback。这些都是工程上能落地的约束。

未证明的部分

文章没有量化 reply 质量提升、误判率变化、人工节省时间、PR 被接受比例,也没有比较“原则学习”与“人工手写 prompt 迭代”的效果差异。

最有价值的证据

不是“Buzz 很强”,而是作者明确暴露了失败模式:反馈若不能泛化,会退化成 brittle exceptions。这个观察对很多 agent 系统都成立。

Limits

这个方案的边界:反馈质量成为新的瓶颈

它把系统瓶颈从“写 prompt 的人”移动到“团队能否持续产生高信号反馈”。这不是缺点,但需要承认。

1. 反馈必须高信号

如果团队 emoji 反应随意、thread note 不一致,agent 会把噪声也制度化。borancakir 在回复区也指出,loop 会 compound 周围的 supervision。

2. skill 需要保持短

Gist 明确说每一行都要 justify its context window cost,`draft-warp-reply` 最好保持在约 200 行以下。否则原则也会变成另一种规则泥潭。

3. 需要 review 和 rollback

如果 agent 可以无审查地改自己的生产 prompt,就是危险的自强化系统。文章的安全性来自“PR 而不是 silent write”。

4. 适合判断任务,不等于适合所有任务

对有明确自动验证的任务,测试和环境反馈仍然更直接。这个方案最适合外部 reward 慢、贵、噪声大的任务。

Insight

真正的新意:把 taste 变成版本化资产

这篇文章最值得带走的不是“给 agent 加反馈 loop”这个口号,而是一个更具体的架构判断:agent 的长期能力不只来自模型参数,也来自团队把判断沉淀成可维护 skill 的速度。

很多团队把 prompt 当“配置文本”,所以 prompt 一旦变长就不可维护。Warp 这个案例把 prompt/skill 当“生产代码”:有单一职责、有 review、有 diff、有回滚、有上下文成本预算。这才是它能持续迭代的关键。
常见做法这篇文章建议的做法我的判断
不断调主 prompt把任务拆成 triage、drafting、learning、analytics 等 skills更符合单一职责,也更容易 review。
人工批注专门标注集把 Slack 中已经发生的团队动作当低摩擦信号更现实,但要防止低质量反馈进入系统。
错误来了就加规则从错误中提取可迁移原则,必要时删除旧原则这是避免 prompt rot 的核心。
agent 自己改自己agent 提 PR,人类 review 后合入保留 self-improvement 的效率,同时避免失控。
如果把这个方案搬到别的团队,第一步不是写 learning agent,而是先定义:哪些人类动作是可信反馈?哪些反馈只能作为候选,不得直接进入 skill?没有这个边界,反馈 loop 只会把组织里的噪声自动化。