🛠️

最后一步 · 光说不练假把式

拿一个真问题，
从头到尾给你设计一条循环

前面给了你零件（三原语 + 护栏）和判断（两个叙事、坑在哪）。
这一步，把它们组装成一条能干活的循环——这才叫「造循环」。

案例线上报错日志，每天早上的分诊地狱

P2 · 遇到什么问题 · 先把痛说具体

每天早上，300 条报错把两个人钉在椅子上

这就是一把典型的「椅子」：高频、重复、要人盯、还容易漏。——它几乎是为循环量身定制的。

P3 · 设计第一步 · 反直觉

不是先写 prompt，是先想「它什么时候算干完、该停」

🎯 可验证目标（每条报错）

产出结构化三段：{根因猜测 + 影响面 + 建议 owner}，写回工单；
啃不动的，明确标 「需人工」。
→ 能被机器判断"做没做完"，不是"做得好不好"。

🛑 退出条件（整条循环）

① 未处理队列清空 → 停；
② 升级（需人工）数 > 5 → 停下喊人；
③ 单条试 3 次没进展 → 标人工、跳过。

回扣 STEP 2 的隐藏零件：目标可验证 = 循环停得住。先把"何时停"钉死，后面写 prompt 才不会跑飞。

P4 · 把问题「翻译」成三原语 + 护栏

填完这张表，循环就成型了

① 触发器

每小时 cron 跑一次＋新错误分组的 webhook 钩子立即触发——你不在场也会自己起。

② 循环体

取一条未处理分组 → 拉最近 trace/堆栈 → 查近 7 天是否同类（去重）→ 给根因+影响面+owner → 写回工单。

③ 退出条件

队列空 / 升级数 > 5 / 单条 3 次无进展 → 停或跳过，绝不空转。

④ 护栏

只读 + 只建议，绝不自动关单、绝不改代码；成本路由：便宜模型做去重分类，贵模型只啃那几条硬骨头。

注意顺序：问题不是"喂给 AI 一段话"，而是逐格翻译成触发器/循环体/退出/护栏——这就是「造循环」的真实动作。

P5 · 跑出来什么样 · 那把椅子空了

20 分钟跑完，人只看「需人工」那 5 条

error-triage.loop — 09:00 cron run

[扫描] 待处理分组 312 → 去重后 28 组（便宜模型干掉 284 条噪音）
[分诊] 28 组逐条产出 {根因 + 影响面 + owner}，写回工单
[升级] 🔴 支付回调失败 ×3 → 影响面=下单链路 → 建议 owner: @pay-team → 标"需人工"
[退出] 队列清空，升级 5 条 ≤ 阈值 → 正常结束，用时 19m

❌ 改造前

2 人 × 4h

每天上午全搭进去，🔴 真问题仍偶尔漏

✅ 改造后

0 人 × 19min

人 9:30 只看 5 条"需人工"，其余已带根因待复核

P6 · 别只看光鲜 · 我在这条循环上踩的坑

每个坑，都对应前面讲过的一个警告

① Loopmaxxing

第一版目标写成「让告警更清晰」→ 它无限改措辞、烧钱不收敛。
改成可验证的"结构化三段"才停下来。

② 保守震荡

让它顺手调去重阈值 → 它在 0.7~0.72 来回挪几十圈。
干脆把"调参"拿出循环，交给人定。

③ 理解债

它写的去重规则越来越玄，没人看得懂。
加一条硬要求：每条规则必须留一句人能读的理由。

你数数就懂了：让它「跑」只花了一下午；这三个坑、那套退出条件，才是真正吃掉 90% 精力的地方——劲都在「让它停对」。

P7 · 把这套搬回你自己的活 · 周一就能做

你的第一条循环，照这 5 步搭

1

挑一把"椅子" ——高频、重复、要人盯、目标可验证的封闭任务（报错分诊 / PR 审查 / CI 自愈 / 对账）。

2

先定目标和退出 ——写下"产出什么算做完""什么时候必须停"，再去写 prompt。

3

四道护栏 ——硬迭代上限、token/成本预算、无进展检测、失败升级给人。缺一道别上生产。

4

状态外置 + 只读起步 ——worktree 隔离、记忆放磁盘；第一版只建议不动手，跑稳了再放权。

5

埋点 + 成本路由 ——接 trace 让它能查自己；便宜模型筛、贵模型啃，省 60–80%。

给创业者一句话：别做 loop，做 loop 的护栏和仪表盘——卖循环会饿死，卖"让循环停得对、查得清"的基础设施会赢。

🪑→🚶

全场就带走这一句

「Loop 工程真正的难点，
不在让它转，
而在让它停对地方——
这样你才能安心离开那把椅子。」

从「喂提示词」到「造循环」· 2026-06 · 感谢观看 🔁
资料来源：Addy Osmani《Loop Engineering》· Peter Steinberger · Martin Fowler · Arize · Requesty · bdtechtalks 等