产出结构化三段:{根因猜测 + 影响面 + 建议 owner},写回工单;
啃不动的,明确标 「需人工」。
→ 能被机器判断"做没做完",不是"做得好不好"。
① 未处理队列清空 → 停;
② 升级(需人工)数 > 5 → 停下喊人;
③ 单条试 3 次没进展 → 标人工、跳过。
[扫描] 待处理分组 312 → 去重后 28 组(便宜模型干掉 284 条噪音) [分诊] 28 组逐条产出 {根因 + 影响面 + owner},写回工单 [升级] 🔴 支付回调失败 ×3 → 影响面=下单链路 → 建议 owner: @pay-team → 标"需人工" [退出] 队列清空,升级 5 条 ≤ 阈值 → 正常结束,用时 19m
第一版目标写成「让告警更清晰」→ 它无限改措辞、烧钱不收敛。
改成可验证的"结构化三段"才停下来。
让它顺手调去重阈值 → 它在 0.7~0.72 来回挪几十圈。
干脆把"调参"拿出循环,交给人定。
它写的去重规则越来越玄,没人看得懂。
加一条硬要求:每条规则必须留一句人能读的理由。