纯用 Claude Code 搓了个对接飞书自动修告警的 Agent

FLM210 2026-06-28 17:52 1

功能很简单，就是把它拉到飞书告警群里。它看到报警后，会自动调脚本查指标或者日志，然后在群里推
个卡片。卡片上会写清楚它发现了什么问题，以及它打算跑什么命令，只要觉得没毛病，点一下确认卡片，会自动就把问题处理了，然后把结果直接回复在原来的告警下面。

目前刚弄了个 beta 版，功能还不够完善，感兴趣的老哥可以交流一下

代码仓库： https://github.com/FLM210/ai-fixer
文档地址： https://FLM210.github.io/ai-fixer/

最新回复 (2)

hxndg 06-28 23:43

1楼

纯讨论哈。
从我原先管 CI 的经验来看，agent 应该做的是无害的探测直接聚合，然后给出一些指标
严重的基本第一时间就得人处理，助手最好是聚合信息。

比方说 agent 发现最近大量的 arm 构建失败，就检查错误是不是一个地方，是不是一台机器，然后给出建议。如果是一台机器，比方说构建 30 次，然后 30 次都是 guangzhou-xavier-03 机器失败，给出驱逐的建议。最后的驱逐还是得交给人处理。
FLM210 楼主 06-29 13:20

2楼

@hxndg 我这个设想的的是 SRE 场景的 agent ，不光局限在 cicd 阶段，内置了查监控查日志的功能会真正去处理业务运行过程中的问题

* 帖子来源V2EX

附近帖子