纯用 Claude Code 搓了个对接飞书自动修告警的 Agent

FLM210 2026-06-28 17:52 1

功能很简单,就是把它拉到飞书告警群里。它看到报警后,会自动调脚本查指标或者日志,然后在群里推
个卡片。卡片上会写清楚它发现了什么问题,以及它打算跑什么命令,只要觉得没毛病,点一下确认卡片,会自动就把问题处理了,然后把结果直接回复在原来的告警下面。


目前刚弄了个 beta 版,功能还不够完善,感兴趣的老哥可以交流一下

代码仓库: https://github.com/FLM210/ai-fixer
文档地址: https://FLM210.github.io/ai-fixer/
最新回复 (2)
  • hxndg 06-28 23:43
    1
    纯讨论哈。
    从我原先管 CI 的经验来看,agent 应该做的是无害的探测直接聚合,然后给出一些指标
    严重的基本第一时间就得人处理,助手最好是聚合信息。

    比方说 agent 发现最近大量的 arm 构建失败,就检查错误是不是一个地方,是不是一台机器,然后给出建议。如果是一台机器,比方说构建 30 次,然后 30 次都是 guangzhou-xavier-03 机器失败,给出驱逐的建议。最后的驱逐还是得交给人处理。
  • FLM210 楼主 06-29 13:20
    2
    @hxndg 我这个设想的的是 SRE 场景的 agent ,不光局限在 cicd 阶段,内置了查监控查日志的功能会真正去处理业务运行过程中的问题
* 帖子来源V2EX
返回