ns探针是不是会掉鸡

sssbbb111 2026-07-01 10:29 1

rt。掉了2个。最新版本

最新回复 (3)
  • coldsword 07-01 10:30
    1

    怎么会,网路到主控连通性不好?还是别的问题

  • cnblackhole 07-01 10:32
    2

    没遇到过,但是之前发生过主控没升级导致掉线的情况

    各位用komari的,如果今天发现小鸡掉线了,需要去更新主控端!

  • whqijy 07-01 10:37
    3

    经常发现个别鸡会离线。

    用agent排查总结如下:


    离线原因是 OpenRC 服务脚本不完整。

    这台机器是 Alpine Linux,nodeget-agent 由 OpenRC 管理。它的服务脚本里配置了:

    sh

    pidfile="/var/run/nodeget-agent/nodeget-agent.pid"
    但脚本启动前没有创建 /var/run/nodeget-agent 目录。/var/run 是运行时目录,重启或清理后里面的内容会消失,所以 agent 再启动时写不了 pidfile,报错类似:

    text

    start-stop-daemon: fopen `/var/run/nodeget-agent/nodeget-agent.pid': No such file or directory
    结果 OpenRC 把 nodeget-agent 标记为 crashed,进程没有正常保持运行,控制端就显示离线。

    我已经做的防复发处理是:在 /etc/init.d/nodeget-agent 里加了启动前检查:

    sh

    pid_dir="/var/run/nodeget-agent"

    start_pre() {
    checkpath --directory --owner root:root --mode 0755 "$pid_dir"
    }
    以后每次启动服务时都会自动创建 pid 目录,因此重启机器后不应该再因为这个原因离线。

    后续注意两点:

    如果以后重装或升级 nodeget-agent,安装脚本可能覆盖 /etc/init.d/nodeget-agent,需要确认 start_pre() 还在。
    如果控制端再次显示离线,先查:
    sh

    rc-service nodeget-agent status
    ps | grep -i '[n]odeget'
    如果又是 crashed,优先检查 pid 目录和服务脚本是否被覆盖。`

* 帖子来源NodeSeek
返回