dartnode这家有点业余

lotfree 2026-06-29 02:14 1

起因是今天晚上一看小鸡CPU直接干到100%, 我还以为变肉鸡了


结论


这是由 DartNode 宿主管理面 / QEMU 虚拟化环境触发的问题,不是我们自己的代理、Docker 容器或业务流量导致。


更严谨地说:日志证明 DartNode 宿主侧正在通过 qemu-guest-agent 高频调用 guest 内命令 /bin/df 做磁盘采集;该行为在 旧 Debian 12 内核上触发了 kernel soft lockup,并导致 qemu-ga 忙循环吃满 1 核 CPU。


是否属于 DartNode 平台 bug,需要他们结合宿主机日志确认;但从 guest 侧证据看,触发源在宿主管理面,不在我们业务栈。


关键日志证据


宿主侧通过 QEMU Guest Agent 高频执行 df,约每 15-20 秒一次:


2026-06-29T00:52:11+0800 us7-x-dn qemu-ga[655]: info: guest-exec called: "/bin/df -B1 --output=target,size,used,avail"
2026-06-29T00:52:26+0800 us7-x-dn qemu-ga[655]: info: guest-exec called: "/bin/df -B1 --output=target,size,used,avail"
2026-06-29T00:52:42+0800 us7-x-dn qemu-ga[655]: info: guest-exec called: "/bin/df -B1 --output=target,size,used,avail"
...
2026-06-29T01:46:44+0800 us7-x-dn qemu-ga[655]: info: guest-exec called: "/bin/df -B1 --output=target,size,used,avail"

内核明确报告 qemu-ga soft lockup:


2026-06-28T19:57:45+0800 us7-x-dn kernel: watchdog: BUG: soft lockup - CPU#0 stuck for 42s! [qemu-ga:655]
2026-06-28T19:58:42+0800 us7-x-dn kernel: CPU: 0 PID: 655 Comm: qemu-ga Tainted: G L 6.1.0-9-amd64 #1 Debian 6.1.27-1
2026-06-28T19:58:42+0800 us7-x-dn kernel: Hardware name: QEMU Standard PC (i440FX + PIIX, 1996)

同时还有虚拟化磁盘/ATA 异常:


2026-06-28T20:23:56+0800 us7-x-dn kernel: ata1: lost interrupt (Status 0x58)
2026-06-28T20:24:02+0800 us7-x-dn kernel: ata1.00: failed to IDENTIFY (I/O error, err_mask=0x4)
2026-06-28T20:24:44+0800 us7-x-dn kernel: ata1.00: disable device

qemu-ga 停止时 systemd 记录其累计 CPU 时间异常:


2026-06-29T01:47:00+0800 us7-x-dn systemd[1]: qemu-guest-agent.service: Consumed 10h 32min 3.287s CPU time.
最新回复 (10)
  • sudoerx 06-29 02:17
    1

    好家伙 先禁了把

  • Jayson 06-29 02:34
    2

    观察观察

  • zooooooo 06-29 03:33
    3

    建议工单,保持关注,感谢纠错!

  • TGRonin 06-29 04:46
    4

    别说业余了,草台班子吧,之前做活动那段时间成啥样了,这几天也刷到了好几个他们的问题

  • pvgrid 06-29 06:23
    5

    这家过于草台了,活动也做的乱七八糟

  • kaixinya 06-29 07:53
    6

    这个问题存在2年了。隔断时间就死机。失联。面板启动,都不管用。一年用半年。所以都不碰他们的机子了。

  • Mofeng 06-29 08:25
    7

    再看看

  • rubua 06-29 08:29
    8

    这家是能别碰就别碰,再便宜都别碰

    去年搞活动,机器从购买开始就各种硬盘容量,无法启动等等问题,前后折腾和发工单搞了20多天才勉强能用了,他们工单效率而且很低,很多时候秒回你一个后,就把你工单忘记了,导致你还要等三五天甚至是一周才会回复你,而且回复了你也不一定能解决问题,等下一次回复你还要等个三五天

  • LeiiY 06-29 09:25
    9

    @rubua #8 刚注册账号收了一个,2C4G的无法开机,而且硬盘容量只有4G。重置也不行,想着点取消服务,结果退回到余额了不能提现。交学费了算是。

  • lehuoyisheng 06-29 13:14
    10

    dd后管用吗

* 帖子来源NodeSeek
返回