vps 监控之 atop+watchdog

之前一段时日 vps 乞丐 经常有CPU 持续100%不断,SSH也连不进
想找一个轻量级可看带进程历史指标的东东,并且是自用VPS,坏了暴力重启即可

atop+watchdog 就适合我场景

深入字节版 atop: 线上系统的性能监控实践

vi /etc/sysconfig/atop

LOGOPTS=""
LOGINTERVAL=60
LOGGENERATIONS=7
LOGPATH=/var/log/atop

systemctl enable atop-rotate.timer

vi /etc/watchdog.conf

max-load-1              = 10
max-load-5              = 1

比如 htop 看见 才 4 小时不到前被重启过


atop 载入历史文件,b , 1200,然后 t 一点点往后看有问题的点位
atop -r /var/log/atop/atop_20240531

感谢分享 !