之前一段时日 vps 乞丐 经常有CPU 持续100%不断,SSH也连不进
想找一个轻量级可看带进程历史指标的东东,并且是自用VPS,坏了暴力重启即可
atop+watchdog 就适合我场景
深入字节版 atop: 线上系统的性能监控实践
vi /etc/sysconfig/atop
LOGOPTS=""
LOGINTERVAL=60
LOGGENERATIONS=7
LOGPATH=/var/log/atop
systemctl enable atop-rotate.timer
vi /etc/watchdog.conf
max-load-1 = 10
max-load-5 = 1
比如 htop 看见 才 4 小时不到前被重启过
atop 载入历史文件,b , 1200,然后 t 一点点往后看有问题的点位
atop -r /var/log/atop/atop_20240531