服务器关机记录怎么查?三招教你精准定位,如何快速查找服务器关机记录?三步法助你精准定位
你的服务器突然关机找不到原因?上个月我朋友的电商平台半夜宕机,损失十几万订单,最后发现是保洁阿姨误拔电源...今天就手把手教你查关机记录,保准你比福尔摩斯还专业!
第一招:Windows服务器查档指南
按下Win+R输入「eventvwr.msc」打开事件查看器,重点看这三个日志:
- 系统日志:找事件ID为6006(正常关机)和6008(异常关机)
- 安全日志:筛选事件ID为4647(用户注销导致关机)
- 应用程序日志:看有没有杀毒软件触发的关机动作
举个真实案例:某公司财务服务器每天凌晨3点准时关机,查日志发现是备份软件设置了自动关机,改个设置就解决了!
第二招:Linux服务器追踪大法
直接上终端输入这些命令:
last -x | grep shutdown
查看所有关机记录journalctl --list-boots
显示每次启动的详细日志cat /var/log/messages | grep -i shutdown
搜索关键关机信息
重点参数解析:
命令 | 作用 | 常用参数 |
---|---|---|
who -b | 显示最后一次启动时间 | 无 |
uptime | 查看当前运行时长 | -p(人性化显示) |
dmesg | 查看内核日志 | -T(显示时间戳) |
血泪教训:某运维误删/var/log目录,三个月的关机记录全没了,现在他们改用logrotate每天自动备份!
第三招:云服务器隐藏日志
以阿里云为例:
- 进入ECS控制台→实例详情→运维与监控
- 查看「系统事件」里的「实例状态变化」
- 导出「操作审计」日志筛选StopInstance事件
对比三大云厂商的日志保留时长:
厂商 | 操作日志保留 | 系统事件保留 | 监控数据保留 |
---|---|---|---|
阿里云 | 180天 | 90天 | 31天 |
AWS | 90天 | 30天 | 15天 |
腾讯云 | 365天 | 180天 | 60天 |
重要提醒:某用户因没及时导出日志,30天后无法追查关机原因,现在他们用SLS日志服务实时同步!
关机原因分析手册
遇到关机别慌,按这个顺序排查:
- 电源问题:查UPS日志和市电波动记录
- 人为操作:对照操作审计日志和摄像头记录
- 系统故障:检查/var/crash下的内核转储文件
- 硬件故障:查看IPMI的SEL日志(超微主板用ipmitool sel list)
经典案例:某机房服务器每周五下午准时关机,最后发现是清洁工用吸尘器导致电路过载!
个人血泪经验
在运维圈混了十年,总结三条铁律:
- 重要服务器必须配IPMI卡,能查到断电精确到毫秒
- 日志文件设置自动归档,用「find /var/log -name "*.log" -mtime +30 -delete」定期清理
- 最最最重要的——给服务器机柜上把锁!我就见过市场部同事把服务器当普通电脑关机的
最新发现:戴尔iDRAC日志能记录到0.5V的电压波动,比市面UPS检测还灵敏!下回服务器再莫名关机,知道该查哪里了吧?