服务器关机记录怎么查?三招教你精准定位,如何快速查找服务器关机记录?三步法助你精准定位

你的服务器突然关机找不到原因?上个月我朋友的电商平台半夜宕机,损失十几万订单,最后发现是保洁阿姨误拔电源...今天就手把手教你查关机记录,保准你比福尔摩斯还专业!


​第一招:Windows服务器查档指南​
按下Win+R输入「eventvwr.msc」打开事件查看器,重点看这三个日志:

  1. ​系统日志​​:找事件ID为6006(正常关机)和6008(异常关机)
  2. ​安全日志​​:筛选事件ID为4647(用户注销导致关机)
  3. ​应用程序日志​​:看有没有杀毒软件触发的关机动作

举个真实案例:某公司财务服务器每天凌晨3点准时关机,查日志发现是备份软件设置了自动关机,改个设置就解决了!


​第二招:Linux服务器追踪大法​
直接上终端输入这些命令:

  • last -x | grep shutdown 查看所有关机记录
  • journalctl --list-boots 显示每次启动的详细日志
  • cat /var/log/messages | grep -i shutdown 搜索关键关机信息

重点参数解析:

​命令​​作用​​常用参数​
who -b显示最后一次启动时间
uptime查看当前运行时长-p(人性化显示)
dmesg查看内核日志-T(显示时间戳)

血泪教训:某运维误删/var/log目录,三个月的关机记录全没了,现在他们改用logrotate每天自动备份!


​第三招:云服务器隐藏日志​
以阿里云为例:

  1. 进入ECS控制台→实例详情→运维与监控
  2. 查看「系统事件」里的「实例状态变化」
  3. 导出「操作审计」日志筛选StopInstance事件

对比三大云厂商的日志保留时长:

​厂商​操作日志保留系统事件保留监控数据保留
阿里云180天90天31天
AWS90天30天15天
腾讯云365天180天60天

重要提醒:某用户因没及时导出日志,30天后无法追查关机原因,现在他们用SLS日志服务实时同步!


​关机原因分析手册​
遇到关机别慌,按这个顺序排查:

  1. ​电源问题​​:查UPS日志和市电波动记录
  2. ​人为操作​​:对照操作审计日志和摄像头记录
  3. ​系统故障​​:检查/var/crash下的内核转储文件
  4. ​硬件故障​​:查看IPMI的SEL日志(超微主板用ipmitool sel list)

经典案例:某机房服务器每周五下午准时关机,最后发现是清洁工用吸尘器导致电路过载!


​个人血泪经验​
在运维圈混了十年,总结三条铁律:

  1. 重要服务器必须配IPMI卡,能查到断电精确到毫秒
  2. 日志文件设置自动归档,用「find /var/log -name "*.log" -mtime +30 -delete」定期清理
  3. 最最最重要的——给服务器机柜上把锁!我就见过市场部同事把服务器当普通电脑关机的

最新发现:戴尔iDRAC日志能记录到0.5V的电压波动,比市面UPS检测还灵敏!下回服务器再莫名关机,知道该查哪里了吧?