运维老司机三招教你查虚拟IP,网络故障排查不再抓瞎,轻松排查虚拟IP,运维老司机三步法解网络故障难题
上周三凌晨两点,服务器突然集体 *** ,整个技术部炸开了锅。老王叼着烟屁股猛敲键盘:"这破虚拟IP又跑哪去了?!" 哎,这时候你是不是特想抄起键盘一顿操作?别急!今天咱们就聊聊那些让网工又爱又恨的虚拟IP排查术。
场景一:服务器突然失联,紧急定位VIP
"小李!线上支付网关崩了!"凌晨三点接到这种电话,血压瞬间飙升。这时候ip addr show就是你的救命稻草:
bash复制# 先看物理网卡状态ip -br link show | grep -v "DOWN"# 再查具体接口IP配置ip addr show eth0 | grep "inet"
上周我遇到个奇葩案例:主备服务器VIP同时消失!结果发现是机房老鼠咬断了网线。用ip route show查路由表时发现默认网关失踪,这才锁定物理层故障。
场景二:集群维护时VIP神秘消失

上个月给银行做灾备演练,主节点切换后VIP *** 活不跟过来。这时候就得祭出ifconfig -a大法:
bash复制# 查看所有虚拟网卡ifconfig | grep "flags" -A 5# 检查特定虚拟接口ifconfig eth0:1
记得去年双十一,某电商平台负载均衡器抽风?其实就是VIP绑错了网卡。用nmcli device show查NetworkManager配置,发现虚拟IP绑在了已停用的网卡上。
场景三:云环境配置 *** 活不生效
新手最怕这种场景:明明控制台显示VIP已分配,但实例就是ping不通。这时候要分三步走:
1️⃣ 查云平台控制台:确认安全组放行ICMP协议
2️⃣ 登录实例查配置:
bash复制cat /etc/sysconfig/network-scripts/ifcfg-eth0:1
3️⃣ 抓包验证:
bash复制tcpdump -i eth0 'icmp' -vvv
上周帮客户排查阿里云VIP不通,结果发现是云防火墙规则把入站流量全拦了。用journalctl -u network.service查日志才发现配置加载失败。
查IP的十八般兵器
场景 | 命令/工具 | 查什么 | 经典案例 |
---|---|---|---|
快速定位 | ip addr show | 当前生效的VIP | K8s节点突然失联 |
历史配置追踪 | cat /etc/network/interfaces | 持久化配置 | 重启后VIP丢失 |
进程级监控 | ss -tulnp | grep 80 | 服务绑定情况 | Nginx没监听正确VIP |
集群环境 | kubectl get svc | K8s服务IP分配 | Service ClusterIP异常 |
个人踩坑心得
查虚拟IP就像破案,得学会"望闻问切":望(看日志)、闻(抓包)、问(查配置)、切(测连通)。有次给证券系统做迁移,VIP切换后交易延迟暴涨,最后发现是ARP缓存没刷新!用arp -d清缓存才解决。
记住!别迷信命令行,有时候物理层的网线松动、交换机的STP协议阻塞,甚至是机架电源接触不良,都会让VIP玩失踪。下次遇到诡异问题,不妨带个寻线仪去机房转转,保不齐会有意外收获。
最后唠叨句:查完IP记得及时备份网络配置!我习惯用networkctl status > network_backup.log,关键时刻能救命。毕竟在这行混久了,谁还没几段被VIP折腾得彻夜难眠的经历呢?