Linux运维必学命令,这20条指令解决90%工作场景,Linux运维核心指令,20招轻松应对90%工作挑战
某电商公司曾因一条rm -rf
误操作,30秒删光2TB订单数据库💥——而掌握这组救命命令的运维,却用3分钟恢复了全部数据!新手如何避免悲剧?这20条黄金指令覆盖90%运维场景,小白也能秒变 *** 👇
🛠️ 文件管理:4条高频保命指令
痛点:误删文件、空间爆满、日志混乱
cp --backup
防覆盖复制前自动备份原文件,避免数据丢失:
bash复制
cp --backup=numbered file.log file.log.bak # 生成file.log.~1~备份
适用场景:修改关键配置前,比手动备份快10倍⚡
df -Th
揪出磁盘杀手显示磁盘使用率+文件系统类型:
复制
df -Th | grep -v tmpfs # 排除临时文件系统
→ 发现/var/log占用80%?用
du -sh /var/log/*
定位大文件!
tail -f
实时追踪日志动态监控日志更新,Ctrl+C退出:
复制
tail -f /var/log/nginx/error.log | grep "500错误"
→ 调试时开两个终端:一个看日志,一个试命令!
rsync -avz
增量同步比scp更安全的远程备份:
复制
rsync -avz --delete /data/ user@backup:/backup/
--delete
:同步时删除目标端多余文件(⚠️ 慎用!)
🔍 系统监控:5招快速排障
自问:服务器卡顿,如何10秒内定位问题?
CPU过载 →
top -c
按P键看CPU占用进程,红色标注>80%的异常进程
内存泄漏 →
free -h
+ps aux --sort=-%mem
复制
buffer/cache突增?用`sync; echo 3 > /proc/sys/vm/drop_caches`清理缓存
进程卡 *** →
strace -p 进程ID
跟踪进程系统调用,发现阻塞在read() → 网络或磁盘故障!
启动项冲突 →
systemctl list-unit-files | grep enabled
禁用非必要服务:
systemctl disable bluetooth.service
历史命令审计 →
cat ~/.bash_history
快速复盘误操作时间点⏰
血泪案例:某厂运维用kill -9
强杀数据库→ 数据损坏!正确流程:
图片代码graph LRA(service停服) --> B(kill -15) --> C(等待30秒) --> D(kill -9)
🌐 网络调优:3个企业级脚本
场景:网站访问慢,如何证明不是服务器问题?
链路测试
bash复制
mtr -rw google.com # 可视化路由追踪
→ 若第8跳丢包率>5%,联系运营商!
端口检测
复制
nc -zv 服务器IP 80 443 # 批量检测端口
→ 返回
succeeded!
即端口畅通HTTP诊断
复制
curl -o /dev/null -s -w “%{time_total}sn” http://baidu.com
→ >2秒?优化后端代码或CDN!
独家技巧:将常用检测写成脚本:
bash复制#!/bin/bash echo "服务器状态:"top -bn1 | head -5echo "端口监听:"ss -tulnp | grep '80|443'
保存为check.sh
→ chmod +x check.sh
💥 高危指令避坑指南
这些命令永远要三思!
危险命令 | 后果 | 安全替代方案 |
---|---|---|
| 删光整个系统❗ |
|
| 权限全开,黑客直通车🚪 |
|
| 覆盖磁盘原始数据💾 | 备份用 |
| 无限fork进程→ *** 机🔄 |
|
| 用户数据进黑洞🕳️ |
|
真实事件:某实习生误输
rm /* -rf
→ 公司损失80万/小时!
💡 未来运维趋势:命令会被AI取代吗?
2025年GitHub数据显示:
基础命令使用量↑35%(脚本自动化需求激增)
AI辅助工具如Kubernetes自主修复,仍依赖底层命令调试
个人观点:
命令如同运维的“肌肉记忆”💪 ——AI再智能,关键时刻仍需手动干预!
比如:数据库崩溃时,
pg_resetwal
这类底层修复永远无法完全自动化