Linux 系统监控和告警的常用工具、配置方法和最佳实践有哪些？

Question

Levenx · Accepted Answer

Linux 系统监控和告警是保障系统稳定运行的重要手段，需要掌握各种监控工具和告警机制。系统监控工具：CPU 监控：top：实时查看 CPU 使用率和进程信息htop：交互式进程查看器，功能更强大mpstat：显示各个 CPU 核心的使用情况sar：系统活动报告，可记录历史数据vmstat：报告虚拟内存统计信息内存监控：free：显示内存使用情况vmstat：查看内存交换、缓存等信息ps aux：查看进程的内存占用pmap：查看进程的内存映射磁盘监控：df：查看磁盘空间使用情况du：查看目录或文件的大小iostat：查看磁盘 I/O 统计信息iotop：实时查看磁盘 I/O 使用情况网络监控：ifconfig/ip：查看网络接口配置netstat/ss：查看网络连接和端口监听nethogs：按进程查看网络带宽使用tcpdump：抓包分析网络流量iftop：实时显示网络带宽使用进程监控：ps：查看进程状态top/htop：实时监控进程pgrep：查找进程 IDpidstat：监控进程资源使用性能分析工具：strace：跟踪系统调用和信号ltrace：跟踪库函数调用perf：性能分析工具s