sar是非常有用的Linux系统性能瓶颈,故障分析的工具。作为运维工程师,这个sar工具一定要利用好。
要使用sar,必须安装有软件包:sysstat。Linux RedHat的5.4全包名为:sysstat-7.0.0-3.el5 。
另外,默认sar
采集系统性能数据的间隔为10分钟,这个粒度太粗,需要修改为1分钟。修改方法:
vi /etc/cron.d/sysstat
将这一行:
*/10 * * * * root /usr/lib64/sa/sa1 1 1
更换为:
*/1 * * * * root /usr/lib64/sa/sa1 1 1
最常用的sar工具使用方法为
•sar -u 10 8 --检查cpu负载,每10秒采样一次,共采样8次 •sar -d 5 2 --查看磁盘块活动,每5秒采样一次,共采样2次. •sar -b --查看io传输速率 •sar -q --查看队列长度和 load averages ,队列越小越好 •sar -B --查看分页信息 •sar -W --查看交换信息 •sar -r --查看空闲内存与空闲交换信息 •sar-n DEV --查看当前服务器的网络流量信息 •sar-r -f /var/log/sa/sa11 --查看历史资源使用 -f
一般情况
sar –u
%iowait若过高,说明磁盘连接存在问题,(可用iostat命令来确定);
因此较低的cpu空闲时间(%idle),可能是io的问题而不是cpu的问题。
低%idle,等待i/o或‘%iowait > 10’所用时间的高百分比。
%system > 15瓶颈,这可能说明有交换。
%user异常高,这可能是没有正确调整应用程序或过度利用cpu。
sar –r/-B
当空闲内存低于一定值后,系统开始分页(很高的换页数 [sar –B] ,说明内存不足),若继续下降,系统就开始将一些进程交换出去,这是系统性能快速恶化的信号,可以查找占用过多内存的进程,或者是否存在过多的进程.修正内存的不正常使用或增大内存才是正确的解决之道。