linux 常用系统性能监控命令-mile米乐体育
监控cpu使用率
使用下面的命令:
[root@localhost ~]# gnome-system-monitor
将会出现图形化工具gnome system monitor,如下图所示:
监控cpu调度程序运行队列
linux可以使用vmstat命令
vmstat是virtual meomory statistics(虚拟内存统计)的缩写, 是实时系统监控工具。该命令通过使用knlist子程序和/dev/kmen伪设备驱动器访问这些数据,输出信息直接打印在屏幕。vmstat反馈的与cpu相关的信息包括:
(1)多少任务在运行
(2)cpu使用的情况
(3)cpu收到多少中断
(4)发生多少上下文切换
下面只介绍 vmstat与cpu相关的参数
vmstat的语法如下:
vmstat [delay [count]]
参数的含义如下:
参数 | 解释 |
---|---|
delay | 相邻的两次采样的间隔时间 |
count | 采样的次数,count只能和delay一起使用 |
当没有参数时,vmstat则显示系统启动以后所有信息的平均值。有delay时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个delay时间段的平均信息。当系统有多个cpu时,输出为所有cpu的平均值。
参数 | 解释 | 从/proc/stat获得数据 |
---|---|---|
r | 在internal时间段里,运行队列里等待cpu的任务(任务)的个数,即不包含vmstat进程 | procs_running-1 |
b | 在internal时间段里,被资源阻塞的任务数(i/0,页面调度,等等.)通常情况下是接近0的 | procs_blocked |
us | 在internal时间段里,用户态的cpu时间(%),包含 nice值为负进程 | (user nice)/total*100 |
sy | 在internal时间段里,核心态的cpu时间(%) | (system irq softirq)/total*100 |
id | 在internal时间段里,cpu空闲的时间,不包括等待i/o的时间(%) | idle/total*100 |
wa | 在internal时间段里,等待i/o的时间(%) | iowait/total*100 |
in | 在internal时间段里,每秒发生中断的次数 | intr/interval |
cs | 在internal时间段里,每秒上下文切换的次数,即每秒内核任务交换的次数 | ctxt/interval |
total_cur = user system nice idle iowait irq softirq
total_pre = pre_user pre_system pre_nice pre_idle pre_iowait pre_irq pre_softirq
total = total_cur – total_pre
[root@localhost ~]# vmstat
运行结果如下:
监控锁竞争
使用 sysstat包中的pidstat命令来监控
[root@localhost ~]# pidstat
运行结果如下:
linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 cpu)
09:58:18 pid %usr %system %guest %cpu cpu command
09:58:18 1 0.00 0.00 0.00 0.00 0 init
09:58:18 4 0.00 0.00 0.00 0.00 0 ksoftirqd/0
……
09:58:18 37143 0.00 0.00 0.00 0.00 0 dbus-launch
09:58:18 37144 0.00 0.00 0.00 0.00 0 dbus-daemon
09:58:18 37268 0.00 0.00 0.00 0.00 0 fprintd
09:58:18 37272 0.00 0.00 0.00 0.00 0 pidstat
监控网络i/o使用率
nicstat原本是solaris平台下显示网卡流量的工具,tim cook将它移植到linux平台
首先安装之,源码在这里下, 这里使用的版本是1.92。
安装make环境:
yum install gcc gcc-c make automake autoconf -y
由于nicstat依赖32 bit glibc package,所以
yum install libgcc.i686 glibc.i686 glibc-devel.i686 -y
下载文件并安装:
# wget -c http://nchc.dl.sourceforge.net/project/nicstat/nicstat-1.92.tar.gz # tar zxvf nicstat-1.92.tar.gz # cd nicstat-1.92 # cp makefile.linux makefile # uname -m
[root@localhost nicstat-1.92]# make
gcc -o3 -m32 nicstat.c -o nicstat
nicstat.c:99:1: warning: “duplex_unknown” redefined
in file included from nicstat.c:84:
/usr/include/linux/ethtool.h:691:1: warning: this is the location of the previous definition
mv nicstat `./nicstat.sh –bin-name`
[root@localhost nicstat-1.92]# ./nicstat.sh
磁盘i/o使用率
iostat [-t] [-c] [interval [count]]
参数的含义如下:
参数 | 解释 |
---|---|
t | 表示输出采用的时间 |
c | 表示只显示cpu的信息 |
internal | 相邻的两次采样的间隔时间 |
count | 采样的次数,count只能和delay一起使用 |
当没有参数时,iostat则显示系统启动以后所有信息的平均值。与cpu有关的输出的含义
参数 | 解释 | 从/proc/stat获得 |
---|---|---|
cpu | 处理器id | |
user | 在internal时间段里,用户态的cpu时间(%) ,不包含 nice值为负进程 | usr/total*100 |
nice | 在internal时间段里,nice值为负进程的cpu时间(%) | nice/total*100 |
sys | 在internal时间段里,核心时间(%) | (system irq softirq)/total*100 |
iowait | 在internal时间段里,硬盘io等待时间(%) | iowait/total*100 |
idle | 在internal时间段里,cpu除去等待磁盘io操作外的因为任何原因而空闲的时间闲置时间 (%) | idle/total*100 |
total_cur = user system nice idle iowait irq softirq
total_pre = pre_user pre_system pre_nice pre_idle pre_iowait pre_irq pre_softirq
total = total_cur – total_pre
有interval时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个interval时间段的平均信息。
使用iostat命令
[root@localhost ~]# iostat
运行结果如下:
linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 cpu)
avg-cpu: %user %nice %system %iowait %steal %idle
6.12 0.00 1.35 2.35 0.00 90.19
device: tps blk_read/s blk_wrtn/s blk_read blk_wrtn
sda 6.03 267.11 272.53 26904430 27450404
ps:附上brendan gregg 个人站点上分享了很多 linux 性能相关的资源:
linux observability tools | linux 性能观测工具
linux benchmarking tools | linux 性能测评工具
linux tuning tools | linux 性能调优工具
linux observability sar
另外,我们之前也分享过另外一篇linux监控命令的文章,有兴趣可以看看。