作为一名linux系统管理员,最主要的工作是优化系统配置,使应用在系统上以最优的状态运行,但是硬件问题、软件问题、网络环境等的复杂性 和多变性,导致对系统的优化变得异常复杂,如何定位性能问题出在哪个方面,是性能优化的一大难题, 本章从系统入手,重点讲述系统软、硬件配置不当可能造成的性能问题,并且给出了检测系统故障和优化性能的一般方法和流程.
1 cpu性能评估
Cpu是影响Linux性能的主要因素之一,下面先介绍几个查看CPU性能的命令.
1.1 vmstat命令
该命令可以显示关于系统各种资源之间相关性能的简要信息,这里我们主要用它来看CPU的一个负载情况.
下面是vmstat命令在某个系统的输出结果:
[root@node1 ~]# vmstat 2 3
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 162240 8304 67032 0 0 13 21 1007 23 0 1 98 0 0
0 0 0 162240 8304 67032 0 0 1 0 1010 20 0 1 100 0 0
0 0 0 162240 8304 67032 0 0 1 1 1009 18 0 1 99 0 0
对上面每项的输出解释如下:
procs
r列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU.
b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等.
memory
swpd列表示切换到内存交换区的内存数量(以k为单位).如果swpd的值不为0,或者比较大,只要si、so的值长期为0,这种情况下一般不用担心,不会影响系统性能.
free列表示当前空闲的物理内存数量(以k为单位)
buff列表示buffers cache的内存数量,一般对块设备的读写才需要缓冲.
cache列表示page cached的内存数量,一般作为文件系统cached,频繁访问的文件都会被cached,如果cache值较大,说明cached的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好.
swap
si列表示由磁盘调入内存,也就是内存进入内存交换区的数量.
so列表示由内存调入磁盘,也就是内存交换区进入内存的数量.
一般情况下,si、so的值都为0,如果si、so的值长期不为0,则表示系统内存不足.需要增加系统内存.
IO项显示磁盘读写状况
Bi列表示从块设备读入数据的总量(即读磁盘)(每秒kb).
Bo列表示写入到块设备的数据总量(即写磁盘)(每秒kb)
这里我们设置的bi bo参考值为1000,如果超过1000,wa值较大,则表示系统磁盘IO有问题,应该考虑提高磁盘的读写性能.
system 显示采集间隔内发生的中断数
in列表示在某一时间间隔中观测到的每秒设备中断数.
cs列表示每秒产生的上下文切换次数.
上面这2个值越大,会看到由内核消耗的CPU时间会越多.
CPU项显示了CPU的使用状态,此列是我们关注的重点.
us列显示了用户进程消耗的CPU 时间百分比.us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法.
sy列显示了内核进程消耗的CPU时间百分比.Sy的值较高时,说明内核消耗的CPU资源很多.
根据经验,us sy的参考值为80%,如果us sy大于 80%说明可能存在CPU资源不足.
id 列显示了CPU处在空闲状态的时间百分比.
wa列显示了IO等待所占用的CPU时间百分比.wa值越高,说明IO等待越严重,根据经验,wa的参考值为20%,如果wa超过20%,说明IO等待严重,引起IO等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘 |