You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

3.8 KiB

atop

监控Linux系统资源与进程的工具

补充说明

[非内部程序,需要安装]它以一定的频率记录系统的运行状态,所采集的数据包含系统资源(CPU、内存、磁盘和网络)使用情况和进程运行情况并能以日志文件的方式保存在磁盘中服务器出现问题后我们可获取相应的atop日志文件进行分析。atop是一款开源软件我们可以从这里获得其源码和rpm安装包。

语法

atop(选项)(参数)

说明

ATOP列:该列显示了主机名、信息采样日期和时间点

PRC列:该列显示进程整体运行情况

  • sys、usr字段分别指示进程在内核态和用户态的运行时间
  • #proc字段指示进程总数
  • #zombie字段指示僵死进程的数量
  • #exit字段指示atop采样周期期间退出的进程数量

CPU列该列显示CPU整体(即多核CPU作为一个整体CPU资源)的使用情况我们知道CPU可被用于执行进程、处理中断也可处于空闲状态(空闲状态分两种一种是活动进程等待磁盘IO导致CPU空闲另一种是完全空闲)

  • sys、usr字段指示CPU被用于处理进程时进程在内核态、用户态所占CPU的时间比例
  • irq字段指示CPU被用于处理中断的时间比例
  • idle字段指示CPU处在完全空闲状态的时间比例
  • wait字段指示CPU处在“进程等待磁盘IO导致CPU空闲”状态的时间比例

CPU列各个字段指示值相加结果为N00%其中N为cpu核数。

cpu列该列显示某一核cpu的使用情况各字段含义可参照CPU列各字段值相加结果为100%

CPL列该列显示CPU负载情况

  • avg1、avg5和avg15字段过去1分钟、5分钟和15分钟内运行队列中的平均进程数量
  • csw字段指示上下文交换次数
  • intr字段指示中断发生次数

MEM列:该列指示内存的使用情况

  • tot字段指示物理内存总量
  • free字段指示空闲内存的大小
  • cache字段指示用于页缓存的内存大小
  • buff字段指示用于文件缓存的内存大小
  • slab字段指示系统内核占用的内存大小

SWP列:该列指示交换空间的使用情况

  • tot字段指示交换区总量
  • free字段指示空闲交换空间大小

PAG列:该列指示虚拟内存分页情况

swin、swout字段换入和换出内存页数

DSK列该列指示磁盘使用情况每一个磁盘设备对应一列如果有sdb设备那么增多一列DSK信息

  • sda字段磁盘设备标识
  • busy字段磁盘忙时比例
  • read、write字段读、写请求数量

NET列多列NET展示了网络状况包括传输层(TCP和UDP)、IP层以及各活动的网口信息

  • XXXi 字段指示各层或活动网口收包数目
  • XXXo 字段指示各层或活动网口发包数目

atop日志

每个时间点采样页面组合起来就形成了一个atop日志文件我们可以使用"atop -r XXX"命令对日志文件进行查看。那以什么形式保存atop日志文件呢

对于atop日志文件的保存方式我们可以这样

  • 每天保存一个atop日志文件该日志文件记录当天信息
  • 日志文件以"atop_YYYYMMDD"的方式命名
  • 设定日志失效期限,自动删除一段时间前的日志文件

其实atop开发者已经提供了以上日志保存方式相应的atop.daily脚本可以在源码目录下找到。在atop.daily脚本中我们可以通过修改INTERVAL变量改变atop信息采样周期(默认为10分钟);通过修改以下命令中的数值改变日志保存天数(默认为28天)

(sleep 3; find $LOGPATH -name 'atop_*' -mtime +28 -exec rm {} \; )& 

最后我们修改cron文件每天凌晨执行atop.daily脚本

0 0 * * * root /etc/cron.daily/atop.daily

相关资料