1 Linux服务器构建与运维管理 第9章:系统监控 阮跷龙 13938213680/ nd@hactcmeducn http://linux.xg.hactcm.edu.cn http://www.51xueweb.cn 问南中医药大学信息管理与信息系统教研室 信息技术字院网络与信息系统科研工作室 2019.1
2 提纲 ¤系统监控概述 D PROC PROC概述、PROC下的目录、PROC下的进程 口监控工具 状态监控:top、htop、atop、 loop 网络监控:ftop 硬件监控: powertop、 ipmitool 性能监控:sar、tsar、perf 口监控系统 Ubuntu Server Observium Centos 7+ Nagios 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
3 1.系统监控概述 11系统监控概述 ¤随着各单位信息化建设的不断深入,应用系统不断增多,运维人员需 要管理的设备、业务数量也急剧增加,如何直观地查看多个设备、业 务的运行情况,并保证设备、业务出现异常时能及时发现,已经成为 运维人员最关心也最需要解决的问题。 在此需求下系统监控应运而生,通过系统监控可以: 实时了解系统的运行状态,快速发现系统异常,分析异常原因,及时解决 异常问题。 ■有效避免系统故障,保障系统对外服务的高可用与高持续,有效提升用户 对系统的满意度。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
4 1.系统监控概述 12监控分类 ¤按监控的时效性 可分为实时监控和周期性监控两种类型。 实时监控: 口指利用软件对系统运行信息进行实时的采集,具有较强的时效性,其数据可反 应系统当前运行情况。 周期性监控: 口指利用软件以一定的时间间隔对系统运行信息进行周期性采集,其数据可反应 系统的运行趋势。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
5 1.系统监控概述 12监控分类 ¤按监控的方式 可分为命令监控和软件监控两种类型。 命令监控: ¤指通过操作系统相关命令实现对系统运行情况的监控,常用的命令监控有top (查看所有正在运行且处于活动状态的实时进程)、 netstat(查看系统网络性 能情况)、 iostat(查看系统CP∪使用情况与磁盘○情况)、fee(查看系统內 存使用情况)、 vmstat(查看系统CPU等指标负载情况)等。 ■软件监控 口指通过第三方软件使用SNMP( Simple Network Management Protocol,简单 网络管理协议)协议、 Agent、探针等手段,对系统运行情况进行周期性监控 并记录监控数据,可实现监控历史数据查看及系统运行情况分析,并可将系统 异常情况通过某种手段(如邮件、短信等)通知相关人员。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
6 1.系统监控概述 12监控分类 ¤按监控的对象 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 设备监控: ¤对物理设备运行情况的监控,主要监控设备的温度、电源、电压、风扇等方面。常用设备 监控手段有PM( Intelligent Platform Management Interface,智能平台管理接口)监控, 通过设备自身的PM监控体系,从而掌握设备的物理运行状态。 ■系统监控 ¤对操作系统整体运行情况的监控,主要监控系统的物理内存、虚拟内存、CP、内核线程 磁盘、进程等方面。常用的系统监控手段主要有命令监控和监控系统监控两种。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
1.系统监控概述 12监控分类 ¤按监控的对象 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 网络监控: ¤对网络运行情况的监控,主要监控网络的可用性、性能以及流量等方面。常用网络监控的 手段有网络嗅探和数据流层面的统计等。 ■业务监控 ¤对业务运行情况的监控,主要监控网站、web服务器、数据库、中间件、域名、电子邮件 以及基础服务等方面。常用的业务监控手段有业务自身监控状态监控和监控系统监控等。 环境监控: ¤对基础环境设备运行状态的监控,主要包括监控配电、∪PS、空调、温度、湿度、漏水 烟、视频、门禁、防雷及消防系统等方面,常用的环境监控手段主要有设备自身监控、 探针(或SNMP)采集监控等。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
8 2.PROC 2.1PROC概述 Linux系统的/proc是一种伪文件系统(即虚拟文件系统),与其它常见的文件 系统不同的是proc只存在内存当中,是存储当前内核运行状态的一系列特殊 文件,用户可以通过这些文件查看有关硬件及当前正在运行进程的信息,甚 至可以通过更改其中某些文件来改变内核的运行状态。 ■鉴于/pro文件系统的特殊性,其目录下的文件也常被称作为虛拟文件,并具有一些独特的特点。 例如,有些文件虽然使用查看命令查看时会返回大量信息,但文件本身的大小却显示为0字节。 大多数文件的时间及日期属性通常为当前系统时间和日期,这些文件会被随时刷新。 ■为了查看和使用上的方便,这些文件通常会按照相关性分类存储于不同的目录甚至子目录中 例如,/roc/scs目录中存储的是当前系统上所有SCS设备的相关信息,/proN中存储的则是 系统当前正在运行的进程相关信息,其中N为正在运行的进程」D。 ■大多数虚拟文件都可使用文件查看命令(如cat、more、les等)进行查看,有些文件信息表述 的内容是一目了然的,但也有文件的信息不具备可读性,不过,可读性较差的文件可使用一些 命令(如apm、free、lspi或top等)来提高文件的可读性。 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
9 2.PROC 22PROC下的进程目录 口/proc目录中包含许多以数字命名的子目录,这些数字表示系统当前正 在运行的进程|D 可南中医药大学/阮晓龙/13938213680/ht/ linuxxg nactcmeaucn/htp/w5 xuewen cn
d Teach Cero, 7. roceocemosTteathe-. xuhed s dree for Hoe/dcet 师查工具①0 10 ≥.,四·0“··6·A·:B四2,,,Ea●··6 [rootacentos7Teach -J tree -L 1 /proc h-1 2. PRoC rog OC下的进程目录 eurogroup cmdline coredump_ filter cpuset exe>/usr/sbin/sshd fdinfo gid_map 1552 limits maps mounting mountstats o score oom score ad pagemap personality provid_map sched schedstat 295 sessionid 可南中医药大学/阮晓龙/出