Linux服务器构建与运维管理 第8章:系统监控 阮晓龙 3938213680/rxl@hactcm.edu.cn http://linux.xg.hactcm.edu.cn 河南中医药大学信息管理与信息系统教研室 信息技术学院网络与信息系统科研工作室 2020.2
Linux服务器构建与运维管理 第8章:系统监控 1 阮晓龙 13938213680 / rxl@hactcm.edu.cn http://linux.xg.hactcm.edu.cn 河南中医药大学信息管理与信息系统教研室 信息技术学院网络与信息系统科研工作室 2020.2
2 提纲 ¤系统监控概述 口PROC PROC概述、PROC下的目录、PROC下的进程 口监控工具 状态监控:top、htop、atop、 loop 网络监控:ifop 硬件监控: powertop、 pmitool 性能监控:sar、tsar、per 口监控系统 Ubuntu server Observium CentoS 7+ Nagios 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 提纲 系统监控概述 PROC PROC概述、PROC下的目录、PROC下的进程 监控工具 状态监控:top、htop、atop、iotop 网络监控:iftop 硬件监控:powertop、ipmitool 性能监控:sar、tsar、perf 监控系统 Ubuntu Server + Observium CentOS 7 + Nagios 2
3 1系统监控概述 11系统监控概述 ¤随着各单位信息化建设的不断深入,应用系统不断增多,运维人员需 要管理的设备、业务数量也急剧增加,如何直观地查看多个设备、业 务的运行情况,并保证设备、业务出现异常时能及时发现,已经成为 运维人员最关心也最需要解决的问题。 在此需求下系统监控应运而生,通过系统监控可以 实时了解系统的运行状态,快速发现系统异常,分析异常原因,及时解决 异常问题。 有效避免系统故障,保障系统对外服务的髙可用与髙持续,有效提升用户 对系统的满意度。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 1.系统监控概述 随着各单位信息化建设的不断深入,应用系统不断增多,运维人员需 要管理的设备、业务数量也急剧增加,如何直观地查看多个设备、业 务的运行情况,并保证设备、业务出现异常时能及时发现,已经成为 运维人员最关心也最需要解决的问题。 在此需求下系统监控应运而生,通过系统监控可以: ◼ 实时了解系统的运行状态,快速发现系统异常,分析异常原因,及时解决 异常问题。 ◼ 有效避免系统故障,保障系统对外服务的高可用与高持续,有效提升用户 对系统的满意度。 3 1.1系统监控概述
4 1系统监控概述 1.2监控分类 ¤按监控的时效性 可分为实时监控和周期性监控两种类型 实时监控: ¤指利用软件对系统运行信息进行实时的采集,具有较强的时效性,其数据可反 应系统当前运行情况。 周期性监控 ¤指利用软件以一定的时间间隔对系统运行信息进行周期性采集,其数据可反应 系统的运行趋势。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 1.系统监控概述 按监控的时效性 ◼ 可分为实时监控和周期性监控两种类型。 ◼ 实时监控: 指利用软件对系统运行信息进行实时的采集,具有较强的时效性,其数据可反 应系统当前运行情况。 ◼ 周期性监控: 指利用软件以一定的时间间隔对系统运行信息进行周期性采集,其数据可反应 系统的运行趋势。 4 1.2监控分类
1系统监控概述 1.2监控分类 ¤按监控的方式 可分为命令监控和软件监控两种类型。 命令监控 ¤指通过操作系统相关命令实现对系统运行情况的监控,常用的命令监控有top (查看所有正在运行且处于活动状态的实时进程)、 netstat(查看系统网络性 能情况)、 Iostat(查看系统α門∪使用情况与磁盘/○情况)、fee(查看系统内 存使用情况)、 amstat(查看系统CP∪等指标负载情况)等。 ■软件监控 口指通过第三方软件使用SNMP( Simple Network Management Protocol,简单 网络管理协议)协议、 Agent、探针等手段,对系统运行情况进行周期性监控 并记录监控数据,可实现监控历史数据查看及系统运行情况分析,并可将系统 异常情况通过某种手段(如邮件、短信等)通知相关人员。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 1.系统监控概述 按监控的方式 ◼ 可分为命令监控和软件监控两种类型。 ◼ 命令监控: 指通过操作系统相关命令实现对系统运行情况的监控,常用的命令监控有top (查看所有正在运行且处于活动状态的实时进程)、netstat(查看系统网络性 能情况)、iostat(查看系统CPU使用情况与磁盘I/O情况)、free(查看系统内 存使用情况)、vmstatI(查看系统CPU等指标负载情况)等。 ◼ 软件监控: 指通过第三方软件使用SNMP(Simple Network Management Protocol,简单 网络管理协议)协议、Agent、探针等手段,对系统运行情况进行周期性监控, 并记录监控数据,可实现监控历史数据查看及系统运行情况分析,并可将系统 异常情况通过某种手段(如邮件、短信等)通知相关人员。 5 1.2监控分类
6 1系统监控概述 1.2监控分类 ¤按监控的对象 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 设备监控 ¤对物理设备运行情况的监控,主要监控设备的温度、电源、电压、风扇等方面。常用设备 监控手段有PM( ntelligent Platform Management Interface,智能平台管理接口)监控, 通过设备自身的PM监控体系,从而掌握设备的物理运行状态。 ■系统监控 ¤对操作系统整体运行情况的监控,主要监控系统的物理内存、虚拟內存、¢P∪、内核线程、 磁盘、进程等方面。常用的系统监控手段主要有命令监控和监控系统监控两种。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 1.系统监控概述 按监控的对象 ◼ 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 ◼ 设备监控: 对物理设备运行情况的监控,主要监控设备的温度、电源、电压、风扇等方面。常用设备 监控手段有IPMI(Intelligent Platform Management Interface,智能平台管理接口)监控, 通过设备自身的IPMI监控体系,从而掌握设备的物理运行状态。 ◼ 系统监控: 对操作系统整体运行情况的监控,主要监控系统的物理内存、虚拟内存、CPU、内核线程、 磁盘、进程等方面。常用的系统监控手段主要有命令监控和监控系统监控两种。 6 1.2监控分类
1系统监控概述 1.2监控分类 ¤按监控的对象 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 ■网络监控 ¤对网络运行情况的监控,主要监控网络的可用性、性能以及流量等方面。常用网络监控的 手段有网络嗅探和数据流层面的统计等。 业务监控 ¤对业务运行情况的监控,主要监控网站、Web服务器、数据库、中间件、域名、电子邮件 以及基础服务等方面。常用的业务监控手段有业务自身监控状态监控和监控系统监控等。 ■环境监控 ¤对基础环境设备运行状态的监控,主要包括监控配电、UPS、空调、温度、湿度、漏水、 烟雾、视频、门禁、防雷及消防系统等方面,常用的环境监控手段主要有设备自身监控、 探针(或SNMP)采集监控等。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 1.系统监控概述 按监控的对象 ◼ 可分为设备监控、系统监控、网络监控、业务监控和环境监控五种类型。 ◼ 网络监控: 对网络运行情况的监控,主要监控网络的可用性、性能以及流量等方面。常用网络监控的 手段有网络嗅探和数据流层面的统计等。 ◼ 业务监控: 对业务运行情况的监控,主要监控网站、Web服务器、数据库、中间件、域名、电子邮件 以及基础服务等方面。常用的业务监控手段有业务自身监控状态监控和监控系统监控等。 ◼ 环境监控: 对基础环境设备运行状态的监控,主要包括监控配电、UPS、空调、温度、湿度、漏水、 烟雾、视频、门禁、防雷及消防系统等方面,常用的环境监控手段主要有设备自身监控、 探针(或SNMP)采集监控等。 7 1.2监控分类
8 2. PROC 2.1PROC概述 Linux系统的/pro是一种伪文件系统(即虚拟文件系统),与其它常见的文件 系统不同的是/pro只存在内存当中,是存储当前內核运行状态的一系列特殊 文件,用户可以通过这些文件查看有关硬件及当前正在运行进程的信息,甚 至可以通过更改其中某些文件来改变内核的运行状态。 ■鉴于/pro文件系统的特殊性,其目录下的文件也常被称作为虚拟文件,并具有一些独特的特点 例如,有些文件虽然使用查看命令查看时会返回大量信息,但文件本身的大小却显示为0字节。 大多数文件的时间及日期属性通常为当前系统时间和日期,这些文件会被随时刷新。 ■为了查看和使用上的方便,这些文件通常会按照相关性分类存储于不同的目录甚至子目录中 例如,/proc/scsi目录中存储的是当前系统上所有SCS设备的相关信息,/ proc/N中存储的则是 系统当前正在运行的进程相关信息,其中N为正在运行的进程D。 ■大多数虚拟文件都可使用文件查看命令(如cat、more、les等)进行查看,有些文件信息表述 的内容是一目了然的,但也有文件的信息不具备可读性,不过,可读性较差的文件可使用一些 命令(如apm、free、lsp或top等)来提高文件的可读性。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 2.PROC Linux系统的/proc是一种伪文件系统(即虚拟文件系统),与其它常见的文件 系统不同的是/proc只存在内存当中,是存储当前内核运行状态的一系列特殊 文件,用户可以通过这些文件查看有关硬件及当前正在运行进程的信息,甚 至可以通过更改其中某些文件来改变内核的运行状态。 ◼ 鉴于/proc文件系统的特殊性,其目录下的文件也常被称作为虚拟文件,并具有一些独特的特点。 例如,有些文件虽然使用查看命令查看时会返回大量信息,但文件本身的大小却显示为0字节。 大多数文件的时间及日期属性通常为当前系统时间和日期,这些文件会被随时刷新。 ◼ 为了查看和使用上的方便,这些文件通常会按照相关性分类存储于不同的目录甚至子目录中, 例如,/proc/scsi目录中存储的是当前系统上所有SCSI设备的相关信息,/proc/N中存储的则是 系统当前正在运行的进程相关信息,其中N为正在运行的进程ID。 ◼ 大多数虚拟文件都可使用文件查看命令(如cat、more、less等)进行查看,有些文件信息表述 的内容是一目了然的,但也有文件的信息不具备可读性,不过,可读性较差的文件可使用一些 命令(如apm、free、lspci或top等)来提高文件的可读性。 8 2.1 PROC概述
9 2. PROC 2.2PROC下的进程目录 口/ proc目录中包含许多以数字命名的子目录,这些数字表示系统当前正 在运行的进程|D。 南中医药大学/阮晓龙/13938213680/http://inux.xg.hactcm.edu.cn/http://www.51xueweb.cn
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 2.PROC /proc目录中包含许多以数字命名的子目录,这些数字表示系统当前正 在运行的进程ID。 9 2.2 PROC下的进程目录
J Teach-CentoS 7-rootaCentoS7Teache-xshell 5 (Free for Home/School) N Teach-CentoS 7-rootecentOS7Teach: Shell 5(Free fe 文件行编描日查00工具①选项卡(B)口M秘sh/oot文件编描日查工具m选项卡(B)囗w0稀 10 2·团·0Q·命·6·A··∷向·四·Q·, [root@centos7Teach -] tree -L 1/proc /Teach 2. PROC prog OC下的进程目录 coredump_filter environ exe ->/usr/sbin/sshd 510 limit mounts 278 oom score oom_score_adj 280 pagemap provid_map 295 onid 仅柯文本发送到图献项卡 仅文本发送到当前选项卡 可南中医药大学/阮晓龙/mn212 ssh/rot211693521322
河南中医药大学 / 阮晓龙 / 13938213680 / http://linux.xg.hactcm.edu.cn / http://www.51xueweb.cn 2.PROC 10 2.2 PROC下的进程目录