vSAN监控和故障排除 Update 1 2018年10月16日 VMware vSphere 6.7 VMware vsan 6.7 VmWare
vSAN 监控和故障排除 Update 1 2018 年 10 月 16 日 VMware vSphere 6.7 VMware vSAN 6.7
vSAN监控和故障排除 您可以从 VMware网站下载最新的技术文档 https://docs.vmwarecom/cn/o VMware网站还提供了最近的产品更新。 如果您对本文档有任何意见或建议,请将反馈信息发送至 docfeedback(@vmware.com VMware, Inc. 北京办公室 上海办公室 广州办公室 3401 Hillview Ave 上海市 广州市 Palo Alto. CA 94304 朝阳区新源南路8号 淮海中路333号 天河路385号 www.vmware.com 启皓北京东塔8层801 瑞安大厦804809室 vmware. com/cn ww.vmware.com/cn ww. vmware. com/cn 版权所有2018 VMware,lnc.保留所有权利。版权和商标信息。 VMware,lc保留所有权利
vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 2 您可以从 VMware 网站下载最新的技术文档: https://docs.vmware.com/cn/。 VMware 网站还提供了最近的产品更新。 如果您对本文档有任何意见或建议,请将反馈信息发送至: docfeedback@vmware.com 版权所有 © 2018 VMware, Inc. 保留所有权利。 版权和商标信息。 VMware, Inc. 3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com 北京办公室 北京市 朝阳区新源南路 8 号 启皓北京东塔 8 层 801 www.vmware.com/cn 上海办公室 上海市 淮海中路 333 号 瑞安大厦 804-809 室 www.vmware.com/cn 广州办公室 广州市 天河路 385 号 太古汇一座 3502 室 www.vmware.com/cn
目录 关于vSAN监控和故障排除4 vSAN简介5 2监控vSAN群集6 监控vSAN容量6 监控物理设备 监控加入vSAN数据存储的设备8 监控vSAN群集中的虚拟对象8 关于vSAN群集重新同步9 关于vSAN群集重新平衡10 使用vSAN默认警报12 使用 VMkerne观察创建警报14 3监控vSAN运行状况16 关于vSAN运行状况服务16 检查vSAN运行状况18 从 ESXi Host Client监控vsAN18 主动测试19 4监控vSAN性能20 关于vSAN性能服务20 已置vSAN性能服务21 使用保存的时间范围22 查看vSAN群集性能22 查看vSAN主机性能23 查看vSAN虚拟机性能25 使用vsAN性能诊断26 5处理故障以及对vsAN进行故障排除28 上载vSAN支持包28 对vsAN使用EsxC命令29 EsXi主机上的vSAN配置可能失败31 不合规虚拟机对象不会立即合规32 vSAN群集配置问题32 处理vSAN中的故障33 关闭并重新启动vSAN群集45 VMware,lc保留所有权利
目录 关于 vSAN 监控和故障排除 4 1 vSAN 简介 5 2 监控 vSAN 群集 6 监控 vSAN 容量 6 监控物理设备 8 监控加入 vSAN 数据存储的设备 8 监控 vSAN 群集中的虚拟对象 8 关于 vSAN 群集重新同步 9 关于 vSAN 群集重新平衡 10 使用 vSAN 默认警报 12 使用 VMkernel 观察创建警报 14 3 监控 vSAN 运行状况 16 关于 vSAN 运行状况服务 16 检查 vSAN 运行状况 18 从 ESXi Host Client 监控 vSAN 18 主动测试 19 4 监控 vSAN 性能 20 关于 vSAN 性能服务 20 配置 vSAN 性能服务 21 使用保存的时间范围 22 查看 vSAN 群集性能 22 查看 vSAN 主机性能 23 查看 vSAN 虚拟机性能 25 使用 vSAN 性能诊断 26 5 处理故障以及对 vSAN 进行故障排除 28 上载 vSAN 支持包 28 对 vSAN 使用 Esxcli 命令 29 ESXi 主机上的 vSAN 配置可能失败 31 不合规虚拟机对象不会立即合规 32 vSAN 群集配置问题 32 处理 vSAN 中的故障 33 关闭并重新启动 vSAN 群集 45 VMware, Inc. 保留所有权利。 3
关于vsAN监控和故障排除 《vSAN监控和故障排除》介绍了如何使用 vSphere Client、esκc‖和RVC命令以及其他工具来监控 Mware vSAN以及进行故障排除。 目标读者 本手册的目标用户为要监控vsAN操作和性能或者对vsAN群集问题进行故障排除的任何人。本手册的目标 读者为熟悉虚拟机技术和数据中心操作且具有丰富经验的系统管理员。本手册假设您熟悉 VMware Sphere,包括 Mware EsXi、 vCenter server和 vSphere Client 有关vSAN以及如何创建vSAN群集的详细信息,请参见《vSAN规划和部署指南》。 有关vsAN功能以及如何配置vSAN群集的详细信息,请参见《管理 VMware VSAN》。 vSphere Client /A v Sphere Web Client 本指南中的说明反映 vSphere Client(基于HTML5的GU)。您也可以使用这些说明通过 vSphere Web Client (基于Fex的GU1)执行任务。 vSphere Client和 vSphere Web Client之间工作流明显不同的任务具有重复过程,其根据相应客户端界面提 供步骤。与 vSphere Web Client有关的过程在标题中包含 vSphere Web Client。 注在 vSphere67 Update1中,几乎所有 vSphere Web Client功能在 vSphere Client中得以实现。有关 其他不受支持的功能的最新列表,请参见《 vSphere Client功能更新说明》。 VMware,lc保留所有权利
关于 vSAN 监控和故障排除 《vSAN 监控和故障排除》介绍了如何使用 vSphere Client、esxcli 和 RVC 命令以及其他工具来监控 VMware vSAN ® 以及进行故障排除。 目标读者 本手册的目标用户为要监控 vSAN 操作和性能或者对 vSAN 群集问题进行故障排除的任何人。本手册的目标 读者为熟悉虚拟机技术和数据中心操作且具有丰富经验的系统管理员。本手册假设您熟悉 VMware vSphere,包括 VMware ESXi、vCenter Server 和 vSphere Client。 有关 vSAN 以及如何创建 vSAN 群集的详细信息,请参见《vSAN 规划和部署指南》。 有关 vSAN 功能以及如何配置 vSAN 群集的详细信息,请参见《管理 VMware vSAN》。 vSphere Client 和 vSphere Web Client 本指南中的说明反映 vSphere Client(基于HTML5 的 GUI)。您也可以使用这些说明通过vSphere Web Client (基于 Flex 的 GUI)执行任务。 vSphere Client 和 vSphere Web Client 之间工作流明显不同的任务具有重复过程,其根据相应客户端界面提 供步骤。与 vSphere Web Client 有关的过程在标题中包含 vSphere Web Client。 注 在 vSphere 6.7 Update 1 中,几乎所有 vSphere Web Client 功能在 vSphere Client 中得以实现。有关 其他不受支持的功能的最新列表,请参见《vSphere Client 功能更新说明》。 VMware, Inc. 保留所有权利。 4
VSAN简介 VMware VSAN是作为EsX管理程序的一部分本机运行的分布式软件层。SAN可汇总主机群集的本地或 直接连接容量设备,并创建在vSAN群集的所有主机之间共享的单个存储池。 虽然vsAN支持HA、 vMotion和DRS等需要共享存储的 VMware功能,但它无需外部共享存储,并且简 化了存储配置和虚拟机置备活动。 VMware,lc保留所有权利
vSAN 简介 1 VMware vSAN 是作为 ESXi 管理程序的一部分本机运行的分布式软件层。vSAN 可汇总主机群集的本地或 直接连接容量设备,并创建在 vSAN 群集的所有主机之间共享的单个存储池。 虽然 vSAN 支持 HA、vMotion 和 DRS 等需要共享存储的 VMware 功能,但它无需外部共享存储,并且简 化了存储配置和虚拟机置备活动。 VMware, Inc. 保留所有权利。 5
监控SAN群集 2 您可以监控vSAN群集以及与其相关的所有对象。 可以监控vsAN环境中的所有对象,包括加入 VSAN群集和vSAN数据存储的主机。有关监控vSAN群集 中的对象和存储资源的详细信息,请参见《 vSphere监控和性能》文档。 本章讨论了以下主题: 监控vSAN容量 监控物理设备 监控加入vSAN数据存储的设备 监控vSAN群集中的虚拟对象 关于vSAN群集重新同步 关于vSAN群集重新平衡 使用vsAN默认警报 使用 VMkernel观察创建警报 监控vSAN容量 以监控 VSAN数据存储的容量、去重和压缩效率以及容量使用情况细目。 群集“摘要”页面包含vSAN容量的摘要信息。还可以在“容量”监控中查看更多详细信息。 VMware,lc保留所有权利
监控 vSAN 群集 2 您可以监控 vSAN 群集以及与其相关的所有对象。 可以监控 vSAN 环境中的所有对象,包括加入 vSAN 群集和 vSAN 数据存储的主机。有关监控 vSAN 群集 中的对象和存储资源的详细信息,请参见《vSphere 监控和性能》文档。 本章讨论了以下主题: n 监控 vSAN 容量 n 监控物理设备 n 监控加入 vSAN 数据存储的设备 n 监控 vSAN 群集中的虚拟对象 n 关于 vSAN 群集重新同步 n 关于 vSAN 群集重新平衡 n 使用 vSAN 默认警报 n 使用 VMkernel 观察创建警报 监控 vSAN 容量 可以监控 vSAN 数据存储的容量、去重和压缩效率以及容量使用情况细目。 群集“摘要”页面包含 vSAN 容量的摘要信息。还可以在“容量”监控中查看更多详细信息。 VMware, Inc. 保留所有权利。 6
vSAN监控和故障排除 vSphere Client 口日9 O vSAN cluster AcTION d se-rdops-vmo5-dhcD-149-2 Summary Monitor Configure Permissions Datastores tes and Alarms duplication and Compression Overview 日v16015125 日8016020129 t Ops sed-Pnysically wrtten 7020 口1o16022333 7o0G日 Overview Breakdown ot the used capacity VSAN irtual objects 7200M40 75600MB(4 Porformarco diap 62a6 步骤 1导航到vSAN群集。 2单击监控选项卡。 在“SAN”下,单击容量以查看vsAN容量信息。 vSphere Web Client 单击vSAN。 b单击容量以查看vsAN容量信息 “容量概览”显示vSAN数据存储的存储容量,包括已用空间和可用空间。“已用容量细目”显示不同对象 类型或数据类型使用的容量百分比。如果选择数据类型,VSAN将显示主要虚拟机数据使用的容量百分比、 vSAN开销以及临时开销。如果选择“对象类型”,SAN将显示以下对象类型使用的容量百分比 虚拟磁盘 虚拟机主页对象 交换对象 性能管理对象 ∨mem对象 文件系统开销 校验和开销 VMware,lc保留所有权利
步骤 1 导航到 vSAN 群集。 2 单击监控选项卡。 选项 描述 vSphere Client 在“vSAN”下,单击容量以查看 vSAN 容量信息。 vSphere Web Client a 单击 vSAN。 b 单击容量以查看 vSAN 容量信息。 “容量概览”显示 vSAN 数据存储的存储容量,包括已用空间和可用空间。“已用容量细目”显示不同对象 类型或数据类型使用的容量百分比。如果选择数据类型,vSAN 将显示主要虚拟机数据使用的容量百分比、 vSAN 开销以及临时开销。如果选择“对象类型”,vSAN 将显示以下对象类型使用的容量百分比: n 虚拟磁盘 n 虚拟机主页对象 n 交换对象 n 性能管理对象 n Vmem 对象 n 文件系统开销 n 校验和开销 n 去重和压缩开销 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 7
vSAN监控和故障排除 去重引擎的空间注意事项 isCS主对象和目标对象,以及 ISCSI LUN ■其他对象类型,例如用户创建的文件、虚拟机模板等 可以查看vSAN数据存储中容量使用情况的历史记录。单击容量历史记录,选择时间范围,然后单击显示结 果 如果在群集上启用去重和压缩功能,则“去重和压缩概览”将显示与该功能相关的容量信息。在启用去重和 压缩功能时,由于磁盘空间进行回收和重新分配,因此可能需要几分钟才能在“容量”监控中反映容量更 新。有关去重和压缩的详细信息,请参见《管理 VMware VSAN》中的“使用去重和压缩”。 监控物理设备 可以监控vSAN群集中使用的主机、缓存设备和容量设备。 1导航到vSAN群集。 2单击监控选项卡 3单击物理磁盘可查看群集中所有主机、缓存设备以及容量设备。此时vSAN将显示有关容量设备的信 息,如总容量、已用容量、预留容量、运行状态、物理位置等。物理位置基于vSAN主机上的缓存设备 和容量设备的硬件位置。 监控加入SAN数据存储的设备 验证备份vSAN数据存储的设备的状态。您可以检查设备是否出现问题 步骤 1导航到存储 2选择vsAN数据存储。 3单击配置选项卡。 可以查看有关vsAN数据存储的常规信息,包括容量、功能和默认存储策略。 4显示有关本地设备的信息。 a单击磁盘管理,然后选择要在页面底部的表中显示本地设备的磁盘组 b单击容量可查看群集中有关已置备和已用容量的信息,还可以按对象类型或数据类型查看已用容量 的细目。 监控vsAN群集中的虚拟对象 您可以查看vSAN群集中的虚拟对象的状态。 或多个主机无法与vSAN数据存储通信时,可能不会显示有关虚拟对象的信息 VMware,lc保留所有权利
n 去重引擎的空间注意事项 n iSCSI 主对象和目标对象,以及 iSCSI LUN n 其他对象类型,例如用户创建的文件、虚拟机模板等 可以查看 vSAN 数据存储中容量使用情况的历史记录。单击容量历史记录,选择时间范围,然后单击显示结 果。 如果在群集上启用去重和压缩功能,则“去重和压缩概览”将显示与该功能相关的容量信息。在启用去重和 压缩功能时,由于磁盘空间进行回收和重新分配,因此可能需要几分钟才能在“容量”监控中反映容量更 新。有关去重和压缩的详细信息,请参见《管理 VMware vSAN》中的“使用去重和压缩”。 监控物理设备 可以监控 vSAN 群集中使用的主机、缓存设备和容量设备。 步骤 1 导航到 vSAN 群集。 2 单击监控选项卡。 3 单击物理磁盘可查看群集中所有主机、缓存设备以及容量设备。此时 vSAN 将显示有关容量设备的信 息,如总容量、已用容量、预留容量、运行状态、物理位置等。物理位置基于 vSAN 主机上的缓存设备 和容量设备的硬件位置。 监控加入 vSAN 数据存储的设备 验证备份 vSAN 数据存储的设备的状态。您可以检查设备是否出现问题。 步骤 1 导航到存储。 2 选择 vSAN 数据存储。 3 单击配置选项卡。 可以查看有关 vSAN 数据存储的常规信息,包括容量、功能和默认存储策略。 4 显示有关本地设备的信息。 a 单击磁盘管理,然后选择要在页面底部的表中显示本地设备的磁盘组。 b 单击容量可查看群集中有关已置备和已用容量的信息,还可以按对象类型或数据类型查看已用容量 的细目。 监控 vSAN 群集中的虚拟对象 您可以查看 vSAN 群集中的虚拟对象的状态。 一个或多个主机无法与 vSAN 数据存储通信时,可能不会显示有关虚拟对象的信息。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 8
vSAN监控和故障排除 步骤 1导航到vSAN群集。 2单击监控选项卡 在vSAN下,选择虚拟对象以查看vSAN群集中的相应虚拟对象。 a在页面顶部的受影响的清单对象区域中选择一种对象类型可显示每个对象的相关信息,例如运行状 况和可用性、存储策略以及 VSAN UU|D。 b在其中一个虚拟对象上选中复选框,然后单击查看放置详细信息可打开“物理放置”对话框。可以 查看设备信息,例如名称、标识符或UUD、用于每个虚拟机的设备数以及在主机间的镜像方式 在“物理放置”对话框中,选中按主机放置对组件分组复选框可按主机和按磁盘组织对象 关于vSAN群集重新同步 可以监控vSAN群集中正在重新同步的虚拟机对象的状态。 当硬件设备、主机或网络出现故障,或将主机置于维护模式时,VSAN将在vSAN群集中启动重新同步。但 是,VSAN可能会暂时等待故障组件恢复联机,然后再启动重新同步任务。 以下事件将在群集中触发重新同步操作: ■编辑虚拟机αⅧM存储策略。更改虚拟机存储策略设置时,SAN可能启动对象重新创建,随后会重新 同步对象。 某些策略更改可能会导致vSAN创建对象的其他版本,并与以前的版本重新同步。完成重新同步后,将 弃用原始对象。 vSAN可确保虚拟机继续运行,且重新同步过程不会中断虚拟机的操作。该过程可能需要更多临时容量 出现故障后,重新启动主机。 从永久或长期故障中恢复主机。如果主机超过60分钟不可用(默认),VSAN将创建数据副本以恢复 完整的策略合规性 将主机置于维护模式之前,使用“迁移全部数据”模式撤出数据。 超过容量设备的容量阈值。vSAN群集中的容量设备接近或超过80%的阈值水平时,会触发重新同步。 如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的OPS 在vSAN群集中监控重新同步任务 要评估正在重新同步的对象的状态,可以监控正在进行的重新同步任务 前提条件 确认vSAN群集中的主机运行的是ESXi6.5或更高版本 1导航到vSAN群集。 VMware,lc保留所有权利
步骤 1 导航到 vSAN 群集。 2 单击监控选项卡。 3 在 vSAN 下,选择虚拟对象以查看 vSAN 群集中的相应虚拟对象。 a 在页面顶部的受影响的清单对象区域中选择一种对象类型可显示每个对象的相关信息,例如运行状 况和可用性、存储策略以及 vSAN UUID。 b 在其中一个虚拟对象上选中复选框,然后单击查看放置详细信息可打开“物理放置”对话框。可以 查看设备信息,例如名称、标识符或 UUID、用于每个虚拟机的设备数以及在主机间的镜像方式。 c 在“物理放置”对话框中,选中按主机放置对组件分组复选框可按主机和按磁盘组织对象。 关于 vSAN 群集重新同步 可以监控 vSAN 群集中正在重新同步的虚拟机对象的状态。 当硬件设备、主机或网络出现故障,或将主机置于维护模式时,vSAN 将在 vSAN 群集中启动重新同步。但 是,vSAN 可能会暂时等待故障组件恢复联机,然后再启动重新同步任务。 以下事件将在群集中触发重新同步操作: n 编辑虚拟机 (VM) 存储策略。更改虚拟机存储策略设置时,vSAN 可能启动对象重新创建,随后会重新 同步对象。 某些策略更改可能会导致 vSAN 创建对象的其他版本,并与以前的版本重新同步。完成重新同步后,将 弃用原始对象。 vSAN 可确保虚拟机继续运行,且重新同步过程不会中断虚拟机的操作。该过程可能需要更多临时容量。 n 出现故障后,重新启动主机。 n 从永久或长期故障中恢复主机。如果主机超过 60 分钟不可用(默认),vSAN 将创建数据副本以恢复 完整的策略合规性。 n 将主机置于维护模式之前,使用“迁移全部数据”模式撤出数据。 n 超过容量设备的容量阈值。vSAN 群集中的容量设备接近或超过 80% 的阈值水平时,会触发重新同步。 如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的 IOPS。 在 vSAN 群集中监控重新同步任务 要评估正在重新同步的对象的状态,可以监控正在进行的重新同步任务。 前提条件 确认 vSAN 群集中的主机运行的是 ESXi 6.5 或更高版本。 步骤 1 导航到 vSAN 群集。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 9
vSAN监控和故障排除 2选择监控选项卡。 3(可选)在 vSphere Web Client中,单击vsAN。 4选择重新同步对象 5跟踪虚拟机对象的重新同步进度。您可以查看重新同步完成之前剩余的字节数。 您也可以查看群集中当前正在同步的对象数量、重新同步预计完成的时间、存储对象完全符合分配的存 储策略需要的剩余时间等信息 对象修复时间定义将主机置于失败状态或维护模式之后修复不合规对象之前SAN等待的时间。默认设 置为60分钟。要更改设置,请编辑对象修复定时器(配置>SAN>服务>高级选项)。 如果群集存在连接问题,则“重新同步对象”页面上的数据可能不会按预期刷新。字段反映的信息可能 不准确 限制vSAN群集中的重新同步活动 您可以减少用于在vsAN群集中的磁盘组上执行重新同步的IoPS数。重新同步限制设置适用于整个群集 以每个磁盘组为基础进行应用。 如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的|OPS数。仅当因重新同步导致群集 中延迟加剧,或主机上重新同步流量过高时,考虑限制重新同步。 重新同步限制可能会增加完成重新同步所需的时间。可能会延迟不合规虚拟机的重新保护。 1导航到vSAN群集 2选择监控选项卡。 3(可选)在 vSphere Web Client中,单击vSAN。 4选择重新同步对象,然后单击重新同步限制。 5(可选)单击显示当前每个主机的重新同步流量以查看重新同步活动 6选中为重新同步对象流量启用限制复选框。 7移动滑块以设置限制,如下所述 向右移动滑块可增加允许用于重新同步的OPS量。 ■向左移动滑块可减少允许用于重新同步的OPS量。 常规做法是将OPS数限制到原有数量的一半并为群集预留一段适应时间。如果需要进一步操作,则再 次将OPs数减半直至群集稳定为止 8单击应用或确定。 关于vSAN群集重新平衡 当群集中任何容量设备中存储的数据达到总容量的80%时,wSAN将自动重新平衡群集,直到所有容量设 备上的可用空间都低于阈值 VMware,lc保留所有权利
2 选择监控选项卡。 3 (可选)在 vSphere Web Client 中,单击 vSAN。 4 选择重新同步对象。 5 跟踪虚拟机对象的重新同步进度。您可以查看重新同步完成之前剩余的字节数。 您也可以查看群集中当前正在同步的对象数量、重新同步预计完成的时间、存储对象完全符合分配的存 储策略需要的剩余时间等信息。 对象修复时间定义将主机置于失败状态或维护模式之后修复不合规对象之前 vSAN 等待的时间。默认设 置为 60 分钟。要更改设置,请编辑对象修复定时器(配置 > vSAN > 服务 > 高级选项)。 如果群集存在连接问题,则“重新同步对象”页面上的数据可能不会按预期刷新。字段反映的信息可能 不准确。 限制 vSAN 群集中的重新同步活动 您可以减少用于在 vSAN 群集中的磁盘组上执行重新同步的 IOPS 数。重新同步限制设置适用于整个群集, 以每个磁盘组为基础进行应用。 如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的 IOPS 数。仅当因重新同步导致群集 中延迟加剧,或主机上重新同步流量过高时,考虑限制重新同步。 重新同步限制可能会增加完成重新同步所需的时间。可能会延迟不合规虚拟机的重新保护。 步骤 1 导航到 vSAN 群集。 2 选择监控选项卡。 3 (可选)在 vSphere Web Client 中,单击 vSAN。 4 选择重新同步对象,然后单击重新同步限制。 5 (可选)单击显示当前每个主机的重新同步流量以查看重新同步活动。 6 选中为重新同步对象流量启用限制复选框。 7 移动滑块以设置限制,如下所述: n 向右移动滑块可增加允许用于重新同步的 IOPS 量。 n 向左移动滑块可减少允许用于重新同步的 IOPS 量。 常规做法是将 IOPS 数限制到原有数量的一半并为群集预留一段适应时间。如果需要进一步操作,则再 次将 IOPS 数减半直至群集稳定为止。 8 单击应用或确定。 关于 vSAN 群集重新平衡 当群集中任何容量设备中存储的数据达到总容量的 80% 时,vSAN 将自动重新平衡群集,直到所有容量设 备上的可用空间都低于阈值。 vSAN 监控和故障排除 VMware, Inc. 保留所有权利。 10