正在加载图片...
第1期 李江昀等:双过程机热备份集群系统的可信性建模与仿真 .79 pd cb 用数值1的稳态可用度Aa1=99.9915%,THC使 用数值2的稳态可用度A2=99.9957%.系统全 年减少的停机时间为△t=(A2一Aa1)X525960= 22.09min 表5模型输入参数 Table 5 Input parameter of SRN model 变迁 授权函数 id nb #(pn_up)-0A(#(pn w)+#(pn cb))<2 模型参数 数值1 数值2 节点平均无永久故障时间,(1/入。p)/h20000 20000 图3磁盘阵列SRN模型 发现未被检测到的永久故障的平均时 30 15 Fig-3 SRN model of raid 间,(l/入_d)/min 表3磁盘阵列SRN模型中位置与变迁的意义 节点平均修复时间,(l/入m)/mim 60 Table 3 Places and transitions of the SRN model in raid 节点平均无临时故障时间,(1/入。)/h 5000 5000 位置 意义 位置意义 发现未被检测到的临时故障的平均时 30 15 pd-up磁盘阵列正常运行 td-f 磁盘阵列故障 间,(1/入u-a)/min pd-r 磁盘阵列修复 td-r 磁盘阵列修复 临时故障的节点脱离集群的平均时间, 10 10 pd-cb磁盘阵列修复后,集群重起 tn-c山由磁盘阵列修复重起 (1/入m_)/s id-b由节点修复重起 永久故障的节点脱离集群的平均时间, 10 10 (1/入m-m)/s 3.3系统可用性分析 THC系统由两个子模型组成,可分别对盘阵共 节点重起的平均时间,(l/入m_b)/min 10 享和镜像共享两种方式进行仿真.两种方式的系统 节点加入集群的平均时间,(1/入mm)/s 5 5 可用条件如表4所示, 集群重起的平均时间,(/入m_由)/min 10 5 表4THC系统可用条件 磁盘阵列平均无故障时间,(1/入d_)h 20000 20000 Table 4 Condition of availability in THC 磁盘阵列平均修复时间,(l/入d:)/min 60 30 共享 回报函数 由磁盘阵列修复重起的平均时间, 10 (1/入d_)/min 盘阵 #(pn-up)>#(pd-up)=1A#(pn-pf)=0A #(pn-if)=0A#(pn-w)=0#(pn-cb)=0 由图4可以看出,将人工发现故障时间、修复系 镜像 #(pn-up)>#(pn-pf)=0A#(pn-if )=0A #(pm-w)=0A#(pn-cb)=0 统时间和系统重起时间缩短为原系统的1/2时,可 有效提高系统可用度,即全年停机时间减少 使用盘阵共享方式时,两个子模型由共同的 22.09min tn-cb变迁和盘阵pd-p位置引出的禁止弧联结; 100.000 使用镜像共享时,因磁盘配置于节点之内,过程机子 99.999 模型本身便可仿真系统行为 ¥99.997 数值2 4仿真分析 99.995 以表5所列数据为输入参数,使用SPNP 数值1 (Stochastic Reward Nets Package)软件包Ver6.0对 99.993 0 2 3 4 数据进行处理,分析仿真结果.SPNP软件包是由美 t/h 国Duke大学的Trivedi教授所领导的研究小组研究 图4单机可用性的提高对系统可用性的影响 和开发,经过多年的运行和修版,已经成为较权威的 Fig.4 Improvement of one node's availability effect on system SRN仿真软件,目前最高版本为Ver6.0. (1)系统带磁盘阵列时,使用数值1与数值2 (2)系统带磁盘阵列时,使用数值1,分别在发 在95%可发现概率下的瞬时可用度比较:THC使 现概率95%,90%,85%下的瞬时可用度比较如图图3 磁盘阵列 SRN 模型 Fig.3 SRN model of raid 表3 磁盘阵列 SRN 模型中位置与变迁的意义 Table3 Places and transitions of the SRN model in raid 位置 意义 pd—up 磁盘阵列正常运行 pd—r 磁盘阵列修复 pd—cb 磁盘阵列修复后‚集群重起 位置 意义 td—f 磁盘阵列故障 td—r 磁盘阵列修复 tn—cb 由磁盘阵列修复重起 id—nb 由节点修复重起 3∙3 系统可用性分析 T HC 系统由两个子模型组成‚可分别对盘阵共 享和镜像共享两种方式进行仿真.两种方式的系统 可用条件如表4所示. 表4 THC 系统可用条件 Table4 Condition of availability in THC 共享 回报函数 盘阵 #(pn—up)>0∧#(pd—up)=1∧#(pn—pf )=0∧ #(pn—if)=0∧#(pn—w)=0∧#(pn—cb)=0 镜像 #(pn—up)>0∧#(pn— pf )=0∧#(pn—if )=0∧ #(pn—w)=0∧#(pn—cb)=0 使用盘阵共享方式时‚两个子模型由共同的 tn—cb 变迁和盘阵 pd—up 位置引出的禁止弧联结; 使用镜像共享时‚因磁盘配置于节点之内‚过程机子 模型本身便可仿真系统行为. 4 仿真分析 以表5所列数据为输入参数[9]‚使用 SPNP (Stochastic Reward Nets Package)软件包 Ver6∙0对 数据进行处理‚分析仿真结果.SPNP 软件包是由美 国 Duke 大学的 Trivedi 教授所领导的研究小组研究 和开发‚经过多年的运行和修版‚已经成为较权威的 SRN 仿真软件‚目前最高版本为 Ver6∙0. (1) 系统带磁盘阵列时‚使用数值1与数值2 在95%可发现概率下的瞬时可用度比较:T HC 使 用数值1的稳态可用度 Ass1=99∙9915%‚T HC 使 用数值2的稳态可用度 Ass2=99∙9957%.系统全 年减少的停机时间为Δt=( Ass2— Ass1)×525960= 22∙09min. 表5 模型输入参数 Table5 Input parameter of SRN model 模型参数 数值1 数值2 节点平均无永久故障时间‚(1/λtn— p)/h 20000 20000 发现未被检测到的永久故障的平均时 间‚(1/λtn— pd)/min 30 15 节点平均修复时间‚(1/λtn— r)/min 60 30 节点平均无临时故障时间‚(1/λtn— i)/h 5000 5000 发现未被检测到的临时故障的平均时 间‚(1/λtn— id)/min 30 15 临时故障的节点脱离集群的平均时间‚ (1/λtn— io)/s 10 10 永久故障的节点脱离集群的平均时间‚ (1/λtn— po)/s 10 10 节点重起的平均时间‚(1/λtn— b)/min 10 5 节点加入集群的平均时间‚(1/λtn— in)/s 5 5 集群重起的平均时间‚(1/λtn— cb)/min 10 5 磁盘阵列平均无故障时间‚(1/λtd— f)/h 20000 20000 磁盘阵列平均修复时间‚(1/λtd— r)/min 60 30 由磁盘阵列修复重起的平均时间‚ (1/λtd— cb)/min 10 5 由图4可以看出‚将人工发现故障时间、修复系 统时间和系统重起时间缩短为原系统的1/2时‚可 有效 提 高 系 统 可 用 度‚即 全 年 停 机 时 间 减 少 22∙09min. 图4 单机可用性的提高对系统可用性的影响 Fig.4 Improvement of one node’s availability effect on system (2) 系统带磁盘阵列时‚使用数值1‚分别在发 现概率95%‚90%‚85%下的瞬时可用度比较如图 第1期 李江昀等: 双过程机热备份集群系统的可信性建模与仿真 ·79·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有