正在加载图片...
第1期 李江昀等:双过程机热备份集群系统的可信性建模与仿真 77. 1 λ一MTTF (6) 以太网LAN 式中,MTTF为平均无故障运行时间. 定义5修复率“:当系统的修复服从指数分 中口心跳线 布时,修复率为常数,即 Server 以太网心跳线 Server A 1 -MTTR (7) 1Gbit以太网 4一一一…---物 式中,MTTR(mean time to repair)为平均修复时 间 磁盘阵列RAID 2THC系统结构和原理 图1THC系统体系结构 2.1硬件拓扑 Fig.1 Architecture of THC THC系统基本硬件拓扑如图1所示).其中, 磁盘阵列可以有效避免磁盘镜像方式的缺点, 心跳线是所有类型高可用性集群的必选连接。心跳 但是盘阵可能成为双过程机系统的单一故障点,从 是指应用系统的一次最小的成功操作,比如成功录 而降低系统的可用性, 入一条记录、成功修改一个档案等;也可以是主、备 2.2工作方式 机通信软件发出的状态报告信号,心跳通过心跳线 (l)双工方式(active/active):两台主机同时运 传输,备机通过判断心跳有无和心跳内容,便可以识 行各自的服务工作,且相互监测对方的情况.当一 别出诸如系统宕机、应用进程被杀掉、心跳线、网络 台主机宕机时,另外一台主机立即接管它的工作,保 线缆是否断开等故障.,配置多条心跳线,可以有效 证工作不间断. 避免由于其中一条意外断开而引起的非主机故障启 (2)主从方式(active//standby):主机工作,从机 用备份机 处于在线监控准备状态,当主机宕机时,从机接管 图中虚线表示可选连接,THC系统数据共享 主机的工作. 可分为磁盘镜像和磁盘阵列两种方式, 无论哪种工作方式,系统节点的服务切换都要 磁盘镜像方式中,每台服务器都有自己的数据 经历故障节点脱离集群、应用程序重新配置和修复 磁盘,并且不断地通过高速以太网,把活动数据从服 节点加入系统的过程,其间,系统暂停对外服务 务器复制到备用服务器,此方式可以消除系统的单 在生产实际中,由于单台小型机或高性能P℃ 点故障(SPOF)·但是该方式最大的缺点是,当故障 足以满足运算需求,故以第二种工作方式为主· 发生在工作机进行磁盘写操作时,会丢失链路中正 在复制的数据,使得备份机的磁盘数据无法更新· 3THC系统建模 另外,备份服务器维护数据镜像需要很高的网络和 3.1过程机子模型 服务器开销. 过程机行为特性如图2所示[].模型各部分 tn id pniu in iu pu pn pu tn pd pn_cb pn pd pn tn 1o D ic in ic n pc pn pc tn po pn cb in dfl 变迁授权函数 pd up inbf#pnup)=0V拟pdup0 tn cb #(pn_cb)=2 图2过程机SRN网模型 Fig-2 SRN model of nodesλ= 1 MTTF (6) 式中‚MTTF 为平均无故障运行时间. 定义5 修复率 μ:当系统的修复服从指数分 布时‚修复率为常数‚即 μ= 1 MTTR (7) 式中‚MTTR (mean time to repair)为平均修复时 间. 2 THC 系统结构和原理 2∙1 硬件拓扑 T HC 系统基本硬件拓扑如图1所示[5].其中‚ 心跳线是所有类型高可用性集群的必选连接.心跳 是指应用系统的一次最小的成功操作‚比如成功录 入一条记录、成功修改一个档案等;也可以是主、备 机通信软件发出的状态报告信号.心跳通过心跳线 传输‚备机通过判断心跳有无和心跳内容‚便可以识 别出诸如系统宕机、应用进程被杀掉、心跳线、网络 线缆是否断开等故障.配置多条心跳线‚可以有效 避免由于其中一条意外断开而引起的非主机故障启 用备份机. 图中虚线表示可选连接.T HC 系统数据共享 可分为磁盘镜像和磁盘阵列两种方式. 磁盘镜像方式中‚每台服务器都有自己的数据 磁盘‚并且不断地通过高速以太网‚把活动数据从服 务器复制到备用服务器.此方式可以消除系统的单 点故障(SPOF).但是该方式最大的缺点是‚当故障 发生在工作机进行磁盘写操作时‚会丢失链路中正 在复制的数据‚使得备份机的磁盘数据无法更新. 另外‚备份服务器维护数据镜像需要很高的网络和 服务器开销. 图1 THC 系统体系结构 Fig.1 Architecture of THC 磁盘阵列可以有效避免磁盘镜像方式的缺点‚ 但是盘阵可能成为双过程机系统的单一故障点‚从 而降低系统的可用性. 2∙2 工作方式 (1) 双工方式(active/active):两台主机同时运 行各自的服务工作‚且相互监测对方的情况.当一 台主机宕机时‚另外一台主机立即接管它的工作‚保 证工作不间断. (2) 主从方式(active/standby):主机工作‚从机 处于在线监控准备状态.当主机宕机时‚从机接管 主机的工作. 无论哪种工作方式‚系统节点的服务切换都要 经历故障节点脱离集群、应用程序重新配置和修复 节点加入系统的过程.其间‚系统暂停对外服务. 在生产实际中‚由于单台小型机或高性能 PC 足以满足运算需求‚故以第二种工作方式为主. 3 THC 系统建模 3∙1 过程机子模型 过程机行为特性如图2所示[6—8].模型各部分 图2 过程机 SRN 网模型 Fig.2 SRN model of nodes 第1期 李江昀等: 双过程机热备份集群系统的可信性建模与仿真 ·77·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有