MSG300:实现 Exchange 2000高可用性 Exchange项目经理 微软研究开发中心 网络工程师讲义 张智勇
网络工程师讲义 张智勇 MSG300: MSG300: 实现Exchange Exchange 2000 高可用性 Exchange Exchange 项目经理 微软研究开发中心 微软研究开发中心
日程 什么是高可用性 ●高可用性要素分析 ●系统关键性组件对高可靠性的影响 ●高可用性的设计策略 网络工程师讲义 张智勇
网络工程师讲义 张智勇 日程 z什么是高可用性 z高可用性要素分析 z系统关键性组件对高可靠性的影响 z高可用性的设计策略
什么是高可用性 高可用性不是: ○产品包中带的一个组件 ○最终目的 O仅仅保证系统正常运行 ●高可用性是: ○不断改进、逐步提高的过程 ○难于处理、复杂而且棘手 要求迫切 网络工程师讲义 张智勇
网络工程师讲义 张智勇 什么是高可用性 z高可用性不是: {产品包中带的一个组件 {最终目的 {仅仅保证系统正常运行 z高可用性是: {不断改进、逐步提高的过程 {难于处理、复杂而且棘手 {要求迫切
要求迫切 造成了损失 可能造成了实际后果 由于应用程序运行不正常而造成的收入损失 应用程序 损失/分钟 Call location $27,000 Number portability $14,000 ERP $13,000 Supply chain mgmt $10,000 Electronic commerce $7,000 Internet banking $6,000 Universal phone services $3700 Customer service $1,000 Microsoft (ech 2001
要求迫切 z 造成了损失 z 可能造成了实际后果 可能造成了实际后果 由于应用程序运行不正常而造成的收入损失 应用程序 Call location Call location Number portability Number portability ERP Supply chain mgmt Supply chain mgmt Electronic commerce Electronic commerce Internet banking Internet banking Universal phone services Universal phone services Customer service Customer service 损失 / 分钟 $27,000 $27,000 $14,000 $14,000 $13,000 $13,000 $10,000 $10,000 $7,000 $6,000 $3,700 $1,000
错综复杂而且棘手 ●很容易设计高可用性 O只是简单实现! 很难设计得非常完善 O避免不必要的复杂性 ○重点加强关键单点故障 ●明确设计原则是问题的关键 网络工程师讲义 张智勇
网络工程师讲义 张智勇 错综复杂而且棘手 z很容易设计高可用性 {只是简单实现! z很难设计得非常完善 {避免不必要的复杂性 {重点加强关键单点故障 z明确设计原则是问题的关键
可用性指数 容错 Business continuance site 99999 4-Node Cluster 9999 Windows datacenter Server Replication 高 99.5 Application Data Management H 990 2-Node cluster 8.0 RAID/storage management 增强 Mirrored Set 965 基本 95.0 Backup 成本 2001
可用性指数 95.0 96.5 98.0 99.0 99.5 99.99 99.999 100 % 基本 增强 高 容错 Backup Mirrored Set Mirrored Set Volume Management Volume Management 2-Node Cluster Node Cluster Application Data Management Application Data Management 4-Node Cluster Node Cluster Windows Datacenter Server Windows Datacenter Server Replication RAID/storage management RAID/storage management Business Continuance Site 可用性 成本
高可用性要素分析 停机意味着什么? ●单点故障 网络工程师讲义 张智勇
网络工程师讲义 张智勇 高可用性要素分析 z停机意味着什么? z单点故障
停机意味着什么? Percentage Percentage Downtime Downtime Uptime Downtime Per Year Per Week 965% 3.5% 12d18h 5h53m 98% 7d 7h 3h22m 99% 2—1 /0 3d15h 1h 41m 998% 0.2% 17h 30m 20m 10sec 999% 0.1% 8h45m 10m 5sec 9999% 0.01% 52.5m 60sec 999999 0.001% 525m osec 999999%00001%315sec 0sec Source: Morris Stern, Blueprints for High Availability
停机意味着什么? 停机意味着什么? 96.5% 3.5% 12d 18h 5h 53m 99.9999% 99.9999% 0.0001% 0.0001% 31.5sec 0.6sec 99.999% 99.999% 0.001% 5.25 m 6sec 99.99% 0.01% 52.5 m 60sec 99.9% 0.1% 8h 45m 10m 5sec 99.8% 0.2% 17h 30m 20m 10sec m 10sec 99% 1% 3d 15h 1h 41m 98% 2% 7d 7h 3h 22m Downtime Per Week Downtime Per Year Percentage Downtime Percentage Uptime Source: Morris & Stern, Source: Morris & Stern, Blueprints for High Availability Blueprints for High Availability
EOg份机意味着什么 ●丢失存储的邮件 ○可能是永久丢失,也可能是暂时丢失! ●无法发送或接收邮件 ●丧失应用程序访问能力 引起老板的不满 网络工程师讲义 张智勇
网络工程师讲义 张智勇 Exchange 停机意味着什么 z丢失存储的邮件 {可能是永久丢失,也可能是暂时丢失! z无法发送或接收邮件 z丧失应用程序访问能力 z引起老板的不满
导致停机的原因 ●数据损坏 ●硬件/软件 ●超负载(邮件循环等) ●人为失误 ●系统维护 ●病毒或其它恶意攻击 网络工程师讲义 张智勇
网络工程师讲义 张智勇 导致停机的原因 z数据损坏 z硬件 /软件 z超负载(邮件循环等) z人为失误 z系统维护 z病毒或其它恶意攻击