高可用是什么意思?该如何保障系统的高可用?

时间:2024-03-16 16:05:05

在讨论服务器领域的时候,我们常常会听到“高可用”一词,那么“高可用”到底是什么意思,应该怎么去理解呢?

高可用(HA)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。而服务器的可用性是指单位时间内(通常一年),服务器可以正常工作的时间比例。

 

高可用是什么意思?该如何保障系统的高可用?

那么如何衡量高可用呢?假设你的系统全年都是正常提供服务,那么就是说你系统的可用性是100%,当然这个值是理想状态下。服务器的可用性一般都是以几个9来表示,比如99%、99.9%、99.99%,9越多就代表可用性越强。这个9是怎么算出来的呢?

可用性=平均故障间隔/(平均故障间隔 + 故障恢复平均时间)

可用性为99%的系统全年停机时间为3.5天;可用性99.9%的系统全年停机时间为8.8小时;而可用性为99.99%的系统全年停机时间为53分钟;至于99.999%的系统全年停机时间仅仅约为5分钟。目前大部分企业的高可用目标是4个9,就是99.99%,也就是允许这台系统的年停机时间约为53分钟。

高可用是什么意思?该如何保障系统的高可用?

 

想要实现高可用就要避免使用单点,你想想看你的单台服务器再强应用优化得再极致,只要它宕机,就都凉凉了,所以需要多台机器也就是需要集群,方法论中叫冗余。如果有冗余备份,宕机了还有其他backup能够顶上,才可能实现高可用。只是有了集群是不能完全满足复杂业务的高可用的,目前业内已经有越来越多的运维人员采用高可用集群软件去保障系统的高可用性。

在高可用集群朝多样化、易操作维护等方向迅速发展的今天,市场上的高可用集群软件产品品种繁多,但对于任何一款高可用集群产品,故障监视都是最核心的功能。监视资源种类的多少和监视层次的深浅,都成为评价一款集群软件高可用性的重要指标。

目前市面上成熟的高可用集群软件已有不少,比如国外就有RedHat 公司的RHCS、Novell公司的Novell Cluster Service、Steeleye公司的Lifekeeper for Linux、Keepalived等,而在国内则是中兴新支点的高可用集群软件——Newstart HA比较有代表性。

高可用是什么意思?该如何保障系统的高可用?

 

高可用集群软件如何保障系统持续不间断运行?我们就以中兴新支点的高可用集群软件为例来简单说说。NewStart HA无需改变任何服务和应用,即可保证系统故障和部件故障时应用不中断;可以自动监控服务器、网卡、浮动 IP 、存储和业务,生产中心失效会自动切换到灾备中心;可实现数据实时同步,切换时间为秒级,因此可以为系统提供电信级,高达 99.999% 的高可用性。