【虚拟化实战】容灾设计之一VR vs SRM

时间:2023-03-09 20:17:39
【虚拟化实战】容灾设计之一VR vs SRM

作者:范军 (Frank Fan) 新浪微博:@frankfan7

从本文开始,我们将介绍一系列的关于容灾的解决方案。先探讨应用的场景,然后再深入介绍技术架构。

情景一:

某小型公司的虚拟化环境中,在5台ESXi服务器上运行100台虚拟机。采用NFS存储。其中需要异地恢复的虚拟机10台。对于异地容灾RPO的要求是30分钟,RTO是1小时。已经使用vSphereStandard 许可。软件购买成本有限。

建议:

采用vSphere Replication (VR)

VR对于已经使用vSphere essential 以上许可的用户是免费的。 VR能够满足RPO30分钟的要求。

技术细节:

VR适用于本地的恢复,或者异地恢复。异地场景如下图所示:

【虚拟化实战】容灾设计之一VR vs SRM

VR的全部功能是有VR Appliance来实现的。VR  Appliance和安装在每个ESXi上的VRA通讯,在第一次的数据同步完成后(baselineSynchronization),仅仅传送以后更改的数据到异地。

考虑因素:

以下虚拟机是不适合使用VR来容灾的:

AD,DNS, LDAP 等两地共享的虚拟机

vCenter

RPO要求<15 分钟

Physical RDM

情景二:

某大型公司的虚拟化环境较复杂,在50台ESXi服务器上运行1500台虚拟机。采用SAN。其中需要异地恢复的虚拟机100台。对于异地容灾要求RPO 30分钟。  RTO是20分钟。

建议:

采用VMware Site Recovery  Manager (SRM)

尽管VR也能满足30分钟RPO的要求,但较难实现100台虚拟机在20分钟内完全在异地恢复(RTO=20分钟)。因为VR的恢复是人工来操作的。

SRM完全可以实现预先设定恢复的工作流,并充分测试。需要是只需要一键触发恢复,完全在后台自动完成。当然SRM需要额外购买许可。注意VR和SRM可以一同使用。

技术细节:

【虚拟化实战】容灾设计之一VR vs SRM

SRM是一个Orchestrator, 设计工作流并且执行恢复的动作。数据的同步是依赖于和存储设备直接通讯的SRA

考虑因素:

设计相对比VR要复杂

存储设备需要支持SRM

参考:

VMworld 2013: Session BCO5129- Protection for All

VMware  vSphere Replication Overview

Site Recovery Manager 5.1Documentation Center