SRM:SiteRecoveryManager server为vmware为数据中心设计灾难备份机制
下面介绍SRM常见术语和常见设计
SiteRecoveryManager server在受保护端和恢复端各自建立一个,被各自的vcenter控制
recovery point objective(RPO)和recovery time objective(RTO)是设计和实施灾难恢复时必须考虑的两个要素
RPO是可接受的数据丢失量
RTO是灾难发生后恢复的时间
SiteRecoveryManager两边的硬件没强制要求一致
SiteRecoveryManager可使用一个数据库来
保护端的SiteRecoveryManager数据库存储了受保护组的设置和受保护的vm
恢复端的SiteRecoveryManager数据库存储的信息依赖于恢复计划的设置、恢复计划测试的结果、真实执行恢复计划的结果、在执行test或者really的恢复的时候的处理:
SiteRecoveryManager对有些硬盘的要求是占时的,对有些存储的要求是永久的
数据库的大小依赖于:受保护的VM上的数量、组的数量、恢复计划的数量、恢复期间的瞬间数据的速度、恢复计划的别的特性
保护的步奏:1)部署管理的配置
2)映射的详细配置 映射网络、主机资源、VM的文件夹在保护端和恢复端
3)创建受保护组 保护受保护组、在恢复site创建占位符
恢复的步奏:1)创建恢复计划
2)测试恢复
3)真实恢复
test recovery time一般大于真正恢复的时间,
test recovery time=Power off vm+resetting storage+重新放至VM(VM存储的占位)
site recovery Management最多保护500VM,最多150个组
site recovery Management支持同时执行3个恢复计划
因为site recovery Management需要把自己底层存储信息给recovery site,所以每次创建一个保护组就需要建立一个存储快照,所以增加组没有增加VM好
在recovery site启用DRS
若没启用DRS VM最好手动指定放在哪个host上
VM恢复的优先级:high、normal、low
注意VM之间具有依赖关系的需要放至同一优先级里
注意tools最好安装:
如果tools木有安装,最好修改timeout value:wait for OS heartbeat和wait for network change
wait for vm to shutdown on the protected site:
在真正的恢复过程中,site recovery Management会从OS级别关闭OS,如果失败才会强制关闭OS,假如你想直接强制关闭OS,你需要修改timeout
这个设置只需要对没安装tools的VM做,安装tools的VM这个值默认就是0
推荐配置:
最好组少VM多
recovery site 启用DRS
没启用DRS手动指定放至VM的host
VM的恢复优先级,注意VM之间的关联性
Tools的安装
确保内部的脚步不会阻止恢复的执行
为了减少site recovery Management和vcenter的压力,注意限制并发VM的数量