不涉及。版本为E0535H08
现场CAS环境有多个虚拟机使用可同一个备份策略,该策略为每月12号进行一次全量备份,每个星期日进行增量备份。从今年4月份以来,策略中的一台虚拟机12号的全量备份不再执行了,而是在14号的凌晨会突然有个报错提示“备份开始时间已经超过结束时间”,如下截图
查看对应对应的12号和14号的cas.log和casserver相关日志,均未发现异常打印。
进一步排查现场环境中的备份策略配置,发现有另一条策略也是在12号晚上进行全量备份,而开始和结束的时间是19:00至次日凌晨06点。而虚拟机未执行的策略的开始时间是12号晚上的20:00(如下截图)。而在19:00开始的策略中,有一台虚机的磁盘文件很大,全量备份的时间很久,查看操作呢日志发现,该虚机和出现备份异常的虚机在同一台主机上。这台虚拟机备份结束的时间每次都是14号的凌晨2点或者3点多。和每次出现全量备份的异常的虚拟机备份任务报错的时间吻合。而在同一个主机上执行备份策略是串行的。出现异常备份的虚拟机的策略执行只能排队等待。
因为只有这个主机和磁盘较大的虚拟机在同一个主机上,这也是备份策略中其他虚拟机可以正常执行备份策略的原因。
1、修改备份策略时间,时间尽量错开,不要有重叠。
2、可以将备份失败的虚机迁移至其他主机,主机之间的策略执行可以串行。
综合来看,推荐方案1,因为虚拟机有HA自动迁移的机制,在哪个主机上在一定程度上不可控,强烈建议同时存在多个策略时,时间一定要错开配置。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作