可以参考这个
1 简介
本文档介绍在H3C UIS超融合管理平台上修改系统时间的方法以及前提条件和注意事项,主要介绍如何通过NTP协议修正系统时间。
1.1 前提条件
修改系统时间可能会对周边产品产生影响。该文档提供的方法仅适合于H3C UIS超融合部署环境,若安装有其他产品或被平台管理,请以实际情况咨询相关产品是否支持修改系统时间。
如果虚拟机开启时间同步功能,则会自动将虚拟机内部时间修改为UIS系统时间,可能会对虚拟机内部业务造成影响。修改时间前必须关闭所有虚拟机时间同步功能,修改时间后请评估时间变化对虚拟机内部应用的影响决定虚拟机是否开启时间同步。
在修改系统时间前,需要检查管理平台中的定时任务,确保所有定时任务均已暂停。
本手册描述的方法适用于E0721及之后版本。
使用正式License时,往前往后修改系统时间均可。使用试用或临时License时,只能往未来修改时间,不能向过去修改时间。因为试用或临时License不允许延长使用时间,往过去修改时间会导致分布式存储handy无法登录,导致存储异常。
任务台上有任务在执行时,请不要执行修改系统时间的操作,待任务执行完毕后再修改系统时间。
如需使用外部时钟源,不建议使用Windows操作系统 本身作为NTP Server。
向过去修改系统时间后,新生效的时间对访问策略立即生效,若修改后的时间早于访问策略创建时间,则需要删除老的访问策略,重新创建。
访问策略的实现原理是取登陆的当前系统时间与访问策略配置时间进行比较,判断是否允许访问。修改时间后,如果当前时间在可访问的时间段内,则可以登陆;如果在禁止时段内则不允许登陆。例如:在可以登陆时间段内,把时间向过去修改,修改至不允许登陆的时间段,此时会无法登陆,系统会提示“您暂时不能访问系统,允许您访问时间为每天(xx:xx ~ xx:xx)。”
使用到定时任务的功能,修改时间前,需将定时任务暂停、待修改时间完成后重新下发。
用到定时任务的功能包括:性能数据采集、ACL生效时间控制、双因子的CRL定时更新、开关机策略、快照策略、备份策略、CVM定时备份、DRX定时功能。部分定时功能详细说明如下。
性能数据:修改时间后需重启mysql、casserver、cas_mon、tomcat8服务
ACL生效时间控制:向过去修改系统时间后,ACL的生效时间段的配置会在重启mysql、casserver、tomcat8服务后生效。
例如:修改时间前配置acl:缺省允许,配置ACL规则为一个网段时间段11:00-19:00点拒绝,ACL被网络策略引用,网络策略下发到虚拟机所用的vSwitch上,虚拟机流量匹配上ACL不能与外界通信。修改时间到11:00前,重启mysql、casserver、tomcat8服务后,虚拟机能够正常通信。
增量、差异备份:为了避免增量和差异备份在向过去修改系统时间后出现混乱,修改时间前暂停备份策略,同时请在修改时间后先做一次全量备份,然后删除修改系统时间前的所有备份(也可以在修改时间前删除所有备份),即可重新执行增量或差异备份。
快照策略、备份策略、CVM定时备份、DRX定时功能、外部云的定时迁移:修改系统时间前,请先进行任务暂停,修改时间后重新下发。。
2 NTP 配置检查
在UIS管理平台配置NTP,一般情况默认已将管理节点作为NTP服务器,环境已搭建双机热备,备节点默认为备NTP服务器。
检查主NTP Server(主管理节点):正常情况下主NTP Server状态如下图所示,LOCAL字段前的*号表示当前节点为主NTP Server,refid状态为“.LOCL”。
检查备NTP Server:正常情况下的备NTP Server状态如下图所示。图中所示的cvknode4为主NTP Server节点,当前节点(如cvknode7)作为备NTP Server节点,并且时间与主NTP Server同步。备NTP Server和主NTP Server时间差值(offset数值)应该在100ms以内。
若检查实际NTP服务状态与NTP配置不符,例如:没有响应的NTP服务器(LOCAL前或NTP Server IP前无*号)、refid状态为INIT或各节点的NTP Server不一致,则表示NTP服务未正常生效,此时需要重新配置NTP服务。
3.1.1 在线场景重新配置NTP服务
1. 集群内部NTP Server
确认各节点时间与CVM节点时间误差不超过30日,否则请使用离线修改方式。
(1) 登录UIS管理平台,关闭所有虚拟机时间同步功能。
(2) 进入NTP时间服务器页面,配置NTP主服务器。单击<保存>按钮。
待任务执行成功后,后台会重启ntpd.service服务。
(3) 等待一段时间后,在节点后台持续执行watch ntpq –p命令,观察NTP配置是否生效。持续观察5-10分钟,若持续无法恢复,可执行systemctl restart ntpd命令手动执行重启ntpd服务,或联系技术支持进行处理。
(4) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(5) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步,如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(6) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
2. 集群外部NTP Server
确认各节点时间与CVM节点时间误差不超过30日,否则请使用离线修改方式。
(1) 登录UIS管理平台,关闭所有虚拟机时间同步功能。
(2) 如需配置外部NTP Server,请登录管理节点后台,执行ntpdate –d NTP_Server_IP命令。输出内容应不含“no server suitable for synchronization found”,如图所示。
(3) 后续步骤请参考集群内部NTP Server的步骤(3)-(6)。如不需要更改NTP Server,跳过此步骤。
3.1.2 离线场景重新配置NTP服务
离线重新配置NTP适用所有场景,请参考1.2 适用范围及注意事项。
1. 离线场景前提配置
关闭虚拟机。
关闭集群HA。
暂停存储池。
暂停类型为共享目录的虚拟机模板存储。
分裂异步远程复制pair对。
备份管理平台数据。
2. 操作步骤
(1) 登录UIS管理平台,关闭所有虚拟机时间同步功能。
(2) 进入NTP时间服务器页面,配置NTP主服务器。单击<保存>按钮。
待任务执行成功后,后台会重启ntpd.service服务。
(3) 等待一段时间后,在节点后台持续执行watch ntpq –p命令,观察NTP配置是否生效。持续观察5-10分钟,可执行ntpstat命令检测连接状态,若持续无法恢复,请联系技术支持进行处理。
(4) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(5) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步;如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(6) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
(7) 将管理平台恢复至在线模式。
3.2 单节点时间同步异常
集群中存在某一节点或某几个节点出现时间不一致时以下情况可采用如下方式进行恢复。
如按照本章节描述无法恢复,请联系技术支持进行处理。
(1) 登陆异常的NTP Server节点后台,执行ntpq –p命令,可看到remote下IP地址前无*号,且offset和jitter值过大,如图所示。
(2) 可尝试继续等待5-10min,观察其能否恢复。若未恢复,请执行systemctl restart ntpd命令手动重启NTP服务,观察输出结果。
(3) 可看到NTP恢复正常。如图所示,由末尾的“adjust time server 172.20.188.103 offset -0.0004 sec”可知时间误差在1S内;若误差超过1S,输出内容应为:step time sever 172.20.188.103 offset –X sec,且offset绝对值大于1。上述两种情况均为正常输出。
3.2.2 非NTP Server节点时间异常
(1) 若某个非NTP Server节点的时间存在误差,可执行ntpdate –d NTP_SERVER_IP命令,检查是否存在网络异常或延迟较高的情况。如是,则多为外部NTP配置异常,此种情况应优先解决网络问题,再查看NTP是否异常。如存在异常可参考NTP Server时间异常进行恢复。
(2) 如果NTP Server无异常,则执行ntpdate –u NTP_SERVER_IP命令,手动同步时间即可。
3.2.3 节点时间无异常,但存在“clock skew detected”告警
出现该情况时,一般情况下可以自动恢复。如果长时间无法恢复,请参考3.1 集群NTP服务异常章节重新下发NTP Server。如果以上方法均无效,请参考本章节内容进行处理。
若集群内某个节点时间误差不超过2S,但执行ceph –s命令可看到始终警告“clock skew detected”,如图所示,可采用如下方法恢复。
(1) 使该节点进入维护模式,然后登陆节点后台依次执行sync、hwclock –w和shutdown –h now命令,使节点关机后再重启该节点。
若该节点上存在业务虚拟机,且不可停止,此时无法进入维护模式,请将虚拟机迁移至未报警的节点上,再进入维护模式,待恢复后再迁移恢复即可。
(2) 重启完成后,查看NTP是否正常,时间是否同步。若多个节点存在该问题,应依次对异常节点执行上述操作。若仍未恢复,请联系技术支持。
4 NTP Server时间或集群整体时间修改
4.1 NTP配置检查
请先参考2 NTP 配置检查章节,若NTP配置异常,则需要先参考3 NTP异常恢复章节,恢复NTP配置;若NTP配置正常,则可进行NTP Server时间或集群整体时间修改。
4.2 在线修改NTP Server时间
4.2.1 不变更NTP Server修改时间
在线修改支持修改时间为一个月内某个时间点的场景,具体请参考1.2 适用范围及注意事项。
(1) 关闭所有虚拟机时间同步功能。
(2) 在NTP Server节点,执行date -s YYYY-MM-DD hh:mm[:ss](完整日期时间,例如:date -s “2022-03-14 10:30:00”)命令,即可修改NTP时间。
(3) 其他节点执行ntpdate –u NTP_Server_IP命令同步时间(如ntpdate –u 10.125.36.101)。
(4) 执行watch date命令,确认各主机时间已同步。
(5) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(6) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步,如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(7) 登录平台成功,查看存储界面,存储数据应显示正常。若向过去修改时间后,存在未获取到IOPS、带宽、磁盘读写时延数据的情况,请执行如下操作。
a. 在主、备节点删除/opt/h3c/var/lib/prometheus_node/data和/opt/h3c/var/lib/prometheus_cluster/data目录。
b. 在主、备节点依次执行supervisorctl restart prometheus-node和supervisorctl restart prometheus-cluster命令。
(8) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
4.2.2 变更NTP Server并修改时间
前台界面保护机制,不建议随意更改NTP Server。涉及NTP Server 变更时间超过5s不超过30日,请参考如下方式在线修改。
1. 目标NTP Server时间与集群时间差值在5S内
(1) 关闭所有虚拟机时间同步功能。
(2) 登录UIS管理平台,进入NTP时间服务器页面,配置NTP主服务器,将其配置为目标NTP Server的IP地址,单击<保存>按钮。
(3) 在NTP Server节点后台持续执行watch ntpq –p命令,观察NTP配置是否生效。
持续观察5-10分钟,可执行ntpstat命令检测连接状态,若持续无法恢复,请联系技术支持进行处理。
(4) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(5) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步,如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(6) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
2. 目标NTP Server 时间与集群时间差值在5S外
(1) 关闭所有虚拟机时间同步功能。
(2) 登录NTP Server节点后台执行date -s YYYY-MM-DD hh:mm[:ss](完整日期时间,例如:date -s “2022-03-14 10:30:00”)命令,即可修改NTP时间。修改时间至与目标NTP Server差值5S内。
NTP Server节点需要在集群内,若在集群外,则需参考目标NTP Server时间与集群时间差值在5S内将其变更为集群内,再执行后续操作,如果存在异常,请参考NTP异常恢复章节进行恢复。
(3) 执行ntpdate –d NTP_SERVER_IP,确认时间差值在5S内。如图所示,由末尾的“adjust time server 172.20.188.103 offset -0.00136 sec”可知时间误差在1S内。
(4) 各节点手动执行ntpdate –u NTP_Server_IP(当前NTP Server),确保集群内个节点时间同步。
(5) 登录UIS管理平台,进入NTP时间服务器页面,配置NTP主服务器,将其配置为目标NTP Server单击<保存>按钮。
(6) 在节点后台执行watch ntpq –p命令,观察NTP配置是否生效。持续观察5-10分钟,可执行ntpstat命令检测连接状态,若持续无法恢复,请联系技术支持进行处理。
(7) 在各节点后台执行watch time命令,各节点时间已同步。持续观察5-10min,如不能自动同步,可手动执行时间同步命令ntpdate –u NTP_Server_IP。
(8) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(9) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步,如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(10) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
4.3 离线修改NTP Server时间
4.3.1 离线场景前提配置
关闭虚拟机。
关闭集群HA。
暂停存储池。
暂停类型为共享目录的虚拟机模板存储。
分裂异步远程复制pair对。
备份管理平台数据。
4.3.2 操作步骤
(1) 检查是否启用以下功能:访问策略生效时间段、双因子的CRL定时更新、密码策略有效期、ACL策略生效时间段、CVM配置定时备份、开关机策略、备份策略、快照策略。如有已启用的功能,请检查是否需要根据修改时间情况重新调整功能生效时间或停止相关功能。
(2) 关闭所有虚拟机时间同步功能。
(3) 修改NTP主服务器。若不涉及变更NTP Server跳过此步骤。
a. 登录UIS管理平台,进入NTP时间服务器页面,配置NTP主服务器。输入目标NTP Server的IP地址,单击<保存>按钮。
b. 在节点后台持续执行watch ntpq –p命令,观察NTP配置是否生效。
持续观察5-10分钟,可执行ntpstat命令检测连接状态,若持续无法恢复,请联系技术支持进行处理。
c. 变更NTP Server 后,各节点已同步时间且不在需要修改时间请直接执行第(8)步。
(4) 在NTP Server节点,执行date -s YYYY-MM-DD hh:mm[:ss](完整日期时间,例如:date -s “2022-03-14 10:30:00”)命令,即可修改NTP时间。
(5) 其他节点使用ntpdate –u NTP_Server_IP进行同步(如ntpdate –u 10.99.226.241)。
(6) 执行watch date命令,确认各主机时间已同步。
(7) 在管理节点执行systemctl restart tomcat8命令在管理节点重启tomcat8服务。
(8) 执行ceph –s命令, 确认状态处于HEALTH_OK;若存在clock skew detected,则需等待系统同步,如果出现osd down的情况,可执行ceph-disk activate-all命令,拉起服务。
(9) 根据实际应用情况确认是否需要开启虚拟机时间同步服务功能。
(10) 恢复上层业务,将共享存储卷重新挂载,重新启动虚拟机。
暂无评论