【产品型号】
H3Cloud OS(云操作系统)
H3C License Server
【涉及版本】
H3Cloud OS E1131 - E1136H01版本(含)
License Server 随VCFC配套的E2180P07H01 版本(含)
当H3Cloud OS与License Server之间的网络中断一段时间后,H3Cloud OS授权管理中概率性出现连接License Server失败的现象。
l 如果是使用H3Cloud OS自带的License Server,在主节点服务器上执行netstat -anp | grep 5555 | wc -l 返回值超过1020或者多次执行发现数值不停增加。
l 如果是使用独立的License Serve,在License Server服务器上多次执行netstat -anp |grep 5555 | wc -l返回值超过1020或者多次执行发现数值不停增加。
同时,出现此情况时,License Server上日志占用空间可能会很大,有可能导致磁盘空间占满。
【原因分析】
当H3Cloud OS与License Server的连接断开一段时间后,H3Cloud OS每分钟会发起一次连接,在重连时只完成了初始的TCP连接,H3Cloud OS上负责后续TLS连接的线程异常,整个连接尚未完成,又不断发起重连,导致License Server上的连接数超出规格。
License Server侧认为H3Cloud OS已经连接成功,每次重连都认为是一个新的连接,导致连接数不断增长,直至连接数占满。同时,日志文件的记录默认对于每一次客户端连接都有详细的记录,由于没有做日志等级的区分,时间长了有可能导致磁盘空间占满。在新主线版本中已经优化,对日志做了分类和开关。
【规避措施】
License Server侧操作:
(1) 执行ls -lh /opt/LicServer/log/,查看licmcore.log文件大小,如果该文件很大且占用磁盘大部分空间,则执行 rm -rf /opt/LicServer/log/licmcore.log 删除该日志文件。
(2) 执行service licscore restart重启license-server核心进程。
a) 如果出现重启失败现象,则将后台的licscore进程杀掉。如下所示:
b) 启动licscore进程。如下图所示:
(3) 执行service licsmonitor restart重启license-server监控进程。
a) 如果出现重启失败现象,则将后台的licsmonitor进程杀掉。如下所示:
b) 启动licsmonitor进程。如下图所示:
H3Cloud OS侧操作:
(1) 重启coreapi容器,重启后会将连接释放。重启方法如下:
a) 在H3Cloud OS主节点上执行命令,查询coreapi容器名,查询方法如下:
b) 重启coreapi容器,约30秒左右能重启完毕,重启过程中coreapi状态为“Termnating”,重启完成后变为“Running”为正常状态。
(2) 在H3Cloud OS云管理平台授权管理中,重新连接License Server,即可连接成功。
【解决方案】
H3Cloud OS E1136H04及之后版本已经解决。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作