略。
某局点使用CAS配合OneStor存储的融合部署环境,主机多次收到“主机日志5分钟内增长超过1MB,实际增长10MB”的告警信息。
CAS中默认会监测系统日志的增长速度,如果增长速率比较高的话就会产生此告警,那么具体是哪些日志增长过快,这些日志增长是否正常,系统并没有记录,需要手动去收集这些信息。
当频繁出现这种告警的时候可以通过如下方法查看:
第一步:将附件下载下来解压,解压出来是一个python脚本文件,此脚本的作用是创建一个mnt/loginfo的目录,每隔300S(即5分钟)获取当前系统的时间,以及df -Tm的信息,还有就是使用du -ah /var/log ,获取/var/log目录下所有文件的大小信息,并将每一次获取的数据生成一个文件。
可以选择使用winscp等sftp的客户端软件连接到CVM主机中,然后将此文件上传到云主机后台。
第二步:通过命令python loginfo20190917.py 来执行,之后系统会执行这个脚本文件,因为每隔5分钟执行一次,如果想要让此脚本在后台运行,可以在后面加一个“&”字符。这里配置在前台运行。
第二步:如果需要其他的操作可以再新建一个会话连接,保持此会话不懂,待出现告警之后去收集和告警时间相近的这几个日志文件,文件不多的话可以将这个目录全部打包发过来。
第三步:找和出现告警相近的这两个日志文件,然后通过Beyond Compare软件对比两个文件的区别(Beyond Compare软件需自己到网上搜索下载安装),通过这个软件就可以对比这5分钟内哪些文件的大小有变化,以及变化多少,找那些相差比较大的即是日志增长比较多的文件。
第四步:查看具体的日志文件,看日志内容是否正常,如果正常的话可以忽略此告警。
判断增长日志是否正常,如果正常可以选择屏蔽此告警。
该案例对您是否有帮助:
您的评价:1
若您有关于案例的建议,请反馈:
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作