不涉及
现场单节点mon服务down且无法正常拉起
1、查看/var/log/ceph/ceph-mon.xxxx.log日志,mon存在断言,原因是mon scrub从db读取auth 54342失败
2、读取auth 54342失败原因是rocksdb中sst文件排序混乱导致mon读取auth版本号失败
3、根据日志打印结合社区相关案例https://github.com/facebook/rocksdb/issues/5558,怀疑是mon处理scrub消息时,调用读取racksdb出现错误,发生断言,导致mon进程无法正常启动。
1、rocksdb数据库已知问题,手动拷贝正常mon节点的/var/lib/ceph/mon/ceph-xxxx/store.db/目录文件到故障mon节点对应目录下(注意故障mon节点的原store.db目录文件需全部删除)
2、重启mon服务进程,service ceph-mon@xxxx restart恢复(一般会自动恢复)
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作