ceph osd tree 命令,查看是否有 OSD 状态为 down 或异常。如果 OSD 正常,大概率是平台误报。glibc 模块 Bug,会导致 onestor-peon 进程 CPU 占用率持续飙升至 99% 以上,进而导致前台磁盘状态更新异常(误报缓存盘异常)。top -Hp [onestor-peon的进程PID],查看是否有线程 CPU 持续占用 99.9%。如果有,这属于系统缺陷,建议联系厂商升级系统或打补丁解决。暂无评论
sdb和sdc两块缓存盘(446.625GB)显示 “异常”,但 HDM 里物理硬盘状态正常,说明物理硬件本身没问题,问题出在 Onestor / 存储池层面的逻辑状态,优先排查存储池状态、RAID / 副本同步、IO 状态。sdb、sdc,单盘容量 446.625GB,状态显示 “异常”sdg/sdj/sdd/sdi/sdh/sdf,单盘 5.4575TB,状态正常sda,状态正常off,无硬件告警diskpool_hdd的健康状态:
sdb和sdc的详细信息:
diskpool_hdd的缓存配置,确认sdb和sdc是否在缓存列表中/var/log/onestor/下的日志,搜索sdb/sdc关键词,看是否有io error、sync failed等报错# 查看磁盘是否被系统识别
lsblk | grep sdb
lsblk | grep sdc
# 测试磁盘读写是否正常
dd if=/dev/zero of=/dev/sdb bs=1M count=100 oflag=direct
dd if=/dev/zero of=/dev/sdc bs=1M count=100 oflag=direct
# 查看磁盘分区
fdisk -l /dev/sdb
fdisk -l /dev/sdc
# 查看文件系统状态(如果已格式化)
blkid /dev/sdb*
# 查看Onestor相关服务
systemctl list-units | grep onestor
# 重启存储服务(以实际服务名为准)
systemctl restart onestor-storage
systemctl restart onestor-agent
| 场景 | 现象 | 解决方法 |
|---|---|---|
| 缓存盘被平台误标记 | HDM 正常,IO 测试正常,平台显示异常 | 重启 Onestor 服务 / 刷新磁盘状态 |
| 缓存盘 IO 超时 / 软错误 | HDM 正常,dd 测试报错 | 磁盘低格 / 更换磁盘,或联系厂商做坏道修复 |
| 缓存池重建 / 同步中 | 状态显示异常,日志有重建进度 | 等待重建完成,或手动触发同步 |
| 缓存盘未正确格式化 | 平台无法识别缓存盘角色 | 重新格式化磁盘,添加为缓存盘 |
/var/log/onestor/下的日志,联系 H3C 技术支持进一步定位平台层面的异常原因。暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论