• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

UIS-V6.5 (E0716)---超融合服务器单台服务器无法重启

19小时前提问
  • 0关注
  • 0收藏,43浏览
粉丝:0人 关注:0人

问题描述:

超融合服务器单台服务器报错,超融合报服务器RAID卡故障,存储集群显示所有硬盘离线。但是检查单台服务器硬盘正常在线,需要重启此服务器,服务器进入维护模式后,重启提示健康度非100无法重启,由于机房在外地无法手动重启,如何远程重启服务器

2 个回答
粉丝:5人 关注:0人

这种情况的核心问题在于:UIS平台为了保证数据安全,在节点健康度(特别是存储健康度)未达到100%时,会拒绝执行重启或维护操作。既然页面操作走不通,我们就需要通过底层系统来“强制”让它重启。

以下是针对你这种情况的远程重启方案和风险控制步骤,请务必仔细阅读并按顺序操作。

 方案一:通过底层系统强制重启(首选)

这是最直接的办法,绕过UIS管理平台的检查,直接对操作系统下发重启指令。

  1. 登录底层系统:通过SSH(如果SSH服务未关闭)或者带外管理系统(HDM/ iLO)的远程控制台(KVM),以root身份登录到这台报错服务器的Linux操作系统。

  2. 执行重启命令:登录后,输入以下命令之一来强制重启系统:

    • 较温和的重启:reboot

    • 更彻底的强制重启(如果reboot卡住):echo b > /proc/sysrq-trigger 或 systemctl reboot -f

  3. 观察启动过程:在远程控制台(KVM)中观察服务器的自检和系统启动过程,看是否能正常进入UIS管理平台。

方案二:通过HDM/ iLO带外管理强制断电(备选)

如果方案一无法执行(例如SSH无法连接),或者执行后系统卡死无响应,就需要通过带外管理系统进行硬件级别的断电重启。这相当于直接拔电源,有数据损坏的风险,请谨慎使用。

  1. 登录带外管理系统:访问该服务器的HDM(H3C)或iLO(HP)等带外管理IP地址,登录管理界面。

  2. 执行强制重启

    • 在远程控制台(KVM)中,寻找电源管理选项。

    • 选择 “强制关机” 或 “关闭电源”

    • 等待服务器完全断电后(通常需要几十秒),再选择 “开机”

    • 注意:有些HDM界面提供 “强制重启” 按钮,可以直接使用。

重启后的恢复步骤

无论用哪种方法重启成功,当服务器再次启动并加入集群后,你需要尽快完成以下操作来恢复集群健康度:

  1. 确认服务状态:登录UIS管理平台,查看刚才重启的节点是否已重新加入集群,状态是否正常。

  2. 处理根本故障:你提到最初的报错是“服务器RAID卡故障”,且导致“存储集群显示所有硬盘离线”。这说明RAID卡可能存在问题(如固件Bug、配置错误或硬件损坏),导致超融合层的存储服务无法识别后端硬盘。

    • 进入维护模式:待节点恢复后,再次尝试通过UIS平台将该节点进入维护模式

    • 检查硬件:通过带外管理系统(HDM)查看RAID卡的健康状态、固件版本,以及所有物理硬盘是否被正确识别。RAID卡工作模式需要是HBA(直通)模式,而不是普通的RAID模式,否则超融合软件可能无法直接管理硬盘。

    • 修复或替换:根据检查结果,修复RAID卡配置、升级固件或更换损坏的硬件。


暂无评论

粉丝:0人 关注:9人

您好! 针对您提到的UIS-V6.5 (E0716)超融合服务器单台无法重启的问题,我建议您按照以下步骤进行排查和处理:

### 方案一:通过底层系统强制重启(首选)
1. 登录底层系统:
- 尝试通过SSH登录到服务器。如果SSH服务未关闭,可以使用以下命令:
ssh root@服务器IP地址
- 如果SSH无法连接,使用带外管理系统(HDM/iLO)的远程控制台(KVM)登录。

2. 执行重启命令:
- 登录后,输入以下命令之一来强制重启系统:
reboot
或者更彻底的强制重启:
echo b > /proc/sysrq-trigger
或者:
systemctl reboot -f

3. 观察启动过程:
- 在远程控制台(KVM)中观察服务器的自检和系统启动过程,看是否能正常进入UIS管理平台。

### 方案二:通过HDM/iLO带外管理强制断电(备选)
1. 登录带外管理系统:
- 访问服务器的HDM(H3C)或iLO(HP)等带外管理IP地址,登录管理界面。

2. 执行强制重启:
- 在远程控制台(KVM)中,寻找电源管理选项。
- 选择“强制关机”或“关闭电源”。
- 等待服务器完全断电后(通常需要几十秒),再选择“开机”。
- 注意:有些HDM界面提供“强制重启”按钮,可以直接使用。

### 重启后的恢复步骤
1. 确认服务状态:
- 登录UIS管理平台,查看刚才重启的节点是否已重新加入集群,状态是否正常。

2. 处理根本故障:
- 检查RAID卡的健康状态、固件版本,以及所有物理硬盘是否被正确识别。
- RAID卡工作模式需要是HBA(直通)模式,而不是普通的RAID模式。

3. 修复或替换:
- 根据检查结果,修复RAID卡配置、升级固件或更换损坏的硬件。

如有需要,请提供更多

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明