• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

【StoreOnce】硬件监控服务异常分析

2024-04-02 发表
  • 0关注
  • 0收藏 182浏览
粉丝:10人 关注:2人

组网及说明

StoreOnce Gen4/Gen4+

问题描述

StoreOnce的硬件监控(hardware monitoring)服务,是通过rest接口登录iLO来获取硬件信息。所以服务本身、StoreOnce到iLO的443端口、iLO本身出问题,硬件监控都有可能显示异常。目前看硬件监控异常的表现有如下几个

1. 点击硬件转圈,提示硬件监控服务不可用,正在不断重试

2. 点击硬件有两条报错:①cannot conmmunicate with iLO②controller3/6 is missing

3. 事件日志报错:hardware report cache is not updating。这个报错一般会伴随1+2的现象

 

硬件监控正常的检查方法

1. iLO web中information→session list看只有一个127.0.0.1登录的ip

2. /etc/init.d/hpspmon status看状态ok

3. tail -f /var/log/hp/platform/hpspmon/hpspmon-<主机名>.log检查health check是否完成。如果有如下complete字样,问题应该已解决

 

过程分析

排查思路如下

1. 4.3.2版本之前iLO不支持high security模式,如果是请修改成production

2. reset iLO。然后检查session list。正常的话127.0.0.1的登录ip应该只有1个

3.如果问题还没解决,需要登录root底层。尝试重启hpspmon服务,方法如下

①记录启动命令,方法:grep -i url /var/log/hp/platform/hpspmon/hpspmon-<主机名>.log

②停止服务:/etc/init.d/hpspmon stop

③启动服务,复制上边的url,注意<MODIFIER>外要加引号。如下是我试验机示例,实际以第一步为准

/opt/hp/platform/bin/hpspmon -m SERVER,STORAGE_CLUSTER --serverURL https://127.0.0.1:443/hw

monitor/monitoring/server/soh9493s01 --storageClusterURL https://127.0.0.1:443/hwmonitor/monitoring/storage

/'<MODIFIER>' --storageClusterUuids 01640eab-0000-1000-8022-45434c303633,08f7d606-0000-1000-8001-313030303030

4. 如果重启后health check依然无法完成,或者/etc/ini.d/hpspmon status还不是ok,可重启pml,方法如下

①su - hpesupport

②pml tools→Restart PML

③等待完全启动,按步骤3检查hpspmon状态

 

在不影响业务的前提下,可操作的步骤就只有这些了。如果上述方法依然不行,就需要查日志进一步分析了。从目前的经验来看,iLO硬件问题的概率较大。如下是我遇到的两个案例

messages日志有如下打印

Nov  6 19:38:38 SOH138H001 kernel: FAT-fs (sdi1): FAT read failed (blocknr 32)

<span "="">Nov  6 19:38:38 SOH138H001 kernel: FAT-fs (sdk1): FAT read failed (blocknr 32)

<span "="">

<span "="">Nov  6 19:38:39 SOH138H001 kernel: FAT-fs (sdj1): FAT read failed (blocknr 32)

<span "="">但是lsscsi看又没有sdi、sdk、sdj。经ERT确认是iLO设备

<span "="">

[0:0:0:0]    storage HP       p1228            0396  -          -       -

[0:1:0:0]    disk    HP       p1228 VOLUME     0396  /dev/sda   36a67bb21000000108024494633303456  72.0TB

[0:1:0:1]    disk    HP       p1228 VOLUME     0396  /dev/sdb   36806de21000000108025494633303456  72.0TB

[0:1:0:2]    disk    HP       p1228 VOLUME     0396  /dev/sdc   3620a0122000000108026494633303456  72.0TB

[0:1:0:3]    disk    HP       p1228 VOLUME     0396  /dev/sdd   3664f2522000000108027494633303456  72.0TB

[0:1:0:4]    disk    HP       p1228 VOLUME     0396  /dev/sde   36dcd4a22000000108028494633303456  72.0TB

[0:1:0:5]    disk    HP       p1228 VOLUME     0396  /dev/sdf   36cd57122000000108029494633303456  72.0TB

[1:0:0:0]    storage HP       p1228            0396  -          -       -

[2:0:0:0]    enclosu HPE      Smart Adapter    5.00  -          -       -

[2:1:0:0]    disk    HPE      LOGICAL VOLUME   5.00  /dev/sdg   3600508b1001c542952accb011313081a  1.20TB

[2:2:0:0]    storage HPE      P408i-a SR Gen10 5.00  -          -       -

[3:0:0:0]    storage HPE      RAID Drvr        0396  -          -       -

[3:0:0:7]    disk    HPE      RAID Drvr VOLUME 0396  /dev/sdh   36269cd22000000108010313030303030   431TB

[16:0:0:0]   disk    iLO      LUN 00 Media 0   2.11  /dev/sdl   iLO_LUN_00_Media_0_000002660A01-0:0   805MB

messages日志中有文件系统的报错,可能是文件系统问题,也可能是硬件问题。此时可以尝试格式化一下iLO芯片(解决文件系统问题),或者更换主板(解决硬件问题)。都需要重启操作,这个case是更换了主板

<span "="">另一个case messages日志没有任何异常打印。故尝试下电后恢复

<span "="">

解决方法

见问题分析

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作