• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

服务器该如何进行巡检

2025-04-21发布
  • 0关注
粉丝:0人 关注:0人

服务器该如何进行巡检

2个回复
#
1
粉丝:19人 关注:0人

服务器巡检应遵循以下步骤,确保系统安全稳定运行:

一、基础巡检规范

  1. 定期检查

    • 执行例行维护,定期备份系统数据(含配置文件和业务数据),数据修改前需备份并记录变更内容。
    • 重大操作(如数据迁移)需预先评估可行性,执行前备份数据并制定应急恢复方案。
  2. 权限与安全

    • 严格管理管理员密码,定期更新,控制用户权限至最小必要范围。
    • 通过BMC/IPMI等带外管理接口获取硬件状态,需提前获取客户授权的BMC IP、账户及密码。

二、硬件健康检查

  1. RAID卡状态监测

    • 检查RAID卡日志(如AHS/Survey日志),关注Patrol Read(巡读)和Consistency Check(一致性检查)状态:
      • PR:检测物理盘介质错误,默认每168小时运行一次,可通过storcli调整速率或关闭。
      • CC:校验冗余RAID数据一致性,默认周期7天,高负载场景建议在业务空闲期执行或调整速率。
    • 使用storcli /cx display patrolreadstorcli /cx display cc查看当前状态。
  2. 硬盘与阵列健康

    • 通过工具(如鲲鹏健康巡检工具)检查硬盘状态,重点关注PSU、坏块、Medium Error等异常。
    • 若发现热备盘故障或I/O延迟异常,需更换故障盘或临时关闭PR/CC(通过storcli命令)。

三、自动化巡检工具

  1. 鲲鹏健康巡检工具

    • 操作流程
      1. 添加设备IP及BMC信息,支持批量导入。
      2. 选择检查项:健康检查、版本风险、资产信息收集。
      3. 设置并发数量(避免过高影响业务),生成报告后查看“统计总览”和详细异常项。
      4. 根据告警代码参考《BMC告警处理手册》处理问题。
  2. Redfish批量巡检

    • 使用Python脚本通过Redfish API批量获取服务器健康状态,生成日志并分析关键指标(如电源、温度、固件版本)。

四、巡检报告与记录

  1. 报告生成

    • 使用管理平台导出机箱清单(xlsx/PDF格式),记录巡检时间、操作员、客户单位等信息。
    • 保存健康检查报告(HTML格式),标注异常项及处理措施。
  2. 问题处理

    • 发现故障时,详细记录原始信息(如日志片段、错误代码),及时联系技术支持。
    • 示例:若RAID卡因PR导致I/O延迟,可临时关闭PR(storcli /cx set patrolread=off)并更换故障硬盘。

五、注意事项

  • 业务影响:巡检避开业务高峰期,CC/PR等资源密集型操作建议在维护窗口执行。
  • 合规性:未经客户书面授权,禁止修改配置或执行上下电操作。
  • 工具更新:定期升级巡检工具版本,适配新固件或硬件特性。

暂无评论

#
2
粉丝:0人 关注:0人

用fist巡检

暂无评论

回复

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作