• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

RAID5阵列中两块盘告警后的恢复步骤

2007-01-06 发表
  • 0关注
  • 0收藏 822浏览
粉丝: 关注:

RAID5阵列中两块磁盘告警后的处理步骤

 

一、组网

二、问题描述

RAID5中两块或两块以上硬盘同时告警的几率是非常低,但并不代表这种情况不会发生。最常见的情况是一块硬盘先告警,在没有发现或未及时更换之前,又一块硬盘出现告警,导致RAID5阵列离线,数据无法读取;在这种情况下,如何正确处理才能尽可能恢复数据?

三、过程分析

首先,两种错误可能导致硬盘告警:逻辑错误、物理错误;如果是物理错误的话,数据恢复的可能性不大;如果是逻辑错误的话,还有可能恢复数据。

其次,一定要根据日志或者其他信息确定哪块盘先出问题、哪块盘后出问题,因为先后出问题的两块盘上的数据是不一样的,后出问题的硬盘上的数据才是最新鲜的,与RAID5中其他硬盘的数据组合后才是完整的,并且可以正常使用的。

最后,两块盘告警的情况下,正确的处理方法是先尝试强行online后坏的硬盘,然后恢复数据;如果尝试强行online后坏的硬盘失败,那么试着强行online先坏的硬盘,再恢复数据。

四、解决办法

本文以AIX环境下的处理过程为例,其他环境下的处理过程类似:

环境:IBM P630 + AIX + scsi raid卡 + 4块18G disk作raid5(no hotspare)

问题:一块硬盘先告警,未及时更换之前,又一块硬盘出现告警,导致RAID5阵列离线,卷组离线,数据无法读取。

#lspv

hdisk0         000b85cdf79f0ec5    rootvg

lspv输出只有hdisk0,而做完RAID5后的hdisk1消失。

#lsdev -Cc disk

hdisk0 Available 10-60-00-0,0 16 Bit LVD SCSI Disk Drive

hdisk1 Defined 20-60-00-0,0 SCSI Disk Array RAID 5

#varyonvg datavg[操作失败,datavg不能varyon]

#diag      [运行出现下面的错误]

The Service Request Number(s)/Probable Cause(s)

66D-111: The disk has been failed by the adapter.

FRU: n/a CH/ID 2 B

Physical Disk

66D-111: The disk has been failed by the adapter.

FRU: n/a CH/ID 2 C

Physical Disk

硬盘2B、2C处于failed状态,根据系统日志确定Channel 2 ID C先出现问题,Channel 2 ID B后出现问题。

 

操作步骤:

1、#smitty pdam

          List PCI SCSI Disk Arrays

          Create a PCI SCSI Disk Array

          Delete a PCI SCSI Disk Array

          Configure a Defined PCI SCSI Disk Array

          Change/Show a PCI SCSI Disk Array

          Reconstruct a PCI SCSI Disk Array

          Revive a FAILED Drive in a PCI SCSI Disk Array

          Fail a Drive in a PCI SCSI Disk Array

          Change/Show PCI SCSI RAID Drive Status

          Perform Consistency Check

          Display Status of Adapter Write Cache

          Recovery Options

选择:List PCI SCSI Disk Arrays       

mscraid0 Available 20-60 PCI 4-Channel Ultra3 SCSI RAID Adapter

hdisk1  Defined Raid  5 20-60-00-0,0 52072 MB Status DEAD

hdisk1  2A Channel 2 ID A  ONLINE

hdisk1  2B Channel 2 ID B  FAILED DRIVE

hdisk1  2C Channel 2 ID C  FAILED DRIVE

hdisk1  2D Channel 2 ID D  ONLINE

2、#smitty pdam

选择:Revive a FAILED Drive in a PCI SCSI Disk Array

2B Channel 2 ID B  FAILED DRIVE

2C Channel 2 ID C  FAILED DRIVE

选择:2B Channel 2 ID B  FAILED DRIVE

        PCI SCSI Disk Array             hdisk1

        Channel ID                      2B

会车后出现下面的提示:Continuing may delete information you may want to keep.  This is your last chance to stop before continuing. Press Enter to continue. Press Cancel to return to the application

敲会车键继续[确认命令成功完成,硬盘强行online成功]

3、通过List PCI SCSI Disk Arrays查看RAID的状态出现:

scraid0 Available 20-60 PCI 4-Channel Ultra3 SCSI RAID Adapter       

hdisk1  Defined Raid  5 20-60-00-0,0 52072 MB Status DEGRADED

hdisk1  2A Channel 2 ID A  ONLINE

hdisk1  2B Channel 2 ID B  ONLINE

hdisk1  2C Channel 2 ID C  FAILED DRIVE

hdisk1  2D Channel 2 ID D  ONLINE

注意:2B已经是online

4、执行diag命令进行诊断,结果显示入下

        The Service Request Number(s)/Probable Cause(s)

        causes are listed in descending order of probability):

        66D-111: The disk has been failed by the adapter.

        FRU: n/a         CH/ID 2C

        Physical Disk

       

5、#varyonvg datavg

   #mount /data

datavg varyon 成功,文件系统mount成功;

6、更换2C Channel上的硬盘,RAID5进行数据重建,数据重建完毕后,建议更换2B Channel上的硬盘,RAID5再次进行数据重建;

7、#smitty pdam

选择:List PCI SCSI Disk Arrays结果如下:

        hdisk1  Available Raid  5 20-60-00-0,0 52072 MB Status OPTIMAL

        hdisk1  2A Channel 2 ID A  ONLINE - 17357Meg

        hdisk1  2B Channel 2 ID B  ONLINE - 17357Meg

        hdisk1  2C Channel 2 ID C  ONLINE - 17357Meg

        hdisk1  2D Channel 2 ID D  ONLINE - 17357Meg

8、数据恢复完毕。

若您有关于案例的建议,请反馈:

作者在2007-01-22对此案例进行了修订
0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作