RAID5 磁盘阵列的故障以及修复要点

磁盘阵列 也会发生故障,在发生故障时
1.若单个硬盘失效, 尝试热插拔, 即拔下来再插上去 ;如果不能解决, 则进入 RAID 配置
界面,将该硬盘进行 ForceOnLine 操作 ;如果不能解决,尝试更换其它硬盘插槽 (一定不要改
变磁盘 顺序 );如果不能解决,尝试将该硬盘格式化后插入,然后使用 ReBuild 操作 ;如果不能
格式化,基本是硬盘物理错误严重,尝试更换硬盘后重建数据。

RAID5 磁盘阵列允许硬盘的热插拔。更换损坏的硬盘时,首先拔下硬盘托架 (硬盘固定
在托架上 ),从托架上卸下损坏的硬盘,再把完好的硬盘安装在托架上,插入阵列里。如果
一切正常,这时 RAID5 磁盘阵列会马上自动进入数据重建状态。这个过程会进行数个到 20
几个小时。
这里要注意几点:
(1) 更换损坏硬盘前,必须查看阵列的当前状态,保证除损坏的硬盘外,其他硬盘处于
正常的 ONL 在线状态。
(2) 更换坏盘必须及时。
(3) 更换的新硬盘必须是完好的。
(4) 在阵列数据重建完成之前,不能插拔任何硬盘。

2.如果多块硬盘失效,先将部分 (不要全部同时上线 )硬盘强制上线,然后进入 操作系统
尝试读取数据,如果能够读取,再将其它硬盘上线,然后重建数据。

3.如果 SCSI 卡损坏导致配置信息丢失,更换卡后,尝试从硬盘读取配置信息 (需要阵列
支持此功能 )。

4.如果所有磁盘上线后,操作系统无法访问 RAID( 资源管理器中无相应盘符 ),尝试进
入“计算机管理 ”–>“磁盘管理 ”查看阵列状态 ;如果处于 “未初始化 ”状态,可以尝试使用数据
恢复软件逐磁道扫描以恢复数据,此时万万不可进行 RAID 初始化操作。

5.不要过于依赖 RAID ,如有条件或特别重要的资料,仍需要刻录光盘或使用磁带机以
备万一。

6.如有条件,最好给阵列加配 UPS。

7.出现问题以后,不要急于开始 RAID 数据修复及 RAID 配置,先给厂家打免费电话,
寻求帮助, 以及到各大数据恢复公司的网站查询, 自己不能确定的操作不要去尝试, 以免造
成更大的损失,导致不可挽回的错误,给自己留下遗憾

8, 热备盘的更换
热备盘总是和 RAID5 磁盘阵列对应起来, 如果不是 RAID5 级别的阵列, 就没有必要创
建热备盘
。因为当别的硬盘损坏、热备盘自动起用时,需要用 RAID5 磁盘阵列中未损坏的
硬盘对热备盘进行数据重建。注意在数据重建过程中不能插拔阵列中的非损坏硬盘 !
一旦正常开始数据重建, 我们就可以更换损坏的硬盘了, 更换后的硬盘会自动成为新的
热备盘

9 , 阵列的扩容
如果当前阵列是 RAID0 级别的,而且阵列中还有空余的插槽,我们就可以对阵列进行
扩容,这时 Array 的右键菜单中就有允许添加新 磁盘 的命令,我们按照提示进行操作就可
以了。 RAID1 和 RAID5 级别的阵列不能扩容

10 , 磁盘阵列 创建和维护应该注意的问题
目前流行的 RAID 级别是 RAID0 、RAID1 和 RAID5 ,在 IBM 的 ServerRAID 卡上
还可以实现 RAID1E 和 RAID5E 的阵列,进一步增加了阵列的可靠性和数据的安全性。
如果条件允许, 我们推荐 “RAID5+ 热备盘 ”的阵列创建 方案 ,这样在数据丢失前, 我们
有 2 次更换硬盘的机会。对于一般的应用,只用 RAID5 磁盘阵列也可以,可以同时提供数
据的存取性能、可靠性和最大的磁盘空间。

管理员必须经常观察阵列的状态, 包括用眼睛观察阵列的黄色警告灯和在管理软件里查
看驱动器的状态。出现故障,及时排除。无论是什么级别的阵列,在排除故障前,都建议做
好数据备份。特别是重要的数据,必须做好可靠的数据备份。

一旦出现硬盘下线 (Defunct) ,必须更换该硬盘, 更换下来的硬盘绝对不能再次在阵列
中使用,有时虽然硬盘黄灯不再报警,但是该硬盘已经是极不可靠的了。

在起初购买硬盘阵列的时候, 除过正常使用的硬盘, 建议多买几块同型号的硬盘, 妥善
保存备用。 因为现在的硬件更新换代特别快, 如果几年后阵列硬盘损坏, 再购买同型号的硬
盘有可能是一件困难的事情,不是就是市场上根本找不到货源,就是价格特别昂贵

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐