HP EVA存储硬盘读写不稳定离线的数据恢复案例

服务器故障&检测&分析:
hp eva存储设备中的raid5磁盘有两块硬盘掉线,lun丢失。硬件工程师对故障服务器进行物理故障检测,发现掉线硬盘能够正常读取,无物理故障,也没有发现坏道。
故障服务器掉线硬盘没有物理故障,所以掉线极有可能是硬盘读写不稳定造成的。eva控制会将读写不稳定的硬盘默认为坏盘并踢出。raid5冗余允许最大掉线硬盘的数量是2,掉线的硬盘超过了2块就会导致服务器崩溃。
通过分析故障服务器内raid条目的存储形式,发现每个硬盘的不同块组成一个raid条目。通过分析后解析出来raid条目信息,发现每个lun都有一份lun_map。由于eva将lun_map分别存放在不同的磁盘中,用一个索引来指定其位置,因此在磁盘中找出这个指定lun_map位置的索引就可以找到现存lun的信息。
服务器数据恢复过程:
1、将故障存储中所有硬盘连接到北亚企安数据恢复平台上,以只读方式将硬盘数据镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。
2、通过故障分析确定硬盘掉线的原因是读写不稳定,被控制器踢出掉线。这些掉线的硬盘中有一部分数据是老旧数据,lun使用的是raid5,只需要将一个lun的raid条目通过raid5的校验算法算出校验值,再和原有的校验值做比较就可以判断这个条目中是否有掉线盘。
将一个lun的所有lun_map都校验一遍就可以知道这个lun中的哪些raid条目中有掉线盘。在这些raid条目中都存在的那个盘就一定就是掉线盘。排除掉线盘后根据lun_map即可恢复所有lun的数据。由北亚企安数据恢复工程师编写相对应程序来实现这个方案,根据编写好的程序去实现不同的功能:
a、编写程序扫描全部lun_map,结合人工分析获取到lun_map。
b、编写检测raid条目的程序检测所有lun中掉线的磁盘,结合人工分析排除掉线的磁盘。
c、编写lun数据恢复程序,结合lun_map恢复所有lun数据。
恢复出所有lun的数据后由人工核对每个lun,验证是否和用户方工程师描述的一致。
3、根据用户方工程师描述,所有lun的数据可以分成两部份:1、vmware的虚拟机;2、hp-ux上的裸设备,裸设备存放oracle的dbf数据库。由于通过恢复出来的lun无法看到里面的文件,因此需要人工核对哪些lun是存放vmware的数据,哪些lun是hp-ux上的裸设备。核对完成后将不同的lun挂载到不同的验证环境中进行验证。
4、将所有存放vmware虚拟机数据的lun里面的虚拟机文件都生成出来,通过nfs共享的方式挂载到虚拟主机上,然后将虚拟机一个一个添加到清单。所有虚拟机加电开机后都能启动系统。用户方工程师亲自对虚拟机里面的数据进行验证没有发现问题。本次数据恢复工作完成。
服务器数据安全tips:
1、定期巡查服务器&存储设备,发现报警及时处理。
2、操作要谨慎,避免误操作导致设备数据丢失。
3、如果发现eva控制器模块不稳定,应当及时更换。
4、本案例中的eva存储故障是由磁盘读写不稳定导致的,如果eva存储中所有磁盘(掉线和没有掉线的)是同一批次,这些没有掉线的磁盘也应该快到极限,如果有条件建议更换掉这批磁盘。


证实动力电池安全隐患 蔚来ES8召回“警示录”
振弦采集模块配置工具VMTool 扩展功能数据处理
如何使用audacity使您的语音变成恶魔般的声音
arm技术在PDF中提取图形的方法
华为为Polar码发现者颁奖,致敬其为通信事业发展的贡献
HP EVA存储硬盘读写不稳定离线的数据恢复案例
梁孟松:中芯国际12nm工艺研发获得突破,2018年销售收入达33.6亿美元
如何在工程的XDC文件里加入GT位置约束
苹果中国公布了调整降价方案
Holtek新推出传感器信号调理MCU BH66F5350
美图区块链平台的三大优势解析
荣威RX7什么时候上市?荣威RX7最新消息:荣威RX7明年上市,越野气息十足,卖15万颜值像保时捷
磷酸铁锂电池加工过程中常见的问题
电子纸显示器的能效在服务自动化中被证明是无价的
常见五轴机床的机械结构形式是怎样的
入门首选,全新升级!纵维立方光固化新品Photon Mono 2闪耀登场!
斯欧主数据管理平台获鲲鹏Validated认证
汇川技术重磅发布InoQuickPro,入选工信部“工业操作系统创新伙伴计划”
移动设备中的RF组件分为哪两个级别?
详解智能家居的控制系统工作原理