【服務(wù)器故障單位】
北京某公司
【服務(wù)器數(shù)據(jù)恢復(fù)故障描述】
客戶有一臺(tái)IBM X3650 M4服務(wù)器,服務(wù)器上配置了8塊硬盤(pán),組成raid5磁盤(pán)陣列,服務(wù)器在運(yùn)行過(guò)程中有2塊硬盤(pán)報(bào)警,隨后系統(tǒng)便無(wú)法啟動(dòng),服務(wù)器上層運(yùn)行的2003系統(tǒng)ORACLE數(shù)據(jù)庫(kù),現(xiàn)在也無(wú)法啟動(dòng)了,急需進(jìn)行服務(wù)器數(shù)據(jù)恢復(fù)操作。
【服務(wù)器數(shù)據(jù)恢復(fù)故障分析】
RAID5存儲(chǔ)結(jié)構(gòu)提供的磁盤(pán)冗余功能僅限于一塊存儲(chǔ)介質(zhì),若有另外一塊磁盤(pán)發(fā)生離線,整個(gè)陣列便會(huì)崩潰,不能正常工作。由于客戶確認(rèn)之前沒(méi)有第二塊硬盤(pán)離線,所以初步認(rèn)定RAID卡上的RAID信息可能已經(jīng)丟失或破壞。
【服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程】
1、對(duì)8塊硬盤(pán)及未進(jìn)行完全同步的新硬盤(pán),進(jìn)行異或測(cè)試,無(wú)明顯錯(cuò)誤。
2、備份全部硬盤(pán)部分關(guān)鍵區(qū)域。
3、在備份過(guò)程中同時(shí)分析原RAID組成結(jié)構(gòu),構(gòu)建虛擬RAID環(huán)境。
4、驗(yàn)證RAID結(jié)構(gòu)是否正確。
5、陣列結(jié)構(gòu)無(wú)明顯錯(cuò)誤,目錄結(jié)構(gòu)及文件路徑完整。
6、修改個(gè)別硬盤(pán)上的RAID信息。
7、將RAID信息導(dǎo)入到RAID卡,重新啟動(dòng)。
8、陣列可以正常工作。
9、及時(shí)加入熱備盤(pán),進(jìn)行同步,讓RAID回到同步狀態(tài)。
【數(shù)據(jù)恢復(fù)結(jié)論】
因?yàn)楫惢驕y(cè)試完全通過(guò),所以表明該存儲(chǔ)故障主要是由于RAID控制器出錯(cuò),丟失RAID信息造成。
恢復(fù)完成后,目錄結(jié)構(gòu)完整,ORACLE數(shù)據(jù)庫(kù)完好。客戶認(rèn)可所恢復(fù)的數(shù)據(jù),恢復(fù)成功。
原文地址:https://blog.51cto.com/sun510/3251132