高手支招:如何排除服務器RAID 5故障? |
發布時間: 2012/8/12 20:15:14 |
由于技術的不斷進步,不同型號的服務器出現RAID 5故障后,處理方法也不同。 現在大型應用程序的網絡拓樸結構,一般都采用C/S結構或B/S結構,至少需要一臺裝有大型數據庫的服務器安放于中心機房;趯Ψ⻊掌靼踩耘c可靠性的考慮,通常會對服務器的磁盤采用磁盤陣列RAID(Redundant Array of Inexpensive Disk)進行磁盤冗余備份。其中RAID 5陣列級別為無獨立校驗磁盤的奇偶校驗磁盤陣列,采用數據分塊和獨立存取技術,能在同一磁盤上并行處理多個訪問請求,同時允許陣列中的任何一個硬盤出現故障。 實際應用中,由于某些不可避免的客觀原因,可能會造成一些陣列故障。最常出現的狀況就是硬盤自行脫機,聯機狀態顯示為DDD(Defunct Disk Drive,無效磁盤驅動器),硬盤出現物理故障或邏輯故障。如果是物理故障,只有進行硬盤更換;如果是邏輯故障,可以通過有針對性的技術修復,恢復硬盤的在線狀態,繼續保持其原始陣列中的硬盤數據條帶化分布狀態,延續數據存儲體系的一致性。 但是,對HP的一些老服務器(如HP LH6000)數據的恢復與新服務器(如HP ProLian系列服務器)的數據恢復是不同的。所以不同的服務器對RAID 5故障的處理也是不同的。筆者曾接觸過兩臺服務器因意外斷電而造成的RAID 5陣列卡數據故障,由于采用了不同的策略而解決了問題。 故障修復 一臺是在2000年購買的HP LH6000的服務器,4塊18GB的硬盤做成RAID 5磁盤陣列,其陣列卡是NetRaid;另一臺是2006年購買的HP ProLian ML370服務器,4塊146GB的硬盤做成RAID 5磁盤陣列,其陣列卡是Smart Array 642并帶有熱備份硬盤(Hot Spare)。兩者操作系統都為Window 2000,數據庫是Server 2000。 HP LH6000的故障如下: 一塊硬盤紅燈閃亮,機器還在正常運行,但沒有多久,系統就不能正常運行,這時才發現另一塊硬盤的紅燈也在閃亮。 解決辦法如下: 1.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。查看陣列信息,發現硬盤狀態為Failed,運用修改配置將一硬盤強行設置成OnLine。重新啟動服務器,在進入系統前的硬件自檢時無效,啟動失敗。 2.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。選擇磁盤陣列,將原來OnLine掛起來的硬盤手工Fail掉,然后再把另一塊Failed的硬盤手工設置成OnLine,重新啟動服務器就可以進入系統了。 3.查看系統及數據庫都運行正常后,再進陣列配置工具把Failed的硬盤手工設置成Rebuild,100%完成重建后再重啟服務器,所有的陣列及系統都恢復原狀了。 由于技術的不斷進步,不同型號的服務器出現RAID 5故障后,處理方法也不同。 現在大型應用程序的網絡拓樸結構,一般都采用C/S結構或B/S結構,至少需要一臺裝有大型數據庫的服務器安放于中心機房;趯Ψ⻊掌靼踩耘c可靠性的考慮,通常會對服務器的磁盤采用磁盤陣列RAID(Redundant Array of Inexpensive Disk)進行磁盤冗余備份。其中RAID 5陣列級別為無獨立校驗磁盤的奇偶校驗磁盤陣列,采用數據分塊和獨立存取技術,能在同一磁盤上并行處理多個訪問請求,同時允許陣列中的任何一個硬盤出現故障。 實際應用中,由于某些不可避免的客觀原因,可能會造成一些陣列故障。最常出現的狀況就是硬盤自行脫機,聯機狀態顯示為DDD(Defunct Disk Drive,無效磁盤驅動器),硬盤出現物理故障或邏輯故障。如果是物理故障,只有進行硬盤更換;如果是邏輯故障,可以通過有針對性的技術修復,恢復硬盤的在線狀態,繼續保持其原始陣列中的硬盤數據條帶化分布狀態,延續數據存儲體系的一致性。 但是,對HP的一些老服務器(如HP LH6000)數據的恢復與新服務器(如HP ProLian系列服務器)的數據恢復是不同的。所以不同的服務器對RAID 5故障的處理也是不同的。筆者曾接觸過兩臺服務器因意外斷電而造成的RAID 5陣列卡數據故障,由于采用了不同的策略而解決了問題。 故障修復 一臺是在2000年購買的HP LH6000的服務器,4塊18GB的硬盤做成RAID 5磁盤陣列,其陣列卡是NetRaid;另一臺是2006年購買的HP ProLian ML370服務器,4塊146GB的硬盤做成RAID 5磁盤陣列,其陣列卡是Smart Array 642并帶有熱備份硬盤(Hot Spare)。兩者操作系統都為Window 2000,數據庫是Server 2000。 HP LH6000的故障如下: 一塊硬盤紅燈閃亮,機器還在正常運行,但沒有多久,系統就不能正常運行,這時才發現另一塊硬盤的紅燈也在閃亮。 解決辦法如下: 1.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。查看陣列信息,發現硬盤狀態為Failed,運用修改配置將一硬盤強行設置成OnLine。重新啟動服務器,在進入系統前的硬件自檢時無效,啟動失敗。 2.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。選擇磁盤陣列,將原來OnLine掛起來的硬盤手工Fail掉,然后再把另一塊Failed的硬盤手工設置成OnLine,重新啟動服務器就可以進入系統了。 3.查看系統及數據庫都運行正常后,再進陣列配置工具把Failed的硬盤手工設置成Rebuild,100%完成重建后再重啟服務器,所有的陣列及系統都恢復原狀了。 本文出自:億恩科技【www.vbseamall.com】 |