與RAID 5相比,RAID 6增加了第二個(gè)獨(dú)立的奇偶校驗(yàn)信息塊。兩個(gè)獨(dú)立的奇偶系統(tǒng)使用不同的算法,數(shù)據(jù)的可靠性非常高,即使兩塊磁碟同時(shí)失效也不會(huì)影響數(shù)據(jù)的使用。但RAID 6需要分配給奇偶校驗(yàn)信息更大的磁碟空間,相對(duì)于RAID 5有更大的“寫損失”,因此“寫性能”非常差。較差的性能和複雜的實(shí)施方式使得RAID 6很少得到實(shí)際套用。
常見(jiàn)的RAID6組建類型 RAID 6(6D + 2P)
1 RAID 6(6D + 2P)原理
和RAID 5相似,RAID 6(6D + 2P)根據(jù)條帶化的數(shù)據(jù)生成校驗(yàn)信息,條帶化數(shù)據(jù)和校驗(yàn)數(shù)據(jù)一起分散存儲(chǔ)到RAID組的各個(gè)磁碟上。在圖1中,D0,D1,D2,D3,D4和D5是條帶化的數(shù)據(jù),P代表校驗(yàn)數(shù)據(jù),Q是第二份校驗(yàn)數(shù)據(jù)。
RAID 6校驗(yàn)數(shù)據(jù)生成公式(P和Q):
P的生成用了異或
P = D0 XOR D1 XOR D2 XOR D3 XOR D4 XOR D5
Q的生成用了係數(shù)和異或
Q = A0*D0 XOR A1*D1 XOR A2*D2 XOR A3*D3 XOR A4*D4 XOR A5*D5
D0~D5:條帶化數(shù)據(jù)
A0~A5:係數(shù)
XOR:異或
*:乘
在RAID 6中,當(dāng)有1塊磁碟出故障的時(shí)候,利用公式1恢複數(shù)據(jù),這個(gè)過(guò)程是和RAID 5一樣的。而當(dāng)有2塊磁碟同時(shí)出故障的時(shí)候,就需要同時(shí)用公式1和公式2來(lái)恢複數(shù)據(jù)了。
各係數(shù)A0~A5是線性無(wú)關(guān)的係數(shù),在D0,D1,D2,D3,D4,D5,P,Q中有兩個(gè)未知數(shù)的情況下,也可以聯(lián)列求解兩個(gè)方程得出兩個(gè)未知數(shù)的值。這樣在一個(gè)RAID組中有兩塊磁碟同時(shí)壞的情況下,也可以恢複數(shù)據(jù)。
上面描述的是校驗(yàn)數(shù)據(jù)生成的算法。其實(shí)RAID 6的核心就是有兩份檢驗(yàn)數(shù)據(jù),以保證兩塊磁碟同時(shí)出故障的時(shí)候,也能保障數(shù)據(jù)的。
這是一種新的RAID標(biāo)準(zhǔn),其自身帶有智慧型化實(shí)時(shí)作業(yè)系統(tǒng)和用于存儲(chǔ)管理的軟體工具,可完全獨(dú)立于主機(jī)運(yùn)行,不占用主機(jī)CPU資源。RAID 7可以看作是一種存儲(chǔ)計(jì)算機(jī)(Storage Computer),它與其他RAID標(biāo)準(zhǔn)有明顯區(qū)別。除了以上的各種標(biāo)準(zhǔn),我們可以如RAID 0+1那樣結(jié)合多種RAID規(guī)範(fàn)來(lái)構(gòu)筑所需的RAID陣列,例如RAID 5+3(RAID 53)就是一種套用較為廣泛的陣列形式。用戶一般可以通過(guò)靈活配置磁碟陣列來(lái)獲得更加符合其要求的磁碟存儲(chǔ)系統(tǒng)。
如何增加磁碟的存取速度,如何防止數(shù)據(jù)因磁碟的故障而丟失及如何有效的利用磁碟空間,一直是電腦專業(yè)人員和用戶的困擾,而大容量磁碟的價(jià)格非常昂貴,對(duì)用戶形成很大的負(fù)擔(dān)。磁碟陣列技術(shù)的產(chǎn)生一舉解決了這些問(wèn)題。
過(guò)去十幾年來(lái),CPU的處理速度增加了五十多倍,記憶體的存取速度也大幅增加,而數(shù)據(jù)儲(chǔ)存裝置--主要是磁碟--的存取速度只增加了三、四倍,形成電腦系統(tǒng)的瓶頸,拉低了電腦系統(tǒng)的整體性能,若不能有效的提升磁碟的存取速度,CPU、記憶體及磁碟間的不平衡將使CPU及記憶體的改進(jìn)形成浪費(fèi)。
磁碟陣列中針對(duì)不同的套用使用的不同技術(shù),稱為RAID 等級(jí)。RAID是Redundant Array of Independent Disks的縮寫,而每一等級(jí)代表一種技術(shù)。目前業(yè)界經(jīng)常套用的RAID等級(jí)是RAID 0~RAID 5。這個(gè)等級(jí)并不代表技術(shù)的高低,RAID 5并不高于RAID 3。至于要選擇那一種RAID 等級(jí)的產(chǎn)品,純視用戶的操作環(huán)境及套用而定,與等級(jí)的高低沒(méi)有必然的關(guān)係。
覆蓋
數(shù)據(jù)恢復(fù)工程師常說(shuō):“只要數(shù)據(jù)沒(méi)有被覆蓋,數(shù)據(jù)就有可能恢復(fù)回來(lái)”。
因?yàn)榇诺拇鎯?chǔ)特性,當(dāng)我們不需要硬碟上的數(shù)據(jù)時(shí),數(shù)據(jù)并沒(méi)有被拿走。刪除時(shí)系統(tǒng)只是在檔案上寫一個(gè)刪除標(biāo)誌,格式化和低級(jí)格式化也是在磁碟上重新覆蓋寫一遍以數(shù)字0為內(nèi)容的數(shù)據(jù),這就是覆蓋。
一個(gè)檔案被標(biāo)記上刪除標(biāo)誌后,他所占用的空間在有新檔案寫入時(shí),將有可能被新檔案占用覆蓋寫上新內(nèi)容。這時(shí)刪除的檔案名稱雖然還在,但他指向數(shù)據(jù)區(qū)的空間內(nèi)容已經(jīng)被覆蓋改變,恢復(fù)出來(lái)的將是錯(cuò)誤異常內(nèi)容。同樣檔案分配表內(nèi)有刪除標(biāo)記的檔案信息所占用的空間也有可能被新檔案名稱檔案信息占用覆蓋,檔案名稱也將不存在了。
當(dāng)將一個(gè)分區(qū)格式化后,有拷貝上新內(nèi)容,新數(shù)據(jù)只是覆蓋掉分區(qū)前部分空間,去掉新內(nèi)容占用的空間,該分區(qū)剩余空間數(shù)據(jù)區(qū)上無(wú)序內(nèi)容仍然有可能被重新組織,將數(shù)據(jù)恢復(fù)出來(lái)。
同理,克隆、一鍵恢復(fù)、系統(tǒng)還原等造成的數(shù)據(jù)丟失,只要新數(shù)據(jù)占用空間小于破壞前空間容量,數(shù)據(jù)恢復(fù)工程師就有可能恢復(fù)你要的分區(qū)和數(shù)據(jù)。