RAID 5

Słownik kwalifikacji INF.02 - Administracja i eksploatacja systemów komputerowych, urządzeń peryferyjnych i lokalnych sieci komputerowych

Co to jest RAID 5?

RAID 5 to poziom macierzy RAID wykorzystujący striping z rozproszoną parzystością (ang. striping with distributed parity). Dane są dzielone na bloki i rozprowadzane między dyski, ale dodatkowo na każdym dysku zapisywany jest blok parzystości dla pozostałych. Dzięki temu — gdy padnie jeden dysk — pozostałe dyski zawierają wystarczająco informacji, aby odtworzyć utracone dane.

Infografika: RAID 5 — poziom macierzy ze stripingiem i rozproszoną parzystością, schemat zapisu danych na 3 dyskach, wzór na pojemność efektywną (n-1)×dysk oraz klasyczne pytanie egzaminacyjne o ochronę przy 3 dyskach

To najpopularniejszy poziom RAID w serwerach plików, NAS-ach i małych macierzach firmowych — oferuje dobry kompromis między pojemnością, bezpieczeństwem i wydajnością. W kwalifikacji INF.02 (Administracja i eksploatacja systemów komputerowych) to najczęściej egzaminowany poziom RAID — zwłaszcza w pytaniu o ochronę przy dokładnie 3 dyskach.

Najważniejsze cechy RAID 5

CechaWartość
Minimum dysków3
Pojemność efektywna(n − 1) × pojemność najmniejszego dysku
Odporność na awarie1 dysk
Wydajność odczytuwysoka (równoległy z wielu dysków)
Wydajność zapisuniższa (obliczanie parzystości — write penalty)
Rebuild po awariidługi (godziny–dni przy dużych dyskach)
Typowe zastosowanieserwery plików, NAS, archiwa biurowe

Jak działa striping z parzystością?

RAID 5 łączy dwa mechanizmy:

  1. Striping — dane są dzielone na bloki (stripes) i zapisywane równolegle na różnych dyskach. Przyspiesza to odczyt — system korzysta z kilku dysków jednocześnie.
  2. Parzystość rozproszona — dla każdego zestawu bloków obliczany jest blok parzystości (XOR wszystkich danych z tego rzędu), zapisywany na innym dysku niż dane. W RAID 5 parzystość wędruje po wszystkich dyskach — nie ma jednego dedykowanego dysku z parzystością.

Schemat dla 3 dysków

        Dysk 1    Dysk 2    Dysk 3
rząd 1:   A1        A2        Pa     ← parzystość rzędu 1 na dysku 3
rząd 2:   B1        Pb        B2     ← parzystość rzędu 2 na dysku 2
rząd 3:   Pc        C1        C2     ← parzystość rzędu 3 na dysku 1
rząd 4:   D1        D2        Pd     ← parzystość rzędu 4 na dysku 3

Parzystość jest rozproszona — na każdym dysku po trochę. Dzięki temu obciążenie zapisu rozkłada się równomiernie, a awaria jednego dysku nie powoduje utraty samej parzystości, którą da się i tak odzyskać z pozostałych.

Bloki parzystości obliczane operatorem XOR

W praktyce blok parzystości to XOR (różnica symetryczna) wszystkich bloków danych z danego rzędu:

Pa = A1 XOR A2

Po awarii dysku z A2, system odzyskuje brakujące dane:

A2 = A1 XOR Pa

To podstawowa matematyka działania RAID 5. Operator XOR ma kluczową własność: X XOR X = 0, więc można odwrócić operację i odtworzyć dowolny brakujący element.

Pojemność efektywna — wzór

Pojemność użytkowa macierzy RAID 5:

pojemność efektywna = (n − 1) × pojemność najmniejszego dysku

gdzie n — liczba dysków w macierzy.

Przykłady

KonfiguracjaPojemność efektywnaStrata na parzystość
3 × 1 TB2 TB33% (1 z 3 dysków)
4 × 1 TB3 TB25% (1 z 4 dysków)
5 × 2 TB8 TB20% (1 z 5 dysków)
6 × 4 TB20 TB17% (1 z 6 dysków)
8 × 4 TB28 TB12,5% (1 z 8 dysków)

Im więcej dysków, tym większy procent pojemności zachowanej do użytku — ale jednocześnie większe ryzyko awarii (rośnie szansa, że któryś dysk padnie).

Uwaga — pojemność liczy się od najmniejszego dysku

Jeśli zbudujemy RAID 5 z dysków o różnych pojemnościach (np. 1 TB + 1 TB + 2 TB), system użyje tylko 1 TB z każdego (pojemność najmniejszego). Otrzymamy macierz 2 TB użytkową — reszta 2 TB nie zostanie wykorzystana. Dlatego budując RAID, używamy dysków o tej samej pojemności.

Odporność na awarie — co się dzieje przy padzie dysku?

Awaria 1 dysku — macierz pracuje dalej

Gdy padnie jeden z dysków:

  1. Macierz wchodzi w stan degraded (zdegradowany).
  2. System dalej działa — dostęp do danych jest możliwy, ale wolniejszy (każde czytanie wymaga obliczenia brakujących bloków z parzystości).
  3. Administrator powinien jak najszybciej wymienić uszkodzony dysk.
  4. Po wymianie zaczyna się rebuild (odbudowa) — dane na nowym dysku są regenerowane z parzystości pozostałych.
  5. Czas rebuildu: od kilku godzin do kilku dni, zależnie od pojemności dysków.

Awaria 2 dysków = utrata danych

Pad drugiego dysku w trakcie rebuildu oznacza bezpowrotną utratę danych — RAID 5 nie ma nadmiarowości na drugą awarię. To istotne ograniczenie: im większe dyski, tym dłuższy rebuild i tym większe ryzyko, że w tym czasie padnie drugi dysk.

Praktyczna uwaga: dla dysków powyżej 2–4 TB w macierzach RAID 5 ryzyko podwójnej awarii podczas rebuildu jest znaczące. Dlatego nowoczesne duże macierze coraz częściej stosują RAID 6 (odporność na 2 awarie) lub RAID 10 zamiast RAID 5.

Write penalty — dlaczego zapis jest wolny?

Każdy zapis do RAID 5 wymaga:

  1. odczytania starego bloku danych z dysku,
  2. odczytania starego bloku parzystości,
  3. obliczenia nowej parzystości (XOR ze starym i nowym blokiem danych),
  4. zapisania nowego bloku danych,
  5. zapisania nowego bloku parzystości.

To 4 operacje I/O na pojedynczy zapis (2 odczyty + 2 zapisy). Stąd RAID 5 ma niższą wydajność zapisu niż RAID 0 czy RAID 10 — to klasyczny write penalty.

Sposoby kompensacji

  • kontroler RAID z pamięcią cache i baterią (BBU) — buforuje zapisy, gromadzi je i zapisuje całymi rzędami,
  • SSD jako cache (tiering) — przyspiesza zapisy,
  • zwiększenie liczby dysków — więcej równoległości.

Zalety i wady RAID 5

Zalety

  • dobra ochrona danych już przy minimum 3 dyskach,
  • wysoka wydajność odczytu (równoległy z wielu dysków),
  • lepsze wykorzystanie pojemności niż RAID 1 (przy 4+ dyskach RAID 5 daje 75%, RAID 1 zawsze 50%),
  • odporność na awarię 1 dysku bez przerw w pracy,
  • rozproszona parzystość — brak wąskiego gardła pojedynczego dysku parity (jak w RAID 4).

Wady

  • brak odporności na awarię 2 dysków jednocześnie,
  • długi rebuild macierzy po wymianie dysku,
  • wolniejszy zapis z powodu write penalty,
  • ryzykowny dla dużych dysków (powyżej 2–4 TB) — ryzyko podwójnej awarii podczas rebuildu,
  • macierz w stanie degraded ma obniżoną wydajność odczytu (obliczanie z parzystości).

RAID 5 a pytania egzaminacyjne CKE

Klasyczne pytanie — 3 dyski

„Aby zapewnić maksymalną ochronę danych przy użyciu dokładnie 3 dysków, powinny one być przechowywane w macierzy RAID…"

Odpowiedź: RAID 5.

Dlaczego nie inne poziomy?

PoziomMin. dyskówCzy zadziała z 3 dyskami?
RAID 02tak, ale brak ochrony
RAID 12tak (z 3 dysków efektywnie 1 = za mało pojemności)
RAID 53TAK — minimalna konfiguracja, ochrona OK
RAID 64NIE — za mało dysków
RAID 104NIE — za mało dysków
RAID 506NIE — za mało dysków

RAID 5 to jedyna sensowna opcja przy dokładnie 3 dyskach — daje ochronę i wykorzystuje 67% pojemności (przeciwko 33–50% w innych konfiguracjach 3-dyskowych).

Co NIE wpływa na utratę danych z HDD

W pytaniu CKE „co NIE powoduje utraty danych" jednym z dystraktorów może być stosowanie macierzy RAID 5 — wręcz chroni dane przed utratą wskutek awarii pojedynczego dysku. Pełna lista czynników (powodujących i niepowodujących) jest w haśle RAID — sekcja „Co wpływa, a co nie wpływa na utratę danych".

RAID 5 a inne poziomy z parzystością

PoziomLiczba dysków parityOdpornośćMin. dysków
RAID 31 (dedykowany)1 dysk3
RAID 41 (dedykowany)1 dysk3
RAID 5równoważnik 1 (rozproszony)1 dysk3
RAID 6równoważnik 2 (rozproszony)2 dyski4
RAID 501 na grupę1 w grupie6

Różnica RAID 4 vs RAID 5: w RAID 4 parzystość zapisywana jest na jednym dedykowanym dysku — co tworzy wąskie gardło (każdy zapis dotyka tego samego dysku). W RAID 5 parzystość jest rozproszona, więc obciążenie rozkłada się równomiernie. Dlatego RAID 4 jest praktycznie wyparty przez RAID 5.

Hot Spare w RAID 5

Hot Spare to dysk zapasowy, stale podpięty do macierzy, ale nieaktywny. W razie awarii dowolnego dysku w macierzy:

  • system automatycznie aktywuje hot spare w jego miejsce,
  • natychmiast rusza rebuild (bez konieczności fizycznej wymiany przez administratora),
  • okres podwyższonego ryzyka (macierz w stanie degraded) skraca się drastycznie.

To popularne rozwiązanie w serwerach 24/7, gdzie nie można czekać na technika z nowym dyskiem.

Czy stosować RAID 5 dzisiaj?

Tak, ale z umiarem. RAID 5 świetnie się sprawdza:

  • w macierzach 3–6 dysków o pojemności do 4 TB każdy,
  • w serwerach plików o umiarkowanym obciążeniu,
  • w NAS-ach domowych i SOHO (Synology, QNAP, ...),
  • jako archiwum dla danych rzadziej zmienianych.

Należy unikać RAID 5:

  • dla dysków powyżej 8 TB (zbyt długi rebuild → wysokie ryzyko),
  • przy bardzo intensywnym zapisie (lepiej RAID 10),
  • w systemach krytycznych wymagających odporności na 2 awarie (lepiej RAID 6).

W praktyce nowoczesne centra danych preferują RAID 6 lub RAID 10 dla większych dysków.

RAID 5 ≠ kopia zapasowa

Klasyczne ostrzeżenie powtórzone: RAID 5 chroni tylko przed fizyczną awarią dysku. Nie zabezpiecza przed:

  • wirusem / ransomware (zaszyfruje dane na wszystkich dyskach naraz),
  • przypadkowym usunięciem plików,
  • pożarem, kradzieżą, zalaniem serwera,
  • awarią kontrolera RAID (czasem dane są niedostępne, dopóki nie zostanie wymieniony na ten sam model),
  • logicznym uszkodzeniem systemu plików.

RAID 5 + backup w innej lokalizacji to absolutne minimum bezpieczeństwa danych.

Powiązane tematy

  • RAID — przegląd wszystkich poziomów macierzy RAID, kontekst nadrzędny.
  • Striping — technika rozproszenia danych, podstawa RAID 0/5/6/10.
  • Parzystość (parity) — mechanizm bezpieczeństwa wykorzystywany w RAID 5 i 6.
  • Kopia zapasowa (backup) — uzupełnienie RAID, NIE alternatywa.
  • Hot Spare — dysk zapasowy do automatycznej wymiany.
  • NAS / serwer plików — typowe urządzenia z RAID 5.

Częste pomyłki — nie myl tego!

  • RAID 5 wymaga 3 dysków, nie 2 — z dwoma dyskami stworzysz tylko RAID 0 lub RAID 1.
  • RAID 5 ≠ RAID 4 — w RAID 4 parzystość jest na jednym dysku, w RAID 5 rozproszona po wszystkich.
  • RAID 5 nie chroni przed 2 awariami — to RAID 6.
  • RAID 5 nie zastępuje kopii zapasowej — najczęstsza pomyłka.
  • „parzystość" w RAID ≠ liczba parzysta — to wynik operacji XOR pozwalający odzyskać dane.
  • pojemność efektywna ≠ suma pojemności dysków — w RAID 5 tracisz „1 dysk" na parzystość.
  • dyski w RAID powinny być tej samej pojemności — inaczej marnujesz nadmiar miejsca.
  • rebuild macierzy ≠ przywrócenie z kopii zapasowej — to dwie różne procedury.
  • „striping z parzystością" ≠ „striping" sam — RAID 0 to czysty striping bez parzystości (brak ochrony).

Najważniejsze do zapamiętania

RAID 5 to striping z rozproszoną parzystością, wymagający minimum 3 dysków, oferujący odporność na awarię 1 dysku. Pojemność użytkowa: (n − 1) × najmniejszy dysk (dla 3×1 TB = 2 TB). Klasyczna odpowiedź CKE dla ochrony danych przy dokładnie 3 dyskach to RAID 5. Główne wady: długi rebuild i brak odporności na 2 awarie. W nowoczesnych systemach z dyskami powyżej 4–8 TB rozważ RAID 6 lub RAID 10. RAID 5 NIE jest kopią zapasową — chroni tylko przed fizyczną awarią dysku.