Co to jest RAID 5?
RAID 5 to poziom macierzy RAID wykorzystujący striping z rozproszoną parzystością (ang. striping with distributed parity). Dane są dzielone na bloki i rozprowadzane między dyski, ale dodatkowo na każdym dysku zapisywany jest blok parzystości dla pozostałych. Dzięki temu — gdy padnie jeden dysk — pozostałe dyski zawierają wystarczająco informacji, aby odtworzyć utracone dane.

To najpopularniejszy poziom RAID w serwerach plików, NAS-ach i małych macierzach firmowych — oferuje dobry kompromis między pojemnością, bezpieczeństwem i wydajnością. W kwalifikacji INF.02 (Administracja i eksploatacja systemów komputerowych) to najczęściej egzaminowany poziom RAID — zwłaszcza w pytaniu o ochronę przy dokładnie 3 dyskach.
Najważniejsze cechy RAID 5
| Cecha | Wartość |
|---|---|
| Minimum dysków | 3 |
| Pojemność efektywna | (n − 1) × pojemność najmniejszego dysku |
| Odporność na awarie | 1 dysk |
| Wydajność odczytu | wysoka (równoległy z wielu dysków) |
| Wydajność zapisu | niższa (obliczanie parzystości — write penalty) |
| Rebuild po awarii | długi (godziny–dni przy dużych dyskach) |
| Typowe zastosowanie | serwery plików, NAS, archiwa biurowe |
Jak działa striping z parzystością?
RAID 5 łączy dwa mechanizmy:
- Striping — dane są dzielone na bloki (stripes) i zapisywane równolegle na różnych dyskach. Przyspiesza to odczyt — system korzysta z kilku dysków jednocześnie.
- Parzystość rozproszona — dla każdego zestawu bloków obliczany jest blok parzystości (XOR wszystkich danych z tego rzędu), zapisywany na innym dysku niż dane. W RAID 5 parzystość wędruje po wszystkich dyskach — nie ma jednego dedykowanego dysku z parzystością.
Schemat dla 3 dysków
Dysk 1 Dysk 2 Dysk 3
rząd 1: A1 A2 Pa ← parzystość rzędu 1 na dysku 3
rząd 2: B1 Pb B2 ← parzystość rzędu 2 na dysku 2
rząd 3: Pc C1 C2 ← parzystość rzędu 3 na dysku 1
rząd 4: D1 D2 Pd ← parzystość rzędu 4 na dysku 3
Parzystość jest rozproszona — na każdym dysku po trochę. Dzięki temu obciążenie zapisu rozkłada się równomiernie, a awaria jednego dysku nie powoduje utraty samej parzystości, którą da się i tak odzyskać z pozostałych.
Bloki parzystości obliczane operatorem XOR
W praktyce blok parzystości to XOR (różnica symetryczna) wszystkich bloków danych z danego rzędu:
Pa = A1 XOR A2
Po awarii dysku z A2, system odzyskuje brakujące dane:
A2 = A1 XOR Pa
To podstawowa matematyka działania RAID 5. Operator XOR ma kluczową własność: X XOR X = 0, więc można odwrócić operację i odtworzyć dowolny brakujący element.
Pojemność efektywna — wzór
Pojemność użytkowa macierzy RAID 5:
pojemność efektywna = (n − 1) × pojemność najmniejszego dysku
gdzie n — liczba dysków w macierzy.
Przykłady
| Konfiguracja | Pojemność efektywna | Strata na parzystość |
|---|---|---|
| 3 × 1 TB | 2 TB | 33% (1 z 3 dysków) |
| 4 × 1 TB | 3 TB | 25% (1 z 4 dysków) |
| 5 × 2 TB | 8 TB | 20% (1 z 5 dysków) |
| 6 × 4 TB | 20 TB | 17% (1 z 6 dysków) |
| 8 × 4 TB | 28 TB | 12,5% (1 z 8 dysków) |
Im więcej dysków, tym większy procent pojemności zachowanej do użytku — ale jednocześnie większe ryzyko awarii (rośnie szansa, że któryś dysk padnie).
Uwaga — pojemność liczy się od najmniejszego dysku
Jeśli zbudujemy RAID 5 z dysków o różnych pojemnościach (np. 1 TB + 1 TB + 2 TB), system użyje tylko 1 TB z każdego (pojemność najmniejszego). Otrzymamy macierz 2 TB użytkową — reszta 2 TB nie zostanie wykorzystana. Dlatego budując RAID, używamy dysków o tej samej pojemności.
Odporność na awarie — co się dzieje przy padzie dysku?
Awaria 1 dysku — macierz pracuje dalej
Gdy padnie jeden z dysków:
- Macierz wchodzi w stan degraded (zdegradowany).
- System dalej działa — dostęp do danych jest możliwy, ale wolniejszy (każde czytanie wymaga obliczenia brakujących bloków z parzystości).
- Administrator powinien jak najszybciej wymienić uszkodzony dysk.
- Po wymianie zaczyna się rebuild (odbudowa) — dane na nowym dysku są regenerowane z parzystości pozostałych.
- Czas rebuildu: od kilku godzin do kilku dni, zależnie od pojemności dysków.
Awaria 2 dysków = utrata danych
Pad drugiego dysku w trakcie rebuildu oznacza bezpowrotną utratę danych — RAID 5 nie ma nadmiarowości na drugą awarię. To istotne ograniczenie: im większe dyski, tym dłuższy rebuild i tym większe ryzyko, że w tym czasie padnie drugi dysk.
Praktyczna uwaga: dla dysków powyżej 2–4 TB w macierzach RAID 5 ryzyko podwójnej awarii podczas rebuildu jest znaczące. Dlatego nowoczesne duże macierze coraz częściej stosują RAID 6 (odporność na 2 awarie) lub RAID 10 zamiast RAID 5.
Write penalty — dlaczego zapis jest wolny?
Każdy zapis do RAID 5 wymaga:
- odczytania starego bloku danych z dysku,
- odczytania starego bloku parzystości,
- obliczenia nowej parzystości (XOR ze starym i nowym blokiem danych),
- zapisania nowego bloku danych,
- zapisania nowego bloku parzystości.
To 4 operacje I/O na pojedynczy zapis (2 odczyty + 2 zapisy). Stąd RAID 5 ma niższą wydajność zapisu niż RAID 0 czy RAID 10 — to klasyczny write penalty.
Sposoby kompensacji
- kontroler RAID z pamięcią cache i baterią (BBU) — buforuje zapisy, gromadzi je i zapisuje całymi rzędami,
- SSD jako cache (tiering) — przyspiesza zapisy,
- zwiększenie liczby dysków — więcej równoległości.
Zalety i wady RAID 5
Zalety
- dobra ochrona danych już przy minimum 3 dyskach,
- wysoka wydajność odczytu (równoległy z wielu dysków),
- lepsze wykorzystanie pojemności niż RAID 1 (przy 4+ dyskach RAID 5 daje 75%, RAID 1 zawsze 50%),
- odporność na awarię 1 dysku bez przerw w pracy,
- rozproszona parzystość — brak wąskiego gardła pojedynczego dysku parity (jak w RAID 4).
Wady
- brak odporności na awarię 2 dysków jednocześnie,
- długi rebuild macierzy po wymianie dysku,
- wolniejszy zapis z powodu write penalty,
- ryzykowny dla dużych dysków (powyżej 2–4 TB) — ryzyko podwójnej awarii podczas rebuildu,
- macierz w stanie degraded ma obniżoną wydajność odczytu (obliczanie z parzystości).
RAID 5 a pytania egzaminacyjne CKE
Klasyczne pytanie — 3 dyski
„Aby zapewnić maksymalną ochronę danych przy użyciu dokładnie 3 dysków, powinny one być przechowywane w macierzy RAID…"
Odpowiedź: RAID 5.
Dlaczego nie inne poziomy?
| Poziom | Min. dysków | Czy zadziała z 3 dyskami? |
|---|---|---|
| RAID 0 | 2 | tak, ale brak ochrony |
| RAID 1 | 2 | tak (z 3 dysków efektywnie 1 = za mało pojemności) |
| RAID 5 | 3 | TAK — minimalna konfiguracja, ochrona OK ✅ |
| RAID 6 | 4 | NIE — za mało dysków |
| RAID 10 | 4 | NIE — za mało dysków |
| RAID 50 | 6 | NIE — za mało dysków |
RAID 5 to jedyna sensowna opcja przy dokładnie 3 dyskach — daje ochronę i wykorzystuje 67% pojemności (przeciwko 33–50% w innych konfiguracjach 3-dyskowych).
Co NIE wpływa na utratę danych z HDD
W pytaniu CKE „co NIE powoduje utraty danych" jednym z dystraktorów może być stosowanie macierzy RAID 5 — wręcz chroni dane przed utratą wskutek awarii pojedynczego dysku. Pełna lista czynników (powodujących i niepowodujących) jest w haśle RAID — sekcja „Co wpływa, a co nie wpływa na utratę danych".
RAID 5 a inne poziomy z parzystością
| Poziom | Liczba dysków parity | Odporność | Min. dysków |
|---|---|---|---|
| RAID 3 | 1 (dedykowany) | 1 dysk | 3 |
| RAID 4 | 1 (dedykowany) | 1 dysk | 3 |
| RAID 5 | równoważnik 1 (rozproszony) | 1 dysk | 3 |
| RAID 6 | równoważnik 2 (rozproszony) | 2 dyski | 4 |
| RAID 50 | 1 na grupę | 1 w grupie | 6 |
Różnica RAID 4 vs RAID 5: w RAID 4 parzystość zapisywana jest na jednym dedykowanym dysku — co tworzy wąskie gardło (każdy zapis dotyka tego samego dysku). W RAID 5 parzystość jest rozproszona, więc obciążenie rozkłada się równomiernie. Dlatego RAID 4 jest praktycznie wyparty przez RAID 5.
Hot Spare w RAID 5
Hot Spare to dysk zapasowy, stale podpięty do macierzy, ale nieaktywny. W razie awarii dowolnego dysku w macierzy:
- system automatycznie aktywuje hot spare w jego miejsce,
- natychmiast rusza rebuild (bez konieczności fizycznej wymiany przez administratora),
- okres podwyższonego ryzyka (macierz w stanie degraded) skraca się drastycznie.
To popularne rozwiązanie w serwerach 24/7, gdzie nie można czekać na technika z nowym dyskiem.
Czy stosować RAID 5 dzisiaj?
Tak, ale z umiarem. RAID 5 świetnie się sprawdza:
- w macierzach 3–6 dysków o pojemności do 4 TB każdy,
- w serwerach plików o umiarkowanym obciążeniu,
- w NAS-ach domowych i SOHO (Synology, QNAP, ...),
- jako archiwum dla danych rzadziej zmienianych.
Należy unikać RAID 5:
- dla dysków powyżej 8 TB (zbyt długi rebuild → wysokie ryzyko),
- przy bardzo intensywnym zapisie (lepiej RAID 10),
- w systemach krytycznych wymagających odporności na 2 awarie (lepiej RAID 6).
W praktyce nowoczesne centra danych preferują RAID 6 lub RAID 10 dla większych dysków.
RAID 5 ≠ kopia zapasowa
Klasyczne ostrzeżenie powtórzone: RAID 5 chroni tylko przed fizyczną awarią dysku. Nie zabezpiecza przed:
- wirusem / ransomware (zaszyfruje dane na wszystkich dyskach naraz),
- przypadkowym usunięciem plików,
- pożarem, kradzieżą, zalaniem serwera,
- awarią kontrolera RAID (czasem dane są niedostępne, dopóki nie zostanie wymieniony na ten sam model),
- logicznym uszkodzeniem systemu plików.
RAID 5 + backup w innej lokalizacji to absolutne minimum bezpieczeństwa danych.
Powiązane tematy
- RAID — przegląd wszystkich poziomów macierzy RAID, kontekst nadrzędny.
- Striping — technika rozproszenia danych, podstawa RAID 0/5/6/10.
- Parzystość (parity) — mechanizm bezpieczeństwa wykorzystywany w RAID 5 i 6.
- Kopia zapasowa (backup) — uzupełnienie RAID, NIE alternatywa.
- Hot Spare — dysk zapasowy do automatycznej wymiany.
- NAS / serwer plików — typowe urządzenia z RAID 5.
Częste pomyłki — nie myl tego!
- RAID 5 wymaga 3 dysków, nie 2 — z dwoma dyskami stworzysz tylko RAID 0 lub RAID 1.
- RAID 5 ≠ RAID 4 — w RAID 4 parzystość jest na jednym dysku, w RAID 5 rozproszona po wszystkich.
- RAID 5 nie chroni przed 2 awariami — to RAID 6.
- RAID 5 nie zastępuje kopii zapasowej — najczęstsza pomyłka.
- „parzystość" w RAID ≠ liczba parzysta — to wynik operacji XOR pozwalający odzyskać dane.
- pojemność efektywna ≠ suma pojemności dysków — w RAID 5 tracisz „1 dysk" na parzystość.
- dyski w RAID powinny być tej samej pojemności — inaczej marnujesz nadmiar miejsca.
- rebuild macierzy ≠ przywrócenie z kopii zapasowej — to dwie różne procedury.
- „striping z parzystością" ≠ „striping" sam — RAID 0 to czysty striping bez parzystości (brak ochrony).
Najważniejsze do zapamiętania
RAID 5 to striping z rozproszoną parzystością, wymagający minimum 3 dysków, oferujący odporność na awarię 1 dysku. Pojemność użytkowa: (n − 1) × najmniejszy dysk (dla 3×1 TB = 2 TB). Klasyczna odpowiedź CKE dla ochrony danych przy dokładnie 3 dyskach to RAID 5. Główne wady: długi rebuild i brak odporności na 2 awarie. W nowoczesnych systemach z dyskami powyżej 4–8 TB rozważ RAID 6 lub RAID 10. RAID 5 NIE jest kopią zapasową — chroni tylko przed fizyczną awarią dysku.