Prawidłowo – w systemach przechowywania danych opartych na tworzeniu kopii lustrzanych (czyli w klasycznym mirroringu, np. RAID 1) maksymalna użyteczna pojemność to dokładnie 1/2 sumy pojemności wszystkich użytych dysków. Wynika to z samej zasady działania: każdy zapis danych jest wykonywany jednocześnie na dwóch nośnikach, więc drugi dysk (albo druga połowa przestrzeni) jest w całości poświęcona na kopię lustrzaną, a nie na dodatkowe dane. Z punktu widzenia użytkownika połowa całkowitej przestrzeni „idzie” na bezpieczeństwo, a tylko połowa na realne składowanie plików. W praktyce, jeśli mamy dwa dyski po 2 TB i skonfigurujemy je w mirror, system widzi 2 TB przestrzeni roboczej, a nie 4 TB. To jest standardowe zachowanie kontrolerów RAID i dobrych macierzy dyskowych – w dokumentacji producenci zawsze podają, że RAID 1 ma współczynnik wykorzystania pojemności 50%. Podobnie działa to w większych zestawach, np. cztery dyski po 1 TB spięte w pary lustrzane nadal dadzą 2 TB przestrzeni użytkowej, a 2 TB będzie zużyte na kopie. Moim zdaniem to jeden z najprostszych i najbardziej przewidywalnych sposobów zabezpieczania danych, szczególnie ważny przy archiwizacji zdjęć, projektów graficznych czy plików RAW. W fotografiach komercyjnych, gdzie utrata materiału jest po prostu niedopuszczalna, mirroring jest uważany za dobrą praktykę – często stosuje się go razem z dodatkowymi kopiamii offline, np. na zewnętrznych dyskach lub w chmurze. Warto też pamiętać, że mirroring nie zastępuje backupu, ale bardzo dobrze chroni przed awarią pojedynczego dysku: gdy jeden nośnik padnie, drugi zawiera identyczny zestaw danych i system może działać dalej praktycznie bez przerwy. Właśnie dlatego świadomie „poświęcamy” tę połowę pojemności – w zamian dostajemy znacznie wyższe bezpieczeństwo danych.
W systemach opartych na kopiowaniu lustrzanym bardzo łatwo pomylić się, jeśli patrzymy tylko na sumę pojemności dysków, a nie na sposób ich wykorzystania. Intuicyjnie kusi myśl, że skoro mamy kilka dysków, to do wykorzystania jest prawie całość, a na bezpieczeństwo idzie tylko jakaś mniejsza część, typu dwie trzecie, trzy czwarte czy cztery piąte. To jednak nie pasuje do zasady mirroringu. W mirrorze każdy fragment danych jest zapisywany co najmniej na dwóch nośnikach, więc nie ma tu żadnego „magicznego” upakowania informacji. Proporcje typu 2/3, 3/4 czy 4/5 bardziej kojarzą się z systemami, które stosują kody nadmiarowe, jak niektóre poziomy RAID z parzystością (np. RAID 5, RAID 6) albo zaawansowane systemy rozproszone typu erasure coding. Tam rzeczywiście można uzyskać wydajniejsze wykorzystanie pojemności, bo dane i informacja nadmiarowa są dzielone na więcej dysków w bardziej skomplikowany sposób. W klasycznym mirroringu nie ma parzystości, nie ma rekonstrukcji z fragmentów – jest po prostu pełna kopia, bit w bit. Typowym błędem myślowym jest mieszanie pojęć: ktoś słyszał, że „RAID poprawia bezpieczeństwo bez dużej utraty pojemności” i automatycznie zakłada, że w każdym wariancie zostaje większość przestrzeni, a tylko część znika na nadmiarowość. To prawda dla niektórych konfiguracji, ale nie dla mirroringu. Tu nadmiarowość jest maksymalnie prosta i przez to kosztowna pojemnościowo: za każdy 1 TB danych płacimy 2 TB fizycznej przestrzeni. Wszystkie odpowiedzi większe niż 1/2 sugerowałyby, że da się przechowywać więcej danych niż pozwala na to liczba pełnych kopii, co byłoby sprzeczne z definicją kopii lustrzanej. Z mojego doświadczenia takie nieporozumienia prowadzą później do rozczarowań przy planowaniu archiwum zdjęć: ktoś kupuje dwa dyski po 4 TB, licząc na „prawie 8 TB na foty”, a po konfiguracji mirrora widzi tylko 4 TB i myśli, że coś jest źle. Tymczasem system działa dokładnie tak, jak powinien. Dobre praktyki branżowe mówią wprost: w mirroringu licz realną pojemność jako połowę sumy dysków i dopiero do tego dopasowuj swoje potrzeby magazynowania i backupu. Każda inna kalkulacja będzie po prostu zbyt optymistyczna i niezgodna z techniczną zasadą działania tego typu macierzy.