Odwrotnością bezstratnej kompresji danych jest dekompresja, czyli proces odtworzenia oryginalnych danych z postaci skompresowanej. W kompresji bezstratnej najważniejsze jest to, że po rozpakowaniu dostajemy dokładnie ten sam ciąg bitów, który był przed kompresją. Nie podobny, nie przybliżony, tylko identyczny. To ma ogromne znaczenie przy plikach tekstowych, programach, bazach danych, dokumentach, archiwach ZIP albo kopiach zapasowych, bo nawet jeden zmieniony bajt może uszkodzić plik lub zmienić jego sens. Przykładowo plik spakowany algorytmem ZIP, 7z albo gzip po dekompresji powinien mieć taką samą sumę kontrolną, np. SHA-256, jak plik źródłowy. W praktyce właśnie dlatego dobre narzędzia archiwizujące sprawdzają integralność danych i zgłaszają błąd, gdy archiwum jest uszkodzone. Moim zdaniem warto zapamiętać prostą parę pojęć: kompresja zmniejsza rozmiar danych, dekompresja przywraca je do normalnej postaci. Algorytmy takie jak LZ77, LZMA czy kodowanie Huffmana działają tak, aby dało się ten proces odwrócić bez utraty informacji, co jest podstawą dobrej praktyki w przechowywaniu i przesyłaniu danych.
W tym pytaniu łatwo pomylić kilka pojęć, bo w codziennej pracy często używa się ich obok siebie, szczególnie przy plikach ZIP, 7z, TAR czy różnych instalatorach. Odwrotnością bezstratnej kompresji nie jest jednak prekompresja, archiwizacja ani pakowanie danych, tylko dekompresja. Prekompresja kojarzy się z przygotowaniem danych przed właściwym zmniejszaniem rozmiaru, na przykład z uporządkowaniem, przekształceniem albo wstępną analizą strumienia danych. To może wspierać skuteczność kompresji, ale nie przywraca oryginalnego pliku ze skompresowanej wersji. Archiwizacja oznacza raczej zebranie, uporządkowanie i zapisanie danych w celu przechowywania, często długoterminowego. Archiwum może być skompresowane, ale nie musi. Dobrym przykładem jest format TAR, który sam w sobie głównie łączy pliki w jeden kontener, a dopiero później bywa kompresowany np. gzipem. Pakowanie danych też nie jest tym samym co dekompresja. Pakowanie może oznaczać umieszczenie wielu plików w jednym pakiecie, przygotowanie instalatora albo kontenera danych. Czasem przy okazji następuje kompresja, ale sens operacji jest inny. Typowy błąd myślowy polega na tym, że użytkownik widzi program do archiwów i zakłada, że każde działanie w takim programie to kompresja albo jej odwrotność. W praktyce trzeba rozróżniać funkcję: zmniejszanie rozmiaru to kompresja, przywracanie danych z tej postaci to dekompresja, a organizowanie plików w archiwum to osobna sprawa.