Zasada próbkowania, czyli twierdzenie Nyquista-Shannona, mówi jasno: aby móc poprawnie zdigitalizować sygnał analogowy, musimy próbkować go z częstotliwością co najmniej dwa razy większą niż najwyższa częstotliwość w jego widmie. Przy dźwięku o maksymalnej częstotliwości 20 kHz, to właśnie 40 kHz jest tym absolutnym minimum. Jednak w praktyce, technologia audio przyjęła nieco wyższą wartość, czyli 44 100 Hz, głównie ze względu na potrzeby zapisu na płytach CD oraz rezerwę na filtry antyaliasingowe. Gdybyśmy wybrali niższą częstotliwość, mogłyby się pojawić zniekształcenia aliasingu, które potrafią solidnie namieszać szczególnie w muzyce czy nagraniach mowy, gdzie precyzja jest kluczowa. Warto też zauważyć, że 44 100 Hz to dziś taki złoty standard – spotykany właściwie wszędzie, od odtwarzania muzyki po produkcję materiałów do internetu. Z mojego doświadczenia wynika, że niższe próbkowania bardzo szybko ujawniają swoje ograniczenia, nawet laik wyczuje pogorszenie jakości dźwięku. W branży stosuje się czasem wyższe wartości, ale to już raczej dla specjalistycznych zastosowań, np. w studiach nagraniowych. Moim zdaniem, bez znajomości tej podstawowej zasady ciężko ruszyć dalej w świecie cyfrowego audio, bo każdy etap obróbki opiera się właśnie na tej logice i konsekwencjach wyboru częstotliwości próbkowania.
Często intuicja podpowiada, że im wyższa częstotliwość próbkowania, tym lepsza jakość dźwięku. Jednak nie zawsze jest to prawda – w praktyce liczy się przede wszystkim dopasowanie do najwyższej częstotliwości występującej w sygnale. Zgodnie z twierdzeniem Nyquista-Shannona, do idealnej rekonstrukcji sygnału wystarczy próbkować go z częstotliwością co najmniej dwukrotnie wyższą niż najwyższa składowa w widmie tego sygnału. W przypadku audio o maksymalnej częstotliwości 20 kHz daje to 40 kHz jako minimum. Wybierając 32 000 Hz, nie spełniamy tego warunku – taka wartość jest zdecydowanie za niska i prowadziłaby do zjawiska aliasingu, czyli nakładania się widm częstotliwości, co skutkuje słyszalnymi artefaktami i nieodwracalną utratą informacji o oryginalnym dźwięku. Z drugiej strony, bardzo popularne w systemach profesjonalnych wartości 48 000 Hz czy nawet 96 000 Hz, choć w pełni poprawne technicznie, nie są najniższymi możliwymi częstotliwościami, które pozwalają na poprawną digitalizację sygnału 20 kHz. Stosuje się je głównie w celu zapewnienia dodatkowej rezerwy jakości lub do zastosowań specjalistycznych, np. w audiofilskich produkcjach czy postprodukcji filmowej. Typowym błędem jest przekonanie, że im wyżej – tym lepiej, nie biorąc pod uwagę ekonomii przetwarzania: wzrost częstotliwości próbkowania oznacza większy rozmiar plików i większe wymagania wobec sprzętu, a korzyści z tego są często marginalne dla standardowego odbiorcy. Dlatego 44 100 Hz to wartość przyjęta za standard, szczególnie w kontekście płyt CD i większości popularnych formatów muzycznych. W praktyce oznacza to, że to właśnie ta wartość pozwala na bezstratną konwersję dźwięku z najwyższymi słyszalnymi częstotliwościami, niepotrzebnie nie obciążając systemu. Warto więc mieć tę zasadę gdzieś z tyłu głowy, bo pozwala ona unikać zarówno zbyt niskiego, jak i przesadnie wysokiego próbkowania, które nie wnosi realnej korzyści.