Normalizacja poziomu szczytowego nagrania, czyli tzw. peak normalization, to taki proces, w którym podnosi się poziom całego nagrania tak, żeby najwyższa wartość szczytowa (czyli ten największy pojedynczy impuls w sygnale) sięgnęła dokładnie 0 dBFS. Oczywiście, w praktyce czasem zostawia się minimalny margines, np. do -0,1 dBFS, żeby uniknąć ewentualnych przesterowań przy dalszym przetwarzaniu, ale główny mechanizm polega właśnie na tym jednym – znajdź najwyższy pik i przesuń wszystko w górę tak, żeby był na samym szczycie skali cyfrowej. To bardzo prosty i szybki sposób na wyrównanie głośności różnych plików albo przygotowanie materiału do dalszego masteringu. Spotyka się to właściwie w każdym DAW-ie i nawet podstawowe programy do montażu audio mają taką funkcję. Z mojego doświadczenia bywa to bardzo przydatne, zwłaszcza jak ktoś dostaje miks z różnych źródeł i chce, żeby od razu było równo pod względem potencjału głośności, zanim zacznie głębsze zmiany. Warto pamiętać, że peak normalization nie zmienia relacji między cichymi a głośnymi fragmentami – nie jest to kompresja ani normalizacja RMS/średnia. Z punktu widzenia standardów, to absolutna podstawa i wręcz obowiązkowy krok w wielu workflow, choć na etapie końcowym w radiu czy streamingach częściej używa się normalizacji według LUFS (średniego poziomu głośności), ale peak normalization dalej ma swoje miejsce, zwłaszcza przy przygotowaniu surowych plików.
Wiele osób myli różne typy normalizacji, szczególnie gdy chodzi o różnicę między szczytową (peak) a średnią (RMS/LUFS). Obniżenie poziomu nagrania o 3 dB – czy to średniego, czy szczytowego – nie jest w ogóle normalizacją, tylko statycznym zmniejszeniem głośności. To po prostu przesunięcie całego sygnału w dół, bez odniesienia do jakiejkolwiek wartości referencyjnej, więc nie rozwiązuje problemu wyrównania potencjału głośności nagrań. Jeszcze większym nieporozumieniem jest podniesienie poziomu nagrania tak, aby średnia wartość osiągnęła 0 dBFS. W praktyce, gdybyśmy podnieśli średni poziom RMS czy LUFS do 0 dBFS, to każdy, nawet umiarkowany pik, przebiłby sufit cyfrowy, wprowadzając fatalne przesterowania cyfrowe. Dla porównania, w broadcastingu czy na platformach typu Spotify, średnia głośność (LUFS) jest ustawiana dużo niżej, np. na -14 LUFS. To pokazuje, jak bardzo niebezpieczne byłoby celowanie w 0 dBFS jako wartość średnią – to się po prostu nie robi z powodów technicznych. Typowym błędem myślowym jest też mylenie normalizacji z kompresją – normalizacja szczytowa nie zmienia dynamiki, czyli różnicy między cichymi a głośnymi fragmentami, po prostu podnosi wszystko tak, żeby najwyższy moment dotykał 0 dBFS. Kompresja to zupełnie inny proces, mający na celu wyrównanie poziomów w sygnale. Wiele osób intuicyjnie zakłada, że celem normalizacji jest podciągnięcie całości do maksimum, ale bez uwzględnienia konkretnego typu normalizacji (szczytowa kontra średnia) można się szybko pogubić. W branży audio przyjmuje się, że normalizacja szczytowa służy tylko do szybkiego wyrównania poziomów wyjściowych, a nie do zarządzania głośnością odbieraną przez słuchacza. Prawidłowe rozróżnienie tych procesów to absolutna podstawa przy pracy z dźwiękiem cyfrowym.