Formanty charakterystyczne dla sybilantów, czyli takich głosek jak „s”, „sz” czy „ś”, zdecydowanie lokalizują się w paśmie 2 000 Hz – 20 000 Hz. To tam właśnie, w wysokich częstotliwościach, rejestruje się największą energię tych dźwięków. Szczególnie wyraźnie widać to na spektrogramach – sybilanty tworzą tam mocne, jasne pasma powyżej 4 kHz, nierzadko nawet do 8 czy 10 kHz. W praktyce, jeśli na przykład miksujesz nagrania głosu w radiu albo czyścisz ścieżkę wokalną w programach typu Audacity czy Pro Tools, to właśnie te zakresy odfiltrowujesz, żeby ograniczyć szumy czy nieprzyjemne „syczenie”. Z mojego punktu widzenia, zrozumienie gdzie są sybilanty pozwala skutecznie stosować de-essery i różne narzędzia do obróbki mowy – nie wytniesz ich, grzebiąc w niskich częstotliwościach, bo tam ich po prostu nie ma. Branża nagraniowa i fonetyczna od lat podkreśla, że sybilanty są kluczowe dla czytelności mowy, ale jednocześnie łatwo je przesterować, stąd właśnie ta wiedza jest praktyczna. Ogólnie to, praca z głosem na co dzień pokazuje, że kto nie zna specyfiki tych wysokich częstotliwości, ten często popełnia błędy przy miksowaniu lub analizie mowy.
Sybilanty to specyficzna grupa głosek, które są bardzo charakterystyczne przez swoje wysokie, syczące brzmienie, jak „s”, „sz” czy „ś”. Wiele osób błędnie zakłada, że formanty tych dźwięków mogą znajdować się w niższych pasmach częstotliwości, takich jak 20–249 Hz czy 250–999 Hz. To jednak zupełnie nie ten obszar – tam rejestruje się raczej podstawowe częstotliwości dźwięku mowy, czyli na przykład ton podstawowy (F0), który jest charakterystyczny dla wysokości głosu, a nie dla artykulacji poszczególnych głosek. Z kolei zakres 1000–1999 Hz jest typowy dla niższych formantów samogłoskowych, zwłaszcza pierwszego i drugiego formantu (F1, F2), ale nie dla sybilantów. To typowy błąd, bo łatwo pomylić pojęcie formantu samogłoski z bardzo silną energią sybilantów – a one mają swój szczyt energetyczny w zdecydowanie wyższym paśmie. Pracując z analizą mowy, często widuję, że początkujący próbują wycinać sybilanty w zbyt niskich zakresach i efekt jest mizerny – syczące „s” dalej przeszkadza, bo jego energia tkwi znacznie wyżej. Standardy fonetyczne i inżynierskie jasno wskazują, że sybilanty są najbardziej wyraziste powyżej 4 kHz, a czasem nawet sięgają 12–16 kHz, dlatego profesjonalne narzędzia do de-essingu celują dokładnie w te zakresy. Rozumienie, jak rozkłada się energia różnych dźwięków mowy, jest podstawą pracy z nagraniami i analizą fonetyczną. To po prostu praktyczna rzecz, bez której trudno dobrze obrabiać lub rozpoznawać mowę.