Prawidłowa kolejność priorytetów alarmów w urządzeniach cyfrowych sieci rozległych to: Critical, Major, Minor, Warning. Ten schemat jest zgodny z powszechnie stosowaną klasyfikacją w systemach zarządzania siecią (NMS), opartą chociażby na praktykach ITU-T i typowych implementacjach SNMP w routerach, przełącznikach czy urządzeniach transmisyjnych (MPLS, SDH, DWDM). Alarm typu Critical oznacza stan krytyczny – zwykle całkowitą utratę funkcjonalności elementu sieci lub usługi, np. brak zasilania głównego, awarię modułu kontrolera, przerwanie głównego łącza WAN, utratę synchronizacji w całym węźle. W praktyce takie zdarzenia wymagają natychmiastowej reakcji, często z udziałem pogotowia serwisowego lub przełączenia ruchu na ścieżki zapasowe. Alarm Major sygnalizuje poważne zakłócenie działania, ale zwykle nie całkowity zanik usługi. Może to być np. awaria jednego z redundantnych modułów, przeciążenie interfejsu, wysoki poziom błędów na łączu, uszkodzenie jednego z zasilaczy przy zachowaniu pracy z drugiego. Z mojego doświadczenia w utrzymaniu sieci, Major to już taki stan „czerwonej lampki”, ale sieć jeszcze wisi i klienci czasem nawet tego nie widzą od razu. Alarm Minor oznacza problem o mniejszym wpływie na działanie – np. chwilowe przekroczenia progów jakości, ostrzeżenia o zbliżaniu się do limitu przepustowości, błędy na interfejsie, które jeszcze nie rozwalają usługi. Tu zwykle planuje się interwencję, ale nie trzeba jej robić natychmiast, raczej w oknie serwisowym. Warning to najniższy poziom – bardziej informacja ostrzegawcza, że coś może się stać w przyszłości, np. rosnące opóźnienia, niewielkie fluktuacje parametrów linii, lekko podwyższona temperatura modułu. Dobre praktyki mówią, żeby w systemach monitoringu odpowiednio mapować te poziomy na kolory i reakcje: Critical – czerwony i alarm dźwiękowy, Major – pomarańczowy, Minor – żółty, Warning – niebieski lub jasny żółty. Dzięki temu dyspozytor NOC od razu wie, czym musi zająć się w pierwszej kolejności. Taka hierarchia pomaga też w SLA – przy incydentach Critical i Major czas reakcji jest zwykle zapisany w umowie z klientem, a Minor i Warning są traktowane bardziej jako sygnały do planowania prac utrzymaniowych.
W cyfrowych sieciach rozległych kolejność i nazewnictwo alarmów nie jest przypadkowe, tylko wynika z długoletniej praktyki branżowej oraz standardów zarządzania siecią. Problem wielu błędnych odpowiedzi polega na tym, że mieszają one poziomy ważności z innymi określeniami, które nie są traktowane jako formalne klasy alarmów, albo odwracają faktyczną hierarchię priorytetów. W profesjonalnych systemach NMS czy OSS bazujących na SNMP, a także w zaleceniach ITU-T dotyczących zarządzania siecią, przyjęło się, że najwyższym priorytetem jest zawsze alarm Critical. Oznacza on sytuację, w której usługa jest całkowicie niedostępna lub węzeł sieci przestaje pełnić swoją podstawową funkcję. Umieszczanie alarmu Major przed Critical sugeruje, że poważna, ale niekrytyczna usterka miałaby być ważniejsza niż całkowita awaria, co jest sprzeczne z logiką utrzymania ciągłości usług i praktyką pracy w centrum nadzoru sieci. Kolejny typowy błąd to wprowadzanie do listy poziomu o nazwie Invalid albo Hardware. Invalid nie jest standardową kategorią alarmową, raczej oznacza niepoprawny lub nieobsługiwany stan, więc nie powinien być traktowany jako poziom ważności. Podobnie Hardware opisuje rodzaj źródła problemu (awaria sprzętowa), a nie jego rangę. W realnych systemach zarządzania można mieć alarm Critical-Hardware, Major-Hardware itp., ale słowo Hardware nie zastępuje poziomów Critical, Major, Minor, Warning, tylko je uzupełnia. Często spotyka się też mylenie nazwy Critical ze źle zapisaną formą „Critcal”, co w praktyce może oznaczać zwykły błąd literowy, ale w pytaniach testowych pokazuje brak precyzji i znajomości terminologii. Odwrócenie kolejności i zaczynanie od Warning sugeruje niezrozumienie, że Warning to najniższy poziom – bardziej ostrzeżenie niż awaria. W dobrze zaprojektowanej sieci operator najpierw reaguje na Critical, potem Major, później Minor, a na końcu analizuje Warning, często w ramach planowanych prac prewencyjnych. Z punktu widzenia SLA, priorytetów w systemach zgłoszeniowych i konfiguracji progów alarmowych, poprawne rozróżnienie tych poziomów jest kluczowe. Błędne uporządkowanie może w praktyce prowadzić do paradoksalnej sytuacji, gdzie zespół utrzymania zajmuje się drobnymi ostrzeżeniami, a krytyczne awarie zostają zignorowane lub obsłużone z opóźnieniem, co jest dokładnym przeciwieństwem dobrych praktyk eksploatacji sieci.