Jakie awarie wykrywa monitoring IT Zabbix
O tym jak ważna jest rola administratora IT w firmie nie trzeba nikogo przekonywać. Natomiast to, czy firma dba o swojego administratora i dostarcza mu narzędzia, które ułatwią pracę oraz pozwolą zadbać o bezpieczeństwo i stabilność sieci to już zupełnie inny temat. Najczęściej dla współpracowników i osób podejmujących strategiczne decyzje administrator to postać tajemnicza i takie też muszą być narzędzia jego pracy. Czas odczarować rzeczywistość.
Z tego artykułu dowiesz się o awariach:
- Awaria klimatyzatora
- Sprawdzanie reklam w sieci
- Przerwy w dostawie prądu
- Sprawdzanie spamu
- Awaria serwera
- Kompatybilność oprogramowania
- Zadbaj o admina
Awaria klimatyzatora
Tomasz, administrator systemów IT w jednym z oddziałów Urzędu Skarbowego odpowiada za dostępność i bezawaryjną pracę wszystkich systemów w urzędzie. Nie mógł przewidzieć, że w godzinach urzędowania klimatyzator w serwerowni ulegnie awarii i doprowadzi do wyłączenia się przegrzanego serwera odpowiedzialnego za obsługę klientów. Co gorsza, doszło również do uszkodzenia i znacznej utraty danych wprowadzanych do systemu. Skutków awarii nie dało się odwrócić, mimo przywrócenia serwera do pracy.
Co by było, gdyby… Tomasz otrzymał informację o podwyższonej temperaturze w serwerowni i mógłby na czas uruchomić awaryjny system klimatyzacji?
Sprawdzanie dostępności reklam w sieci
Krystyna zajmuje się pozyskiwaniem reklamodawców w znanym ogólnopolskim internetowym portalu modowym. Wielkim sukcesem Krystyny było nawiązanie współpracy z popularnym producentem kosmetyków. Reklama wiodącego produktu, czyli kremu pod oczy pojawiła się na portalu modowym w określonym umową terminie i miejscu. W czasie trwania kampanii promocyjnej programista odpowiedzialny za witrynę wprowadził na stronie drobne poprawki. Niestety nie sprawdził poprawności działania linków z reklamą, skutkiem czego reklama kremu zniknęła z portalu. Przez następne kilka dni nikt nie zauważył problemu … oprócz reklamodawcy, który wystąpił o ogromne odszkodowanie za niedotrzymanie warunków umowy.
Co by było, gdyby… automaty, które on-line sprawdzają działanie linków z reklamą wygenerowały alert o niedostępności ogłoszenia? Taka sytuacja nie miałaby miejsca.
Data Center bez prądu?
Kto zaczyna dzień od sprawdzenia strony internetowej dostawcy energii pod kątem planowanych przerw w dopływie prądu? No właśnie… Jerzy, administrator sieci IT w dużym banku również nie miał tego w zwyczaju. Jego firma była przygotowana na przerwę w dostarczeniu energii – agregat prądotwórczy miał zapewnić podtrzymanie zasilania na okres 12 godzin. Jednak zapewnił tylko na 2 godziny, bo na tyle wystarczyło paliwa w agregacie. Niestety, o tym przekonał się Jerzy w momencie, kiedy cała serwerownia, w tym serwer odpowiedzialny za transakcje bankowe, przerwał pracę.
Co by było, gdyby… automat, który codziennie monitoruje komunikaty publikowane na stronie dostawcy energii, powiadomił o planowanej przerwie w dopływie energii z kilkudniowym wyprzedzeniem? Jerzy miałby dość czasu na uruchomienie procedury kontrolnej i uzupełnienie zbiorniku paliwa.
Sprawdzanie spamu
W dzisiejszych czasach większość ustaleń i informacji otrzymujemy mailem. Chyba, że serwer pocztowy zdecyduje inaczej i uzna naszą korespondencję za groźną. O ile przeglądanie kosza i spamu w prywatnej skrzynce nie stanowi dla nikogo problemu, to przeglądanie codziennie setek maili na firmowym serwerze pocztowym było dla Łukasza, administratora IT w firmie produkującej armaturę, dużym wyzwaniem. Wymagało od niego ogromnych nakładów czasu i cierpliwości. I tego właśnie zabrakło feralnego dnia, kiedy w kwarantannie utknął mail od Klienta dotyczący bardzo ważnego dla firmy przetargu. Mail nie dotarł do adresata na czas. Oferta przetargowa nie została złożona na czas i firma Łukasza została wyłączona z postępowania.
Co by było, gdyby… automat powiadomił o mailu od klienta w kwarantannie? Łukasz nie musiałby spędzać godziny dziennie na przeglądaniu spamu.
Awarie serwerów
Prawo Murphy’ego znane jest administratorom bardzo dobrze – jeśli jakiś serwer ma odmówić współpracy, to zrobi to ten najważniejszy i w najgorszym z możliwych momentów. Przekonała się o tym Urszula, szefowa działu płac w dużej firmie produkującej opony samochodowe. Jej dział odpowiada z naliczenie i wypłatę wynagrodzeń dla 4 tysięcy zatrudnionych osób. W praktyce oznacza to kilka dni wytężonej pracy jej pracowników, którzy starają się wszystkie wynagrodzenia naliczyć prawidłowo i na czas. Serwer, który obsługuje program do naliczania płac odczuł skutki wzmożonej pracy i w dniu zatwierdzania wynagrodzeń odmówił współpracy. Przywrócenie jego funkcjonowania trwało kilka godzin. Wynagrodzenia zostały wypłacone z jednodniowym opóźnieniem, co wywołało duże niezadowolenie pracowników i zarządu.
Co by było, gdyby… automat powiadomił o ryzyku wyczerpania wolnej pamięci na dysku? Administrator mógłby odpowiednio wcześnie zapewnić właściwe zasoby pamięci dla serwera i nikt nie odczułby żadnych negatywnych skutków tej operacji.
Kombatybilność oprogramowania
O zaplanowanej aktualizacji programu do fakturowania transakcji w sklepie internetowym Krzysztof, administrator systemów IT, został poinformowany z kilkudniowym wyprzedzeniem. Aktualizacja miała być przeprowadzona w nocy, z uwagi na konieczność zapewnienia dostępności usługi dla klientów. Standardowe testy nie wykazały nieprawidłowości. Niestety, rano okazało się, że jeden z komponentów programu do fakturowania nie jest kompatybilny z aktualną wersją systemu płacowego. Do usunięcia problemu sklep nie mógł obsługiwać transakcji zakupu. Oznacza to ogromne straty, gdyż awaria przerwała klientom zakupy w gorącym okresie sezonowych wyprzedaży i większość z nich skorzystała z oferty konkurencji.
Co by było, gdyby… automat powiadomił o braku kompatybilności systemów, administrator mógłby odpowiednio wcześnie zareagować i na bieżąco usunąć niezgodność.
Zadbaj o swojego admina
Jeżeli przeżyłeś podobną historię, może to oznaczać, że administrator z twojej firmy należy do grup 44% adminów (na podstawie badań własnych), którzy nie korzystają z narzędzi do centralnego zarządzania i monitorowania sieci.
Odpowiedzialny administrator na pewno będzie chciał mieć wszystko pod kontrolą na tyle, na ile jest to możliwe. Doceni powiadomienia via e-mail lub SMS o problemach na newralgicznej części infrastruktury. Na pewno przyda się także bieżące monitorowanie usług sieciowych (np. DNS, LDAP, AD itp.) dostępnych na poszczególnych serwerach. Istotna byłaby też bieżąca informacja, które urządzenie generuje największy ruch w sieci albo w jakich godzinach dany serwer jest najczęściej odpytywany. Możliwość podejrzenia wyników monitorowania sieci w postaci wykresów z możliwością ich eksportu na pewno będzie przydatna podczas przygotowywania raportów dla przełożonych.
Wszystkie wymienione powyżej funkcjonalności i wiele innych przydatnych narzędzi zapewni nam Zabbix, najwyżej oceniana na świecie darmowa, typu open source aplikacja do monitorowania sieci. Zabbix znamy od lat. Wykorzystujemy w swojej pracy i dzięki temu 91% awarii jesteśmy w stanie przewidzieć i prewencyjnie usunąć ich potencjalne przyczyny. Wiemy o czym mówimy – od lat monitorujemy systemy wielooddziałowej (ponad tysiąc oddziałów) instytucji finansowej.
Podziel się treścią:
Napisz do mnie: