Czego nie wiesz o awariach infrastruktury IT
Przestoje, niezależnie od tego, czy są planowane, czy nie, stanowią jedno z największych wyzwań dla firmy ze względu na koszty i inne wywoływane problemy.
Czy liczba przestojów w firmach maleje
Przestoje planowane to okresy, w których firma lub zakład produkcyjny decyduje się celowo wyłączyć część lub całą produkcję na określony czas. W celu konserwacji, napraw i przeglądów; wprowadzania zmian w procesach produkcyjnych – nowych urządzeń czy technologii; szkoleń pracowników, czy nawet rozwiązania problemu nadprodukcji i optymalizacji kosztów. W każdym razie planowane przestoje dają technikom szansę na ich monitorowanie i kontrolę – odbywają się prawie zawsze poza godzinami szczytu, w weekendy i święta, często równolegle z tymczasowym obejściem i odroczeniem zadań, które nie są pilne.
Nieplanowane przestoje, czyli po prostu awarie to już zupełnie inna historia. Powodowane przez niezamierzone okoliczności bywają nieobliczalne i to zarówno pod względem przyczyn jak i poniesionych przez firmę kosztów.
Średnio, w stosunku do przestojów planowanych, awarie kosztują o 35% więcej za minutę. I nie chodzi tylko o utratę spodziewanych w czasie awarii przychodów. W grę wychodzą też dane, narażone na utratę czy uszkodzenie, koszty wtórne, takie jak wydatki na pracę bezczynnych pracowników oraz prawne i regulacyjne konsekwencje niedostępności usług o znaczeniu krytycznym dla klientów, pracowników i innych interesariuszy.
A jeśli myśleliście, że liczba i koszty przestojów w firmach maleją to byliście w błędzie. Przeciętny zakład produkcyjny doświadcza miesięcznie aż 20 nieplanowanych przestojów, czyli o sześć więcej niż dwa lata temu*.
*na podstawie danych firm z listy Fortune Global 500
Ile kosztują awarie w 2022 roku
Według badań Siemens „Prawdziwe koszty przestoju 2022”:
Koszty awarii w firmach z listy Fortune Global 500 to aż 11% ich rocznych obrotów, o 8% więcej niż dwa lata temu. Roczny koszt przestoju wynosi 129 milionów USD, czyli 65% więcej w porównaniu z ostatnim badaniem przeprowadzonym w latach 2019-2020.
Chociaż awarie zdarzają się wszystkim organizacjom, koszty przestojów mogą się różnić w zależności od wielu czynników. Wg badań Siemens koszt straconej godziny waha się obecnie od średnio 39 000 USD do ponad 2 mln USD w zależności od branży.
Najwyższe koszty awarii ponosi branża motoryzacyjna. W latach 2019 – 2020: 1,3 mln USD, dwa lata później już 2 mln USD. W branży paliwowej tempo wzrostu awarii jest jeszcze wyższe – w tym samym okresie koszty awarii wzrosły dwukrotnie do prawie 500 tys. USD. Inne branże wysokiego ryzyka to m.in. bankowość i finanse, opieka zdrowotna, produkcja, media i komunikacja.
Dlaczego dochodzi do awarii
Dlaczego w ogóle dochodzi do przestojów? A jakie są najczęstsze ich przyczyny? Okazuje się, że absolutnym zwycięzcą w tej kategorii są problemy z siecią.
Dlaczego? Żyjemy w świecie, w którym więcej organizacji niż kiedykolwiek w sposób naturalny przenosi swoje IT do chmury. Środowiska chmurowe oferują korzyści, takie jak elastyczność i skalowalność, są również bardziej dynamiczne i złożone, przez co tradycyjne rozwiązania w zakresie ochrony danych stają się zwyczajnie nieskuteczne.
Podsumowując – technologie chmurowe i hybrydowe mogą zarówno pomóc w zapobieganiu awariom, jak i wprowadzić nowe potencjalne ryzyka. Jakie?
- Korzystając z technologii chmurowych, firmy często są zależne od dostawcy usług. Jeśli dostawca doświadczy awarii, może to wpłynąć na infrastrukturę usługobiorcy.
- Złożone infrastruktury są w dużym stopniu narażone na błędy w konfiguracji, których konsekwencją może być awaria.
- Wprowadzenie chmur i hybryd może wiązać się z nowymi zagrożeniami bezpieczeństwa, takimi jak ataki hakerskie czy naruszenia danych.
- W technologiach hybrydowych konieczne jest zapewnienie prawidłowej integracji pomiędzy lokalnymi systemami a rozwiązaniami chmurowymi.
- I wspomniane już błędy ludzkie. Wdrażając nowe technologie, firma musi skutecznie zarządzać procesem zmiany, aby uniknąć konfliktów i nieadekwatnych procedur.
Jakie inne przyczyny awarii wskazały firmy w 2022 roku?
Jak podaje Acronis w Globalnym raporcie Cyber Protection Week 2022 ponad jedna trzecia (36%) przypadków przestojów jest powodowana przez cyberataki. Ich liczba ciągle rośnie – o 93% tylko w pierwszej połowie 2021 roku.
Przestoje nie zdarzają się wyłącznie z powodu czynników zewnętrznych. Często są konsekwencją błędów popełnianych przez osoby znajdujące się najbliżej infrastruktury. Szacuje się, że to właśnie błąd ludzki był przyczyną 40% poważnych przestojów w ciągu ostatnich trzech lat (wg Uptime Institute). Ale jakie to błędy? W dużej mierze te proceduralne — albo personel ich nie przestrzega, albo są nieadekwatne do rzeczywistych procesów.
Jak przeciwdziałać awariom
Chociaż nie można całkowicie wyeliminować przestojów, można zmniejszyć ich dotkliwość. Poprzez odpowiednie rozwiązania, które zmniejszają zakłócenia w działalności biznesowej i zwiększają dostępność infrastruktury informatycznej.
Tymczasem monitorowanie infrastruktury informatycznej w czasie rzeczywistym, nawet w branżach, które należą do tych o największej skali, złożoności i wymaganiach jest możliwe z wykorzystaniem bezpłatnych narzędzi takich jak ZABBIX.
Z ZABBIX monitorujesz setki tysięcy parametrów infrastruktury informatycznej, niezależnie od jej złożoności, rozproszenia, liczby urządzeń i producentów monitorowanych urządzeń, liczby baz danych i obsługiwanych aplikacji. Tylko wtedy masz pełną kontrolę nad swoją infrastrukturą. A to wszystko w jednym centrum dowodzenia.
W ZABBIX możesz monitorować cała rozproszoną architekturę swojej firmy albo oddzielnie poszczególne oddziały. ZABBIX stale sprawdza, czy na serwerach dostępny jest ruch sieciowy, który jest niezbędny do działania całej usługi i wymiany danych między systemami. Jeżeli jakiś port nie odpowiada, monitoring o tym informuje. Monitoruje również obciążenie na ruchu sieciowym, wysycenie pamięci czy procesora. A Ty Konfigurujesz panele zarządcze i administracyjne dopasowane do Twoich potrzeb. W raportach z Grafany widzisz przejrzyście to, co ma rzeczywisty wpływ na stabilność pracy Twojej infrastruktury.
Pomyśl o prewencji. Zapraszamy do kontaktu. Porozmawiajmy o tym, jak rozwiązać problem przestojów w Twojej firmie.
Źródła:
Acronis (March 2022). Acronis Cyber Protection Week Global Report 2022
Atlassian. Calculating the Cost of Downtime
Check Point Software Technologies Ltd. Cyber Attack Trends: 2021 Mid Year Report
Forrester (August 2019). The Real Costs of Planned and Unplanned Downtime
IDC (January 2021). IDC’s Worldwide State of Data Protection & DR Survey
IDC (July 2021). Ransomware Study: Where You Are Matters
Ponemon Institute (January 2016). Cost of Data Center Outages
Security.org (May 2019). Public Awareness of Major Data Breaches
Uptime Institute (June 2022). 2022 Outage Analysis Report
Podziel się treścią: