CASE STUDY
Czy biznes
potrzebuje Zabbixa?
Monitoring SLA w retail.
CASE STUDY
Czy biznes
potrzebuje Zabbixa?
Monitoring SLA w retail.
WPROWADZENIE
WPROWADZENIE
Klient to jedna z sieci sklepów typu convenience w Europie Środkowo-Wschodniej, zarządzająca tysiącami punktów sprzedaży. Firma realizuje nowoczesną strategię handlu detalicznego zorientowaną na klienta, intensywnie inwestując w nowe technologie i automatyzację procesów.
Z Zabbixa korzystał przede wszystkim dział IT – to klasyczny scenariusz, w którym system monitoringu służy administratorom do bieżącej kontroli stanu infrastruktury. Ale w tej historii kluczową rolę odegrał zespół Product Ownerów, którzy odpowiadają za raportowanie do zarządu i rozwój usług biznesowych.
To właśnie oni uświadomili sobie, że potrzebują danych z Zabbixa bardziej, niż początkowo przypuszczali. Jasnych, wiarygodnych wskaźników dostępności poszczególnych elementów infrastruktury, które składają się na funkcjonowanie całej usługi – przedstawionych w czytelny, przejrzysty sposób. Takich, które można realnie wykorzystać w raportach dla zarządu i przy podejmowaniu decyzji operacyjnych.
PROBLEMY KLIENTA
PROBLEMY KLIENTA
Zabbix przestał być narzędziem wyłącznie dla IT. Ale zanim to się stało, trzeba było rozwiązać kilka istotnych problemów. Główny problem to ogromna liczba powiadomień o stanie infrastruktury. Częsta sytuacja w dużych, wielooddziałowych firmach zarządzanych globalnie. Czy sam dostęp do takich danych wystarczy, by ocenić, czy usługa naprawdę działa?
Oczywiście, że nie. Informacja o stanie pojedynczego urządzenia była niewystarczająca, by określić, czy działa cała usługa biznesowa, np. drukowanie paragonów czy akceptacja płatności, w skali całej sieci. Potrzebne było inne podejście: oparte na SLA, jasno zdefiniowanych progach oraz perspektywie użytkownika końcowego, nie tylko infrastruktury.
PERSPEKTYWA KLIENTA
„Nie interesuje nas, czy drukarka działa – interesuje nas, czy można wystawić paragon. Potrzebowaliśmy spojrzenia, które łączy komponenty w całościową usługę.”
Problemy klienta
-
Niewystarczająca widoczność w czasie rzeczywistym
Kierownictwo nie miało możliwości bieżącego śledzenia dostępności kluczowych komponentów infrastruktury, co utrudniało szybkie reagowanie na incydenty. -
Nadmiar alertów – brak reakcji
System generował tysiące powiadomień, które nie były obsługiwane z powodu braku zasobów. Prowadziło to do utraty kontroli nad realnym stanem usług. -
Trudności z raportowaniem do zarządu i partnerów
Brakowało przejrzystych dashboardów SLA i narzędzi do generowania raportów, które mogłyby być wykorzystywane operacyjnie i negocjacyjnie. -
Ograniczona kontrola nad usługami zewnętrznych dostawców
Klient nie posiadał niezależnych źródeł informacji o dostępności usług świadczonych przez partnerów, co ograniczało jego pozycję w rozmowach kontraktowych.
CZY WIESZ, ŻE…
Funkcja SLA w Zabbixie pozwala monitorować dostępność usług i sprawdzać, czy realizują one założone cele operacyjne. To nie jedyny przypadek używania zamiennie terminów SLA, SLO i SLI.
SLA (Service Level Agreement) to umowa.
SLO (Service Level Objective) to cel operacyjny.
SLI (Service Level Indicator) to wskaźnik, który mierzy, czy cel został osiągnięty.
WYZWANIE
WYZWANIE
Monitoring miał pokazać nie tylko, czy coś działa, ale czy działa usługa, na której opiera się biznes.
To właśnie ta zmiana – z technicznego na usługowe podejście do monitoringu – przesunęła punkt ciężkości z analizy urządzeń na obserwację doświadczenia użytkownika końcowego. Zamiast pytać „czy działa sprzęt?”, trzeba było zapytać „czy działa usługa, z której korzysta klient?”. To wymagało nowego sposobu myślenia, precyzyjnego definiowania zależności między komponentami oraz ustalenia progów, które mają znaczenie nie tylko dla IT, ale przede wszystkim dla biznesu.
Kluczowe wyzwania projektu
1. Zdefiniowanie usług biznesowych i ich technicznego odwzorowania
Aby monitorować SLA z perspektywy biznesu, należało najpierw określić, czym w praktyce jest „działająca usługa” – np. sprzedaż czy drukowanie paragonów – oraz z jakich komponentów się składa. To wymagało precyzyjnego zmapowania zależności między systemami, urządzeniami i punktami styku z użytkownikiem końcowym.
2. Uzupełnienie monitoringu i weryfikacja infrastruktury
Kolejnym krokiem była szczegółowa analiza istniejącego monitoringu i identyfikacja luk – brakujących danych, nieaktualnych elementów, zbyt ogólnych metryk. W wielu przypadkach konieczne było wdrożenie nowych checków, integracji i rozszerzeń, by rzeczywiście odwzorować działanie usług w całej sieci sprzedaży.
PERSPEKTYWA KLIENTA
„Z poziomu infrastruktury wszystko wyglądało poprawnie, ale nie wiedzieliśmy, czy klient faktycznie może zapłacić, wydrukować paragon, zakończyć transakcję. Potrzebowaliśmy spojrzenia z poziomu usługi – nie urządzenia.”
ROZWIĄZANIE
ROZWIĄZANIE
W odpowiedzi na zidentyfikowane wyzwania wdrożyliśmy centralny system monitorowania oparty na Zabbix, uzupełniony o dedykowane dashboardy w Grafanie. Projekt został zrealizowany etapowo, w ścisłej współpracy z klientem, zgodnie z poniższym podejściem:
1. Zdefiniowanie usług podlegających SLA
Wspólnie z klientem zidentyfikowaliśmy listę krytycznych urządzeń i usług wymagających monitorowania dostępności, m.in.: komputery kasowe, terminale płatnicze, drukarki fiskalne, urządzenia sieciowe, ekrany reklamowe, czytniki biletów, cenówki elektroniczne, urządzenia sieciowe i wiele innych. Lista ta została ujęta w cyklicznie aktualizowanym dokumencie monitoringu.
2. Konfiguracja mechanizmów oceny SLA
Dla każdej z usług opracowaliśmy wyzwalacze (triggery) w Zabbixie, które w precyzyjny sposób określają stan dostępności – z uwzględnieniem dni tygodnia, godzin pracy sklepów, wyjątków i progu tolerancji błędów. System uwzględnia m.in. liczbę sklepów z danym problemem, czas trwania incydentu oraz warunki krytyczne (np. brak działania wszystkich kas w danym punkcie).
3. Budowa dashboardów w Grafanie
Dane z Zabbixa zostały zintegrowane z Grafaną i przedstawione w postaci przejrzystych dashboardów: miesięcznych i rocznych zestawień SLA dla całej sieci i infrastruktury, operacyjnych widoków dla zespołów technicznych, dashboardów SLA usług zarządzanych przez zewnętrznych dostawców (np. drukarki fiskalne).
4. Weryfikacja, kalibracja i testy progów SLA
Opracowaliśmy wspólnie z klientem definicje progów SLA. W przypadku trudnych do oszacowania metryk przyjęto statystyczne dane z historii zdarzeń z Zabbixa.
5. Wsparcie operacyjne
W przypadku większości alertów związanych z usługami SLA, klient kieruje zgłoszenia do partnera wdrożeniowego, co pozwala ograniczyć wewnętrzne zaangażowanie zespołu IT i szybciej zidentyfikować źródło problemu.
PERSPEKTYWA APLITT
„Zabbix wspierany Grafaną pozwolił przenieść monitoring z poziomu technicznego (np. pingów i urządzeń) na poziom UX, czyli tego, co faktycznie widzi klient i lokalny operator.
W efekcie Aplitt przygotował narzędzie, które pokazuje realny stan usług, np. czas dostępności kas, backupów czy sieci.”
REZULTAT
REZULTAT
Wdrożenie centralnego monitoringu SLA opartego o Zabbix i dashboardy w Grafanie przyniosło klientowi szereg wymiernych korzyści:
Pełna widoczność dostępności usług
Zespół IT oraz interesariusze biznesowi zyskali dostęp do rzeczywistych danych o stanie infrastruktury i dostępności usług w punktach sprzedaży, w podziale na konkretne urządzenia i lokalizacje.
Wzrost poziomu SLA
Dzięki lepszej kontroli i szybszej reakcji na problemy, udało się, zgodnie z oczekiwaniami zarządu, podnieść poziom SLA.
Zwiększenie efektywności operacyjnej
Ujednolicenie konfiguracji Zabbixa oraz automatyzacja alertów pozwoliły ograniczyć nadmiar powiadomień i poprawić czas reakcji na incydenty. Rozproszona odpowiedzialność została zastąpiona centralnym nadzorem.
Dane do raportowania i negocjacji
Dashboardy SLA są wykorzystywane zarówno do raportowania wewnętrznego, jak i jako podstawa rozmów z partnerami zewnętrznymi, np. dostawcami drukarek. Dane z Grafany są traktowane jako wiarygodne źródło weryfikacji czy SLA było spełnione.
Podstawa do dalszego rozwoju
Zbudowana architektura i zdefiniowane mechanizmy mogą być rozwijane w kolejnych obszarach, np. raportowania jakości danych, integracji z narzędziami BI, analizy trendów awarii czy wsparcia decyzji inwestycyjnych w infrastrukturę.
PERSPEKTYWA KLIENTA
„Wreszcie mogliśmy spojrzeć na dostępność usług z poziomu całej sieci, a nie pojedynczych incydentów. To zmieniło sposób, w jaki IT rozmawia z biznesem.”
CZY TWOJA FIRMA TEŻ POTRZEBUJE MONITOROWAĆ SLA?
CZY TWOJA FIRMA TEŻ POTRZEBUJE MONITOROWAĆ SLA?
Jeśli zarządzasz rozbudowaną siecią punktów sprzedaży lub usług i chcesz mieć pewność, że wszystko działa tak, jak powinno – nie wystarczy wiedzieć, czy urządzenia są online. Potrzebujesz monitoringu, który pokaże Ci, czy działa cała usługa biznesowa – z punktu widzenia klienta, lokalnych operatorów i zarządu.
Zadbaj o ciągłość działania i wiarygodne raporty SLA. Skontaktuj się z nami i sprawdź, jak możemy pomóc Twojej organizacji zobaczyć więcej i szybciej reagować.