CASE STUDY

Czy biznes
potrzebuje Zabbixa?
Monitoring SLA w retail.

CASE STUDY

Czy biznes
potrzebuje Zabbixa?
Monitoring SLA w retail.

WPROWADZENIE

WPROWADZENIE

Klient to jedna z sieci sklepów typu convenience w Europie Środkowo-Wschodniej, zarządzająca tysiącami punktów sprzedaży. Firma realizuje nowoczesną strategię handlu detalicznego zorientowaną na klienta, intensywnie inwestując w nowe technologie i automatyzację procesów.

Z Zabbixa korzystał przede wszystkim dział IT – to klasyczny scenariusz, w którym system monitoringu służy administratorom do bieżącej kontroli stanu infrastruktury. Ale w tej historii kluczową rolę odegrał zespół Product Ownerów, którzy odpowiadają za raportowanie do zarządu i rozwój usług biznesowych.

To właśnie oni uświadomili sobie, że potrzebują danych z Zabbixa bardziej, niż początkowo przypuszczali. Jasnych, wiarygodnych wskaźników dostępności poszczególnych elementów infrastruktury, które składają się na funkcjonowanie całej usługi – przedstawionych w czytelny, przejrzysty sposób. Takich, które można realnie wykorzystać w raportach dla zarządu i przy podejmowaniu decyzji operacyjnych.

PROBLEMY KLIENTA

PROBLEMY KLIENTA

Zabbix przestał być narzędziem wyłącznie dla IT. Ale zanim to się stało, trzeba było rozwiązać kilka istotnych problemów. Główny problem to ogromna liczba powiadomień o stanie infrastruktury. Częsta sytuacja w dużych, wielooddziałowych  firmach zarządzanych globalnie. Czy sam dostęp do takich danych wystarczy, by ocenić, czy usługa naprawdę działa?

Oczywiście, że nie. Informacja o stanie pojedynczego urządzenia była niewystarczająca, by określić, czy działa cała usługa biznesowa, np. drukowanie paragonów czy akceptacja płatności, w skali całej sieci. Potrzebne było inne podejście: oparte na SLA, jasno zdefiniowanych progach oraz perspektywie użytkownika końcowego, nie tylko infrastruktury.

PERSPEKTYWA KLIENTA

„Nie interesuje nas, czy drukarka działa – interesuje nas, czy można wystawić paragon. Potrzebowaliśmy spojrzenia, które łączy komponenty w całościową usługę.”

Problemy klienta

  • Niewystarczająca widoczność w czasie rzeczywistym
    Kierownictwo nie miało możliwości bieżącego śledzenia dostępności kluczowych komponentów infrastruktury, co utrudniało szybkie reagowanie na incydenty.

  • Nadmiar alertów – brak reakcji
    System generował tysiące powiadomień, które nie były obsługiwane z powodu braku zasobów. Prowadziło to do utraty kontroli nad realnym stanem usług.

  • Trudności z raportowaniem do zarządu i partnerów
    Brakowało przejrzystych dashboardów SLA i narzędzi do generowania raportów, które mogłyby być wykorzystywane operacyjnie i negocjacyjnie.

  • Ograniczona kontrola nad usługami zewnętrznych dostawców
    Klient nie posiadał niezależnych źródeł informacji o dostępności usług świadczonych przez partnerów, co ograniczało jego pozycję w rozmowach kontraktowych.

monitoring SLA zabbix

CZY WIESZ, ŻE…

Funkcja SLA w Zabbixie pozwala monitorować dostępność usług i sprawdzać, czy realizują one założone cele operacyjne. To nie jedyny przypadek używania zamiennie terminów SLA, SLO i SLI.

SLA (Service Level Agreement) to umowa.

SLO (Service Level Objective) to cel operacyjny.

SLI (Service Level Indicator) to wskaźnik, który mierzy, czy cel został osiągnięty.

WYZWANIE

WYZWANIE

Monitoring miał pokazać nie tylko, czy coś działa, ale czy działa usługa, na której opiera się biznes.

To właśnie ta zmiana – z technicznego na usługowe podejście do monitoringu – przesunęła punkt ciężkości z analizy urządzeń na obserwację doświadczenia użytkownika końcowego. Zamiast pytać „czy działa sprzęt?”, trzeba było zapytać „czy działa usługa, z której korzysta klient?”. To wymagało nowego sposobu myślenia, precyzyjnego definiowania zależności między komponentami oraz ustalenia progów, które mają znaczenie nie tylko dla IT, ale przede wszystkim dla biznesu.

Kluczowe wyzwania projektu

1. Zdefiniowanie usług biznesowych i ich technicznego odwzorowania
Aby monitorować SLA z perspektywy biznesu, należało najpierw określić, czym w praktyce jest „działająca usługa” – np. sprzedaż czy drukowanie paragonów – oraz z jakich komponentów się składa. To wymagało precyzyjnego zmapowania zależności między systemami, urządzeniami i punktami styku z użytkownikiem końcowym.

2. Uzupełnienie monitoringu i weryfikacja infrastruktury
Kolejnym krokiem była szczegółowa analiza istniejącego monitoringu i identyfikacja luk – brakujących danych, nieaktualnych elementów, zbyt ogólnych metryk. W wielu przypadkach konieczne było wdrożenie nowych checków, integracji i rozszerzeń, by rzeczywiście odwzorować działanie usług w całej sieci sprzedaży.

monitoring SLA zabbix 7

PERSPEKTYWA KLIENTA

„Z poziomu infrastruktury wszystko wyglądało poprawnie, ale nie wiedzieliśmy, czy klient faktycznie może zapłacić, wydrukować paragon, zakończyć transakcję. Potrzebowaliśmy spojrzenia z poziomu usługi – nie urządzenia.”

ROZWIĄZANIE

ROZWIĄZANIE

W odpowiedzi na zidentyfikowane wyzwania wdrożyliśmy centralny system monitorowania oparty na Zabbix, uzupełniony o dedykowane dashboardy w Grafanie. Projekt został zrealizowany etapowo, w ścisłej współpracy z klientem, zgodnie z poniższym podejściem:

1. Zdefiniowanie usług podlegających SLA

Wspólnie z klientem zidentyfikowaliśmy listę krytycznych urządzeń i usług wymagających monitorowania dostępności, m.in.: komputery kasowe, terminale płatnicze, drukarki fiskalne, urządzenia sieciowe, ekrany reklamowe, czytniki biletów, cenówki elektroniczne, urządzenia sieciowe i wiele innych. Lista ta została ujęta w cyklicznie aktualizowanym dokumencie monitoringu.

2. Konfiguracja mechanizmów oceny SLA

Dla każdej z usług opracowaliśmy wyzwalacze (triggery) w Zabbixie, które w precyzyjny sposób określają stan dostępności – z uwzględnieniem dni tygodnia, godzin pracy sklepów, wyjątków i progu tolerancji błędów. System uwzględnia m.in. liczbę sklepów z danym problemem, czas trwania incydentu oraz warunki krytyczne (np. brak działania wszystkich kas w danym punkcie).

3. Budowa dashboardów w Grafanie

Dane z Zabbixa zostały zintegrowane z Grafaną i przedstawione w postaci przejrzystych dashboardów: miesięcznych i rocznych zestawień SLA dla całej sieci i infrastruktury, operacyjnych widoków dla zespołów technicznych, dashboardów SLA usług zarządzanych przez zewnętrznych dostawców (np. drukarki fiskalne).

4. Weryfikacja, kalibracja i testy progów SLA

Opracowaliśmy wspólnie z klientem definicje progów SLA. W przypadku trudnych do oszacowania metryk przyjęto statystyczne dane z historii zdarzeń z Zabbixa.

5. Wsparcie operacyjne

W przypadku większości alertów związanych z usługami SLA, klient kieruje zgłoszenia do partnera wdrożeniowego, co pozwala ograniczyć wewnętrzne zaangażowanie zespołu IT i szybciej zidentyfikować źródło problemu.

YouTube player

PERSPEKTYWA APLITT

„Zabbix wspierany Grafaną pozwolił przenieść monitoring z poziomu technicznego (np. pingów i urządzeń) na poziom UX, czyli tego, co faktycznie widzi klient i lokalny operator.

W efekcie Aplitt przygotował narzędzie, które pokazuje realny stan usług, np. czas dostępności kas, backupów czy sieci.”

REZULTAT

REZULTAT

Wdrożenie centralnego monitoringu SLA opartego o Zabbix i dashboardy w Grafanie przyniosło klientowi szereg wymiernych korzyści:

Pełna widoczność dostępności usług

Zespół IT oraz interesariusze biznesowi zyskali dostęp do rzeczywistych danych o stanie infrastruktury i dostępności usług w punktach sprzedaży, w podziale na konkretne urządzenia i lokalizacje.

Wzrost poziomu SLA

Dzięki lepszej kontroli i szybszej reakcji na problemy, udało się, zgodnie z oczekiwaniami zarządu, podnieść poziom SLA.

Zwiększenie efektywności operacyjnej

Ujednolicenie konfiguracji Zabbixa oraz automatyzacja alertów pozwoliły ograniczyć nadmiar powiadomień i poprawić czas reakcji na incydenty. Rozproszona odpowiedzialność została zastąpiona centralnym nadzorem.

Dane do raportowania i negocjacji

Dashboardy SLA są wykorzystywane zarówno do raportowania wewnętrznego, jak i jako podstawa rozmów z partnerami zewnętrznymi, np. dostawcami drukarek. Dane z Grafany są traktowane jako wiarygodne źródło weryfikacji czy SLA było spełnione.

Podstawa do dalszego rozwoju

Zbudowana architektura i zdefiniowane mechanizmy mogą być rozwijane w kolejnych obszarach, np. raportowania jakości danych, integracji z narzędziami BI, analizy trendów awarii czy wsparcia decyzji inwestycyjnych w infrastrukturę.

PERSPEKTYWA KLIENTA

„Wreszcie mogliśmy spojrzeć na dostępność usług z poziomu całej sieci, a nie pojedynczych incydentów. To zmieniło sposób, w jaki IT rozmawia z biznesem.”

CZY TWOJA FIRMA TEŻ POTRZEBUJE MONITOROWAĆ SLA?

CZY TWOJA FIRMA TEŻ POTRZEBUJE MONITOROWAĆ SLA?

Jeśli zarządzasz rozbudowaną siecią punktów sprzedaży lub usług i chcesz mieć pewność, że wszystko działa tak, jak powinno – nie wystarczy wiedzieć, czy urządzenia są online. Potrzebujesz monitoringu, który pokaże Ci, czy działa cała usługa biznesowa – z punktu widzenia klienta, lokalnych operatorów i zarządu.

Zadbaj o ciągłość działania i wiarygodne raporty SLA. Skontaktuj się z nami i sprawdź, jak możemy pomóc Twojej organizacji zobaczyć więcej i szybciej reagować.

      Zaznacz wszystkie wymagane.

    Wyrażam zgodę na przetwarzanie przez Aplitt sp. z o.o. moich danych osobowych wskazanych w formularzu kontaktowym w celu otrzymywania informacji handlowych i marketingowych dotyczących produktów i usług z oferty Aplitt sp. z o.o.. Więcej informacji w Polityce Prywatności.* Wyrażam zgodę na przetwarzanie przez Aplitt sp. z o.o. moich danych osobowych wskazanych w formularzu kontaktowym w celu otrzymywania informacji handlowych i marketingowych dotyczących produktów i usług z oferty Aplitt sp. z o.o.. Więcej informacji w Polityce Prywatności.

    Wyrażam zgodę na kontakt za pomocą wyżej wymienionych kanałów komunikacji w celu przedstawienia mi informacji handlowych lub w celu marketingu bezpośredniego Aplitt sp. z o.o..* Wyrażam zgodę na kontakt za pomocą wyżej wymienionych kanałów komunikacji w celu przedstawienia mi informacji handlowych lub w celu marketingu bezpośredniego Aplitt sp. z o.o..

    Pola oznaczone gwiazdką (*) są wymagane.