InfrastrukturaCIO

Szukasz igły w stosie danych? To narzędzie Ci pomoże.

Executive ViewPoint

Z Piotrem Skorackim, Network Solutions Architect w NTT oraz Dominikiem Łoniewskim, Systems Architect w Cisco, rozmawiamy o koncepcji Full-Stack Observability: czym jest, dlaczego stała się obecnie priorytetem dla wielu organizacji, czym różni się od tradycyjnego monitoringu, w jaki sposób wpływa na powiązanie wydajności technologii z wynikami biznesowymi oraz jak wspiera firmy w kontekście chmury obliczeniowej. Dyskutujemy także o konkretnym rozwiązaniu – Cisco Full-Stack Observability: z jakich elementów się składa i za co one odpowiadają, jak radzi sobie z zarządzaniem mikroserwisami i monitorowaniem Kubernetes, w jaki sposób możliwości tej platformy uzupełniają usługi i rozwiązania NTT, jak przebiega proces jej wdrożenia i wreszcie, jakie niesie korzyści dla firm.

Szukasz igły w stosie danych? To narzędzie Ci pomoże.

Czym jest koncepcja Full-Stack Observability?

Piotr Skoracki (P.S.): Full-Stack Observability (FSO) zakłada wgląd w stan funkcjonowania świadczonej przez nas usługi cyfrowej oraz szybką identyfikację ewentualnych z nią problemów. Na tę usługę lub aplikację składa się mnóstwo komponentów – software’owych, infrastrukturalnych czy w końcu sieciowych, i należy podkreślić, że „po drodze” może się zepsuć dowolny ich zestaw. Co więcej – liczba wzajemnych powiązań pomiędzy tymi komponentami rośnie.

Widoczność całego stosu i korelacja danych jest więc niezbędna, aby szybko znaleźć przysłowiową „igłę” w tym „stogu siana”. Można też powiedzieć, że FSO ma w ogóle zapobiec powstaniu problemu poszukiwania wspomnianej „igły”. Czas to pieniądz i dla usługodawców cyfrowych wczesne wykrycie problemu z danym komponentem usługi to czas zaoszczędzony na usunięciu awarii. Ponadto oznacza to również minimalizację utraty przychodu ze swojej usługi oraz reputacji lub wizerunku. W przypadku wewnętrznych usług przedsiębiorstwa jest to równie istotna kwestia – ataki ransomware, np. taki jak na firmę Maersk, pokazały, jak łatwo brak dostępności usług potrafi cofnąć giganta do epoki analogowej i ponownego wykorzystywania papieru.

Szukasz igły w stosie danych? To narzędzie Ci pomoże.

Zamiast znalezienia problemu i samodzielnego jego usunięcia, sprawczość menedżerów IT ogranicza się często do eskalacji problemu do dostawcy wyżej wymienionej usługi. Jestem gotów się założyć, że większość czytelników chociaż raz w życiu doświadczyła odpowiedzi „u nas działa” i w konsekwencji przerzucania się gorącym kartoflem, bo „problem na pewno leży po stronie sieci, serwera itd.”. A co, gdyby móc szybko samemu zidentyfikować problem i w dodatku mieć na to niezbite dowody? Na tym właśnie polega FSO.

Piotr Skoracki, Network Solutions Architect w NTT

Dlaczego koncepcja ta stała się obecnie priorytetem dla wielu organizacji zainteresowanych poprawą efektywności zarządzania infrastrukturą i zasobami IT? Jakie zjawiska miały i mają na to wpływ – złożoność i rozproszenie technologii, rozwój chmury obliczeniowej, szum danych?

P.S.:  Myślę, że głównym motywatorem jest zmiana strategii IT na model „as-a-Service”. Mam na myśli usługi, takie jak SaaS (np. Office 365), IaaS/PaaS (public cloud i mniejsze platformy) oraz konsumpcję usług przez internet, zamiast przez sieci prywatne. Pomijając pozytywne aspekty tego podejścia, proszę zwrócić uwagę, że w praktyce oznacza to zmianę sposobu działania działów IT. Zamiast znalezienia problemu i samodzielnego jego usunięcia, sprawczość menedżerów IT ogranicza się często do eskalacji problemu do dostawcy wyżej wymienionej usługi. Jestem przekonany, że większość czytelników chociaż raz w życiu doświadczyła odpowiedzi „u nas działa” i w konsekwencji przerzucania się gorącym kartoflem, bo „problem na pewno leży po stronie sieci, serwera itd.”. A co, gdyby móc szybko samemu zidentyfikować problem i w dodatku mieć na to niezbite dowody? Na tym właśnie polega FSO.

Do tego dochodzi jeszcze kwestia pracy zdalnej. Jak bowiem nasz helpdesk ma wspierać pracowników, którzy z własnego laptopa łączą się przez prywatne Wi-Fi i domowe łącze internetowe, bezpośrednio do usługi SaaS w chmurze? Żaden z tych elementów nie jest przecież pod kontrolą naszego działu IT. Ale proszę np. spróbować powiedzieć prezesowi, że musi sobie poradzić sam (śmiech). Te czasy już bezpowrotnie minęły. Na szczęście FSO rzuca koło ratunkowe zespołom wsparcia.

Czym koncepcja FSO różni się od tradycyjnego monitoringu? Jakie znaczenie ma tu kwestia zasięgu obserwowalności, który powinien obejmować cały stos technologii?

P.S.: Widoczność całego stosu nie jest standardem typowych rozwiązań, które specjalizują się tylko w monitoringu sieci, aplikacji itp. FSO nie tylko widzi, ale wyławia zdarzenia z szumu ogromnego wolumenu danych i koreluje je ze sobą między domenami stosu oraz – co być może jest nawet najważniejsze – mierzy ich wpływ na wydajność aplikacji oraz metryk biznesowych.

Ale w zagadnieniu tym chodzi również o przyjętą perspektywę na usługę. Komponenty FSO nie są bowiem osadzone za klawiaturą laptopa, tylko wewnątrz kodu, na infrastrukturze i – co szczególnie istotne – tam, gdzie użytkownik końcowy. Przy użyciu tradycyjnych narzędzi IT, często nie widzimy problemu, bo  patrzymy na niego z miejsca, z którego nie jest on widoczny.

Czy wdrożenie FSO pozwala na poprawę bezpieczeństwa danych?

P.S.: Tak, ponieważ na bezpieczeństwo składają się trzy aspekty: poufność, integralność i dostępność danych (w skrócie CIA – confidentiality, integrity, availability). FSO istotnie wpływa zaś na ten ostatni aspekt.

Szukasz igły w stosie danych? To narzędzie Ci pomoże.

Mogłoby się wydawać, że dla FSO środowisko chmurowe jest skrajnie trudne do obsługi. Nic bardziej mylnego. Filary, w oparciu o które działa FSO – AppDynamics, ThousandEyes, Intersight Workload Optimizer – są całkowicie niezależne od wybranych dla aplikacji zasobów obliczeniowych. Oczywiście, w niektórych przypadkach dostosowanie, parametryzacja ustawień poszczególnych komponentów FSO może wymagać uwzględniania specyfiki środowiska chmury. W innych zaś FSO „konsumuje” interfejsy programistyczne (API) dostawcy i nie ma kompletnie żadnego znaczenia, kim ów dostawca jest.

Dominik Łoniewski, Systems Architect w Cisco

W jaki sposób koncepcja FSO wpływa na powiązanie wydajności technologii z wynikami biznesowymi?

P.S.: Wpływa ona wprost proporcjonalnie do powiązania naszego biznesu z dostępnością usługi cyfrowej. Jeśli prowadziłbym jednoosobową działalność gospodarczą i korzystał głównie z Excela i drukarki – pewnie nie byłbym zainteresowany FSO. Co innego platformy e-commerce. Ale tego typu biznesy już dawno przeliczyły niedostępność usługi na straty. Żyjemy w końcu w czasach, w których większość ruchu w globalnym internecie to ataki DDoS z sieci botnetowych.

W NTT obserwujemy natomiast, że zmianę sposobu myślenia przechodzą obecnie te firmy, które same konsumują usługi cyfrowe od dostawców zewnętrznych na własne potrzeby lub do świadczenia swoich usług, dalej do klientów. Było to wyraźnie widać zwłaszcza w czasach  lockdownu, kiedy dostępność platformy wideokonferencyjnej z chmury oznaczała „być albo nie być” dla codziennej pracy.

W jaki sposób FSO wspiera firmy w kontekście chmury obliczeniowej?

Dominik Łoniewski (D.Ł.): Na chmury obliczeniowe należy spojrzeć jak na środowiska, w których możemy uruchomić naszą aplikację lub ich całe zbiory, tworzące kompletne biznesowe rozwiązanie. Ponadto, sposób ich działania może być wspierany – i najczęściej jest – gotowymi komponentami aplikacyjnymi, które dostawca natywnie oferuje w swoim rozwiązaniu. Jest to właśnie jeden z powodów, dla których w chmurach tak popularne jest dziś uruchamianie bardzo złożonych systemów. Relacje zachodzące między nimi są równie skomplikowane, ale nie jest to specjalnie widoczne. Przynajmniej na początku.

W tym kontekście mogłoby się wydawać, że dla FSO takie środowisko jest skrajnie trudne do obsługi. Nic bardziej mylnego. Filary, w oparciu o które działa FSO – AppDynamics, ThousandEyes, Intersight Workload Optimizer – są całkowicie niezależne od wybranych dla aplikacji zasobów obliczeniowych. Oczywiście, w niektórych przypadkach dostosowanie, parametryzacja ustawień poszczególnych komponentów FSO może wymagać uwzględniania specyfiki środowiska chmury. W innych zaś FSO „konsumuje” interfejsy programistyczne (API) dostawcy i nie ma żadnego znaczenia, kim ów dostawca jest.

To podejście Cisco Systems jest też doceniane przez dużych dostawców, z którymi aktywnie współpracujemy, jak np. z AWS. Już dzisiaj dwa komponenty FSO – AppDynamics i ThousandEyes, oferowane są w AWS Marketplace jako rozwiązania do obserwacji aplikacji, z wielu kont AWS, wielu regionów oraz „availability zones”, włączając aktywności użytkowników. Również dla obszarów aplikacji dostarczanych z prywatnych DC.

Za co dokładnie odpowiadają wspomniane filary Cisco FSO: AppDynamics, ThousandEyes i  Intersight Workload Optimizer?

P.S.: AppDynamics nadaje znaczenie biznesowe w domenie samej aplikacji. Obserwuje interakcje użytkowników z aplikacją, wydajność oraz zależności między usługami, a następnie przedstawia wnioski o wartości istotnej nie tylko dla IT, ale przede wszystkim dla biznesu.

ThousandEyes z kolei koreluje wydajność i dostępność aplikacji z sieciami – WAN, LAN i DC. Daje więc widoczność z perspektywy tytułowych „tysiąca oczu”. To po pierwsze, widok na nasze usługi z zewnątrz (tam, gdzie są użytkownicy końcowi). A po drugie, na usługi zewnętrzne, np. Office 365/Teams z wewnątrz naszej organizacji, a więc z perspektywy pracowników, również tych pracujących z domu.

Natomiast Intersight Workload Optimizer pomaga proaktywnie monitorować wydajność aplikacji przy optymalizacji kosztów wynikających z eksploatacji infrastruktury data center – serwerów, macierzy, witalizatorów. Jest to szczególnie ważne w przypadku hyperscalerów, ale ma też istotne znaczenie dla optymalizacji inwestycji w zasoby własne.

W jaki sposób możliwości platformy Cisco FSO uzupełniają usługi i rozwiązania NTT?

P.S.: W Polsce pozycjonujemy się przede wszystkim jako integrator IT – integrujemy infrastrukturę i aplikacje biznesowe z istniejącym ekosystemem naszych klientów, a także zapewniamy im wsparcie. Nasi inżynierowie i architekci rozumieją specyfikę tych ekosystemów oraz uwarunkowania organizacyjne. FSO daje narzędzia do szybkiego reagowania w przypadku awarii, ale też sugestie optymalizacyjne. Dzięki temu nasza praca z klientem staje się ciągłym procesem, a nie wyłącznie cyklem od wdrożenia do wdrożenia.

Jak platforma Cisco FSO radzi sobie z zarządzaniem mikroserwisami i monitorowaniem Kubernetes?

D.Ł.: W Cisco rozumiemy i obserwujemy zmiany zachodzące w sposobach implementacji usług, których dynamika znacznie przyspieszyła ostatnimi laty. Wychodząc obecnie tym wyzwaniom naprzeciw, dajemy pełną możliwość obserwowania, jak pracują klastry K8s i usługi działające na ich bazie. Niezależnie czy klastry te uruchamiane są w środowisku chmury publicznej, hybrydowej czy też prywatnej. Budowanie swoistej mapy „obserwacji” jest w pełni dostosowane do filozofii, jaka przyświeca budowie klastrów Kubernetes – automatycznej instrumentacji, aktualizacjom, dodawaniu lub usuwaniu podów K8s, przenoszeniu obciążeń podów w celu równoważenia obciążeń lub uzyskiwaniu lepszych metryk biznesowych.

Widzimy też, jak ewoluują architektury aplikacji budowanych w oparciu o mikroserwisy. Bardzo szybko wzrastają wielkości klastrów, jak również stopień skomplikowania wzajemnych zależności konfiguracyjnych w tych środowiskach. Adresujemy te potrzeby przez ciągły rozwój platformy AppDynamics – nie tylko od strony możliwości obserwacji tych relacji, lecz także w części ich jasnej i klarownej wizualizacji, czyli właśnie fragmentu Observability w koncepcji FSO.

Jakie zatem najważniejsze korzyści przynosi organizacji zastosowanie strategii Cisco FSO?

P.S.: Rozmawiając z klientami NTT, proszę ich, żeby opowiedzieli mi, jak wyglądała ich ostatnia awaria. Ile czasu zajęła im jej identyfikacja, a ile jej usunięcie? Kto musiał być w to zaangażowany – wewnątrz i na zewnątrz firmy. Wreszcie, ile wyniosły straty? Warto  przeprowadzić takie ćwiczenie i ocenić, na ile jesteśmy zadowoleni z wyniku tych rozważań. Poza tym spisać listę usług cyfrowych od dostawców zewnętrznych oraz policzyć, ilu pracowników pracuje zdalnie. Wcale nie trzeba bowiem być platformą e-commerce, czy świadczyć inne usługi webowe, żeby być silnie zależnym biznesowo od dostępności usług.

Natomiast w przypadku organizacji, które same świadczą jakieś usługi, dyskusja dotyczy nie tylko dostępności, lecz także wydajności aplikacji oraz optymalizacji wykorzystania infrastruktury. Jeśli wiedza na temat tego, ilu użytkowników końcowych opuszcza Państwa aplikację np. na etapie wyświetlenia ceny usługi lub po przekroczeniu czasu ładowania jest przydatna dla biznesu, to najkrócej rzecz ujmując, FSO pozwala po prostu zarabiać firmie więcej pieniędzy.

Jak przebiega typowy proces wdrożenia rozwiązania Cisco FSO? Z jakimi wyzwaniami dla organizacji wiąże się implementacja tego narzędzia? Jaka jest tu rola partnerów, takich jak NTT?

P.S.: To zależy od komponentów FSO, jakie są wdrażane. Przykładowo – integracja ThousandEyes nie wymaga dużych nakładów pracy inżynierów sieciowych. Z drugiej strony, implementacja AppDynamics będzie wymagała ścisłej współpracy programistów, DevOpsów i właściciela biznesowego aplikacji.

Natomiast rolą NTT przy projekcie na etapie implementacji jest – oprócz roli typowo technicznej – wsparcie przy zdefiniowaniu przypadków zastosowania, kryteriów sukcesu i realnych korzyści dla biznesu. W skrócie – doradzamy, konfigurujemy i wspieramy adaptację, aby faktycznie zapewnić zwrot z takiej inwestycji.

Jakie organizacje powinny być w szczególny sposób zainteresowane wdrożeniem koncepcji FSO w oparciu o usługi i rozwiązania Cisco oraz NTT?

P.S.: Na pewno wszystkie firmy, które opierają trzon swojej działalności na świadczeniu usługi cyfrowej, w szczególności przez internet.  Jeśli takiej firmie brak dostępności lub degradacja wydajności sprawia, że telefony się rozdzwaniają, a przychód spada, to łatwo policzyć zwrot z takiej inwestycji.

Nieco trudniejsze jest natomiast ocenienie, na ile zaburzenie wewnętrznych procesów IT w organizacji przekłada się na wyniki. W dobie pracy hybrydowej i „Everything-as-a-Service”, de facto każdej firmie powinno zależeć na zapewnieniu odpowiedniej jakości narzędzi IT. Kiedyś nie do pomyślenia było udostępnienie pracownikom laptopów, dziś to już niekwestionowany standard. Wsparcie dla pracy zdalnej i narzędzi chmurowych jest po prostu następnym przystankiem na tej samej drodze.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.