CIOPolecane tematy

Jak sztuczna inteligencja wspiera zarządzanie systemami IT?

Funkcje oparte na algorytmach sztucznej inteligencji mogą stanowić znaczące ułatwienie w codziennej pracy administratorów i innych osób odpowiedzialnych za funkcjonowanie firmowego środowiska IT. Należy mieć jednak na uwadze, że nie wszystkie dostępne na rynku rozwiązania są jednakowo efektywne.

Każdy producent zaawansowanych systemów IT stawia sobie obecnie za punkt honoru posiadanie w ofercie rozwiązań sztucznej inteligencji wspierających zarządzanie środowiskiem informatycznym. I nie chodzi tu o rozwiązania automatyzujące zarządzanie zasobami sprzętowymi będące funkcją danego produktu, takie jak dobrze znane mechanizmy Distributed Resource Scheduler (DRS) w systemach wirtualizacyjnych, czy zaawansowane mechanizmy Quality of Service (QoS) w macierzach dyskowych. Chodzi o rozwiązania, które mają wspierać zarządzanie samym sprzętem, automatyzować procesy zbierania danych telemetrycznych, dokonywać analizy tych danych i dostarczać administratorom infrastruktury nowej wartości – czy to w postaci gotowych odpowiedzi na przyczyny problemów technicznych, czy konkretnych zaleceń rekonfiguracyjnych mających na celu wyeliminowanie potencjalnych problemów.

Ocena dostępnych na rynku rozwiązań nie jest jednak zadaniem prostym. Należy bowiem oddzielić warstwę przekazu marketingowego od rzeczywistych możliwości rozwiązania i jego realnej przydatności dla administratora systemu IT. Należy zadać sobie pytanie, czy dane narzędzie faktycznie oferuje dla mnie, jako osoby zarządzającej infrastrukturą, jakąś konkretną wartość, która przekłada się na korzyści biznesowe. Czy np. jest w stanie rzeczywiście radykalnie uprościć zadania administracyjne, czy jest w stanie dostarczyć istotnie więcej informacji, niż prosta analiza danych pomiarowych. Nie wystarczy bowiem deklaracja, że dane rozwiązanie posiada mechanizmy sztucznej inteligencji i wykorzystuje algorytmy uczenia maszynowego. Istota bowiem tkwi w szczegółach implementacji – w tym, jak szczegółowo opomiarowany jest system, w jaki długim horyzoncie czasowych wykonywane są analizy, na jak licznej populacji danego typu rozwiązania znajdowane są zależności i czy bazuje tylko na danych telemetrycznych jednego urządzenia czy całego ekosystemu informatycznego. Nie trudno jest wszakże zbudować system sztucznej inteligencji, który na podstawie wskazań o rosnącej temperaturze powietrza w urządzeniu zdiagnozuje uszkodzony wentylator czy na podstawie historycznej analizy zajętości dysku przewidzi moment przepełnienia jego pojemności.

Zapraszamy do udziału w webinarium HPE InfoSight

Innowacyjna technologia HPE InfoSight to platformę sztucznej inteligencji dla macierzy dyskowych HPE 3PAR StoreServ i HPE Nimble Storage i jedna z najbardziej unikalnych rozwiązań w branży. Eksperci HPE opowiedzą, w jaki sposób pozwala ona na szybkie diagnozowanie przyczyn oraz prognozowanie wystąpień spadków wydajności i przerw w dostępie do danych. Omówią też plany dotyczące wykorzystania HPE InfoSight na potrzeby całych centrów danych. Rejestracja na stronie: https://connect.hpe.com/hpe-InfoSight-webinar

Sztuką jest natomiast zbudować rozwiązanie, które w sposób radykalny zmienia podejście do zarządzania infrastrukturą IT. Na czym polega ta zmiana? Na tym, że to system zarządzania, poprzez odpowiednią analizę danych telemetrycznych pochodzących z wielu urządzeń systemu IT, poprzez korelację zdarzeń występujących w różnych elementach środowiska informatycznego jest w stanie dostarczyć odpowiedzi nie tylko na pytania, co się stało i co było przyczyną problemów, ale także potrafi poinformować administratora o tym, co się może stać i jak tego uniknąć. W konsekwencji taki system sam może podejmować działania naprawcze oraz formułować zalecenia rekonfiguracyjne mające na celu wyeliminowanie potencjalnych kłopotów. W ten sposób zarządzanie systemem IT staje się znacznie prostsze, diagnozowanie problemów znacznie szybsze, a dostępność systemu znacznie wyższa.

Co jest zatem potrzebne, aby taki system stworzyć?

Po pierwsze, wszechstronna i obszerna baza danych telemetrycznych. Im więcej danych pomiarowych, tym dokładniejsze analizy i bardziej trafne diagnozy. Ważna jest tutaj możliwie duża szczegółowość danych – ilość i częstotliwość mierzonych parametrów, liczba systemów udostępniających swoje dane pomiarowe oraz możliwie długi horyzont czasowy danych historycznych. Im bardziej szczegółowe dane, tym łatwiejsze wykrywanie nawet drobnych anomalii i tym bardziej precyzyjne diagnozy. Im więcej systemów uwzględnianych w analizie, tym łatwiejsze uczenie się na błędach, a w konsekwencji precyzyjniejsze proaktywne korygowanie konfiguracji w całej populacji zainstalowanych urządzeń. Im więcej urządzeń w ramach pojedynczego systemu IT poddawanych jednoczesnej analizie korelacyjnej, tym dokładniejsze wskazania rzeczywistych źródeł problemów. Im dłuższa historia analizy, tym łatwiejsze wychwytywanie trendów i zależności między zdarzeniami.

Drugim niezbędnym elementem dobrego systemu zarządzania opartego na sztucznej inteligencji są dojrzałe i sprawdzone algorytmy analizy korelacyjnej i predykcyjnej. Nie ma nic ważniejszego niż właściwy algorytm, który na podstawie posiadanych danych potrafi samodzielnie uczyć się i przewidywać zdarzenia, które jeszcze nie wystąpiły. Tylko wówczas można mówić o systemie, który nie tylko reaktywnie diagnozuje usterki (co potrafi wiele produktów dostępnych na rynku), ale proaktywnie przewiduje awarie i im zapobiega, ograniczając tym samym do minimum ryzyko przestoju.

Trzecim, mniej efektownym, ale nie mniej ważnym elementem jest wydajna platforma obliczeniowa. Ogromna ilość danych pomiarowych poddawanych analizie oraz skomplikowane algorytmy obliczeniowe wymagają niezwykle wydajnych rozwiązań sprzętowych, aby być w stanie dostarczać niezbędne dla administratora dane w określonym czasie. Nie miałby jakiekolwiek racji bytu system analizy predykcyjnej, jeżeli wyniki tej analizy byłby dostępne długo po tym, gdy problem zaistniał. Jeśli rozwiązanie ma reagować proaktywnie na potencjalne zagrożenia, musi dostarczać wyniki analiz w czasie rzeczywistym.
Dobrym przykładem takiego dojrzałego i wszechstronnego systemu zarządzania opartego na mechanizmach sztucznej inteligencji jest platforma InfoSight firmy Hewlett Packard Enterprise (HPE).

Platforma HPE InfoSight

Innowacyjna platforma HPE InfoSight została stworzona kilka lat temu przez firmę Nimble Storage (w roku 2017 przejętą przez HPE) i jest rynkowym prekursorem rozwiązań sztucznej inteligencji służących do optymalizacji i automatyzacji pracy systemów IT. Platforma obejmuje swoim zasięgiem nie tylko macierze dyskowe (HPE 3PAR StoreServ, HPE Nimble Storage), ale również środowiska wirtualizacji serwerów VMware.

Podstawą działania platformy HPE InfoSight jest zbieranie masowej ilości danych telemetrycznych z dużej ilości punktów pomiarowych rozmieszczonych w różnych miejscach środowisk IT klientów, którzy wyrażą na to zgodę. Następnie zmierzone wartości są bezpiecznie przesyłane do środowiska chmurowego firmy HPE. Kolejnym krokiem jest globalna korelacja danych telemetrycznych przy pomocy mechanizmów uczenia maszynowego. Efektem końcowym jest przygotowanie konkretnych, dedykowanych zaleceń dla poszczególnych klientów.

Platforma HPE InfoSight jest dostępna w postaci bezpiecznego portalu dostępnego w chmurze (bez konieczności instalowania żadnych urządzeń i oprogramowania w siedzibie klienta).

Na rysunku 1 przedstawiono przykładowy wykres opóźnienia czasu odpowiedzi mierzonego pomiędzy maszyną wirtualną w środowisku wirtualizacyjnym VMware a dyskiem logicznym na macierzy dyskowej.


Rysunek 1: Wykres opóźnienia czasu odpowiedzi dla maszyny wirtualnej

Z wykresu w bardzo prosty sposób można odczytać składowe opóźnienia, tj. jakie opóźnienie jest wnoszone poprzez kolejne elementy środowiska: serwery, sieć oraz samą macierz dyskową. Tym samym możliwa jest bardzo szybka diagnoza, gdzie leży problem w długim dostępie do danych. Warto w tym miejscu nadmienić, że platforma HPE InfoSight nie wymaga instalowania żadnych urządzeń i oprogramowania w siedzibie klienta.

Platforma HPE InfoSight potrafi również optymalizować środowiska IT, doradzając użytkownikom stosowne zalecenia rekonfiguracyjne. Przykłady zostały przedstawione na rysunku 2. Platforma jest w stanie wykryć między innymi nieprawidłowe ustawienia połączeń hostów do portów macierzy i konfiguracji multipathingu, a następnie zalecić zmianę ustawień dla konkretnego portu. Na podstawie danych obciążenia poszczególnych wolumenów dyskowych InfoSight potrafi zarekomendować wprowadzenie lub zmianę konkretnych ustawień QoS w celu zapewnienia odpowiedniej wydajności dla krytycznych aplikacji. Analizując obciążenia poszczególnych hostów platforma może doradzić migrację konkretnych maszyn wirtualnych pomiędzy hostami w celu optymalnego rozłożenia obciążeń między zwirtualizowanymi serwerami.


Rysunek 2: Przykłady prewencyjnych rekomendacji rekonfiguracji

W środowiskach pamięci masowych istotnym parametrem jest wymagany czas odpowiedzi środowiska. Platforma HPE InfoSight automatycznie dobiera rekomendacje w zależności od dynamicznej zmiany wspomnianego parametru. Konkretny przykład został przedstawiony na rysunku 3. Na rysunku przedstawiono wyniki analizy obciążenia, które wskazują przekroczone normy czasu odpowiedzi dla zapisów sekwencyjnych. Dalej platforma podaje konkretne rekomendacje zmiany konfiguracji macierzy w celu wyeliminowana zaobserwowanych problemów.


Rysunek 3: Przykład rekomendacji rekonfiguracji macierzy

Poza przedstawionymi powyżej zaawansowanymi przykładami, platforma HPE InfoSight posiada tak oczywiste cechy jak: przedstawianie historycznych danych wydajnościowych, wyznaczanie elementów najbardziej obciążających środowisko, rekomendacje rozbudów sprzętowych itd.

Przyszłość

Obecnie platforma HPE InfoSight obejmuje swoim zasięgiem macierze dyskowe HPE 3PAR StoreServ, HPE Nimble Storage oraz środowiska wirtualizacji serwerów VMware. Firma Hewlett Packard Enterprise pracuje nad rozszerzeniem platformy InfoSight również na pozostałe elementy infrastruktury (serwery, sieci itd.), tworząc globalne środowisko sztucznej inteligencji dla całego centrum danych.

Marek Kozicki, Enterprise Solution Architect, Hewlett Packard Enterprise
Wojciech Kozikowski, Storage Solution Architect, Hewlett Packard Enterprise

Tagi

Podobne

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *