Artykuł z magazynu ITwizCIO
Koncepcja Chaos Monkey w ING Banku Śląskim
W ING Banku Śląskim testowana jest koncepcja, która zmierza do codziennego odtwarzania całego środowiska aplikacyjnego. Testy koncepcji Chaos Monkey bank rozpoczął w grudniu br. Jest to bardzo skomplikowany proces, zważywszy na złożone, heterogeniczne środowisko IT banku i funkcjonujące w nim ok. 200 aplikacji.
Chaos Monkey to narzędzie do testowania odporności aplikacji na awarie infrastruktury IT. To test tego, jak aplikacja zachowa się gdy spróbujemy ją uszkodzić. Przedstawiciele ING Banku Śląskiego wierzą jednak, że koncepcja Chaos Monkey poprawia wiele innych parametrów. Przede wszystkim dyscyplinuje deweloperów, którzy muszą dbać o to, aby wbudować w aplikację pełną automatykę. Muszą ją tak zaprojektować, aby działała nawet wówczas, gdy wydarzy się coś nietypowego. Chaos Monkey poprawia także spójność konfiguracji i stabilności środowiska IT.
Dodatkowo rozważana przez ING Bank Śląski koncepcja zwiększa również poziom bezpieczeństwa. Jeśli bowiem w jakiś sposób w środowisku IT banku zagnieździ się malware, to gdy system działa bez przerwy przez np. 5 lat istnieje ryzyko, że nie zostanie wykryty przez wiele miesięcy. Natomiast gdy każdy serwer odtwarzany jest z „czystej” kopii po każdych 8 godzinach pracy banku, to do takiego okresu czasu ograniczone jest działanie złośliwego kodu. W ING Banku Śląskim odtwarzana jest już każdej nocy cała farma terminali Citrix.
Zalety Chaos Monkey to:
- · budowa architektury aplikacji pozbawionych pojedynczych punktów awarii,
- · uniemożliwianie lokalnego przechowywanie danych, przez co wymuszane jest przechowywanie danych w systemach bazodanowych relacyjnych lub no_sql,
- · budowa centralnego systemu logów systemów operacyjnych i aplikacji, jakże cennego dla późniejszego monitoringu i przetwarzania danych Big Data,
- · automatyczne odświeżanie zasobów serwerów wirtualnych,
- · brak konieczności zarządzania pojedynczymi hostami, zespół IT zarządza obrazami systemów operacyjnych, a nie samymi hostami,
- · automatyczne skalowanie infrastruktury i oszczędności energii, zabijana maszyna wirtualna w sytuacji niskiego obciążenia całego systemu nie wymaga provisioningu nowej na jej miejsce.