RynekPolecane tematy

O rozwoju narzędzi i problemach w projektach Big Data

Rozmowa z  Irfan Khan, SVP & General Manager Big Data w SAP, wcześniej CTO w Sybase.

O rozwoju narzędzi i problemach w projektach Big Data

Jakie są dziś największe problemy związane z analizą dużych zbiorów danych?

Przede wszystkim trzeba wiedzieć czego się szuka. Tym bardziej, że jest wiele informacji, które zbieramy, które są w naszych bazach danych, ale nie mamy do nich dostępu lub jest on bardzo utrudniony. Równie ważna jest wizualizacja informacji w czasie rzeczywistym. Czekanie na efekt analizy i wizualizacji danych może spowodować, że w momencie, gdy otrzymamy już wynik tego procesu analizowana sytuacja przestaje być aktualna. Mamy już w ofercie rozwiązanie do real-time visualization – SAP Lumira. Operuje ono na informacjach przechowywanych w bazie danych, a nie w systemach pamięci masowych.

SAP Lumira analizuje informacje bezpośrednio z bazy danych. Czy zgada się Pan z opinią Donalda Feinberga z Gartnera, że powinniśmy mieć bezpośredni, szybki dostęp do wszystkich danych firmowych, niezależnie od tego, jak są stare?

W pewnych sytuacjach, w konkretnych sektorach gospodarki z pewnością tak. Dotyczy to np. instytucji finansowych, które – ze względu na prawo – powinny mieć dostęp do każdego nagrania, czy notatki z rozmowy z klientem, a także do wszystkich jego transakcji. Efektem braku dostępu do tych danych mogą być bowiem wysokie kary finansowe. Dotyczy to np. maklerów. Nadzór giełdowy może bowiem nawet po kilku latach poprosić o informację na temat przeprowadzonej przez nich transakcji. Z pewnością jednak nie można mówić o tym w kontekście każdego „kawałka” informacji, zdjęcia, pliku wideo, czy wiadomości, którą wytworzymy.

A propos, często stosują Państwo jednocześnie platformę SAP HANA i rozwiązanie open source Hadoop…

To bardzo dobre rozwiązanie, gdy mamy do czynienia z dużą ilością danych, a nie ma sensu przechowywać ich w tradycyjnych bazach danych. Dotyczy to np. danych zbieranych z terminali POS. Wówczas wybieramy Hadoop, który jest tańszy i może przechowywać ogromne zbiory informacji. Ważne jest jednak skuteczne zintegrowanie Hadoop z SAP HANA.

Na SAP Database & Technology Partner Summit często wspominają Państwo o rozwiązaniu do przetwarzania danych w czasie rzeczywistym. Pan też o nim wspomniał. Czy klienci SAP już ich używają?

Kiedy myślimy o dostępie do danych w czasie rzeczywistym w kontekście Big Data nie zawsze jest to bardzo duża ilość informacji, czasami może to być bardzo duża liczba jej źródeł. Przykładem może być eBay, który stworzył narzędzie pozwalające znacząco zawęzić wyniki wyszukiwania. System analityczny eBay przechowuje w tym celu dane o tym, w jakie przedmioty na aukcjach kliknęliśmy, jakie kupiliśmy, a nawet o tych, które chcieliśmy kupić, ale nam się nie udało. Można też uwzględniać inne informacje, np. dotyczące wieku, płci, miejsca zamieszkania, a nawet tego, czy mieszka się w bogatej, czy w biednej dzielnicy miasta. Efektem jest ograniczenie wyników wyszukiwania z kilkuset, kilku tysięcy do tych kilku najbardziej interesujących.

W swojej prezentacji wspomniał Pan o zwiększającej się gęstości zapisu danych. Z kolei Donald Feinberg mówił o spadającym gwałtownie TCO rozwiązań bazodanowych dzięki zastosowaniu technologii in-memory. Jak trendy te zmienią infrastrukturę w centrach danych?

To zmiana na wielu poziomach. Przede wszystkim doprowadzi do uproszczenia samej infrastruktury, w tym zasad licencjonowania rozwiązań bazodanowych. Przykładowo dziś mamy do czynienia z wieloma różnymi silnikami do analizy danych – OLAP, OLE, Predictive. Wkrótce wszystkie te role spełniać będzie jedno narzędzie. Z kolei technologia in-memory to brak wielu ruchomych elementów w systemach pamięci masowych. To zaś znacznie ograniczy zużycie energii na zasilanie i chłodzenie systemów bazodanowych.

HP jest głównym partnerem SAP Database & Technology Partner Summit. Czy oferują już Państwo rozwiązania sprzętowo-programowe takie, jak Oracle Exadata Database Machine?

Wspólnie stworzyliśmy rozwiązania nazywane przez nas software appliance. Software, ponieważ samodzielnie nie oferujemy rozwiązań sprzętowych. Te oferują nasi partnerzy. Jest ich już ponad siedmiu. Poza HP są to także Dell, Fujitsu, czy IBM.

 

Więcej o SAP HANA na filmie:

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *