PracaAnalitykaProgramowaniePolecane tematy
Turniej analityczny i bezpłatne środowisko pracy sposobem SAS na spopularyzowanie data science
Zadaniem uczestników tegorocznej edycji turnieju SAS Data Science Hackathon było stworzenie kompleksowego projektu analitycznego na potrzeby przykładowej firmy produkcyjnej. Inicjatywa miała na celu promowanie zaawansowanej analityki wśród studentów jako technologii, z którą warto wiązać przyszłość zawodową. SAS oferuje również rozwiązania pomocne w tworzeniu programów nauczania oraz zrozumieniu przebiegu cyklu analitycznego.
Pod koniec listopada w SAS Innovation Hub w Warszawie odbył się turniej analityczny SAS Data Science Hackathon. Scenariusz rywalizacji zakładał, że uczestnicy wcielą się w rolę specjalistów data science w dużej firmie produkcyjnej. W rywalizacji wzięło udział 7 zespołów.
Jako podstawę do pracy uczestnicy turnieju SAS Data Science Hackathon otrzymali dane dotyczące historycznej wartości zamówień oraz informacje o kwotach przeznaczonych na działania marketingowe. Zadaniem uczestników było stworzenie projektu analitycznego z wykorzystaniem technik uczenia maszynowego, począwszy od przygotowania danych, aż po opracowanie modelu analitycznego i zaprezentowanie wniosków dotyczących m.in. wpływu wydatków na cele promocyjne i wolumen zamówień, a także zaproponowanie modelu predykcyjnego dla zagregowanej, miesięcznej wartości zamówień przy założeniu trzymiesięcznego horyzontu prognozy. Dane do zadania konkursowego zostały przygotowane przez ekspertów firmy Nestlé Poland, która była partnerem tegorocznego SAS Data Science Hackathon.
„Prace konkursowe były ocenianie według czterech kryteriów: poprawności metodologicznej, oceny jakości zaproponowanego modelu, kreatywności oraz atrakcyjności prezentowanych wniosków i wyników. Uczestnicy musieli wykazać się w każdym z tych aspektów, gdyż miały one równy wpływ na ocenę końcową” – mówi Anna Muszyńska, Country Leader w SAS Polska i przewodnicząca Jury SAS Data Science Hackathon. Uczestnicy wykonywali zadanie konkursowe w środowisku SAS Viya, które umożliwia funkcjonalne pokrycie pełnego cyklu analitycznego zarówno poprzez użycie interfejsów typu drag & drop, jak i dowolnego języka programowania, takiego jak: SAS 4GL, Python, R, Java, LUA lub wykorzystanie REST API.
Decyzją jury, I miejsce w SAS Data Science Hackathon zajęła drużyna w składzie: Aleksandra Łuczak i Paulina Tomaszewska z Politechniki Warszawskiej oraz Maciej Tomaszewski z Uniwersytetu Warszawskiego. Członkowie drużyn, które zajęły miejsca od 1 do 3, otrzymali nagrody finansowe. Dodatkowo, członkowie zwycięskiego zespołu otrzymali vouchery uprawniające do bezpłatnego udziału w dowolnie wybranym szkoleniu organizowanym przez SAS Polska. Dla zdobywców 2-go i 3-go miejsca przygotowano vouchery na bezpłatne podejście do wybranego egzaminu SAS wraz z kursem e-learningowym. Nagrodą specjalną w SAS Data Science Hackathon był płatny staż w zespole analitycznym firmy Nestlé Poland.
Inicjatywa miała na celu promowanie zaawansowanej analityki wśród studentów jako technologii, z którą warto wiązać przyszłość zawodową. Zdaniem przedstawicieli SAS Institute tego typu działania stają się istotne, ponieważ – jak wynika z danych McKinsey Global Institute, do 2020 roku globalny deficyt specjalistów data science sięgnie 4 mln stanowisk. Dużego znaczenia nabiera więc sprawna edukacja i działania promujące obszar data science wśród studentów.
Poza organizowaniem turniejów analitycznych, SAS Institute angażuje się w tworzenie programów nauczania w zakresie zaawansowanej analityki. Dodatkowo, firma udostępnia nieodpłatnie – oparte na komercyjnej platformie SAS Viya – dostosowane do celów edukacyjnych środowisko SAS Viya for Learners. Rozwiązanie to pozwala zrozumieć, jak przebiega cały cykl analityczny i stanowi przydatne narzędzie zarówno dla początkujących analityków, jak i osób, które rozpoczęły przewód doktorski z zakresu data science. Użytkownicy mogą programować, wykorzystując nie tylko język SAS, ale również Python czy R. Co więcej, osoby korzystające z rozwiązania SAS Viya for Learners – zarówno studenci, jak i wykładowcy – mogą dołączyć do globalnej społeczności SAS i otrzymać dostęp do szeregu narzędzi edukacyjnych, kursów internetowych, dokumentacji, a także – wsparcia technicznego.
KOMENTARZ EKSPERTA
O specyfice data science, potrzebie promowania tego kierunku kształcenia inżynierów, a także proponowanych przez SAS rozwiązaniach mówi Mariusz Dzieciątko, Business Solution Manager w firmie SAS Polska.
Dlaczego, Państwa zdaniem, potrzebne jest zwiększenie zainteresowania technologią/koncepcją data science wśród dzisiejszych studentów? W jaki sposób data science wpisuje się w potrzeby biznesu w czasach cyfrowej transformacji?
Jesteśmy obecnie w okresie cyfrowej rewolucji biznesowej. Coraz więcej firm zaczyna na co dzień korzystać z rozwiązań analitycznych, a to powoduje potrzebę zwiększenia liczby dostępnych na rynku pracy osób posiadających odpowiednie kompetencje. Luka w tym zakresie stale się powiększa, stąd podejmowane są działania dwukierunkowe: kształcenie większej liczby osób z odpowiednimi kompetencjami oraz demokratyzacja analityki poprzez dostarczanie narzędzi pracy analityka niewymagających m.in. kompetencji programistycznych.
Jak kształtuje się zainteresowanie obszarem data science wśród studentów polskich uczelni, w porównaniu z innymi krajami naszego regionu lub całej Europy?
Popularność obszaru data science w Polsce nie odbiega od zainteresowania tematem w innych krajach europejskich. Pewnym problemem jest natomiast ukierunkowanie szkolnictwa na przekazywanie wiedzy encyklopedycznej, kosztem rozwoju logicznego i krytycznego myślenia oraz wnioskowania na bazie wiedzy. Jest to zresztą problem dotyczący nie tylko polskich szkół. Wydaje się, że system edukacji nie zauważył jeszcze rewolucji cyfrowej oraz jej wpływu na potrzeby rynku pracy i kompetencji potrzebnych przy konkurowaniu z wszechobecną automatyzacją i robotyzacją wielu dziedzin gospodarki.
Co sprawia, że turnieje w rodzaju SAS Data Science Hackathon są interesujące dla uczestników? Do jakich osób kierowane są tego typu inicjatywy?
Turnieje takie jak SAS Data Science Hackathon dają możliwość sprawdzenia wiedzy uczestników w działaniu, ale też pozyskania nowej wiedzy i doświadczeń. Przykładowo, przed tegorocznym turniejem odbyło się szkolenie z narzędzi udostępnionych do realizacji zadań konkursowych. Udział w takich inicjatywach daje też możliwość poznania nowych osób zainteresowanych podobną problematyką oraz kontaktu ze środowiskiem biznesu. Konkurs skierowany był głównie do studentów różnych kierunków, którzy chcieli rozwijać swoje kompetencje.
Jakie są dziś możliwości poznania świata data science dla osób spoza świata biznesu i zaawansowanej analityki? Czy jedyną możliwością jest tu wybór odpowiedniego kierunku studiów i właściwej uczelni?
Aby wkroczyć do świata data science nie jest konieczne wybranie odpowiedniego kierunku studiów, choć niewątpliwie to znacznie upraszcza wejście w temat. Obecnie istnieje ogromna ilość materiałów dostępnych online. Są też kompletne kursy i szkolenia, które pozwalają zgłębić temat. W efekcie, liczy się przede wszystkim chęć zdobywania nowej wiedzy. Środki są tu kwestią drugorzędną.
W jaki sposób SAS angażuje się w działania mające na celu kształcenie inżynierów data science w Polsce?
Staramy się motywować nauczycieli akademickich do nieustannej modyfikacji programów nauczania, tak aby studenci mieli możliwość pracy z najnowszymi technologiami. Dzielimy się też wiedzą na temat innowacyjnych rozwiązań wdrażanych u klientów SAS na całym świecie. Organizujemy dedykowane dla środowiska akademickiego szkolenia, spotkania i konferencje pozwalające na wymianę doświadczeń między uczelniami, a także bezpośrednio pomiędzy studentami.
Jakie możliwości ma platforma SAS Viya for Learners w porównaniu z komercyjną wersją SAS Viya?
Platforma SAS Viya for Learners to kompletne środowisko pokrywające pełny cykl analityczny. Dokładnie takie samo, jak to, dostępne dla komercyjnych zastosowań oraz udostępniane na dobrej wydajności sprzęcie w chmurze SAS. Środowisko SAS Viya for Learners jest jednak adresowane głównie do studentów i nauczycieli akademickich. Ważną cechą naszego rozwiązania jest dostęp do platformy z dowolnego miejsca na świecie, o dowolnej porze bez konieczności instalacji jakichkolwiek komponentów na komputerze użytkownika. Wszystkie aplikacje użytkowe działają w środowisku przeglądarki internetowej. Użytkownicy mają możliwość pracy w środowiskach wizualnych bez programowania lub podnosić swoje kwalifikacje w programowaniu w języku SAS 4GL czy też korzystać z funkcjonalności SAS z poziomu Pythona czy języka R. Udostępnione narzędzia pozwalają na przetwarzanie, czyszczenie, eksplorację danych, budowę modeli prognostycznych, pracę z szeregami czasowymi czy też analizę danych nieustrukturyzowanych (np. tekstowych), optymalizację, budowę modeli deep learningowych włącznie z analizą obrazów 2D i 3D, a także plików dźwiękowych. Dodatkowo jest możliwość zapoznania się z procesem operacjonalizacji modeli i zarządzaniem cyklem ich życia oraz osadzania modeli w zestawach decyzji biznesowych. Środowisko zawiera też wiele kompletnych kursów e-learningowych do samodzielnej nauki oraz możliwość korzystania z pomocy ekspertów SAS.