Praca
Inżynier Data Science pilnie poszukiwany
Data Science to obecnie bardzo dynamicznie rozwijająca się gałąź branży IT. Inżynierowie danych oraz specjaliści ds. uczenia maszynowego znajdują zatrudnienie w wielu sektorach gospodarki. Kim tak naprawdę są? Czym dokładnie się zajmują? Jakie umiejętności należy posiadać, aby zostać inżynierem ds. data science?
Data science to dziedzina zajmująca się danymi, która pozwala odkryć w nich często głęboko ukryte informacje. W oparciu o takie informacje można tworzyć algorytmy, które pozwalają wdrożyć wiele praktycznych funkcji – np. przekształcić mowę w tekst pisany lub budować systemy rekomendacji zakupowych oparte na analizie tysięcy czy milionów dokonanych wcześniej transakcji.
Co powinien umieć „badacz danych”?
Data scientist (badacz danych) to osoba, której głównym zadaniem jest zrozumienie danych, opracowanie i dostrojenie algorytmu, który pozwoli rozwiązać konkretny problem zgłaszany przez klienta. Musi zatem posiadać dużą wprawę w operowaniu danymi – umieć pobrać je z bazy danych, przetworzyć, odpowiednio oczyścić z błędnych, niepasujących wpisów.
To, co odróżnia zadania „badacza danych” od obowiązków programisty czy analityka biznesowego, to przeprowadzenie wnioskowania na bazie przetworzonych już danych i dobór odpowiedniego algorytmu. Przydaje się tu więc znajomość statystyki matematycznej, rachunku prawdopodobieństwa i algebry liniowej. Ale to nie wszystko – konieczna jest także orientacja w konkretnych metodach i algorytmach stosowanych zwłaszcza w uczeniu maszynowym (machine learning), czyli np. znajomość modeli opartych o sieci neuronowe czy modne ostatnio lasy losowe.
Liczą się też kompetencje miękkie
“Data scientist to nie tylko specjalista od analizy danych z mocnymi kompetencjami programistycznymi i testowania kodu. Na rynku pracy liczą się także kompetencje miękkie, takie jak empatia, zrozumienie potrzeb klientów biznesowych i wysokie umiejętności komunikacyjne, które pomogą wyjaśnić zastosowane rozwiązania osobom bez przygotowania technicznego. Zastosowane modele są często na tyle skomplikowane, że nie jest łatwo przekonać osoby, które podejmują ostateczną decyzję o wdrożeniu danego algorytmu, że będzie to decyzja dobra. Kolejną ważną cechą specjalisty od data science jest cierpliwość. Proces uczenia algorytmów może trwać bardzo długo, nawet na najszybszych komputerach i musi być wielokrotnie powtarzany aż do uzyskania zadowalającego efektu” – tłumaczy dr inż. Piotr Szajowski, Data Scientist w Capgemini Polska.
O rosnącym zapotrzebowaniu na tego typu specjalistów świadczy też rosnąca liczba ogłoszeń o pracę w serwisach rekrutacyjnych, szczególnie tych, skierowanych do osób związanych z branżą IT. “Najbardziej poszukiwani są Data Scientists oraz Analitycy Biznesowi, którzy niekoniecznie muszą znać jakąkolwiek z technologii programowania, a jeżeli już pojawia się ona w wymaganiach, to najczęściej pada na SQL oraz Python. Kluczowym dla tego typu stanowisk jest przede wszystkim umiejętność analitycznego myślenia, znajomość zagadnień statystycznych czy rozumienie, jakich informacji mogą udzielić duże zbiory danych, a więc big data” – mówi Michał Szum, Customer Care Team Leader w firmie JustJoinIt. Według niego, wraz ze wzrostem liczby ogłoszeń zwiększa się również liczba kandydatów aplikujących na poszczególne stanowiska. “Porównując początek roku z obecną sytuacją zanotowaliśmy niemal 5-krotny wzrost aplikacji na każde stanowisko” – mówi Michał Szum.
Jakie projekty wspiera data scientist?
Zagadnieniem, które pojawia się ostatnio dość często w różnych projektach z dziedziny sztucznej inteligencji jest wykrywanie anomalii. Klienci zamawiają i utrzymują duże, skomplikowane systemy IT, które – z natury rzeczy – wymagają szybkiej reakcji na wszelkie zaobserwowane odstępstwa od normalnego działania.
“Każde odstępstwo od normalnego działania systemów może oznaczać przestoje, złą jakość produktów, utratę cennych danych, utratę reputacji i inne, zwykle niemiłe konsekwencje. Automatyczne wykrywanie anomalii w działaniu systemów jest więc gorącym tematem i w naszym zespole nieustannie ktoś nad tego typu zagadnieniami pracuje. Przydają się tu zarówno metody znane z tradycyjnych obszarów statystyki matematycznej, jak i względnie nowe, opracowane w ostatnich latach modele oparte na sieciach neuronowych” – mówi Marcin Stachowiak, Artificial Intelligence Development Lead w Capgemini Polska. Firmy mającej za sobą przygotowanie prototypu urządzenia, które być może w przyszłości znajdzie zastosowanie w handlu detalicznym. Mowa o inteligentnym koszyku, który jest w stanie na podstawie obrazu z kamery określić, jakie produkty się w nim znajdują.