Analityk Big Data to bardzo perspektywiczny zawód w następnych latach - profesja porównywalna do odkrywcy, który wyciąga ciekawe wnioski z dużej ilości danych.
Trzy lata temu Harvard Business Review określił profesję analityka big data mianem "najseksowniejszego zawodu XXI wieku". To stwierdzenie w czasach coraz bardziej entuzjastycznego podejścia do zarządzania informacją nie powinno nikogo dziwić. Zawód analityka zyskuje na znaczeniu praktycznie z każdą minutą, kiedy na świecie przybywa coraz więcej danych, które nie tylko warto posiadać, ale również trzeba nimi odpowiednio zarządzać.
Mimo że obszar data science (termin zestawiany często ze specjalistami z obszaru big data) to świat liczb, stoją za nimi ludzie z wysoce wyspecjalizowanymi kompetencjami. Każdego dnia wyszukiwarka Google przetwarza ponad 24 petabajty danych, w ciągu minuty wrzucamy 100 godzin materiału wideo na YouTube, a na Facebooku co godzinę przesyłanych jest blisko 10 milionów fotografii. Produkujemy zatem niebotyczną ilość danych, w których coraz trudniej się odnaleźć, dlatego analityka staje się dla wielu organizacji naturalnym filarem ich działania.
Trudno jednakże o jedną oficjalną i uniwersalną definicję big data. Literatura przedmiotu najczęściej wspomina o czterech V, które opisują najistotniejsze cechy zbioru „wielkich danych”, a są nimi: volume (ogromna ilość), variety (wielka różnorodność), velocity (zawrotna szybkość pojawiania się i konieczności analizowania w czasie rzeczywistym) oraz value (znacząca wartość). Zazwyczaj big data kojarzy się z informacjami, które każdy z nas zostawia w internecie, ale tak naprawdę to również zbiory danych, którymi dysponują banki, ubezpieczyciele, służba zdrowia czy sklepy.
– Data Scientist wykorzystuje wszystkie dane, do których dotrze, zazwyczaj z kilku niezależnych od siebie źródeł. Dane internetowe wymagają pewnych (niestety dość rzadko spotykanych w Polsce) umiejętności technicznych, aby odpowiednio je przetworzyć. Przykładowo niewiele banków w Polsce analizuje akcje logowania klientów z serwisów online, jednocześnie starając się wywnioskować, kim może być użytkownik. Jestem jednak przekonany, że w ciągu roku bądź dwóch lat ten trend się zmieni – wyjaśnia Łukasz Dziekan, Starszy Manager w PwC.
Profil i zakres obowiązków
Firma doradcza McKinsey & Company oszacowała, że w ciągu kilku najbliższych lat obszar data science będzie potrzebował co najmniej. 1,5 mln specjalistów. Dlatego działy zarządzania danymi są najszybciej rozwijającymi się departamentami niemal już we wszystkich dużych firmach. Zespoły data management są pełne świetnych informatyków i fizyków, którzy opracowują algorytmy do obróbki trudnych do zliczenia informacji. Coraz częściej spotyka się ich również w firmach doradczych, które zaczynają świadczyć usługi z obszaru analityki danych klientom z wielu branż. Dlatego warto rozważyć karierę w konsultingu. – W naszym zespole karierę rozpoczyna się od stanowiska Data Cruncher, który powinien zarówno lubić pracę zespołową, jak i posiadać wiedzę na temat efektywnego przetwarzania danych. Następnie można awansować na stanowisko Junior Data Scientist, by po 2 latach zostać Data Scientist. Ścieżka kariery obejmuje również takie stopnie specjalistyczne, jak m.in. Data Software Developer czy Data Software Architect, oraz stanowiska managerskie – dodaje Łukasz Dziekan.
Perspektywy rozwoju
Nowa profesja dotyczy wielu obszarów wiedzy, w tym m.in. ekonomii, matematyki i statystyki. Do tego istotna jest również znajomość takich języków, jak SQL, Python, R, c#/F# czy Scala. Ale ścisła, oparta na zbiorach danych wiedza to nie wszystko, co ma znaczenie w tym zawodzie.
– Data Scientist posiada wysokie umiejętności techniczne w takich obszarach, jak przetwarzanie równoległe, bazy relacyjne i nierelacyjne, umiejętność czyszczenia danych, doskonałą znajomość algorytmów statystycznych i uczenia maszynowego, a także umiejętność szybkiego uczenia się. Analitycy z reguły rozwiązują problem po raz pierwszy i muszą zrozumieć na początku, czego tak naprawdę szukają lub czego pragną klienci jego organizacji – wyjaśnia Łukasz Dziekan. Poza tymi kompetencjami, podobnie jak w przypadku innych zawodów analitycznych, coraz większego znaczenia nabierają umiejętności komunikacyjne przydatne przy prezentacji najważniejszych wniosków swojej pracy. Warto podkreślić, że Data Scientist to nie zwykły analityk po matematyce czy socjologii. Ten zawód posiada profil stricte interdyscyplinarny. Analityk potrafi nie tylko zestawić dane, ale spojrzeć na nie z całkiem innej perspektywy. Dlatego to praca dla ludzi ciekawych świata, a wręcz ciekawskich.
– W amerykańskim modelu Data Scientist sam wyciąga wnioski, a następnie przedstawia je liderom w działach marketingu, HR czy sprzedaży. W Polsce cały czas utrzymuje się przekonanie, że specjaliści big data to panowie od „pisania selectów”. Takie podejście znacząco spłyca możliwe do osiągnięcia rezultaty dzięki rozwiązaniom z tego obszaru. Dlatego najlepszy model opiera się na współpracy zespołu biznesowego razem z analitykami big data, którzy muszą znać zarówno przedmiot, jak i cel swoich analiz – podsumowuje Łukasz Dziekan.

