Big Data Scientist jak gwiazda rocka

Wyznanie „jestem badaczem danych” w niedalekiej przyszłości będzie wywoływało podobne emocje co „jestem gwiazdą rocka”. Mimo że dla niektórych termin Big Data Scientist może brzmieć jak czarna magia, to Hal Varian, główny ekonomista Google, już dziś wymienia badacza danych jako najbardziej seksowną profesję tej dekady. Rynek zmaga się obecnie z deficytem specjalistów od Big Data i analityki internetowej. W samych tylko Stanach Zjednoczonych do 2020 roku może on wynieść nawet 4 mln wolnych stanowisk.

Big Data odcyfrowana

Jeff Hammerbacher oraz D.J. Patil to dwaj ojcowie-założyciele terminu „Big Data Scientist”. Ukuli tę nazwę już siedem lat temu, w 2008 roku, akcentując konieczność analizy danych w Sieci. Wielu tę deklarację kwitowało wówczas uśmieszkiem politowania. Jednak to Hammerbacher i Patil mieli rację. Po latach amerykański Forbes zaliczy obydwu Panów do grona siedmiu najbardziej wpływowych badaczy danych na świecie. Zajmą drugie miejsce na pudle, tuż za szefem Google, Larrym Pagem.

Badacz danych to wciąż młody zawód, który nie zdołał jeszcze okrzepnąć na rynku i zakorzenić się w powszechnej świadomości. W 2008 roku portal LinkedIn postanowił przebadać profile zawodowe swoich użytkowników. Okazało się, że żaden użytkownik nie zadeklarował się jako Big Data Scientist. Za to w 2013 roku tę profesję wpisało w swoich profilach 3 440 użytkowników portalu. Dzisiaj to jeden z najczęściej poszukiwanych zawodów w Dolinie Krzemowej. Niestety, rynek boryka się z poważną trudnością, bowiem wykwalifikowanych pracowników od Big Data jest jak na lekarstwo.

Dlatego firmy działające w obszarze analityki internetowej toczą o nich regularną wojnę. Josh Sullivan, lider niemal pół tysięcznej grupy „badaczy danych” w firmie konsultingowej Booz Allen Hamilton twierdzi, że użytkownicy, w których profilu zawodowym na LinkedIn widnieje wpis „data science”, otrzymują dziś od rekruterów nawet sto maili dziennie z propozycją zmiany pracy. Dlaczego badacze danych są tak łakomym kąskiem na celowniku headhunterów?

Specjalista od Big Data na wagę baryłki ropy naftowej

Specjaliści od Big Data to pracownicy sektora gospodarki cyfrowej, kluczowej gałęzi w ekonomii społeczeństw postindustrialnych, w których główną rolę odgrywa informacja, a właściwie: dostęp do informacji. To właśnie informacje, czyli dane, są nową ropą naftową – jak zgrabnie ujął to Clive Humby.

Pracownicy sektora Big Data są specjalistami do spraw pozyskiwania, analizowania, segmentowania i interpretowania informacji, jakie internauci pozostawiają po sobie na witrynach. Ich wiedza jest kombinatem wiadomości z zakresu ekonomii, matematyki, statystyki oraz nowych technologii. Właśnie do tych nauk nawiązuje termin „scientist” (naukowiec, badacz), używany w nawie tego zawodu – tłumaczy Piotr Prajsnar, CEO Cloud Technologies, największej platformy Big Data w Polsce.

Jak wynika z raportu McKinsey Global Institute Big Data Scientist już teraz jest jednym z najbardziej pożądanych zawodów nie tylko w USA, ale i na całym świecie. Do 2020 roku luka na rynku pracy w USA wyniesie już ponad 1,5 mln wolnych stanowisk, czekających na obsadzenie przez specjalistów od Big Data na stanowiskach kierowniczych, zaś cały deficyt stanowisk powiązanych z Big Data może sięgnąć nawet ponad 4 mln nieobsadzonych stanowisk. Dziura rośnie z roku na rok, również na polskim rynku. Sprzyja jej oczywiście dwucyfrowe tempo, w jakim rozrasta się ilość danych w Sieci w skali roku.

Magister Big Data

Ten deficyt specjalistów dostrzegły już uczelnie wyższe. W odpowiedzi na alarmujące sygnały spływające ze środowisk biznesowych, wdrożyły do swojej oferty edukacyjnej studia dedykowane zagadnieniom Big Data. Przykładowo Uniwersytet w Iowa uruchomił w 2013 roku kierunek Analityka Biznesowa i Systemy Informacyjne. Na pierwszy rok studiów zapisało się ponad 170 studentów. Polska, która mimo wszystko jeszcze raczkuje na rynku Big Data, rynkowa luka w zawodzie badaczy danych również jest wyczuwalna. Już obecnie na portalach z ogłoszeniami o pracę coraz więcej rekruterów poszukuje osób z doświadczeniem w Big Data. Zapotrzebowanie zgłasza sam biznes: według badania autorstwa InsightExpress 8 na 10 polskich menedżerów IT sądzi, że Big Data stanowiło będzie trzon strategii ich przedsiębiorstw w ciągu najbliższych pięciu lat.

Polskie uczelnie nie zamierzają przespać tego czasu. Szkoła Główna Handlowa w październiku zeszłego roku uruchomiła pierwszą edycję dwusemestralnych studiów podyplomowych: Inżynieria Danych – Big Data. Koło Statystyki i Demografii SGH organizuje konferencje przybliżające te wątki studentom, wśród których znajdą się być może przyszli badacze danych. Podobnie Instytut Podstaw Informatyki PAN zachęca do podjęcia studiów podyplomowych na kierunku „Metody i narzędzia nowoczesnej analizy danych w biznesie”. Z kolei Politechnika Warszawska od 2012 organizuje seminaria poświęcone tematyce Big Data. W polskiej nauce pierwsze oznaki zainteresowania potencjałem tej branży są już widoczne. Big Data Scientist będzie niebawem wymieniany jednym tchem obok takich profesji jak prawnik, chirurg czy dentysta. Oprócz obiecujących perspektyw zawodowych i gwarancji wolnych stołków, w Big Data kuszą także zarobki. A te dla wielu mogą okazać się propozycją nie do odrzucenia.

Big Data = Big Money?

Frank J. Ohlhorst to dziennikarz IT, który zaczął zajmować się tematyką Big Data zanim jeszcze stało się to modne. W książce „Turning Big Data into Big Money” przywołał zasadę 4V, za sprawą której Big Data może (ale wcale nie musi) generować Big Money, czyli wielkie pieniądze.

Te 4V to: Volume (ogromna ilość danych), Variety (ogromna różnorodność), Veracity (wiarygodność danych) oraz Velocity (zawrotna szybkość ich generowania). Te cztery czynniki składają się na wartość danych, w sensie zarówno merytorycznym jak i czysto finansowym – tłumaczy Łukasz Kapuśniak, Chief Big Data Officer w Cloud Technologies.

Ohlhorst jednak nie odpowiedział wprost na pytanie: ile można zarobić na danych? Pokazuje raczej, na czym należy się skupić, żeby móc na nich zarobić. Mimo to można podać pewne szacunki zarobkowe branży Big Data. Przynajmniej w kolebce tej technologii, czyli w Stanach Zjednoczonych. O oszacowanie średnich wynagrodzeń badaczy danych w USA pokusił się portal DataJobs. Według jego analityków zarobki specjalisty ds. Big Data wahają się w granicach 50 tys. USD – 75 tys. USD. W przypadku doświadczonych analityków mówimy już o widełkach cenowych rzędu 65 tys. USD – 110 tys. USD. Z kolei według Burtch Works mediana zarobków badacza danych ze stażem do 3 lat, który może pochwalić się dyplomem uniwersyteckim, dobrą znajomością języków programowania oraz metod statystycznych, wynosi 80 tys. USD. Ci, którzy pracują w branży dłużej mogą liczyć nawet na 150 tys. USD. Czy to już “Big Money”? Zależy jak na to patrzeć. W USA są to zarobki, które stoją w tym samym rzędzie co pensje lekarzy czy prawników, a także wyspecjalizowanych programistów.

Big Data w przeliczeniu na złotówki

Czy Big Data można przeliczyć na złotówki? Można, jednak nie bez problemów. W Polsce podstawowej trudności przysparza fakt, że zawód badacza danych jeszcze u nas nie ostygł, a w związku z tym brakuje – nomen omen – danych do przedstawienia wiarygodnych statystyk. W dostępnych raportach płacowych zawody takie jak Big Data Scientist czy Big Data Architect praktycznie nie występują. Powodem jest m.in. niewielka liczba pracowników tego sektora, których kwalifikuje się często do tej samej grupy wynagrodzeń, co np. programistów. W ustaleniu miarodajnych wyników nie pomaga również często znacząca rozpiętość widełek płacowych. Jednak sporządzenie takich wyników jest tylko kwestią czasu, bowiem popularność Big Data w kraju nad Wisłą rośnie lawinowo. Dowodem są choćby raporty giełdowych spółek, pełniące funkcję papierka lakmusowego tego wciąż kształtującego się rynku.

Prześwietlając najnowszy raport Cloud Technologies, największej platformy Big Data w Polsce, wysnuć wniosek, że Big Data w Polsce wkracza właśnie w swój złoty okres. To spółka założona przez Piotra Prajsnara i związana z analizą dużych zbiorów danych wykorzystywanych m.in. w personalizowaniu reklam internetowych, okazała się u nas najlepszą inwestycją na parkiecie NewConnect. Rok 2014 rok zamknęła z rekordowym na alternatywnym parkiecie kursem: +726,7%. W poprzednim roku spółka zwiększyła obroty o ponad 670 proc., do poziomu 17,54 mln zł (dla porównania rok wcześniej wyniosły one 2,61 mln zł). I kwartał 2015 roku to już prawdziwy boom spółki: zwiększyła ona swoje przychody o prawie 740 proc., do 5,63 mln zł. Zysk netto sięgnął 2,44 mln zł. W znacznej mierze spowodowane jest to rozszerzeniem działalności spółki na segment reklamy mobile, związanym z pozyskaniem studia game-developerów oraz produkcją gier mobilnych. Pierwsza produkcja studia game-developerów z Cloud Technologies, Bouncing Ball, okazała się hitem App Store, notując 3,5 mln pobrań w pierwsze 3 tygodnie od publikacji, stając się numerem 1 w USA i zyskując tytuł „Featured by Apple”. Korzystając z deszczu Big Data spółka rośnie jak na drożdżach, czego dowodem jest fakt, że już dziś rozgląda się m.in. właśnie za badaczami danych. Cloud Technologies szuka Unity Developerów, Java Developerów, Junior PHPowców oraz Project Managera. Wygląda więc na to, że Big Data rozgaszcza się w Polsce na dobre. Epoka Big (Smart) Data Dr Vinton Gray Cerf z Google, szerszej publiczności znany jako „ojciec internetu”, już w 2008 roku zapowiadał nadejście czasów, w których koniecznością stanie się poznanie osoby po drugiej stronie kabla. Po to, by lepiej zrozumieć ją i jej potrzeby. Te czasy już nadeszły.

Big Data rośnie dziś w tempie dwucyfrowym, zaś dynamika wzrostu przekracza 40% w skali roku. Wikibon prognozuje, że do 2017 roku wartość całego rynku osiągnie 47 mld USD. Już dziś należałoby mówić może nie tyle o Big, co o Huge Data. Jak przewiduje Oracle w 2020 roku Sieć będzie dziewięciokrotnie większa niż obecnie: wygenerujemy ponad 45 Zettabajtów danych (obecnie rozmiary Internetu szacuje się na około 5 ZB). IDC przelicza, że na jednego mieszkańca Ziemi przypadnie wówczas ponad 5,2 GB danych. Według prezesa Google w 48 godzin produkujemy w Internecie więcej danych, niż od początku powstania cywilizacji do 2003 roku.

Nie popadajmy jednak w obsesję ilości. Bardziej podstawową kwestią powinna być dla nas rozdzielczość czy też jakość danych, czyli to, co można z ich pomocą zrobić. Wówczas na pierwszym planie pojawia się pojęcie „Smart Data”, czyli danych już uporządkowanych i zinterpretowanych, pogrupowanych w profile behawioralne (profile zachowań) użytkowników internetu. To przetworzone (niesurowe) dane, które przeszły przez warsztat wytrawnego badacza i stanowią solidną podstawę nie tylko do zbudowania konkretnej strategii komunikacyjnej, ale też do personalizacji Sieci – tłumaczy Piotr Prajsnar, którego spółka opracowała największy w tej części Europy silnik behawioralny (monitoruje ponad pół miliona witryn i składa się z 40 mln profili behawioralnych internautów) oraz pierwszą w Polsce platformę do mailingu w modelu RTB (Real-Time Bidding) mailingexchange.com

Cyfrowy zawrót głowy

Ilość danych generowanych w internecie faktycznie może przyprawiać o zawrót głowy. Rzecz w tym, żeby tej głowy nie stracić – i podjąć trud ich przeanalizowania.

Obecnie wykorzystujemy bowiem stosunkowo niewielką część danych: średnio 20% całego wolumenu Big Data. IDC pociesza jednak, że do 2020 roku będzie to już 30%. Mimo istotnego skoku procentowego to jednak wciąż mało, ten procent trzeba zwiększać. Tylko w ten sposób uda nam się uczynić Internet bardziej przyjaznym środowiskiem – tłumaczy Łukasz Kapuśniak.

To jednak oznacza, że branżę IT czeka tytaniczna wręcz praca, w której liczyć się będzie każda para rąk na pokładzie. Dlatego nie powinno nikogo stanowiska typu Big Data Scientist/Architect/Analyst, będą rosły jak grzyby po deszczu. To nie tylko seksowne i lukratywne zawody. To zawody (na miarę) przyszłości.

Źródło: informacja prasowa

Cześć!

Chcesz opublikować tekst? Odezwij się do nas
Karolina Michalak Relationship Manager
redakcja@ehandel.com.pl
+48 721 945 134
  • Infoguru Sp. z o.o. Sp. k.

    Wydawca

  • POLAND, Poznań, Truskawiecka 13

    Adres prawny

  • VAT ID 7811967834

    NIP