karrier_napok_logo SZTE Állásbörze 2024.04.23.

C7A0398

Magyar adattudósnak és adatmérnöknek áll a világ


A nagy mennyiségű adatok elemzésére épülő üzleti intelligencia szolgáltatások képezik a globális IT piac egyik leggyorsabban bővülő szegmensét. Ezen a területen vált elismert játékossá a budapesti székhelyű Starschema. Ha olyan nagyvállalatok megbízásain akarsz dolgozni, mint a Netflix, a Facebook vagy a Disney, van egy karriertippünk.

A 2006-ban alapított Starschema Kft. az üzleti intelligencia szolgáltatások terén Magyarországon piacvezetőnek számít. Működésének első évtizedében átlagban évente duplázta árbevételét, de a későbbiekben is kétszámjegyű növekedési tempót diktált. Megrendeléseinek nagy része a tengerentúlról, főként Fortune 500-as nagyvállalatoktól érkezik. A budapesti székhely mellett a Starschema két irodával rendelkezik: Szegeden és Washingtonban.

Történetének kiemelkedő mérföldköve, hogy a világ egyik vezető technológiai vállalata, a HCL Technologies idén tavasszal felvásárolta a budapesti céget. Az akvizíció új kapukat is nyit meg a Starschema számára, emellett az indiai tech óriási nyújtotta háttér biztosítja a hosszút távú fejlődést és a nagyobb volumenű megbízások elnyerését.


Data science

A cég által elvégzett feladatokat alapvetően két csoportba lehet osztani. Az első a data science területe, ahol a cél olyan algoritmusok fejlesztése, amikkel a statisztikára, a gépi tanulásra és a nagy mennyiségű adatfeldolgozási technológiákra építve komplex összefüggéseket lehet feltárni. Ezek legtöbbször valamilyen új üzleti felismeréshez vezetnek.


Az egyik data science projekt során a Starschema szakemberei azt vizsgálták, milyen tényezők hatnak az USA területén található szélerőművek teljesítményére. Ennek részeként több évtizedre visszamenőleg dolgozták fel a különböző időjárás előrejelzők adatait, hogy megnézzék, az adott területre ki adta a pontosabb becslést. Ez azért lényeges, mert minél pontosabb egy előrejelzés a szél irányára és erősségére vonatkozóan, annál jobb becslés adható arra az energiamennyiségre, amit a szélerőművek táplálnak a rendszerbe egy meghatározott időpontban.


C7A6639


Data engineering

A data engineering ott folytatódik, ahol a data science véget ér. Itt már a meglévő modelleket kell kiterjeszteni, skálázni. A feladat nem az elemző algoritmusok megalkotása, hanem az, hogy az adatelemzés és az adatvizualizáció hatalmas mennyiségű adatok esetén is gyorsan elvégezhető legyen.

Remek példát szolgáltat ehhez a Netflix megbízása. A világ legnagyobb streaming szolgáltatója több mint 200 millió felhasználóval rendelkezik. Az általuk generált sok százmillió adatból igazi művészet valós időben kinyerni a legfontosabb mutatószámokat, mint pl. a nézettség, a sorozatöregedés vagy a folytatási hajlandóság. A Starschema módszereinek segítségével az elemzők ezeket az információkat másodperceken belül megkapják.

Itt érdemes megemlíteni, hogy a Facebook adatfeldolgozási folyamatait gyorsítja a cég két megoldása. A világ legnagyobb közösségi hálózatának irányítói az adatvizualizációs szervereket a magyar csapat programjaival felügyelik és frissítik. Ezen felül a Starschema segített a Facebook-nak egy olyan algoritmus elterjesztésében, amivel könnyebb és gyorsabb felderíteni a gyanús felhasználói aktivitásokat.


C7A6690-2