Шта је наука о подацима?
Наука о подацима је поље које комбинује елементе рачунарске науке, статистике и знања специфичног за домен како би се из података извукли увиди и знање. Циљ науке о подацима је да користи податке за одговарање на питања или решавање проблема који су од интереса за одређену организацију или заједницу.ӕӕУ пракси, наука о подацима укључује низ активности, укључујући:ӕӕ* Разбијање података: чишћење, трансформисање и припрема подаци за анализуӕ* Истраживање података: визуализација и сумирање података за разумевање образаца и трендоваӕ* Моделирање: коришћење статистичких техника или техника машинског учења за предвиђање исхода или објашњење феноменаӕ* Комуникација: представљање налаза и препорука заинтересованим странама на јасан и ефикасан начин.ӕӕНеке уобичајене апликације. науке о подацима укључује:ӕӕ* Предиктивно одржавање: коришћење података сензора за предвиђање када ће опрема вероватно отказатиӕ* Сегментација купаца: коришћење демографских података и података о понашању за груписање купаца у различите сегментеӕ* Откривање превара: коришћење алгоритама машинског учења за идентификацију лажних трансакцијаӕ* Препорука системи: коришћење података о понашању корисника за предлагање производа или услуга који ће вероватно бити од интереса.ӕӕНаука о подацима је област која се брзо развија, са новим техникама и алатима који се стално развијају. Неке од кључних технологија које се користе у науци о подацима укључују:ӕӕ* Питхон: популарни програмски језик за анализу података и машинско учењеӕ* Р: статистички програмски језик који се широко користи у академској заједници и индустријиӕ* СКЛ: стандардни језик за управљање релационим базама податакаӕ* Хадооп : оквир отвореног кода за дистрибуирано рачунарство и складиштење великих података.



