Co je Data Science?
Data Science je obor, který kombinuje prvky počítačové vědy, statistiky a znalosti specifické pro určitou doménu, aby z dat získal poznatky a znalosti. Cílem datové vědy je používat data k zodpovězení otázek nebo řešení problémů, které zajímají konkrétní organizaci nebo komunitu. data pro analýzu* Průzkum dat: vizualizace a sumarizace dat za účelem pochopení vzorců a trendů* Modelování: použití statistických technik nebo technik strojového učení k předpovídání výsledků nebo vysvětlení jevů* Komunikace: prezentace zjištění a doporučení zainteresovaným stranám jasným a efektivním způsobem.
Některé běžné aplikace datové vědy zahrnují:
* Prediktivní údržba: použití dat ze senzorů k předpovídání, kdy zařízení pravděpodobně selže
* Segmentace zákazníků: použití demografických údajů a údajů o chování k seskupení zákazníků do odlišných segmentů
* Detekce podvodů: použití algoritmů strojového učení k identifikaci podvodných transakcí
* Doporučení systémy: používání údajů o chování uživatelů k navrhování produktů nebo služeb, které by mohly být zajímavé.
Věda o datech je rychle se vyvíjející obor, ve kterém se neustále vyvíjejí nové techniky a nástroje. Některé z klíčových technologií používaných v datové vědě zahrnují:
* Python: oblíbený programovací jazyk pro analýzu dat a strojové učení
* R: statistický programovací jazyk široce používaný v akademické sféře a průmyslu
* SQL: standardní jazyk pro správu relačních databází
* Hadoop : open-source framework pro distribuované výpočty a ukládání velkých dat.



