Разумевање варијансе: кључни концепт у анализи података
Варијанца је мера ширења или дисперзије скупа података. Представља колико појединачне тачке података одступају од средње вредности. Другим речима, мери колико су подаци распоређени од просечне вредности.ӕӕНа пример, ако имате скуп резултата испита са средњом вредношћу од 80 и стандардном девијацијом од 10, то значи да је већина резултата груписана око 80 (средња вредност), али постоје неке варијације у резултатима (представљене стандардном девијацијом). Када би стандардна девијација била виша, рецимо 20, онда би резултати били више распоређени и било би више варијација у подацима.ӕӕВаријанца се израчунава као просек квадрата разлике између сваке тачке података и средње вредности. Изражава се у квадратним јединицама (нпр. квадратни инчи, квадратни метри) и често се означава симболом „σ²“ (сигма на квадрат).ӕӕ Разумевање варијансе је важно јер нам помаже да разумемо колико је неизвесности или ризика повезано са скупом података. У финансијама, на пример, можемо користити варијансу за мерење ризика инвестиционог портфеља. У машинском учењу, могли бисмо да користимо варијансу да бисмо разумели колико добро се модел генерализује на нове податке.



