Histogrammien ymmärtäminen: opas tietojen graafiseen esittämiseen
Histogrammi on graafinen esitys tietojoukon jatkuvien muuttujien jakaumasta. Se on kaavio, joka näyttää eri arvojen tiheyden tietojoukossa. X-akseli edustaa muuttujan eri arvoja, ja y-akseli edustaa kuhunkin luokkaan kuuluvien havaintojen tai tapausten määrää.
Histogrammissa eri luokat esitetään pylväillä, ja kunkin palkin korkeus ilmaisee tähän luokkaan kuuluvien havaintojen määrä. Jos meillä on esimerkiksi tietojoukko koepisteistä, histogrammi näyttää kunkin pistemäärän saaneiden opiskelijoiden määrän (esim. 0-20, 21-40, 41-60 jne.).
Histogrammeja voidaan käyttää :
* Visualisoi muuttujan jakauma
* Tunnista jakauman muoto (esim. normaali, vino, bimodaalinen)
* Tunnista poikkeamat ja epätavalliset arvot
* Vertaa eri muuttujien jakaumaa
* Arvioi mallin tai algoritmin suorituskykyä tietojoukko
On olemassa monenlaisia histogrammeja, mukaan lukien:
* Yksinkertainen histogrammi: näyttää eri arvojen tiheyden tietojoukossa.
* Tiheyshistogrammi: näyttää datan tiheyden eri kohdissa.
* Pinottu histogrammi: näyttää eri arvojen tiheyden. useissa luokissa.
* Lämpökartan histogrammi: näyttää eri arvojen esiintymistiheyden matriisissa.
Histogrammeja käytetään laajasti monilla aloilla, mukaan lukien rahoitus, markkinointi ja terveydenhuolto, analysoimaan ja visualisoimaan suuria tietojoukkoja.



