Memahami Histogram: Panduan untuk Perwakilan Data Grafik
Histogram ialah perwakilan grafik taburan pembolehubah berterusan set data. Ia ialah plot yang menunjukkan kekerapan nilai yang berbeza dalam set data. Paksi-x mewakili nilai berbeza bagi pembolehubah, dan paksi-y mewakili bilangan pemerhatian atau kejadian yang termasuk dalam setiap kategori.
Dalam histogram, kategori berbeza diwakili oleh bar, dan ketinggian setiap bar menunjukkan bilangan pemerhatian yang termasuk dalam kategori tersebut. Contohnya, jika kita mempunyai set data markah peperiksaan, histogram akan menunjukkan bilangan pelajar yang mendapat markah dalam setiap julat skor (cth., 0-20, 21-40, 41-60, dsb.).
Histogram boleh digunakan untuk :
* Visualisasikan taburan pembolehubah
* Kenal pasti bentuk taburan (cth., normal, condong, bimodal)
* Kenal pasti outlier dan nilai luar biasa
* Bandingkan taburan pembolehubah berbeza
* Nilaikan prestasi model atau algoritma pada sesuatu dataset
Terdapat banyak jenis histogram, termasuk:
* Histogram ringkas: menunjukkan kekerapan nilai berbeza dalam dataset.
* Histogram ketumpatan: menunjukkan ketumpatan data pada titik berbeza.
* Histogram bertindan: menunjukkan kekerapan nilai berbeza dalam berbilang kategori.
* Histogram peta haba: menunjukkan kekerapan nilai berbeza dalam matriks.
Histogram digunakan secara meluas dalam banyak bidang, termasuk kewangan, pemasaran dan penjagaan kesihatan, untuk menganalisis dan menggambarkan set data yang besar.



