Memahami Varians: Konsep Utama dalam Analisis Data
Varians ialah ukuran penyebaran atau serakan set data. Ia mewakili berapa banyak titik data individu menyimpang daripada nilai min. Dalam erti kata lain, ia mengukur sejauh mana penyebaran data adalah daripada nilai purata.
Sebagai contoh, jika anda mempunyai set markah peperiksaan dengan min 80 dan sisihan piawai 10, ini bermakna kebanyakan markah dikelompokkan di sekeliling 80 (min), tetapi terdapat beberapa variasi dalam skor (diwakili oleh sisihan piawai). Jika sisihan piawai lebih tinggi, katakan 20, maka skor akan lebih tersebar dan akan terdapat lebih banyak variasi dalam data.
Variance dikira sebagai purata perbezaan kuasa dua antara setiap titik data dan min. Ia dinyatakan dalam unit persegi (cth., inci kuasa dua, meter kuasa dua) dan sering dilambangkan dengan simbol "σ²" (sigma kuasa dua).
Pemahaman varians adalah penting kerana ia membantu kita memahami berapa banyak ketidakpastian atau risiko yang dikaitkan dengan set data. Dalam kewangan, sebagai contoh, kita mungkin menggunakan varians untuk mengukur risiko portfolio pelaburan. Dalam pembelajaran mesin, kami mungkin menggunakan varians untuk memahami sejauh mana model membuat generalisasi kepada data baharu.



