Memahami AUC dalam Klasifikasi Binari: Tafsiran, Julat, Ambang dan Banyak Lagi
AUC (Area Under the Receiver Operating Characteristic Curve) ialah ukuran prestasi pengelas binari, seperti model pembelajaran mesin. Ia mewakili pertukaran antara kadar positif benar dan kadar positif palsu model pada ambang yang berbeza.
Keluk ROC memplotkan kadar positif sebenar terhadap kadar positif palsu pada ambang yang berbeza, dan AUC ialah kawasan di bawah keluk ini. AUC 1.0 menunjukkan pengelas sempurna, manakala AUC 0.5 menunjukkan pengelas rawak.
AUC digunakan untuk menilai prestasi model pengelasan binari dalam pelbagai bidang seperti pengelasan imej, pengelasan teks dan bioinformatik. Ia juga digunakan untuk membandingkan prestasi model yang berbeza atau untuk mengoptimumkan parameter model.
Berikut adalah beberapa aspek utama AUC:
1. Tafsiran: AUC boleh ditafsirkan sebagai kebarangkalian bahawa contoh positif yang dipilih secara rawak akan mempunyai skor yang lebih tinggi daripada contoh negatif yang dipilih secara rawak.
2. Julat: Julat AUC ialah [0, 1], dengan 0 mewakili pengelas rawak dan 1 mewakili pengelas sempurna.
3. Ambang: AUC sensitif kepada pilihan ambang, yang boleh menjejaskan kadar positif sebenar dan kadar positif palsu.
4. Pengelasan berbilang kelas: AUC boleh diperluaskan kepada masalah pengelasan berbilang kelas menggunakan teknik seperti satu lawan satu atau satu lawan semua.
5. Matriks kekeliruan: AUC berkait rapat dengan matriks kekeliruan, yang meringkaskan bilangan positif benar, negatif benar, positif palsu dan negatif palsu.
6. Pemilihan model: AUC boleh digunakan sebagai kriteria untuk pemilihan model, di mana model dengan nilai AUC yang lebih tinggi diutamakan.
7. Pengoptimuman: AUC boleh dioptimumkan menggunakan teknik seperti pengesahan silang dan carian grid untuk mencari parameter optimum untuk model tertentu.



