ทำความเข้าใจ AUC ในการจำแนกประเภทไบนารี: การตีความ พิสัย เกณฑ์ และอื่นๆ
AUC (พื้นที่ใต้เส้นโค้งลักษณะการทำงานของตัวรับ) คือการวัดประสิทธิภาพของตัวแยกประเภทไบนารี เช่น โมเดลแมชชีนเลิร์นนิง มันแสดงถึงการแลกเปลี่ยนระหว่างอัตราบวกจริงกับอัตราบวกลวงของแบบจำลองที่เกณฑ์ต่างกัน เส้นโค้ง ROC พล็อตอัตราบวกจริงเทียบกับอัตราบวกลวงที่เกณฑ์ต่างกัน และ AUC คือพื้นที่ใต้เส้นโค้งนี้ AUC 1.0 หมายถึงตัวแยกประเภทที่สมบูรณ์แบบ ในขณะที่ AUC 0.5 หมายถึงตัวแยกประเภทแบบสุ่ม
AUC ใช้เพื่อประเมินประสิทธิภาพของแบบจำลองการจำแนกประเภทไบนารีในสาขาต่างๆ เช่น การจำแนกภาพ การจำแนกข้อความ และชีวสารสนเทศศาสตร์ นอกจากนี้ยังใช้เพื่อเปรียบเทียบประสิทธิภาพของโมเดลต่างๆ หรือเพื่อปรับพารามิเตอร์โมเดลให้เหมาะสม ต่อไปนี้คือประเด็นสำคัญบางประการของ AUC:
1 การตีความ: AUC สามารถตีความได้ว่าเป็นความน่าจะเป็นที่ตัวอย่างเชิงบวกที่เลือกโดยการสุ่มจะมีคะแนนสูงกว่าตัวอย่างเชิงลบที่ถูกสุ่มเลือก
2 ช่วง: ช่วงของ AUC คือ [0, 1] โดยที่ 0 หมายถึงตัวแยกประเภทแบบสุ่ม และ 1 หมายถึงตัวแยกประเภทที่สมบูรณ์แบบ
3 เกณฑ์: AUC มีความอ่อนไหวต่อการเลือกเกณฑ์ ซึ่งอาจส่งผลต่ออัตราบวกที่แท้จริงและอัตราผลบวกลวง
4 การจำแนกประเภทหลายชั้น: AUC สามารถขยายไปสู่ปัญหาการจำแนกประเภทหลายชั้นได้โดยใช้เทคนิค เช่น one-vs-one หรือ one-vs-all.
5 เมตริกซ์ความสับสน: AUC มีความสัมพันธ์อย่างใกล้ชิดกับเมทริกซ์ความสับสน ซึ่งสรุปจำนวนผลบวกจริง ผลลบจริง ผลบวกลวง และผลลบลวง
6 การเลือกรุ่น: AUC สามารถใช้เป็นเกณฑ์สำหรับการเลือกรุ่น โดยที่ควรใช้รุ่นที่มีค่า AUC สูงกว่า การเพิ่มประสิทธิภาพ: AUC สามารถเพิ่มประสิทธิภาพได้โดยใช้เทคนิคต่างๆ เช่น การตรวจสอบข้ามและการค้นหาตาราง เพื่อค้นหาพารามิเตอร์ที่เหมาะสมที่สุดสำหรับโมเดลที่กำหนด



