การทำความเข้าใจความผิดปกติในการวิเคราะห์ข้อมูล
ความผิดปกติคือการวัดว่าการสังเกตนั้นผิดปกติหรือไม่คาดคิดเพียงใด โดยสัมพันธ์กับการกระจายตัวของค่าที่คาดหวัง กล่าวอีกนัยหนึ่ง เป็นการวัดระดับที่การสังเกตเบี่ยงเบนไปจากสิ่งที่คาดหวังจากประสบการณ์หรือความรู้ในอดีต เช่น ถ้าเราวัดความสูงของกลุ่มคน แล้วคนหนึ่งมีความสูง 2 เมตร นี่จะถือว่าผิดปกติเพราะมันสูงกว่าส่วนสูงเฉลี่ยของกลุ่มมาก ในทำนองเดียวกัน หากเราต้องวัดอุณหภูมิเมืองในช่วงเวลาหนึ่งปี และวันหนึ่งบันทึกอุณหภูมิไว้ที่ -50 องศาเซลเซียส ก็ถือว่าผิดปกติเช่นกัน เนื่องจากอุณหภูมิจะเย็นกว่าอุณหภูมิเฉลี่ยของเมืองมาก
ความผิดปกติสามารถวัดได้โดยใช้เทคนิคทางสถิติต่างๆ เช่น วิธี z-score, Modified Z-score หรือวิธี Boxplot เทคนิคเหล่านี้จะคำนวณจำนวนค่าเบี่ยงเบนมาตรฐานที่การสังเกตอยู่ห่างจากค่าเฉลี่ยหรือค่ามัธยฐานของชุดข้อมูล ยิ่งการสังเกตอยู่ห่างจากค่าเฉลี่ยหรือค่ามัธยฐานมากเท่าใด ก็จะถือว่ามีความผิดปกติมากขึ้นเท่านั้น ความผิดปกติเป็นสิ่งสำคัญในการวิเคราะห์ข้อมูล เนื่องจากสามารถช่วยให้เราระบุรูปแบบหรือค่าผิดปกติที่ผิดปกติในข้อมูลที่อาจต้องมีการตรวจสอบหรือคำอธิบายเพิ่มเติม ตัวอย่างเช่น ในการวิเคราะห์ข้อมูลทางการเงิน การเคลื่อนไหวของราคาหุ้นที่ผิดปกติอาจบ่งบอกถึงแนวโน้มของตลาดหรือกิจกรรมที่อาจเกิดการฉ้อโกง ในการวิเคราะห์ข้อมูลด้านการดูแลสุขภาพ ผลการทดสอบทางการแพทย์ที่ผิดปกติอาจบ่งบอกถึงสภาวะสุขภาพที่ร้ายแรงหรือข้อผิดพลาดในการทดสอบ โดยสรุป ความผิดปกติคือการวัดว่าการสังเกตที่ผิดปกติหรือไม่คาดคิดนั้นสัมพันธ์กับการกระจายของค่าที่คาดหวังอย่างไร สามารถวัดได้โดยใช้เทคนิคทางสถิติต่างๆ และมีความสำคัญในการวิเคราะห์ข้อมูลเพราะสามารถช่วยเราระบุรูปแบบหรือค่าผิดปกติที่อาจต้องมีการตรวจสอบหรือคำอธิบายเพิ่มเติม



