


भिन्नता को समझना: डेटा विश्लेषण में एक प्रमुख अवधारणा
वेरिएंस डेटा के एक सेट के प्रसार या फैलाव का माप है। यह दर्शाता है कि व्यक्तिगत डेटा बिंदु औसत मूल्य से कितना विचलित हैं। दूसरे शब्दों में, यह मापता है कि डेटा औसत मूल्य से कितना फैला हुआ है। उदाहरण के लिए, यदि आपके पास 80 के औसत और 10 के मानक विचलन के साथ परीक्षा स्कोर का एक सेट है, तो इसका मतलब है कि अधिकांश स्कोर आसपास क्लस्टर किए गए हैं 80 (माध्य), लेकिन स्कोर में कुछ भिन्नता है (मानक विचलन द्वारा दर्शाया गया है)। यदि मानक विचलन अधिक होता, मान लीजिए 20, तो स्कोर अधिक फैल जाएगा और डेटा में अधिक भिन्नता होगी। भिन्नता की गणना प्रत्येक डेटा बिंदु और माध्य के बीच वर्ग अंतर के औसत के रूप में की जाती है। इसे वर्ग इकाइयों (उदाहरण के लिए, वर्ग इंच, वर्ग मीटर) में व्यक्त किया जाता है और इसे अक्सर प्रतीक "σ²" (सिग्मा वर्ग) द्वारा दर्शाया जाता है।
विचरण को समझना महत्वपूर्ण है क्योंकि इससे हमें यह समझने में मदद मिलती है कि सेट के साथ कितनी अनिश्चितता या जोखिम जुड़ा हुआ है। डेटा। उदाहरण के लिए, वित्त में, हम निवेश पोर्टफोलियो के जोखिम को मापने के लिए भिन्नता का उपयोग कर सकते हैं। मशीन लर्निंग में, हम यह समझने के लिए विचरण का उपयोग कर सकते हैं कि कोई मॉडल नए डेटा को कितनी अच्छी तरह सामान्यीकृत करता है।



