


डेटासेट में गुम डेटा के लिए आरोपण विधियों को समझना
इम्प्यूटर्स एल्गोरिदम या सांख्यिकीय मॉडल हैं जिनका उपयोग डेटासेट में लापता डेटा मानों को भरने के लिए किया जाता है। प्रतिरूपण का लक्ष्य डेटासेट में उपलब्ध जानकारी के आधार पर, लुप्त मानों के बारे में सर्वोत्तम संभव अनुमान लगाना है।
कई प्रकार की प्रतिरूपण विधियाँ हैं, जिनमें शामिल हैं:
1. माध्य प्रतिनियुक्ति: यह विधि एक ही चर के लिए देखे गए मानों के माध्य के साथ लुप्त मानों को भरती है।
2। माध्यिका प्रतिरूपण: यह विधि एक ही चर के लिए देखे गए मानों के माध्यिका के साथ लुप्त मानों को भरती है।
3। प्रतिगमन प्रतिरूपण: यह विधि अन्य चर के देखे गए मूल्यों के आधार पर लुप्त मूल्यों की भविष्यवाणी करने के लिए एक प्रतिगमन मॉडल का उपयोग करती है।
4। K-निकटतम पड़ोसी प्रतिरूपण: यह विधि गायब मान वाले k के सबसे समान अवलोकनों को ढूंढती है, और लापता डेटा को भरने के लिए उनके मानों का उपयोग करती है।
5। एकाधिक प्रतिनियुक्ति: यह विधि लापता डेटा के लिए अलग-अलग आरोपित मूल्यों के साथ डेटासेट के कई संस्करण बनाती है, और आरोपित मूल्यों में अनिश्चितता को ध्यान में रखते हुए प्रत्येक संस्करण का अलग-अलग विश्लेषण करती है।
6। डेटा संवर्द्धन: यह विधि डेटासेट के आकार को बढ़ाने और लापता डेटा के प्रभाव को कम करने के लिए मौजूदा डेटा को परिवर्तित करके नया डेटा उत्पन्न करती है, जैसे शोर जोड़कर या नए चर बनाकर। गुम डेटा से निपटने के लिए इम्प्यूटेशन एक उपयोगी तकनीक है। लेकिन यह सुनिश्चित करने के लिए कि यह सटीक और विश्वसनीय है, आरोपण विधि की पसंद पर सावधानीपूर्वक विचार करना और लगाए गए डेटा के प्रदर्शन का मूल्यांकन करना महत्वपूर्ण है।



