mobile theme mode icon
theme mode light icon theme mode dark icon
Random Question अनियमित
speech play
speech pause
speech stop

डेटासेट में गुम डेटा के लिए आरोपण विधियों को समझना

इम्प्यूटर्स एल्गोरिदम या सांख्यिकीय मॉडल हैं जिनका उपयोग डेटासेट में लापता डेटा मानों को भरने के लिए किया जाता है। प्रतिरूपण का लक्ष्य डेटासेट में उपलब्ध जानकारी के आधार पर, लुप्त मानों के बारे में सर्वोत्तम संभव अनुमान लगाना है।

कई प्रकार की प्रतिरूपण विधियाँ हैं, जिनमें शामिल हैं:

1. माध्य प्रतिनियुक्ति: यह विधि एक ही चर के लिए देखे गए मानों के माध्य के साथ लुप्त मानों को भरती है।
2। माध्यिका प्रतिरूपण: यह विधि एक ही चर के लिए देखे गए मानों के माध्यिका के साथ लुप्त मानों को भरती है।
3। प्रतिगमन प्रतिरूपण: यह विधि अन्य चर के देखे गए मूल्यों के आधार पर लुप्त मूल्यों की भविष्यवाणी करने के लिए एक प्रतिगमन मॉडल का उपयोग करती है।
4। K-निकटतम पड़ोसी प्रतिरूपण: यह विधि गायब मान वाले k के सबसे समान अवलोकनों को ढूंढती है, और लापता डेटा को भरने के लिए उनके मानों का उपयोग करती है।
5। एकाधिक प्रतिनियुक्ति: यह विधि लापता डेटा के लिए अलग-अलग आरोपित मूल्यों के साथ डेटासेट के कई संस्करण बनाती है, और आरोपित मूल्यों में अनिश्चितता को ध्यान में रखते हुए प्रत्येक संस्करण का अलग-अलग विश्लेषण करती है।
6। डेटा संवर्द्धन: यह विधि डेटासेट के आकार को बढ़ाने और लापता डेटा के प्रभाव को कम करने के लिए मौजूदा डेटा को परिवर्तित करके नया डेटा उत्पन्न करती है, जैसे शोर जोड़कर या नए चर बनाकर। गुम डेटा से निपटने के लिए इम्प्यूटेशन एक उपयोगी तकनीक है। लेकिन यह सुनिश्चित करने के लिए कि यह सटीक और विश्वसनीय है, आरोपण विधि की पसंद पर सावधानीपूर्वक विचार करना और लगाए गए डेटा के प्रदर्शन का मूल्यांकन करना महत्वपूर्ण है।

Knowway.org आपको बेहतर सेवा प्रदान करने के लिए कुकीज़ का उपयोग करता है। Knowway.org का उपयोग करके, आप कुकीज़ के हमारे उपयोग के लिए सहमत होते हैं। विस्तृत जानकारी के लिए, आप हमारे कुकी नीति पाठ की समीक्षा कर सकते हैं। close-policy