


मशीन लर्निंग में इम्प्यूटर्स को समझना: प्रकार और विचार
मशीन लर्निंग के संदर्भ में, एक इम्प्यूटर एक उपकरण या एल्गोरिदम है जिसका उपयोग डेटासेट में लापता मानों को भरने के लिए किया जाता है। डेटा प्रविष्टि त्रुटियों, अपूर्ण डेटा, या सेंसर की खराबी जैसे विभिन्न कारणों से गुम मान हो सकते हैं। उपलब्ध डेटा में देखे गए पैटर्न और रिश्तों के आधार पर लापता मूल्यों का अनुमान लगाने के लिए इंप्यूटर्स का उपयोग किया जाता है।
कई प्रकार के इंप्यूटर्स उपलब्ध हैं, जिनमें शामिल हैं:
1. माध्य प्रतिनियुक्ति: यह विधि उस सुविधा के लिए देखे गए मानों के माध्य के साथ लुप्त मानों को भरती है।
2। माध्यिका प्रतिरूपण: यह विधि उस विशेषता के लिए देखे गए मानों के माध्यिका के साथ लुप्त मानों को भरती है।
3. प्रतिगमन प्रतिरूपण: यह विधि सुविधाओं के बीच संबंधों के आधार पर लुप्त मूल्यों की भविष्यवाणी करने के लिए एक प्रतिगमन मॉडल का उपयोग करती है।
4। K-निकटतम पड़ोसी प्रतिरूपण: यह विधि लापता मानों वाले k के सबसे समान अवलोकनों को ढूंढती है और लुप्त मानों को भरने के लिए उनके मानों का उपयोग करती है।
5। मैट्रिक्स गुणनखंडन प्रतिरूपण: यह विधि डेटा को दो निम्न-आयामी मैट्रिक्स में विघटित करती है और लापता मानों का अनुमान लगाने के लिए इन मैट्रिक्स का उपयोग करती है।
6। जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) प्रतिरूपण: यह विधि मूल डेटा के समान सिंथेटिक डेटा उत्पन्न करने के लिए जीएएन का उपयोग करती है, और फिर लापता मानों को भरने के लिए इस सिंथेटिक डेटा का उपयोग करती है।
इम्प्यूटर का उपयोग श्रेणीबद्ध और संख्यात्मक डेटा दोनों के लिए किया जा सकता है, लेकिन विभिन्न प्रकार के डेटा के लिए अलग-अलग विधियाँ बेहतर काम कर सकती हैं। उदाहरण के लिए, प्रतिगमन प्रतिरूपण संख्यात्मक डेटा के लिए अच्छी तरह से काम कर सकता है, जबकि के-निकटतम पड़ोसी प्रतिरूपण श्रेणीबद्ध डेटा के लिए बेहतर काम कर सकता है। यह ध्यान रखना महत्वपूर्ण है कि प्रतिरूपण हमेशा आवश्यक नहीं होता है, और आगे बढ़ने से पहले प्रतिरूपण की आवश्यकता का सावधानीपूर्वक मूल्यांकन करना महत्वपूर्ण है। इसके अतिरिक्त, आरोपित डेटा का उपयोग करने वाले किसी भी विश्लेषण के परिणामों की व्याख्या करते समय आरोपण विधि की संभावित पूर्वाग्रहों और सीमाओं पर विचार करना महत्वपूर्ण है।



