विशेषता निकर्ष (फ़ीचर एक्सट्रैक्शन)
यंत्र अधिगम , पैटर्न मान्यता और मूर्ति प्रोद्योगिकी में, फीचर एक्सट्रैक्शन मापे गए डेटा के शुरुआती सेट से शुरू होता है और व्युत्पन्न मूल्यों (फ़ीचर (मशीन लर्निंग) ) का निर्माण करता है, जिसका उद्देश्य सूचनात्मक और गैर-निरर्थक होना है, जो बाद के सीखने और सामान्यीकरण के चरणों को सुविधाजनक बनाता है, और कुछ मामलों में बेहतर मानवीय व्याख्याओं के लिए अग्रणी। फ़ीचर निष्कर्षण आयामीता में कमी से संबंधित है।[1] जब कलन विधि में इनपुट डेटा संसाधित होने के लिए बहुत बड़ा होता है और यह अनावश्यक होने का संदेह होता है (उदाहरण के लिए दोनों पैरों और मीटरों में समान माप, या रास्टर छवियों के रूप में प्रस्तुत छवियों की पुनरावृत्ति), तो इसे कम में परिवर्तित किया जा सकता है फीचर का सेट (मशीन लर्निंग) (जिसे फीचर वेक्टर भी कहा जाता है)। प्रारंभिक सुविधाओं के एक सबसेट का निर्धारण करना फीचर चयन कहलाता है।[2] चयनित सुविधाओं में इनपुट डेटा से प्रासंगिक जानकारी शामिल होने की उम्मीद है, ताकि पूर्ण प्रारंभिक डेटा के बजाय इस कम किए गए प्रतिनिधित्व का उपयोग करके वांछित कार्य किया जा सके।
सामान्य
फीचर एक्सट्रैक्शन में डेटा के एक बड़े सेट का वर्णन करने के लिए आवश्यक संसाधनों की संख्या को कम करना शामिल है। जटिल डेटा का विश्लेषण करते समय प्रमुख समस्याओं में से एक शामिल चरों की संख्या से उत्पन्न होती है। बड़ी संख्या में चर के साथ विश्लेषण के लिए आम तौर पर बड़ी मात्रा में स्मृति और गणना शक्ति की आवश्यकता होती है, साथ ही यह एक सांख्यिकीय वर्गीकरण एल्गोरिथ्म को प्रशिक्षण नमूनों के लिए ओवरफिट करने और नए नमूनों के लिए खराब सामान्यीकरण का कारण बन सकता है। पर्याप्त सटीकता के साथ डेटा का वर्णन करते हुए इन समस्याओं को हल करने के लिए चर के संयोजन के निर्माण के तरीकों के लिए फीचर निष्कर्षण एक सामान्य शब्द है। कई मशीन लर्निंग व्यवसायी मानते हैं कि प्रभावी मॉडल निर्माण की कुंजी ठीक से अनुकूलित सुविधा निष्कर्षण है।[3] आम तौर पर एक विशेषज्ञ द्वारा निर्मित एप्लिकेशन-निर्भर सुविधाओं के निर्मित सेटों का उपयोग करके परिणामों में सुधार किया जा सकता है। ऐसी ही एक प्रक्रिया को फीचर इंजीनियरिंग कहा जाता है। वैकल्पिक रूप से, अरैखिक आयामीता में कमी तकनीकों का उपयोग किया जाता है जैसे:
- स्वतंत्र घटक विश्लेषण
- आइसोमैप
- कर्नेल पीसीए
- अव्यक्त शब्दार्थ विश्लेषण
- आंशिक न्यूनतम वर्ग
- प्रमुख कंपोनेंट विश्लेषण
- मल्टीफैक्टर आयामीता में कमी
- गैर रेखीय आयामीता में कमी
- अर्ध निश्चित एम्बेडिंग
- ऑटो ऑटोएन्कोडर
इमेज प्रोसेसिंग
अनुप्रयोग का एक बहुत महत्वपूर्ण क्षेत्र इमेज प्रोसेसिंग है, जिसमें एल्गोरिदम का उपयोग डिजीटल छवि या विडियो स्ट्रीम के विभिन्न वांछित भागों या आकृतियों (विशेषताओं) का पता लगाने और अलग करने के लिए किया जाता है। ऑप्टिकल कैरेक्टर मान्यता के क्षेत्र में यह विशेष रूप से महत्वपूर्ण है।
कार्यान्वयन
कई सांख्यिकीय पैकेज पैकेजों की सूची सुविधा निष्कर्षण और आयाम में कमी प्रदान करती है। MATLAB, SciLab, NumPy, scikit-learn और R (प्रोग्रामिंग लैंग्वेज) जैसे सामान्य संख्यात्मक प्रोग्रामिंग वातावरण बिल्ट-इन कमांड के माध्यम से कुछ सरल सुविधा निष्कर्षण तकनीक (जैसे प्रमुख घटक विश्लेषण) प्रदान करते हैं। अधिक विशिष्ट एल्गोरिदम अक्सर सार्वजनिक रूप से उपलब्ध स्क्रिप्ट या तृतीय-पक्ष ऐड-ऑन के रूप में उपलब्ध होते हैं। विशिष्ट सॉफ़्टवेयर मशीन लर्निंग अनुप्रयोगों को लक्षित करने वाले सॉफ़्टवेयर पैकेज भी हैं जो सुविधा निष्कर्षण में विशेषज्ञ हैं।[4]
यह भी देखें
- क्लस्टर विश्लेषण
- आयामीता में कमी
- फ़ीचर डिटेक्शन (कंप्यूटर विज़न)
- फीचर चयन
- डेटा खनन
- कनेक्टेड-कंपोनेंट लेबलिंग
- विभाजन (इमेज प्रोसेसिंग)
- अंतरिक्ष मानचित्रण
- गतिशील बनावट
- रेडियोमिक्स
संदर्भ
- ↑ Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (September 2020). "Optimization of data-driven filterbank for automatic speaker verification". Digital Signal Processing. 104: 102795. arXiv:2007.10729. doi:10.1016/j.dsp.2020.102795. S2CID 220665533.
- ↑ Alpaydin, Ethem (2010). मशीन लर्निंग का परिचय. London: The MIT Press. p. 110. ISBN 978-0-262-01243-0. Retrieved 4 February 2017.
- ↑ "यह सभी सुविधाओं के बारे में है". Reality AI Blog. September 2017.
- ↑ See, for example, https://reality.ai/
This article needs additional citations for verification. (January 2016) (Learn how and when to remove this template message) |
Rustum, Rabee, Adebayo Adeloye, and Aurore Simala. "Kohonen self-organising map (KSOM) extracted features for enhancing MLP-ANN prediction models of BOD5." In International Symposium: Quantification and Reduction of Predictive Uncertainty for Sustainable Water Resources Management-24th General Assembly of the International Union of Geodesy and Geophysics (IUGG), pp. 181-187. 2007.