विशेषता निकर्ष (फ़ीचर एक्सट्रैक्शन)

From Vigyanwiki
Revision as of 23:35, 8 June 2023 by alpha>Indicwiki (Created page with "{{Short description|Defining attributes of data useful for analysis}} यंत्र अधिगम , पैटर्न मान्यता और मूर...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

यंत्र अधिगम , पैटर्न मान्यता और मूर्ति प्रोद्योगिकी में, फीचर एक्सट्रैक्शन मापे गए डेटा के शुरुआती सेट से शुरू होता है और व्युत्पन्न मूल्यों (फ़ीचर (मशीन लर्निंग) ) का निर्माण करता है, जिसका उद्देश्य सूचनात्मक और गैर-निरर्थक होना है, जो बाद के सीखने और सामान्यीकरण के चरणों को सुविधाजनक बनाता है, और कुछ मामलों में बेहतर मानवीय व्याख्याओं के लिए अग्रणी। फ़ीचर निष्कर्षण आयामीता में कमी से संबंधित है।[1] जब कलन विधि में इनपुट डेटा संसाधित होने के लिए बहुत बड़ा होता है और यह अनावश्यक होने का संदेह होता है (उदाहरण के लिए दोनों पैरों और मीटरों में समान माप, या रास्टर छवियों के रूप में प्रस्तुत छवियों की पुनरावृत्ति), तो इसे कम में परिवर्तित किया जा सकता है फीचर का सेट (मशीन लर्निंग) (जिसे फीचर वेक्टर भी कहा जाता है)। प्रारंभिक सुविधाओं के एक सबसेट का निर्धारण करना फीचर चयन कहलाता है।[2] चयनित सुविधाओं में इनपुट डेटा से प्रासंगिक जानकारी शामिल होने की उम्मीद है, ताकि पूर्ण प्रारंभिक डेटा के बजाय इस कम किए गए प्रतिनिधित्व का उपयोग करके वांछित कार्य किया जा सके।

सामान्य

फीचर एक्सट्रैक्शन में डेटा के एक बड़े सेट का वर्णन करने के लिए आवश्यक संसाधनों की संख्या को कम करना शामिल है। जटिल डेटा का विश्लेषण करते समय प्रमुख समस्याओं में से एक शामिल चरों की संख्या से उत्पन्न होती है। बड़ी संख्या में चर के साथ विश्लेषण के लिए आम तौर पर बड़ी मात्रा में स्मृति और गणना शक्ति की आवश्यकता होती है, साथ ही यह एक सांख्यिकीय वर्गीकरण एल्गोरिथ्म को प्रशिक्षण नमूनों के लिए ओवरफिट करने और नए नमूनों के लिए खराब सामान्यीकरण का कारण बन सकता है। पर्याप्त सटीकता के साथ डेटा का वर्णन करते हुए इन समस्याओं को हल करने के लिए चर के संयोजन के निर्माण के तरीकों के लिए फीचर निष्कर्षण एक सामान्य शब्द है। कई मशीन लर्निंग व्यवसायी मानते हैं कि प्रभावी मॉडल निर्माण की कुंजी ठीक से अनुकूलित सुविधा निष्कर्षण है।[3] आम तौर पर एक विशेषज्ञ द्वारा निर्मित एप्लिकेशन-निर्भर सुविधाओं के निर्मित सेटों का उपयोग करके परिणामों में सुधार किया जा सकता है। ऐसी ही एक प्रक्रिया को फीचर इंजीनियरिंग कहा जाता है। वैकल्पिक रूप से, अरैखिक आयामीता में कमी तकनीकों का उपयोग किया जाता है जैसे:

इमेज प्रोसेसिंग

अनुप्रयोग का एक बहुत महत्वपूर्ण क्षेत्र इमेज प्रोसेसिंग है, जिसमें एल्गोरिदम का उपयोग डिजीटल छवि या विडियो स्ट्रीम के विभिन्न वांछित भागों या आकृतियों (विशेषताओं) का पता लगाने और अलग करने के लिए किया जाता है। ऑप्टिकल कैरेक्टर मान्यता के क्षेत्र में यह विशेष रूप से महत्वपूर्ण है।


कार्यान्वयन

कई सांख्यिकीय पैकेज पैकेजों की सूची सुविधा निष्कर्षण और आयाम में कमी प्रदान करती है। MATLAB, SciLab, NumPy, scikit-learn और R (प्रोग्रामिंग लैंग्वेज) जैसे सामान्य संख्यात्मक प्रोग्रामिंग वातावरण बिल्ट-इन कमांड के माध्यम से कुछ सरल सुविधा निष्कर्षण तकनीक (जैसे प्रमुख घटक विश्लेषण) प्रदान करते हैं। अधिक विशिष्ट एल्गोरिदम अक्सर सार्वजनिक रूप से उपलब्ध स्क्रिप्ट या तृतीय-पक्ष ऐड-ऑन के रूप में उपलब्ध होते हैं। विशिष्ट सॉफ़्टवेयर मशीन लर्निंग अनुप्रयोगों को लक्षित करने वाले सॉफ़्टवेयर पैकेज भी हैं जो सुविधा निष्कर्षण में विशेषज्ञ हैं।[4]


यह भी देखें

संदर्भ

  1. Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (September 2020). "Optimization of data-driven filterbank for automatic speaker verification". Digital Signal Processing. 104: 102795. arXiv:2007.10729. doi:10.1016/j.dsp.2020.102795. S2CID 220665533.
  2. Alpaydin, Ethem (2010). मशीन लर्निंग का परिचय. London: The MIT Press. p. 110. ISBN 978-0-262-01243-0. Retrieved 4 February 2017.
  3. "यह सभी सुविधाओं के बारे में है". Reality AI Blog. September 2017.
  4. See, for example, https://reality.ai/

Rustum, Rabee, Adebayo Adeloye, and Aurore Simala. "Kohonen self-organising map (KSOM) extracted features for enhancing MLP-ANN prediction models of BOD5." In International Symposium: Quantification and Reduction of Predictive Uncertainty for Sustainable Water Resources Management-24th General Assembly of the International Union of Geodesy and Geophysics (IUGG), pp. 181-187. 2007.