स्वचालित मशीन लर्निंग: Difference between revisions
(Created page with "{{Short description|Process of automating the application of machine learning}} {{Machine learning|Problems}} स्वचालित यंत्र अधिगम (...") |
No edit summary |
||
Line 2: | Line 2: | ||
{{Machine learning|Problems}} | {{Machine learning|Problems}} | ||
स्वचालित [[ यंत्र अधिगम ]] (ऑटोएमएल) मशीन लर्निंग को | '''स्वचालित [[ यंत्र अधिगम |मशीन लर्निंग]]''' (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर लागू करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के रूप में प्रस्तावित किया गया था। <ref name="autoweka1">{{cite conference|year=2013|title=Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms|url=https://dl.acm.org/citation.cfm?id=2487629|conference=KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining|pages=847–855|vauthors=Thornton C, Hutter F, Hoos HH, Leyton-Brown K}}</ref><ref name="AutoML2014ICML"/> ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का उपयोग करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त रूप से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में [[हाइपरपैरामीटर अनुकूलन|हाइपरपैरामीटर ऑप्टिमाइजेशन]], [[ मेटा-लर्निंग (कंप्यूटर विज्ञान) |मेटा-लर्निंग (कंप्यूटर विज्ञान)]] और [[ तंत्रिका वास्तुकला खोज |न्यूरल आर्किटेक्चर सर्च]] इनक्लूडेड हैं। | ||
== | == स्टैण्डर्ड एप्रोच से कम्पेरिज़न == | ||
एक | एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए उपयोग किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा '''उस रूप में नहीं हो स'''कता है जिस पर सभी एल्गोरिदम लागू किए जा सकें। डेटा को मशीन लर्निंग के लिए उपयुक्त बनाने के लिए, एक एक्सपर्ट्स को उचित [[डेटा प्री-प्रोसेसिंग]], [[ फ़ीचर इंजीनियरिंग ]], फीचर निष्कर्षण और [[फीचर चयन]] विधियों को लागू करना पड़ सकता है। इन चरणों के बाद, प्रैक्टिशनर्स को अपने मॉडल के पूर्वानुमानित प्रदर्शन को अधिकतम करने के लिए [[एल्गोरिदम चयन]] और हाइपरपैरामीटर अनुकूलन करना होगा। यदि गहन शिक्षण का उपयोग किया जाता है, तो तंत्रिका नेटवर्क की वास्तुकला को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए। | ||
इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर- | इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर-एक्सपर्ट्सों के लिए इन चरणों को सरल बनाना और उनके लिए मशीन लर्निंग तकनीकों का सही और प्रभावी ढंग से उपयोग करना आसान बनाना है। | ||
ऑटोएमएल स्वचालित [[डेटा विज्ञान]] के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी | ऑटोएमएल स्वचालित [[डेटा विज्ञान]] के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी इनक्लूडेड हैं।<ref>{{cite journal |last1=De Bie |first1=Tijl |last2=De Raedt |first2=Luc |last3=Hernández-Orallo |first3=José |last4=Hoos |first4=Holger H. |last5=Smyth |first5=Padhraic |last6=Williams |first6=Christopher K. I. |title=स्वचालित डेटा विज्ञान|journal=Communications of the ACM |date=March 2022 |volume=65 |issue=3 |pages=76–87 |doi=10.1145/3495256|doi-access=free }}</ref> | ||
== | ==ऑटोमेशन के लक्ष्य== | ||
स्वचालित मशीन लर्निंग मशीन लर्निंग | स्वचालित मशीन लर्निंग मशीन लर्निंग प्रोसेस के विभिन्न चरणों को लक्षित कर सकती है।<ref name="AutoML2014ICML">{{Cite web|title=AutoML 2014 @ ICML|vauthors=Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H|work=AutoML 2014 Workshop @ ICML|access-date=2018-03-28|url=http://icml2014.automl.org}}</ref> स्वचालित करने के चरण हैं: | ||
* डेटा | * डेटा रेडी करना और अंतर्ग्रहण (रॉ डेटा और विविध प्रारूपों से) | ||
** कॉलम [[सांख्यिकीय डेटा प्रकार]] का पता लगाना; उदाहरण के लिए, बूलियन, असतत संख्यात्मक, सतत संख्यात्मक, या पाठ | ** कॉलम [[सांख्यिकीय डेटा प्रकार]] का पता लगाना; उदाहरण के लिए, बूलियन, असतत संख्यात्मक, सतत संख्यात्मक, या पाठ | ||
** कॉलम आशय का पता लगाना; उदाहरण के लिए, लक्ष्य/लेबल, स्तरीकृत नमूनाकरण फ़ील्ड, संख्यात्मक सुविधा, श्रेणीबद्ध पाठ सुविधा, या मुफ़्त पाठ सुविधा | ** कॉलम आशय का पता लगाना; उदाहरण के लिए, लक्ष्य/लेबल, स्तरीकृत नमूनाकरण फ़ील्ड, संख्यात्मक सुविधा, श्रेणीबद्ध पाठ सुविधा, या मुफ़्त पाठ सुविधा | ||
Line 23: | Line 23: | ||
** मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और [[ सीखने का स्थानांतरण ]] | ** मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और [[ सीखने का स्थानांतरण ]] | ||
** विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना | ** विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना | ||
* [[मॉडल चयन]] - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन | * [[मॉडल चयन]] - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन इनक्लूडेड होते हैं | ||
* सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की | * सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की कम्पेरिज़न में बेहतर परिणाम देता है<ref>{{cite arXiv|last1=Erickson|first1=Nick|last2=Mueller|first2=Jonas|last3=Shirkov|first3=Alexander|last4=Zhang|first4=Hang|last5=Larroy|first5=Pedro|last6=Li|first6=Mu|last7=Smola|first7=Alexander|date=2020-03-13|title=AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data|class=stat.ML|eprint=2003.06505}}</ref> | ||
* लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन | * लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन | ||
* समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन | * समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन | ||
* मूल्यांकन मेट्रिक्स और सत्यापन | * मूल्यांकन मेट्रिक्स और सत्यापन प्रोसेसओं का चयन | ||
* समस्या की जाँच | * समस्या की जाँच | ||
** [[रिसाव (मशीन लर्निंग)]] का पता लगाना | ** [[रिसाव (मशीन लर्निंग)]] का पता लगाना |
Revision as of 12:50, 9 August 2023
Part of a series on |
Machine learning and data mining |
---|
स्वचालित मशीन लर्निंग (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर लागू करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के रूप में प्रस्तावित किया गया था। [1][2] ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का उपयोग करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त रूप से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में हाइपरपैरामीटर ऑप्टिमाइजेशन, मेटा-लर्निंग (कंप्यूटर विज्ञान) और न्यूरल आर्किटेक्चर सर्च इनक्लूडेड हैं।
स्टैण्डर्ड एप्रोच से कम्पेरिज़न
एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए उपयोग किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा उस रूप में नहीं हो सकता है जिस पर सभी एल्गोरिदम लागू किए जा सकें। डेटा को मशीन लर्निंग के लिए उपयुक्त बनाने के लिए, एक एक्सपर्ट्स को उचित डेटा प्री-प्रोसेसिंग, फ़ीचर इंजीनियरिंग , फीचर निष्कर्षण और फीचर चयन विधियों को लागू करना पड़ सकता है। इन चरणों के बाद, प्रैक्टिशनर्स को अपने मॉडल के पूर्वानुमानित प्रदर्शन को अधिकतम करने के लिए एल्गोरिदम चयन और हाइपरपैरामीटर अनुकूलन करना होगा। यदि गहन शिक्षण का उपयोग किया जाता है, तो तंत्रिका नेटवर्क की वास्तुकला को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए।
इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर-एक्सपर्ट्सों के लिए इन चरणों को सरल बनाना और उनके लिए मशीन लर्निंग तकनीकों का सही और प्रभावी ढंग से उपयोग करना आसान बनाना है।
ऑटोएमएल स्वचालित डेटा विज्ञान के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी इनक्लूडेड हैं।[3]
ऑटोमेशन के लक्ष्य
स्वचालित मशीन लर्निंग मशीन लर्निंग प्रोसेस के विभिन्न चरणों को लक्षित कर सकती है।[2] स्वचालित करने के चरण हैं:
- डेटा रेडी करना और अंतर्ग्रहण (रॉ डेटा और विविध प्रारूपों से)
- कॉलम सांख्यिकीय डेटा प्रकार का पता लगाना; उदाहरण के लिए, बूलियन, असतत संख्यात्मक, सतत संख्यात्मक, या पाठ
- कॉलम आशय का पता लगाना; उदाहरण के लिए, लक्ष्य/लेबल, स्तरीकृत नमूनाकरण फ़ील्ड, संख्यात्मक सुविधा, श्रेणीबद्ध पाठ सुविधा, या मुफ़्त पाठ सुविधा
- कार्य का पता लगाना; उदाहरण के लिए, बाइनरी वर्गीकरण, प्रतिगमन विश्लेषण, क्लस्टर विश्लेषण, या रैंक करना सीखना
- फ़ीचर इंजीनियरिंग
- फीचर चयन
- सुविधा निकालना
- मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और सीखने का स्थानांतरण
- विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना
- मॉडल चयन - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन इनक्लूडेड होते हैं
- सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की कम्पेरिज़न में बेहतर परिणाम देता है[4]
- लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन
- समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन
- मूल्यांकन मेट्रिक्स और सत्यापन प्रोसेसओं का चयन
- समस्या की जाँच
- रिसाव (मशीन लर्निंग) का पता लगाना
- गलत कॉन्फ़िगरेशन का पता लगाना
- प्राप्त परिणामों का विश्लेषण
- यूजर इंटरफेस और विज़ुअलाइज़ेशन बनाना
यह भी देखें
- तंत्रिका वास्तुकला खोज
- तंत्रिका विकास
- स्व ट्यूनिंग
- न्यूरल नेटवर्क इंटेलिजेंस
- ऑटोएआई
- मॉडलऑप्स
संदर्भ
- ↑ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
- ↑ 2.0 2.1 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.
- ↑ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "स्वचालित डेटा विज्ञान". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
- ↑ Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].
अग्रिम पठन
- "Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI". Bizety. 2020-06-16.
- Ferreira, Luís, et al. "A comparison of AutoML tools for machine learning, deep learning and XGBoost." 2021 International Joint Conference on Neural Networks (IJCNN). IEEE, 2021. https://repositorium.sdum.uminho.pt/bitstream/1822/74125/1/automl_ijcnn.pdf