स्वचालित मशीन लर्निंग: Difference between revisions
No edit summary |
(text) |
||
Line 2: | Line 2: | ||
{{Machine learning|Problems}} | {{Machine learning|Problems}} | ||
''' | '''ऑटोमेटेड [[ यंत्र अधिगम |मशीन लर्निंग]]''' (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर अप्लाई करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के फॉर्म में प्रस्तावित किया गया था। <ref name="autoweka1">{{cite conference|year=2013|title=Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms|url=https://dl.acm.org/citation.cfm?id=2487629|conference=KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining|pages=847–855|vauthors=Thornton C, Hutter F, Hoos HH, Leyton-Brown K}}</ref><ref name="AutoML2014ICML"/> ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का यूज़ करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त फॉर्म से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में [[हाइपरपैरामीटर अनुकूलन|हाइपरपैरामीटर ऑप्टिमाइजेशन]], [[ मेटा-लर्निंग (कंप्यूटर विज्ञान) |मेटा-लर्निंग (कंप्यूटर विज्ञान)]] और [[ तंत्रिका वास्तुकला खोज |न्यूरल आर्किटेक्चर सर्च]] इनक्लूडेड हैं। | ||
== स्टैण्डर्ड एप्रोच से कम्पेरिज़न == | == स्टैण्डर्ड एप्रोच से कम्पेरिज़न == | ||
एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए | एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए यूज़ किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा उस फॉर्म में नहीं हो सकता है जिस पर सभी एल्गोरिदम अप्लाई किए जा सकें। डेटा को मशीन लर्निंग के लिए एप्रोप्रियेट बनाने के लिए, एक एक्सपर्ट्स को उचित [[डेटा प्री-प्रोसेसिंग]], [[ फ़ीचर इंजीनियरिंग |फ़ीचर इंजीनियरिंग]], फीचर एक्सट्रैक्शन और [[फीचर चयन|फीचर सेलेक्शन]] मेथड को अप्लाई करना पड़ सकता है। इन स्टेप्स के बाद, प्रैक्टिशनर्स को अपने मॉडल के प्रेडिक्टिव परफॉरमेंस को मक्सिमाइज़ करने के लिए [[एल्गोरिदम चयन|एल्गोरिदम सेलेक्शन]] और हाइपरपैरामीटर ऑप्टिमाइजेशन करना होगा। यदि डीप लर्निंग का यूज़ किया जाता है, तो न्यूरल नेटवर्क की आर्किटेक्चर को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए। | ||
इनमें से प्रत्येक | इनमें से प्रत्येक स्टेप चैलेंजिंग हो सकता है, जिसके परिणामस्वफॉर्म मशीन लर्निंग का यूज़ करने में सिग्नीफिकेंट हर्डल आ सकती हैं। ऑटोएमएल का ऐम नॉन-एक्सपर्ट्स के लिए इन स्टेप्स को सिम्प्लीफाई करना और उनके लिए मशीन लर्निंग तकनीकों का करेक्टली और एफ्फेक्टिवेली यूज़ करना इजी बनाना है। | ||
ऑटोएमएल | ऑटोएमएल ऑटोमॅटींग [[डेटा विज्ञान]] के ब्रॉडर दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा एक्सप्लोरेशन और मॉडल इंटरप्रिटेशन जैसे चैलेंजिंग कार्य भी इनक्लूडेड हैं। <ref>{{cite journal |last1=De Bie |first1=Tijl |last2=De Raedt |first2=Luc |last3=Hernández-Orallo |first3=José |last4=Hoos |first4=Holger H. |last5=Smyth |first5=Padhraic |last6=Williams |first6=Christopher K. I. |title=स्वचालित डेटा विज्ञान|journal=Communications of the ACM |date=March 2022 |volume=65 |issue=3 |pages=76–87 |doi=10.1145/3495256|doi-access=free }}</ref> | ||
==ऑटोमेशन के | ==ऑटोमेशन के टारगेट== | ||
ऑटोमेटेड मशीन लर्निंग मशीन लर्निंग प्रोसेस के वेरियस स्टेजेस को लक्षित कर सकती है। <ref name="AutoML2014ICML">{{Cite web|title=AutoML 2014 @ ICML|vauthors=Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H|work=AutoML 2014 Workshop @ ICML|access-date=2018-03-28|url=http://icml2014.automl.org}}</ref> ऑटोमेटेड करने के स्टेप हैं: | |||
* डेटा | * डेटा प्रिपरेशन और इन्जेसशन (रॉ डेटा और मिसलेनियस फॉर्मेट्स से) | ||
** कॉलम [[सांख्यिकीय डेटा प्रकार]] का | ** कॉलम [[सांख्यिकीय डेटा प्रकार|स्टैटिस्टिकल डाटा टाइप्स]] का डिटेक्शन; उदाहरण के लिए, बूलियन, डिस्क्रीट न्यूमेरिकल, कंटीन्यूअस न्यूमेरिकल, या टेक्स्ट | ||
** कॉलम | ** कॉलम इंटेंट डिटेक्शन; उदाहरण के लिए, टारगेट/लेबल, स्ट्रैटिफिकेशन फील्ड, न्यूमेरिकल फीचर, कैटेगोरिकल टेक्स्ट फीचर, या फ्री टेक्स्ट फीचर | ||
** | ** टास्क डिटेक्शन; उदाहरण के लिए, बाइनरी क्लासिफिकेशन, [[प्रतिगमन विश्लेषण|रिग्रेशन]], [[क्लस्टर विश्लेषण|क्लस्टरिंग]], या [[रैंक करना सीखना|रैंकिंग]] | ||
* फ़ीचर इंजीनियरिंग | * फ़ीचर इंजीनियरिंग | ||
** फीचर | ** फीचर सेलेक्शन | ||
** | ** फीचर एक्सट्रैक्शन | ||
** | ** मेटा-लर्निंग और [[ सीखने का स्थानांतरण |ट्रांसफर लर्निंग]] | ||
** | ** यूड डेटा और/या मिसिंग वैल्यू का डिटेक्शन और हैंडलिंग | ||
* [[मॉडल चयन]] - यह | * [[मॉडल चयन|मॉडल सेलेक्शन]] - यह चूज़ करना कि किस मशीन लर्निंग एल्गोरिदम का यूज़ करना है, जिसमें प्रायः कई कम्पीटिन्ग सॉफ्टवेयर इम्प्लीमेंटेशन इनक्लूडेड होते हैं | ||
* | * एनसेम्ब्लिंग - कन्सेंसस का एक फॉर्म जहां कई मॉडलों का यूज़ प्रायः किसी एक मॉडल की कम्पेरिज़न में बेहतर रिजल्ट देता है <ref>{{cite arXiv|last1=Erickson|first1=Nick|last2=Mueller|first2=Jonas|last3=Shirkov|first3=Alexander|last4=Zhang|first4=Hang|last5=Larroy|first5=Pedro|last6=Li|first6=Mu|last7=Smola|first7=Alexander|date=2020-03-13|title=AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data|class=stat.ML|eprint=2003.06505}}</ref> | ||
* लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर | * लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर ऑप्टिमाइजेशन | ||
* | * टाइम, मेमोरी, एंड कम्प्लेक्सिटी कंस्ट्रेंट्स | ||
* | * इवैल्यूएशन मेट्रिक्स और वेलिडेशन प्रोसीड्यूर का सेलेक्शन | ||
* | * प्रॉब्लम चेकिंग | ||
** [[रिसाव (मशीन लर्निंग)]] | ** [[रिसाव (मशीन लर्निंग)|लीकेज (मशीन लर्निंग)]] डिटेक्शन | ||
** | ** मिसकॉन्फ़िगरेशन डिटेक्शन | ||
* | * औबटेन्ड रिजल्ट्स एनालिसिस | ||
* यूजर इंटरफेस और विज़ुअलाइज़ेशन | * यूजर इंटरफेस और विज़ुअलाइज़ेशन क्रिएट करना | ||
==यह भी देखें== | ==यह भी देखें== | ||
* | * न्यूरल आर्किटेक्चर सर्च | ||
* [[तंत्रिका विकास]] | * [[तंत्रिका विकास|न्यूरल डेवलपमेंट]] | ||
* [[स्व ट्यूनिंग]] | * [[स्व ट्यूनिंग|सेल्फ ट्यूनिंग]] | ||
* [[न्यूरल नेटवर्क इंटेलिजेंस]] | * [[न्यूरल नेटवर्क इंटेलिजेंस]] | ||
* [[ऑटोएआई]] | * [[ऑटोएआई]] |
Revision as of 14:36, 9 August 2023
Part of a series on |
Machine learning and data mining |
---|
ऑटोमेटेड मशीन लर्निंग (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर अप्लाई करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के फॉर्म में प्रस्तावित किया गया था। [1][2] ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का यूज़ करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त फॉर्म से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में हाइपरपैरामीटर ऑप्टिमाइजेशन, मेटा-लर्निंग (कंप्यूटर विज्ञान) और न्यूरल आर्किटेक्चर सर्च इनक्लूडेड हैं।
स्टैण्डर्ड एप्रोच से कम्पेरिज़न
एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए यूज़ किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा उस फॉर्म में नहीं हो सकता है जिस पर सभी एल्गोरिदम अप्लाई किए जा सकें। डेटा को मशीन लर्निंग के लिए एप्रोप्रियेट बनाने के लिए, एक एक्सपर्ट्स को उचित डेटा प्री-प्रोसेसिंग, फ़ीचर इंजीनियरिंग, फीचर एक्सट्रैक्शन और फीचर सेलेक्शन मेथड को अप्लाई करना पड़ सकता है। इन स्टेप्स के बाद, प्रैक्टिशनर्स को अपने मॉडल के प्रेडिक्टिव परफॉरमेंस को मक्सिमाइज़ करने के लिए एल्गोरिदम सेलेक्शन और हाइपरपैरामीटर ऑप्टिमाइजेशन करना होगा। यदि डीप लर्निंग का यूज़ किया जाता है, तो न्यूरल नेटवर्क की आर्किटेक्चर को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए।
इनमें से प्रत्येक स्टेप चैलेंजिंग हो सकता है, जिसके परिणामस्वफॉर्म मशीन लर्निंग का यूज़ करने में सिग्नीफिकेंट हर्डल आ सकती हैं। ऑटोएमएल का ऐम नॉन-एक्सपर्ट्स के लिए इन स्टेप्स को सिम्प्लीफाई करना और उनके लिए मशीन लर्निंग तकनीकों का करेक्टली और एफ्फेक्टिवेली यूज़ करना इजी बनाना है।
ऑटोएमएल ऑटोमॅटींग डेटा विज्ञान के ब्रॉडर दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा एक्सप्लोरेशन और मॉडल इंटरप्रिटेशन जैसे चैलेंजिंग कार्य भी इनक्लूडेड हैं। [3]
ऑटोमेशन के टारगेट
ऑटोमेटेड मशीन लर्निंग मशीन लर्निंग प्रोसेस के वेरियस स्टेजेस को लक्षित कर सकती है। [2] ऑटोमेटेड करने के स्टेप हैं:
- डेटा प्रिपरेशन और इन्जेसशन (रॉ डेटा और मिसलेनियस फॉर्मेट्स से)
- कॉलम स्टैटिस्टिकल डाटा टाइप्स का डिटेक्शन; उदाहरण के लिए, बूलियन, डिस्क्रीट न्यूमेरिकल, कंटीन्यूअस न्यूमेरिकल, या टेक्स्ट
- कॉलम इंटेंट डिटेक्शन; उदाहरण के लिए, टारगेट/लेबल, स्ट्रैटिफिकेशन फील्ड, न्यूमेरिकल फीचर, कैटेगोरिकल टेक्स्ट फीचर, या फ्री टेक्स्ट फीचर
- टास्क डिटेक्शन; उदाहरण के लिए, बाइनरी क्लासिफिकेशन, रिग्रेशन, क्लस्टरिंग, या रैंकिंग
- फ़ीचर इंजीनियरिंग
- फीचर सेलेक्शन
- फीचर एक्सट्रैक्शन
- मेटा-लर्निंग और ट्रांसफर लर्निंग
- यूड डेटा और/या मिसिंग वैल्यू का डिटेक्शन और हैंडलिंग
- मॉडल सेलेक्शन - यह चूज़ करना कि किस मशीन लर्निंग एल्गोरिदम का यूज़ करना है, जिसमें प्रायः कई कम्पीटिन्ग सॉफ्टवेयर इम्प्लीमेंटेशन इनक्लूडेड होते हैं
- एनसेम्ब्लिंग - कन्सेंसस का एक फॉर्म जहां कई मॉडलों का यूज़ प्रायः किसी एक मॉडल की कम्पेरिज़न में बेहतर रिजल्ट देता है [4]
- लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर ऑप्टिमाइजेशन
- टाइम, मेमोरी, एंड कम्प्लेक्सिटी कंस्ट्रेंट्स
- इवैल्यूएशन मेट्रिक्स और वेलिडेशन प्रोसीड्यूर का सेलेक्शन
- प्रॉब्लम चेकिंग
- लीकेज (मशीन लर्निंग) डिटेक्शन
- मिसकॉन्फ़िगरेशन डिटेक्शन
- औबटेन्ड रिजल्ट्स एनालिसिस
- यूजर इंटरफेस और विज़ुअलाइज़ेशन क्रिएट करना
यह भी देखें
- न्यूरल आर्किटेक्चर सर्च
- न्यूरल डेवलपमेंट
- सेल्फ ट्यूनिंग
- न्यूरल नेटवर्क इंटेलिजेंस
- ऑटोएआई
- मॉडलऑप्स
संदर्भ
- ↑ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
- ↑ 2.0 2.1 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.
- ↑ De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "स्वचालित डेटा विज्ञान". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
- ↑ Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].
अग्रिम पठन
- "Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI". Bizety. 2020-06-16.
- Ferreira, Luís, et al. "A comparison of AutoML tools for machine learning, deep learning and XGBoost." 2021 International Joint Conference on Neural Networks (IJCNN). IEEE, 2021. https://repositorium.sdum.uminho.pt/bitstream/1822/74125/1/automl_ijcnn.pdf