स्वचालित मशीन लर्निंग: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Process of automating the application of machine learning}} {{Machine learning|Problems}} स्वचालित यंत्र अधिगम (...")
 
No edit summary
Line 2: Line 2:
{{Machine learning|Problems}}
{{Machine learning|Problems}}


स्वचालित [[ यंत्र अधिगम ]] (ऑटोएमएल) मशीन लर्निंग को वास्तविक दुनिया की समस्याओं पर लागू करने के कार्यों को स्वचालित करने की प्रक्रिया है। ऑटोएमएल में संभावित रूप से कच्चे डेटासेट की शुरुआत से लेकर तैनाती के लिए तैयार मशीन लर्निंग मॉडल के निर्माण तक हर चरण शामिल है। मशीन लर्निंग को लागू करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक कृत्रिम बुद्धिमत्ता-आधारित समाधान के रूप में प्रस्तावित किया गया था।<ref name="autoweka1">{{cite conference|year=2013|title=Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms|url=https://dl.acm.org/citation.cfm?id=2487629|conference=KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining|pages=847–855|vauthors=Thornton C, Hutter F, Hoos HH, Leyton-Brown K}}</ref><ref name="AutoML2014ICML"/>ऑटोएमएल में स्वचालन की उच्च डिग्री का उद्देश्य गैर-विशेषज्ञों को मशीन लर्निंग में विशेषज्ञ बनने की आवश्यकता के बिना मशीन लर्निंग मॉडल और तकनीकों का उपयोग करने की अनुमति देना है। मशीन लर्निंग को एंड-टू-एंड लागू करने की प्रक्रिया को स्वचालित करने से अतिरिक्त रूप से सरल समाधान, उन समाधानों के तेज़ निर्माण और मॉडल का लाभ मिलता है जो अक्सर हाथ से डिज़ाइन किए गए मॉडल से बेहतर प्रदर्शन करते हैं।{{citation needed|date=September 2022}}. ऑटोएमएल में उपयोग की जाने वाली सामान्य तकनीकों में [[हाइपरपैरामीटर अनुकूलन]], [[ मेटा-लर्निंग (कंप्यूटर विज्ञान) ]]|मेटा-लर्निंग और [[ तंत्रिका वास्तुकला खोज ]] शामिल हैं।
'''स्वचालित [[ यंत्र अधिगम |मशीन लर्निंग]]''' (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर लागू करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के रूप में प्रस्तावित किया गया था। <ref name="autoweka1">{{cite conference|year=2013|title=Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms|url=https://dl.acm.org/citation.cfm?id=2487629|conference=KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining|pages=847–855|vauthors=Thornton C, Hutter F, Hoos HH, Leyton-Brown K}}</ref><ref name="AutoML2014ICML"/> ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का उपयोग करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त रूप से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में [[हाइपरपैरामीटर अनुकूलन|हाइपरपैरामीटर ऑप्टिमाइजेशन]], [[ मेटा-लर्निंग (कंप्यूटर विज्ञान) |मेटा-लर्निंग (कंप्यूटर विज्ञान)]] और [[ तंत्रिका वास्तुकला खोज |न्यूरल आर्किटेक्चर सर्च]] इनक्लूडेड हैं।


== मानक दृष्टिकोण से तुलना ==
== स्टैण्डर्ड एप्रोच से कम्पेरिज़न ==
एक विशिष्ट मशीन लर्निंग एप्लिकेशन में, चिकित्सकों के पास प्रशिक्षण के लिए उपयोग किए जाने वाले इनपुट डेटा बिंदुओं का एक सेट होता है। कच्चा डेटा उस रूप में नहीं हो सकता है जिस पर सभी एल्गोरिदम लागू किए जा सकें। डेटा को मशीन लर्निंग के लिए उपयुक्त बनाने के लिए, एक विशेषज्ञ को उचित [[डेटा प्री-प्रोसेसिंग]], [[ फ़ीचर इंजीनियरिंग ]], फीचर निष्कर्षण और [[फीचर चयन]] विधियों को लागू करना पड़ सकता है। इन चरणों के बाद, चिकित्सकों को अपने मॉडल के पूर्वानुमानित प्रदर्शन को अधिकतम करने के लिए [[एल्गोरिदम चयन]] और हाइपरपैरामीटर अनुकूलन करना होगा। यदि गहन शिक्षण का उपयोग किया जाता है, तो तंत्रिका नेटवर्क की वास्तुकला को भी मशीन लर्निंग विशेषज्ञ द्वारा चुना जाना चाहिए।
एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए उपयोग किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा '''उस रूप में नहीं हो स'''कता है जिस पर सभी एल्गोरिदम लागू किए जा सकें। डेटा को मशीन लर्निंग के लिए उपयुक्त बनाने के लिए, एक एक्सपर्ट्स को उचित [[डेटा प्री-प्रोसेसिंग]], [[ फ़ीचर इंजीनियरिंग ]], फीचर निष्कर्षण और [[फीचर चयन]] विधियों को लागू करना पड़ सकता है। इन चरणों के बाद, प्रैक्टिशनर्स को अपने मॉडल के पूर्वानुमानित प्रदर्शन को अधिकतम करने के लिए [[एल्गोरिदम चयन]] और हाइपरपैरामीटर अनुकूलन करना होगा। यदि गहन शिक्षण का उपयोग किया जाता है, तो तंत्रिका नेटवर्क की वास्तुकला को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए।


इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर-विशेषज्ञों के लिए इन चरणों को सरल बनाना और उनके लिए मशीन लर्निंग तकनीकों का सही और प्रभावी ढंग से उपयोग करना आसान बनाना है।
इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर-एक्सपर्ट्सों के लिए इन चरणों को सरल बनाना और उनके लिए मशीन लर्निंग तकनीकों का सही और प्रभावी ढंग से उपयोग करना आसान बनाना है।


ऑटोएमएल स्वचालित [[डेटा विज्ञान]] के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी शामिल हैं।<ref>{{cite journal |last1=De Bie |first1=Tijl |last2=De Raedt |first2=Luc |last3=Hernández-Orallo |first3=José |last4=Hoos |first4=Holger H. |last5=Smyth |first5=Padhraic |last6=Williams |first6=Christopher K. I. |title=स्वचालित डेटा विज्ञान|journal=Communications of the ACM |date=March 2022 |volume=65 |issue=3 |pages=76–87 |doi=10.1145/3495256|doi-access=free }}</ref>
ऑटोएमएल स्वचालित [[डेटा विज्ञान]] के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी इनक्लूडेड हैं।<ref>{{cite journal |last1=De Bie |first1=Tijl |last2=De Raedt |first2=Luc |last3=Hernández-Orallo |first3=José |last4=Hoos |first4=Holger H. |last5=Smyth |first5=Padhraic |last6=Williams |first6=Christopher K. I. |title=स्वचालित डेटा विज्ञान|journal=Communications of the ACM |date=March 2022 |volume=65 |issue=3 |pages=76–87 |doi=10.1145/3495256|doi-access=free }}</ref>




==स्वचालन के लक्ष्य==
==ऑटोमेशन के लक्ष्य==
स्वचालित मशीन लर्निंग मशीन लर्निंग प्रक्रिया के विभिन्न चरणों को लक्षित कर सकती है।<ref name="AutoML2014ICML">{{Cite web|title=AutoML 2014 @ ICML|vauthors=Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H|work=AutoML 2014 Workshop @ ICML|access-date=2018-03-28|url=http://icml2014.automl.org}}</ref> स्वचालित करने के चरण हैं:
स्वचालित मशीन लर्निंग मशीन लर्निंग प्रोसेस के विभिन्न चरणों को लक्षित कर सकती है।<ref name="AutoML2014ICML">{{Cite web|title=AutoML 2014 @ ICML|vauthors=Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H|work=AutoML 2014 Workshop @ ICML|access-date=2018-03-28|url=http://icml2014.automl.org}}</ref> स्वचालित करने के चरण हैं:
* डेटा तैयार करना और अंतर्ग्रहण (कच्चे डेटा और विविध प्रारूपों से)
* डेटा रेडी करना और अंतर्ग्रहण (रॉ डेटा और विविध प्रारूपों से)
** कॉलम [[सांख्यिकीय डेटा प्रकार]] का पता लगाना; उदाहरण के लिए, बूलियन, असतत संख्यात्मक, सतत संख्यात्मक, या पाठ
** कॉलम [[सांख्यिकीय डेटा प्रकार]] का पता लगाना; उदाहरण के लिए, बूलियन, असतत संख्यात्मक, सतत संख्यात्मक, या पाठ
** कॉलम आशय का पता लगाना; उदाहरण के लिए, लक्ष्य/लेबल, स्तरीकृत नमूनाकरण फ़ील्ड, संख्यात्मक सुविधा, श्रेणीबद्ध पाठ सुविधा, या मुफ़्त पाठ सुविधा
** कॉलम आशय का पता लगाना; उदाहरण के लिए, लक्ष्य/लेबल, स्तरीकृत नमूनाकरण फ़ील्ड, संख्यात्मक सुविधा, श्रेणीबद्ध पाठ सुविधा, या मुफ़्त पाठ सुविधा
Line 23: Line 23:
** मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और [[ सीखने का स्थानांतरण ]]
** मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और [[ सीखने का स्थानांतरण ]]
** विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना
** विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना
* [[मॉडल चयन]] - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन शामिल होते हैं
* [[मॉडल चयन]] - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन इनक्लूडेड होते हैं
* सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की तुलना में बेहतर परिणाम देता है<ref>{{cite arXiv|last1=Erickson|first1=Nick|last2=Mueller|first2=Jonas|last3=Shirkov|first3=Alexander|last4=Zhang|first4=Hang|last5=Larroy|first5=Pedro|last6=Li|first6=Mu|last7=Smola|first7=Alexander|date=2020-03-13|title=AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data|class=stat.ML|eprint=2003.06505}}</ref>
* सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की कम्पेरिज़न में बेहतर परिणाम देता है<ref>{{cite arXiv|last1=Erickson|first1=Nick|last2=Mueller|first2=Jonas|last3=Shirkov|first3=Alexander|last4=Zhang|first4=Hang|last5=Larroy|first5=Pedro|last6=Li|first6=Mu|last7=Smola|first7=Alexander|date=2020-03-13|title=AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data|class=stat.ML|eprint=2003.06505}}</ref>
* लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन
* लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन
* समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन
* समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन
* मूल्यांकन मेट्रिक्स और सत्यापन प्रक्रियाओं का चयन
* मूल्यांकन मेट्रिक्स और सत्यापन प्रोसेसओं का चयन
* समस्या की जाँच
* समस्या की जाँच
** [[रिसाव (मशीन लर्निंग)]] का पता लगाना
** [[रिसाव (मशीन लर्निंग)]] का पता लगाना

Revision as of 12:50, 9 August 2023

स्वचालित मशीन लर्निंग (ऑटोएमएल) मशीन लर्निंग को रियल-वर्ल्ड प्रोब्लेम्स पर लागू करने के कार्यों को ऑटोमॅटिंग करने की प्रोसेस है। ऑटोएमएल में पोटेंशिअली रॉ डेटासेट की बिगनिंग से लेकर डिप्लॉयमेंट के लिए रेडी मशीन लर्निंग मॉडल के डेवलपमेंट तक हर स्टेज इनक्लूडेड है। मशीन लर्निंग को अप्लाई करने की बढ़ती चुनौती के लिए ऑटोएमएल को एक आर्टिफीशियल इंटेलिजेंस-बेस्ड सोल्युशन के रूप में प्रस्तावित किया गया था। [1][2] ऑटोएमएल में ऑटोमेशन की हाई डिग्री का एम नॉन-एक्सपर्ट्स को मशीन लर्निंग में एक्सपर्ट्स बनने की रिक्वायरमेंट के बिना मशीन लर्निंग मॉडल और तकनीकों का उपयोग करने की परमिशन देना है। मशीन लर्निंग को एंड-टू-एंड अप्लाई करने की प्रोसेस को ऑटोमैटिंग करने से अतिरिक्त रूप से सिम्पलर सोल्यूशंस, उन सोल्यूशंस के फास्टर क्रिएशन और मॉडल का लाभ मिलता है जो प्रायः हाथ से डिज़ाइन किए गए मॉडल से बेटर परफॉर्म करते हैं। ऑटोएमएल में यूज़ की जाने वाली कॉमन टेक्नीक में हाइपरपैरामीटर ऑप्टिमाइजेशन, मेटा-लर्निंग (कंप्यूटर विज्ञान) और न्यूरल आर्किटेक्चर सर्च इनक्लूडेड हैं।

स्टैण्डर्ड एप्रोच से कम्पेरिज़न

एक टिपिकल मशीन लर्निंग एप्लिकेशन में, प्रैक्टिशनर्स के पास ट्रेनिंग के लिए उपयोग किए जाने वाले इनपुट डेटा पॉइंट्स का एक सेट होता है। रॉ डेटा उस रूप में नहीं हो सकता है जिस पर सभी एल्गोरिदम लागू किए जा सकें। डेटा को मशीन लर्निंग के लिए उपयुक्त बनाने के लिए, एक एक्सपर्ट्स को उचित डेटा प्री-प्रोसेसिंग, फ़ीचर इंजीनियरिंग , फीचर निष्कर्षण और फीचर चयन विधियों को लागू करना पड़ सकता है। इन चरणों के बाद, प्रैक्टिशनर्स को अपने मॉडल के पूर्वानुमानित प्रदर्शन को अधिकतम करने के लिए एल्गोरिदम चयन और हाइपरपैरामीटर अनुकूलन करना होगा। यदि गहन शिक्षण का उपयोग किया जाता है, तो तंत्रिका नेटवर्क की वास्तुकला को भी मशीन लर्निंग एक्सपर्ट्स द्वारा चुना जाना चाहिए।

इनमें से प्रत्येक चरण चुनौतीपूर्ण हो सकता है, जिसके परिणामस्वरूप मशीन लर्निंग का उपयोग करने में महत्वपूर्ण बाधाएँ आ सकती हैं। ऑटोएमएल का लक्ष्य गैर-एक्सपर्ट्सों के लिए इन चरणों को सरल बनाना और उनके लिए मशीन लर्निंग तकनीकों का सही और प्रभावी ढंग से उपयोग करना आसान बनाना है।

ऑटोएमएल स्वचालित डेटा विज्ञान के व्यापक दृष्टिकोण में एक महत्वपूर्ण भूमिका निभाता है, जिसमें डेटा इंजीनियरिंग, डेटा अन्वेषण और मॉडल व्याख्या जैसे चुनौतीपूर्ण कार्य भी इनक्लूडेड हैं।[3]


ऑटोमेशन के लक्ष्य

स्वचालित मशीन लर्निंग मशीन लर्निंग प्रोसेस के विभिन्न चरणों को लक्षित कर सकती है।[2] स्वचालित करने के चरण हैं:

  • डेटा रेडी करना और अंतर्ग्रहण (रॉ डेटा और विविध प्रारूपों से)
  • फ़ीचर इंजीनियरिंग
    • फीचर चयन
    • सुविधा निकालना
    • मेटा-लर्निंग (कंप्यूटर विज्ञान)|मेटा-लर्निंग और सीखने का स्थानांतरण
    • विषम डेटा और/या गुम मूल्यों का पता लगाना और संभालना
  • मॉडल चयन - यह चुनना कि किस मशीन लर्निंग एल्गोरिदम का उपयोग करना है, जिसमें अक्सर कई प्रतिस्पर्धी सॉफ़्टवेयर कार्यान्वयन इनक्लूडेड होते हैं
  • सामूहिक शिक्षण - सर्वसम्मति का एक रूप जहां कई मॉडलों का उपयोग अक्सर किसी एक मॉडल की कम्पेरिज़न में बेहतर परिणाम देता है[4]
  • लर्निंग एल्गोरिदम और फीचराइजेशन का हाइपरपैरामीटर अनुकूलन
  • समय, स्मृति और जटिलता बाधाओं के तहत पाइपलाइन चयन
  • मूल्यांकन मेट्रिक्स और सत्यापन प्रोसेसओं का चयन
  • समस्या की जाँच
  • प्राप्त परिणामों का विश्लेषण
  • यूजर इंटरफेस और विज़ुअलाइज़ेशन बनाना

यह भी देखें

संदर्भ

  1. Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.
  2. 2.0 2.1 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. "AutoML 2014 @ ICML". AutoML 2014 Workshop @ ICML. Retrieved 2018-03-28.
  3. De Bie, Tijl; De Raedt, Luc; Hernández-Orallo, José; Hoos, Holger H.; Smyth, Padhraic; Williams, Christopher K. I. (March 2022). "स्वचालित डेटा विज्ञान". Communications of the ACM. 65 (3): 76–87. doi:10.1145/3495256.
  4. Erickson, Nick; Mueller, Jonas; Shirkov, Alexander; Zhang, Hang; Larroy, Pedro; Li, Mu; Smola, Alexander (2020-03-13). "AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data". arXiv:2003.06505 [stat.ML].


अग्रिम पठन