यंत्र अधिगम नियंत्रण: Difference between revisions
m (Arti Shah moved page मशीन लर्निंग नियंत्रण to यंत्र अधिगम नियंत्रण without leaving a redirect) |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Subfield of machine learning, intelligent control and control theory}} | {{short description|Subfield of machine learning, intelligent control and control theory}} | ||
[[ यंत्र अधिगम ]] कंट्रोल (एमएलसी) मशीन लर्निंग, [[बुद्धिमान नियंत्रण]] और [[नियंत्रण सिद्धांत]] का एक उपक्षेत्र है | [[ यंत्र अधिगम | '''यंत्र अधिगम''']] '''कंट्रोल''' (एमएलसी) मशीन लर्निंग, [[बुद्धिमान नियंत्रण]] और [[नियंत्रण सिद्धांत]] का एक उपक्षेत्र है | ||
जो मशीन लर्निंग | |||
जो मशीन लर्निंग कविधियों ं के साथ [[इष्टतम नियंत्रण]] समस्याओं को हल करता है। | |||
मुख्य अनुप्रयोग जटिल अरेखीय प्रणालियाँ हैं | मुख्य अनुप्रयोग जटिल अरेखीय प्रणालियाँ हैं | ||
जिसके लिए [[रैखिक नियंत्रण सिद्धांत]] विधियाँ लागू नहीं होती हैं। | जिसके लिए [[रैखिक नियंत्रण सिद्धांत]] विधियाँ लागू नहीं होती हैं। |
Revision as of 00:36, 23 September 2023
यंत्र अधिगम कंट्रोल (एमएलसी) मशीन लर्निंग, बुद्धिमान नियंत्रण और नियंत्रण सिद्धांत का एक उपक्षेत्र है
जो मशीन लर्निंग कविधियों ं के साथ इष्टतम नियंत्रण समस्याओं को हल करता है। मुख्य अनुप्रयोग जटिल अरेखीय प्रणालियाँ हैं जिसके लिए रैखिक नियंत्रण सिद्धांत विधियाँ लागू नहीं होती हैं।
समस्याओं एवं कार्यों के प्रकार
आमतौर पर चार तरह की समस्याएं सामने आती हैं।
- नियंत्रण पैरामीटर पहचान: एमएलसी एक पैरामीटर पहचान में तब्दील हो जाती है[1] यदि नियंत्रण कानून की संरचना दी गई है लेकिन पैरामीटर अज्ञात हैं। एक उदाहरण पीआईडी नियंत्रक के गुणांकों को अनुकूलित करने के लिए आनुवंशिक एल्गोरिदम है[2] या असतत-समय इष्टतम नियंत्रण।[3]
- पहली तरह की प्रतिगमन समस्या के रूप में नियंत्रण डिजाइन: एमएलसी सेंसर सिग्नल से एक्चुएशन कमांड तक एक सामान्य नॉनलाइनियर मैपिंग का अनुमान लगाता है, यदि सेंसर सिग्नल और इष्टतम एक्चुएशन कमांड हर राज्य के लिए जाना जाता है। एक उदाहरण ज्ञात पूर्ण राज्य फीडबैक से सेंसर फीडबैक की गणना है। इस कार्य के लिए तंत्रिका नेटवर्क आमतौर पर उपयोग की जाने वाली तकनीक है।[4]
- दूसरे प्रकार की प्रतिगमन समस्या के रूप में नियंत्रण डिज़ाइन: एमएलसी मनमाने ढंग से गैर-रेखीय नियंत्रण कानूनों की भी पहचान कर सकता है जो संयंत्र की लागत फ़ंक्शन को कम करते हैं। इस मामले में, न तो कोई मॉडल, न ही नियंत्रण कानून संरचना, न ही अनुकूलन एक्चुएशन कमांड को जानने की आवश्यकता है। अनुकूलन केवल संयंत्र में मापे गए नियंत्रण प्रदर्शन (लागत फ़ंक्शन) पर आधारित है। आनुवंशिक प्रोग्रामिंग इस उद्देश्य के लिए एक शक्तिशाली प्रतिगमन तकनीक है।[5]
- सुदृढीकरण सीखने का नियंत्रण: सुदृढीकरण सीखने का उपयोग करके मापा प्रदर्शन परिवर्तनों (पुरस्कारों) पर नियंत्रण कानून को लगातार अद्यतन किया जा सकता है।[6]
उदाहरण के लिए, एमएलसी में तंत्रिका नेटवर्क नियंत्रण शामिल है, आनुवंशिक एल्गोरिदम आधारित नियंत्रण, आनुवंशिक प्रोग्रामिंग नियंत्रण, सुदृढीकरण सीखने का नियंत्रण, और अन्य डेटा-संचालित नियंत्रण के साथ पद्धतिगत ओवरलैप है, जैसे कृत्रिम बुद्धिमत्ता और रोबोट नियंत्रण।
अनुप्रयोग
एमएलसी सफलतापूर्वक लागू कर दिया गया है कई अरेखीय नियंत्रण समस्याओं के लिए, अज्ञात और अक्सर अप्रत्याशित सक्रियण तंत्र की खोज करना। उदाहरण अनुप्रयोगों में शामिल हैं
- उपग्रहों का दृष्टिकोण नियंत्रण।[7]
- थर्मल नियंत्रण का निर्माण।[8]
- फीडबैक अशांति नियंत्रण।[2][9]
- दूर से संचालित पानी के भीतर वाहन।[10]
- पीजे फ्लेमिंग और आरसी पर्सहाउस (2002) के समीक्षा लेख में कई और इंजीनियरिंग एमएलसी एप्लिकेशन का सारांश दिया गया है।[11]
जहाँ तक सभी सामान्य अरेखीय विधियों का प्रश्न है, एमएलसी बिना किसी गारंटी के अभिसरण के साथ आता है, विभिन्न परिचालन स्थितियों के लिए इष्टतमता या मजबूती।
संदर्भ
- ↑ Thomas Bäck & Hans-Paul Schwefel (Spring 1993) "An overview of evolutionary algorithms for parameter optimization", Journal of Evolutionary Computation (MIT Press), vol. 1, no. 1, pp. 1-23
- ↑ 2.0 2.1 N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
- ↑ Zbigniew Michalewicz, Cezary Z. Janikow & Jacek B. Krawczyk (July 1992) "A modified genetic algorithm for optimal control problems", [Computers & Mathematics with Applications], vol. 23, no 12, pp. 83-94.
- ↑ C. Lee, J. Kim, D. Babcock & R. Goodman (1997) "Application of neural networks to turbulence control for drag reduction", Physics of Fluids, vol. 6, no. 9, pp. 1740-1747
- ↑ D. C. Dracopoulos & S. Kent (December 1997) "Genetic programming for prediction and control", Neural Computing & Applications (Springer), vol. 6, no. 4, pp. 214-228.
- ↑ Andrew G. Barto (December 1994) "Reinforcement learning control", Current Opinion in Neurobiology, vol. 6, no. 4, pp. 888–893
- ↑ Dimitris. C. Dracopoulos & Antonia. J. Jones (1994) Neuro-genetic adaptive attitude control, Neural Computing & Applications (Springer), vol. 2, no. 4, pp. 183-204.
- ↑ Jonathan A. Wright, Heather A. Loosemore & Raziyeh Farmani (2002) "Optimization of building thermal design and control by multi-criterion genetic algorithm, [Energy and Buildings], vol. 34, no. 9, pp. 959-972.
- ↑ Steven J. Brunton & Bernd R. Noack (2015) Closed-loop turbulence control: Progress and challenges, Applied Mechanics Reviews, vol. 67, no. 5, article 050801, pp. 1-48.
- ↑ J. Javadi-Moghaddam, & A. Bagheri (2010 "An adaptive neuro-fuzzy sliding mode based genetic algorithm control system for under water remotely operated vehicle", Expert Systems with Applications, vol. 37 no. 1, pp. 647-660.
- ↑ Peter J. Fleming, R. C. Purshouse (2002 "Evolutionary algorithms in control systems engineering: a survey" Control Engineering Practice, vol. 10, no. 11, pp. 1223-1241
अग्रिम पठन
- Dimitris C Dracopoulos (August 1997) "Evolutionary Learning Algorithms for Neural Adaptive Control", Springer. ISBN 978-3-540-76161-7.
- Thomas Duriez, Steven L. Brunton & Bernd R. Noack (November 2016) "Machine Learning Control - Taming Nonlinear Dynamics and Turbulence", Springer. ISBN 978-3-319-40624-4.