लर्निंग क्लासिफायर सिस्टम

From Vigyanwiki
एलसीएस नियमों का 2डी विज़ुअलाइज़ेशन एक 3डी फ़ंक्शन का अनुमान लगाना सीख रहा है। प्रत्येक नीला दीर्घवृत्त समाधान स्थान के भाग को कवर करने वाले एक व्यक्तिगत नियम का प्रतिनिधित्व करता है। (एक्ससीएसएफ से ली गई छवियों से अनुकूलित[1] मार्टिन बुट्ज़ की अनुमति से)

लर्निंग क्लासीफायर सिस्टम, जिन्हें एलसीएस के रूप में जाना जाता है, एक नियम-आधारित मशीन लर्निंग विधियों का एक प्रतिमान है जो खोज के घटक जैसे कि सामान्यतः एक जेनेटिक कलन विधि को एक सीखने के घटक (जो सुपरवाइज्ड लर्निंग, रिइंफोर्समेंट लर्निंग, या अनसुपर्वाइज्ड लर्निंग को कर सकता है) के साथ जोड़ता है।

लर्निंग क्लासीफायर सिस्टम उसे पहचानने का प्रयास करते हैं[2][3] जो संदर्भ-विशेष नियमों का एक समूह पहचानते हैं,[4] जो संग्रहीत ज्ञान को एक अंशांतरिक तरीके से रखते हैं और उसका उपयोग पूर्ववर्ती तरीके से करते हैं[5] जिससे पूर्वानुमान जैसे कि व्यवहार मॉडलिंग, वर्गीकरण, डेटा खनन, रिग्रेशन, फंक्शन अनुमान, या रणनीति (गेम थ्योरी) कर सकें।[5] यह दृष्टिकोण जटिल समाधान अंतर्विरामित हो सकते हैं[6] और उन्हें छोटे, सरल भागों में विभाजित करने देता है।

लर्निंग क्लासीफायर सिस्टम के पीछे के मूल सिद्धांत जटिल अनुकूल सिस्टमों को मॉडल करने के प्रयास से आए थे, जिसमें रूल-आधारित एजेंट्स का उपयोग एक कृत्रिम ज्ञान सिस्टम बनाने के लिए किया गया। यह कृत्रिम बुद्धिमत्ता सिस्टम आर्टिफिशियल इंटेलिजेंस का भाग था।

कार्यप्रणाली

किसी दिए गए शिक्षण वर्गीकरण प्रणाली की वास्तुकला और घटक अत्यधिक परिवर्तनशील हो सकते हैं। एलसीएस को एक मशीन के रूप में सोचना उपयोगी है जिसमें कई इंटरैक्टिंग घटक सम्मिलित होते हैं। किसी दिए गए समस्या क्षेत्रों की मांगों के अनुरूप घटकों को जोड़ा या हटाया जा सकता है, या उपस्थित घटकों को संशोधित/विनिमय किया जा सकता है या कलन विधि को कई अलग-अलग समस्या क्षेत्र में कार्य करने के लिए पर्याप्त अनुकूलनीय बनाया जा सकता है। परिणामस्वरूप, एलसीएस प्रतिमान को कई समस्या क्षेत्र पर अनुकूलित ढंग से लागू किया जा सकता है जो यंत्र अधिगम की मांग करते हैं। एलसीएस कार्यान्वयन के मध्य प्रमुख विभाजन इस प्रकार हैं: (1) मिशिगन-शैली वास्तुकला बनाम पिट्सबर्ग-शैली वास्तुकला,[7] (2) सुदृढीकरण शिक्षण बनाम पर्यवेक्षित शिक्षण, (3) वृद्धिशील शिक्षण बनाम बैच शिक्षण, (4) ऑनलाइन मशीन लर्निंग बनाम ऑफ़लाइन शिक्षण, (5) शक्ति-आधारित फिटनेस बनाम सटीकता-आधारित फिटनेस, और (6) पूर्ण एक्शन मैपिंग बनाम सर्वश्रेष्ठ एक्शन मैपिंग। ये विभाजन आवश्यक रूप से परस्पर अनन्य नहीं हैं। उदाहरण के लिए, एक्ससीएस,[8]सबसे प्रसिद्ध और सबसे अच्छा अध्ययन किया गया एलसीएस कलन विधि, मिशिगन-शैली है, इसे सुदृढीकरण सीखने के लिए डिज़ाइन किया गया था, परंतु यह पर्यवेक्षित शिक्षण भी कर सकता है, वृद्धिशील शिक्षण लागू करता है जो ऑनलाइन या ऑफ़लाइन हो सकता है, सटीकता-आधारित योग्यता लागू करता है, और एक पूर्ण प्रक्रिया मानचित्रण उत्पन्न करना चाहता है।.

एक सामान्य एलसीएस कलन विधि के तत्व

पर्यवेक्षित शिक्षण को निष्पादित करने वाले एक सामान्य मिशिगन-शैली सीखने के क्लासिफायर सिस्टम सीखने के चक्र को दर्शाने वाला एक चरण-वार योजनाबद्ध

यह ध्यान में रखते हुए कि एलसीएस एक विशिष्ट विधि के अतिरिक्त आनुवंशिक-आधारित मशीन लर्निंग के लिए एक प्रतिमान है, निम्नलिखित एक सामान्य, आधुनिक एलसीएस कलन विधि के प्रमुख तत्वों की रूपरेखा तैयार करता है। सरलता के लिए आइए हम पर्यवेक्षित शिक्षण के साथ मिशिगन शैली की वास्तुकला पर ध्यान केंद्रित करें। इस प्रकार के सामान्य एलसीएस में सम्मिलित अनुक्रमिक चरणों को दर्शाते हुए दाईं ओर दिए गए चित्र देखें।

पर्यावरण

पर्यावरण, डेटा का स्रोत है जिस पर एलसीएस सीखता है। यह एक ऑफ़लाइन, परिमित प्रशिक्षण डेटा सेट या लाइव प्रशिक्षण उदाहरणों की एक ऑनलाइन अनुक्रमिक स्ट्रीम हो सकती है। यह माना जाता है कि प्रत्येक प्रशिक्षण उदाहरण में कुछ संख्या में विशेषताएं, और रुचि का एक एकल समापन बिंदु सम्मिलित होता है। एलसीएस सीखने के भाग में फीचर चयन सम्मिलित हो सकता है, इसलिए प्रशिक्षण डेटा में सभी सुविधाओं को जानकारीपूर्ण होने की आवश्यकता नहीं है। किसी इंस्टेंस के फ़ीचर मानों के सेट को सामान्यतः क्षेत्र के रूप में जाना जाता है। सरलता के लिए आइए बूलियन डेटा प्रकार/बाइनरी संख्या सुविधाओं और बूलियन डेटा प्रकार/बाइनरी नंबर वर्ग के साथ एक उदाहरण समस्या क्षेत्र मान लें। मिशिगन-शैली प्रणालियों के लिए, प्रत्येक सीखने के चक्र पर पर्यावरण से एक उदाहरण प्रशिक्षित किया जाता है। पिट्सबर्ग-शैली प्रणालियाँ बैच लर्निंग करती हैं, जहाँ प्रत्येक पुनरावृत्ति में अधिकांश या सभी प्रशिक्षण डेटा पर नियम सेट का मूल्यांकन किया जाता है।

नियम/वर्गीकरणकर्ता/जनसंख्या

एक नियम एक संदर्भ-विशेष संबंध होता है जो क्षेत्र मानों और किसी पूर्वानुमान के मध्य होता है। नियम सामान्यतःएक {IF:THEN} अभिव्यक्ति के रूप में प्रकट होते हैं या अधिक विशिष्ट उदाहरण के रूप में, (यदि 'लाल' और 'अष्टकोण' है तो 'स्टॉप-साइन'} ). एलसीएस और नियम-आधारित मशीन लर्निंग में एक महत्वपूर्ण अवधारणा यह है कि एक व्यक्तिगत नियम अपने आप में एक मॉडल नहीं है, क्योंकि नियम केवल तभी लागू होता है जब उसकी शर्त पूरी हो जाती है। किसी नियम को समाधान स्थान के स्थानीय-मॉडल के रूप में समझें।

नियम विभिन्न डेटा प्रकारों (जैसे कि बाइनरी, विशिष्ट मूल्य, अनुक्रमिक, या अनिश्चित मूल्य) को संभालने के लिए कई अलग-अलग तरीकों में प्रस्तुत किए जा सकते हैं। बाइनरी डेटा को दिए जाने पर, एलसीएस पारंपरिक रूप से एक त्रिविध नियम प्रतिनिधित्व लागू करता है अर्थात् नियम में प्रत्येक फ़ीचर के लिए 0, 1, या '#' सम्मिलित हो सकता है। डॉन्ट केयर संकेत (अर्थात् '#') एक वाइल्डकार्ड के रूप में नियम की शर्त में सेवा करता है जिससे नियम और पूर्ण सिस्टम फ़ीचर और निर्धारित अंतस्थल तकनीक के बीच संबंधों को व्यापक कर सकते हैं। यह अनुमानित पूर्वानुमान के लिए ज्ञान को सार्वभौमिक बनाने में सहायक होता है। निम्नलिखित नियम (#1###0 ~ 1) अर्थात् शर्त ~ प्रक्रिया को विवेचित किया जा सकता है: यदि दूसरी फीचर = 1 और छठी फीचर = 0 तो तर्क पूर्वानुमान = 1। हम कहेंगे कि इस नियम में दूसरी और छठी फ़ीचर विशिष्ट रूप से निर्दिष्ट किए गए थे, जबकि अन्य फ़ीचर व्यापक रूप से निर्दिष्ट किए गए थे।

यह नियम और संबंधित पूर्वानुमान केवल उस उदाहरण पर लागू होती है जब नियम की स्थिति उदाहरण से संतुष्ट होती है। इसे सामान्यतः मिलान के रूप में जाना जाता है। मिशिगन-शैली एलसीएस में, प्रत्येक नियम की अपनी फिटनेस होती है, साथ ही इसके साथ जुड़े कई अन्य नियम-पैरामीटर होते हैं जो उस नियम की उपस्थित प्रतियों की संख्या, नियम की उम्र, का वर्णन कर सकते हैं।

यह नियम और इसकी संबंधित पूर्वानुमान केवल तभी लागू होते हैं जब नियम की शर्त इंस्टेंस द्वारा पूरी की जाती है। इसे सामान्यतः मिलान के रूप में जाना जाता है। मिशिगन-स्टाइल एलसीएस में, प्रत्येक नियम के अपने फिटनेस के साथ, और उससे जुड़े अन्य नियम-पैरामीटर होते हैं जो उसे वर्णन कर सकते हैं। और अन्य विवरणात्मक या अनुभवशास्त्रीय सांख्यिकी हो सकते हैं। एक नियम और इसके पैरामीटर प्रायः एक क्लासिफायर के रूप में उल्लिखित होते हैं। मिशिगन-स्टाइल सिस्टमों में, क्लासिफायर्स एक पॉपुलेशन [पी] के भीतर संभाले जाते हैं जिसमें उपयोगकर्ता ने परिभाषित अधिकतम क्लासिफायरों की संख्या होती है। अधिकांश स्टोकैस्टिक खोज कलन विधियों के विपरीत, एलसीएस जनसंख्या केवल प्रारंभ होती हैं अर्थात् नियमों की जनसंख्या का रैन्डम रूप से प्रारंभिककरण करने की कोई आवश्यकता नहीं होती है। क्लासिफायर्स को प्रारंभ में जनसंख्या में एक कवरिंग मेकेनिज़्म के साथ प्रस्तुत किया जाता है।

किसी भी एलसीएस में, प्रशिक्षित मॉडल किसी एकल नियम/वर्गीकरणकर्ता के अतिरिक्त नियमों/वर्गीकरणकर्ताओं का एक सेट होता है। जिसे मिशिगन-शैली एलसीएस में, संपूर्ण प्रशिक्षित वर्गीकरणकर्ता जनसंख्या पूर्वानुमान मॉडल बनाता है।

मिलान

एलसीएस के सबसे महत्वपूर्ण और प्रायः समय लेने वाले तत्वों में से एक मिलान प्रक्रिया है। एलसीएस सीखने के चक्र में पहला कदम पर्यावरण से एक एकल प्रशिक्षण उदाहरण लेता है और इसे [p] में भेजता है जहां मिलान होता है। चरण दो में, अब [p] में प्रत्येक नियम की तुलना प्रशिक्षण उदाहरण से की जाती है जिससे यह देखा जा सके कि कौन से नियम मेल खाते हैं अर्थात वर्तमान उदाहरण के लिए उचित, रूप से प्रासंगिक हैं। चरण तीन में, किसी भी मिलान नियम को मिलान सेट [एम] में ले जाया जाता है। एक नियम एक प्रशिक्षण उदाहरण से मेल खाता है यदि नियम शर्त में निर्दिष्ट सभी फीचर मान प्रशिक्षण उदाहरण में संबंधित फीचर मान के बराबर हैं।

उदाहरण के लिए, मान लें कि प्रशिक्षण उदाहरण (001001 ~ 0) है, तो निम्नलिखित नियमों का मिलान होगा: (###0## ~ 0), (00###1 ~ 0), (#01001 ~ 1), परंतु निम्नलिखित नियमों का मिलान नहीं होगा: (1##### ~ 0), (000##1 ~ 0), (#0#1#0 ~ 1)। ध्यान दें कि मिलान में, नियम द्वारा निर्दिष्ट अंतस्थल / प्रक्रिया को ध्यान में नहीं लिया जाता है। इस परिणामस्वरूप, मैच सेट में ऐसे क्लासिफायर्स सम्मिलित हो सकते हैं जो विरोधाभासी प्रक्रिया प्रस्तावित करते हैं। चौथे चरण में, क्योंकि हम सुपरवाइज़्ड लर्निंग कर रहे हैं, [M] को एक सही सेट [C] और एक गलत सेट [I] में विभाजित किया जाता है। एक मिलान नियम सही सेट में चला जाता है यदि यह सही प्रक्रिया का प्रस्ताव करता है, अन्यथा यह [I] में चला जाता है। इसके अतिरिक्त एक प्रक्रिया सेट [ए] बनाया जाएगा, क्योंकि सही प्रक्रिया ज्ञात नहीं है।

कवरिंग

सीखने के चक्र में इस बिंदु पर, यदि कोई वर्गीकरणकर्ता इसे [m] या [c] में नहीं बनाता है कवरिंग तंत्र लागू किया जाता है। कवरिंग ऑनलाइन स्मार्ट जनसंख्या आरंभीकरण का एक रूप है। कवरिंग अव्यवस्थित, ढंग से एक नियम उत्पन्न करता है जो वर्तमान प्रशिक्षण उदाहरण से मेल खाता है और पर्यवेक्षित शिक्षण के स्थितियों में, वह नियम भी सही प्रक्रिया के साथ उत्पन्न होता है। यह मानते हुए कि प्रशिक्षण उदाहरण (001001 ~ 0) है, कवरिंग निम्नलिखित में से कोई भी नियम उत्पन्न कर सकता है: (#0#0## ~ 0), (001001 ~ 0), (#010## ~ 0)। कवर करना न केवल यह सुनिश्चित करता है कि प्रत्येक सीखने के चक्र में कम से कम एक सही, [c] से मेल खाने वाला नियम है, बल्कि वह जनसंख्या में आरंभ किया गया कोई भी नियम कम से कम एक प्रशिक्षण उदाहरण से मेल खाता हो। यह एलसीएस को उन नियमों को खोज करने से रोकता है जो किसी भी प्रशिक्षण उदाहरण से मेल नहीं खाते हैं।

पैरामीटर अपडेट/क्रेडिट असाइनमेंट/लर्निंग

छठे चरण में, [एम] में किसी भी नियम के नियम पैरामीटर को वर्तमान प्रशिक्षण उदाहरण से प्राप्त नए अनुभव को प्रतिबिंबित करने के लिए अद्यतन किया जाता है। एलसीएस कलन विधि के आधार पर, इस चरण में कई अपडेट हो सकते हैं। पर्यवेक्षित शिक्षण के लिए, हम किसी नियम की सटीकता/त्रुटि को अपडेट कर सकते हैं। नियम सटीकता/त्रुटि मॉडल सटीकता/त्रुटि से भिन्न है, क्योंकि इसकी गणना संपूर्ण प्रशिक्षण डेटा पर नहीं की जाती है, बल्कि केवल उन सभी उदाहरणों पर की जाती है जिनसे यह मेल खाता है। नियम सटीकता की गणना नियम के सही सेट [c] में होने की संख्या को मैच सेट [m] में होने की संख्या से विभाजित करके की जाती है। नियम सटीकता को 'स्थानीय सटीकता' के रूप में माना जा सकता है। नियम फिटनेस को भी यहां अपडेट किया जाता है, और सामान्यतः इसकी गणना नियम सटीकता के एक फ़ंक्शन के रूप में की जाती है। फिटनेस की अवधारणा सीधे पारंपरिक आनुवंशिक कलन विधि से ली गई है। ध्यान रखें कि क्रेडिट असाइनमेंट और सीखने के लिए एलसीएस पैरामीटर को कैसे अपडेट करता है, इस पर कई भिन्नताएं हैं।

सबसम्पूर्णता

सातवें चरण में, सामान्यतः एक सबसम्पूर्णता तंत्र लागू किया जाता है। सबसम्पूर्णता एक स्पष्ट सारांश मेकेनिज़्म है जो समस्या स्थान के लगभगिक हिस्से को कवर करने वाले क्लासिफायर्स को मिलाकर एकीकृत करता है। इससे प्राप्त किए गए एकीकृत क्लासिफायर्स द्वारा पूरी समस्या के बिना अधिकतम समस्या विस्तार को कवर किया जा सकता है। सबसम्पूर्ण क्लासिफायर नवीकरण क्लासिफायर को सभी प्रमुखता में सरलता से स्वीकार करता है। यह केवल तभी संभव होता है जब सबसम्पूर्ण क्लासिफायर नवीकरण क्लासिफायर से अधिक सार्वभौमिक, समान अभिनयक, और नवीकरण क्लासिफायर द्वारा कवर किए जाने वाले समस्या स्थान को कवर करता है।

नियम खोज/आनुवंशिक कलन विधि

आठवें चरण में, एलसीएस एक उच्च अभिजात्य आनुवंशिक कलन विधि (जीए) को अपनाता है जो योग्यतम की उत्तरजीविता के आधार पर दो मूल वर्गीकरणकर्ताओं का चयन करता हैं। माता-पिता का चयन सामान्यतः टूर्नामेंट चयन का उपयोग करके [c] से किया जाता है। कुछ प्रणालियों ने रूलेट व्हील चयन या नियतात्मक चयन को लागू किया है, और या तो [p] पैनमिक्टिक चयन, या [m]) से अलग-अलग मूल नियमों का चयन किया है। क्रॉसओवर और म्यूटेशन ऑपरेटरों को अब दो नए संतान नियम उत्पन्न करने के लिए लागू किया जाता है। इस बिंदु पर, माता-पिता और संतान दोनों के नियम [p] पर वापस आ जाते हैं। एलसीएस जेनेटिक कलन विधि अत्यधिक अभिजात्य है क्योंकि प्रत्येक सीखने की पुनरावृत्ति में, जनसंख्या का विशाल बहुमत संरक्षित होता है। इस नियम का खोज वैकल्पिक रूप से किसी अन्य विधि द्वारा की जा सकती है, जैसे कि वितरण कलन विधि का अनुमान, परंतु जीए अब तक का सबसे सरल दृष्टिकोण है। जीए जैसे विकासवादी कलन विधि एक स्टोकेस्टिक खोज को नियोजित करते हैं, जो एलसीएस को एक स्टोकेस्टिक कलन विधि बनाता है। एलसीएस खोज स्थान का प्रवीणता से अन्वेषण करने का प्रयास करता है, परंतु नियम संयोजनों का व्यापक खोज नहीं करता है यह अधिकतम समाधान की दिशा में समाप्त होने की गारंटी नहीं देता है।

विलोपन

सामान्य एलसीएस सीखने के चक्र में अंतिम चरण अधिकतम जनसंख्या आकार को बनाए रखना है। विलोपन तंत्र विलोपन के लिए सामान्यतः रूलेट व्हील चयन का उपयोग करके क्लासिफायर का चयन करता है। किसी क्लासिफायरियर को हटाने के लिए चुने जाने की संभावना उसकी उपयुक्तता के व्युत्क्रमानुपाती होती है। जब किसी क्लासिफायर को हटाने के लिए चुना जाता है, तो इसका संख्यात्मकता पैरामीटर एक से कम हो जाता है तथा जब किसी क्लासिफायरियर की संख्या शून्य हो जाती है, तो उसे जनसंख्या से पूरी तरह हटा दिया जाता है।

प्रशिक्षण

एलसीएस कुछ उपयोगकर्ता परिभाषित प्रशिक्षण आवृत्तियों के लिए यह चरण पुनरावर्तित किया जाता है या जब तक उपयोगकर्ता द्वारा परिभाषित समाप्ति मानदंड पूरा नहीं हो जाता हैं। ऑनलाइन लर्निंग के लिए, एलसीएस प्रत्येक आवृत्ति में पर्याप्त नया प्रशिक्षण उदाहरण आपूर्ति से प्राप्त करता है, और ऑफ़लाइन सीखने के लिए, एलसीएस एक सीमित प्रशिक्षण डेटासेट के माध्यम से पुनरावृत्त करता है। एक बार जब यह डेटासेट में अंतिम उदाहरण तक पहुंच जाता है, तो यह पहले उदाहरण पर वापस चला जाता है और डेटासेट के माध्यम से पुनः आवर्तन करने लगता है।

नियम संघनन

जब प्रशिक्षण पूर्ण होता है, तो नियम जनसंख्या में अनिवार्य रूप से कुछ नकारात्मक, अनावश्यक और अनुभवहीन नियम सम्मिलित होते हैं।यह सामान्य है कि एक नियम संक्षेपण या संक्षेपण हीरिस्टिक का उपयोग किया जाए जो एक पोस्ट-प्रोसेसिंग चरण के रूप में काम आता है। इस परिणाम स्थायीत किए गए संक्षिप्त नियम जनसंख्या का प्रयोग विभाजन मॉडल के रूप में किया जा सकता है उदाहरण के लिए, परीक्षण उदाहरणों पर पूर्वानुमान बनाना और ज्ञान खोज के लिए व्याख्यात्मक रूप से विश्लेषित किया जा सकता है।

पूर्वानुमान

चाहे नियम संघनन लागू किया गया हो या नहीं, एलसीएस कलन विधि का आउटपुट क्लासिफायर की आबादी है जिसे पहले से अनदेखे उदाहरणों पर भविष्यवाणियां करने के लिए लागू किया जा सकता है। पूर्वानुमान तंत्र स्वयं पर्यवेक्षित एलसीएस सीखने के चक्र का हिस्सा नहीं है, हालांकि यह सुदृढीकरण सीखने वाले एलसीएस सीखने के चक्र में एक महत्वपूर्ण भूमिका निभाएगा। अभी हम इस बात पर विचार करते हैं कि डेटा का परीक्षण करने के लिए भविष्यवाणियां करने के लिए पूर्वानुमान तंत्र को कैसे लागू किया जा सकता है। पूर्वानुमान लगाते समय, एलसीएस सीखने के घटकों को निष्क्रिय कर दिया जाता है जिससे आबादी आने वाले परीक्षण डेटा से सीखना जारी न रखे। एक परीक्षण उदाहरण [पी] को पास किया जाता है जहां हमेशा की तरह एक मैच सेट [एम] बनता है। इस बिंदु पर मैच सेट को पूर्वानुमान सरणी में अलग तरीके से पास किया जाता है। मैच सेट के नियम विभिन्न क्रियाओं की पूर्वानुमान कर सकते हैं, इसलिए एक वोटिंग योजना लागू की जाती है। एक साधारण वोटिंग योजना में, मिलान नियमों से सबसे मजबूत समर्थन वाले 'वोट' वाली प्रक्रिया जीत जाती है, और चयनित पूर्वानुमान बन जाती है। सभी नियमों को समान वोट नहीं मिलता है। बल्कि किसी एक नियम के लिए वोट की ताकत सामान्यतः उसकी संख्या और उपयुक्तता पर निर्भर होती है। यह वोटिंग योजना और एलसीएस के ज्ञान को संग्रहीत करने की प्रकृति से पता चलता है कि एलसीएस कलन विधि अंतर्निहित रूप से शिक्षार्थियों को इकट्ठा करते हैं।

व्याख्या

व्यक्तिगत एलसीएस नियम सामान्यतः मानव पठनीय IF:THEN अभिव्यक्ति हैं। एलसीएस पूर्वानुमान मॉडल का गठन करने वाले नियमों को विभिन्न नियम मापदंडों के आधार पर रैंक किया जा सकता है और मैन्युअल रूप से निरीक्षण किया जा सकता है। सांख्यिकीय और ग्राफ़िकल का उपयोग करके ज्ञान खोज का मार्गदर्शन करने के लिए वैश्विक रणनीतियाँ भी प्रस्तावित की गई हैं।[9][10]अन्य उन्नत मशीन लर्निंग दृष्टिकोणों के संबंध में, जैसे कि कृत्रिम तंत्रिका नेटवर्क, या आनुवंशिक प्रोग्रामिंग, लर्निंग क्लासिफायर सिस्टम विशेष रूप से उन समस्याओं के लिए उपयुक्त हैं जिनके लिए व्याख्यात्मक समाधान की आवश्यकता होती है।

इतिहास

प्रारंभिक वर्ष

जॉन हेनरी हॉलैंड को उनकी अभूतपूर्व पुस्तक एडेप्टेशन इन नेचुरल एंड आर्टिफिशियल सिस्टम्स के माध्यम से जेनेटिक कलन विधि को लोकप्रिय बनाने के लिए जाना जाता था।[11] 1975 में और उन्होंने हॉलैंड के स्कीमा प्रमेय को औपचारिक रूप दिया। 1976 में, हॉलैंड ने जीए अवधारणा के विस्तार की संकल्पना की जिसे उन्होंने संज्ञानात्मक प्रणाली कहा,[12] और एडेप्टिव कलन विधि पर आधारित कॉग्निटिव सिस्टम्स पेपर में पहली लर्निंग क्लासिफायर सिस्टम के रूप में जाने जाने वाले का पहला विस्तृत विवरण प्रदान किया गया।[13] कॉग्निटिव सिस्टम CS-1 नाम की इस पहली प्रणाली की कल्पना एक मॉडलिंग टूल के रूप में की गई थी, जिसे मानव पठनीय नियमों की आबादी का उपयोग करके अज्ञात अंतर्निहित गतिशीलता के साथ एक वास्तविक प्रणाली को मॉडल करने के लिए डिज़ाइन किया गया था। लक्ष्य यह था कि नियमों का एक सेट बनाया जाए जिससे ऑनलाइन मशीन लर्निंग को कम भुगतान/इनाम के आधार पर पर्यावरण के अनुकूल बनाया जा सके और वास्तविक प्रणाली से मेल खाने वाले व्यवहार को उत्पन्न करने के लिए इन नियमों को लागू किया जा सके। इस प्रारंभिक, महत्वाकांक्षी कार्यान्वयन को बाद में अत्यधिक जटिल माना गया, [2][14]1980 के प्रारंभ में, केनेथ ए डी जोंग और उनके छात्र स्टीफन स्मिथ ने एलएस-1 के साथ नियम-आधारित मशीन लर्निंग के लिए एक अलग दृष्टिकोण अपनाया, जहां सीखने को ऑनलाइन अनुकूलन प्रक्रिया के अतिरिक्त ऑफ़लाइन अनुकूलन प्रक्रिया के रूप में देखा गया था।[15][16][17] यह नया दृष्टिकोण एक मानक आनुवंशिक कलन विधि के समान था परंतु नियमों के स्वतंत्र सेट विकसित किए। उस समय से मिशिगन विश्वविद्यालय में हॉलैंड द्वारा प्रारंभ किए गए ऑनलाइन शिक्षण ढांचे से प्रेरित एलसीएस विधियों को मिशिगन-शैली एलसीएस के रूप में संदर्भित किया गया है, और पिट्सबर्ग विश्वविद्यालय में स्मिथ और डी जोंग से प्रेरित लोगों को पिट्सबर्ग-शैली के रूप में संदर्भित किया गया है। एल.सी.एस.[2][14] 1986 में, हॉलैंड ने वह विकसित किया जिसे अगले दशक के लिए मानक मिशिगन-शैली एलसीएस माना जाएगा।[18]एलसीएस अनुसंधान के शुरुआती दिनों में उभरी अन्य महत्वपूर्ण अवधारणाओं में सम्मिलित हैं

(1) क्रेडिट असाइनमेंट/सीखने के लिए बकेट ब्रिगेड कलन विधि (बीबीए) की औपचारिकता,[19] (2) संपूर्ण जनसंख्या [पी] के अतिरिक्त एक सामान्य 'पर्यावरणीय क्षेत्र' (यानी मैच सेट [एम]) से मूल नियमों का चयन,[20] (3) कवरिंग, पहली बार क्रिएट ऑपरेटर के रूप में प्रस्तुत किया गया,[21] (4) एक एक्शन सेट की औपचारिकता [ए],[21](5) एक सरलीकृत एल्गोरिथम वास्तुकला,[21](6) शक्ति-आधारित फिटनेस,[18](7) एकल-चरण, या पर्यवेक्षित सीखने की समस्याओं पर विचार[22] और सही सेट का परिचय [सी],[23] (8) सटीकता-आधारित फिटनेस[24] (9) एलसीएस के साथ फ़ज़ी लॉजिक का संयोजन[25] (जिसने बाद में फजी एलसीएस कलन विधि की एक श्रृंखला को जन्म दिया), (10) बहु-चरणीय समस्याओं पर प्रदर्शन में सुधार के लिए लंबी प्रक्रिया श्रृंखलाओं और डिफ़ॉल्ट पदानुक्रमों को प्रोत्साहित करना,[26][27][28] (11) अव्यक्त शिक्षा की जांच करना[29]), और (12) पहली क्यू-लर्निंग-जैसी क्रेडिट असाइनमेंट तकनीक का प्रारंभ ।[30] यद्यपि इनमें से सभी अवधारणाएँ आधुनिक एलसीएस कलन विधि में लागू नहीं की गई हैं, प्रत्येक एलसीएस प्रतिमान के विकास में मील की पत्थर थीं।

क्रांति

1990 के दशक के मध्य में दो घटनाओं के कारण क्लासिफायर सिस्टम सीखने में रुचि फिर से जागृत हुई क्यू-लर्निंग कलन विधि का विकास[31] सुदृढीकरण सीखने के लिए, और स्टीवर्ट विल्सन द्वारा महत्वपूर्ण रूप से सरलीकृत मिशिगन-शैली एलसीएस आर्किटेक्चर की प्रारंभ।[8][32] विल्सन का जीरोथ-लेवल क्लासिफायर सिस्टम [32]हॉलैंड के मानक एलसीएस कार्यान्वयन के आधार पर कलन विधि समझ बढ़ाने पर ध्यान केंद्रित किया गया।[18] यह, आंशिक रूप से, मूल बीबीए क्रेडिट असाइनमेंट के लिए आवश्यक नियम-बोली और आंतरिक संदेश सूची को हटाकर, और इसे हाइब्रिड बीबीए/क्यू--लर्निंग रणनीति के साथ बदलकर किया गया था। जेडसीएस ने प्रदर्शित किया कि एक बहुत ही सरलएलसीएस आर्किटेक्चर मूल, अधिक जटिल कार्यान्वयन के साथ-साथ अच्छा प्रदर्शन कर सकता है। हालाँकि,जेडसीएसको अभी भी अति-सामान्य क्लासिफायर के प्रसार सहित प्रदर्शन कमियों का सामना करना पड़ा।

1995 में, विल्सन ने अपना ऐतिहासिक पेपर, सटीकता के आधार पर क्लासिफायर फिटनेस प्रकाशित किया जिसमें उन्होंने क्लासिफायर सिस्टम एक्ससीएस की शुरुआत की।[8] एक्ससीएस ने जेडसीएसका सरलीकृत आर्किटेक्चर लिया और एक सटीकता-आधारित फिटनेस, एक विशिष्ट जीए, एक स्पष्ट सामान्यीकरण तंत्र जिसे सब्सम्प्शन कहा जाता है, और क्यू-लर्निंग क्रेडिट असाइनमेंट का एक अनुकूलन जोड़ा। एक्ससीएस को सटीक और अधिकतम सामान्य क्लासिफायर विकसित करते हुए इष्टतम प्रदर्शन तक पहुंचने की क्षमता के साथ-साथ इसकी प्रभावशाली समस्या द्वारा लोकप्रिय बनाया गया था। एक्ससीएस बाद में सबसे प्रसिद्ध और सबसे अधिक अध्ययन किया जाने वालाएलसीएस कलन विधि बन गया और सटीकता-आधारितएलसीएस के एक नए समूह को परिभाषित किया। जेडसीएस वैकल्पिक रूप से शक्ति-आधारित एलसीएस का पर्याय बन गया। एक्ससीएस इसलिए भी महत्वपूर्ण है, क्योंकि इसने एलसीएस और सुदृढीकरण सीखने के क्षेत्र के मध्य अंतर को सफलतापूर्वक कर दिया है। एक्ससीएस की सफलता के बाद,एलसीएस को बाद में सामान्यीकरण क्षमता से संपन्न सुदृढीकरण शिक्षण प्रणालियों के रूप में वर्णित किया गया।[33] सुदृढीकरण सीखना सामान्यतः एक मूल्य फ़ंक्शन सीखना चाहता है जो क्षेत्र क्रिया स्थान का संपूर्ण प्रतिनिधित्व करता है। इसी तरह, एक्ससीएस का डिज़ाइन इसे पर्यावरण में उच्च भुगतान वाले स्थानों पर ध्यान केंद्रित करने के अतिरिक्त समस्या स्थान का एक सर्व-समावेशी और सटीक प्रतिनिधित्व बनाने के लिए प्रेरित करता है जैसा कि शक्ति-आधारित एलसीएस के विषय में था। वैचारिक रूप से, पूर्ण मानचित्र न केवल यह दर्शाता है कि आपको क्या करना चाहिए, या क्या सही है, बल्कि यह भी दर्शाता है कि आपको क्या नहीं करना चाहिए, या क्या गलत है। अलग तरह से, अधिकांश शक्ति-आधारित एलसीएस, या विशेष रूप से पर्यवेक्षित शिक्षण एलसीएस सर्वोत्तम एक्शन मैप के रूप में कुशल सामान्यीकरण के नियम सेट की तलाश करते हैं। सटीकता-आधारित फिटनेस और पूर्ण बनाम सर्वोत्तम कार्य मानचित्रों के मध्य तुलना की अधिक विस्तार से जांच की गई है।[34][35]


एक्ससीएस के दृष्टिकोण से

एक्ससीएस नेएलसीएस कलन विधि और अनुप्रयोगों की एक पूरी नई पीढ़ी के विकास को प्रेरित किया। 1995 में, कांगडन बीमारी की वास्तविक दुनिया की महामारी विज्ञान जांच में एलसीएस लागू करने वाले पहले व्यक्ति थे [36]होम्स द्वारा बारीकी से अनुसरण किया गया जिन्होंने बूले++ विकसित किया,[37] एपीसीएस,[38] और बाद में एपी एक्ससीएस[39] महामारी विज्ञान वर्गीकरण के लिए. इन शुरुआती कार्यों ने बाद में जैव सूचना विज्ञान अनुप्रयोगों द्वारा जटिल और बड़े पैमाने पर डेटा खनन कार्यों में एलसीएस कलन विधि को लागू करने में रुचि को प्रेरित किया। 1998 में, स्टोलज़मैन ने प्रत्याशित क्लासिफायर सिस्टम की शुरुआत की जिसमें क्लासिक 'कंडीशन-एक्शन' प्रतिनिधित्व के अतिरिक्त 'कंडीशन-एक्शन-इफेक्ट' के रूप में नियम सम्मिलित थे।[29] एसीएस को किसी वातावरण में सभी संभावित स्थितियों में किसी प्रक्रिया के अवधारणात्मक परिणामों की पूर्वानुमान करने के लिए डिज़ाइन किया गया था। दूसरे शब्दों में, सिस्टम एक मॉडल विकसित करता है जो न केवल निर्दिष्ट करता है कि किसी दिए गए स्थिति में क्या करना है, बल्कि यह भी जानकारी प्रदान करता है कि किसी विशिष्ट प्रक्रिया के निष्पादित होने के बाद क्या होगा। एलसीएस कलन विधि का यह समूह बहु-चरणीय समस्याओं, योजना बनाने, सीखने में तेजी लाने या अवधारणात्मक अलियासिंग को स्पष्ट करने के लिए सबसे उपयुक्त है। बुट्ज़ ने बाद में एलसीएस के इस प्रत्याशित समूह का अनुसरण करते हुए मूल पद्धति में कई सुधार विकसित किए।[40] 2002 में, विल्सन ने एक्ससीएसएफ की शुरुआत की, जिसमें फ़ंक्शन सन्निकटन करने के लिए एक गणना की गई क्रिया को जोड़ा गया।[41] 2003 में, बर्नैडो-मैन्सिला ने एक सुपरवाइज्ड क्लासिफायर सिस्टमप्रस्तुत किया, जिसने पर्यवेक्षित शिक्षण, एकल-चरण समस्याओं और सर्वोत्तम एक्शन सेट बनाने के कार्य के लिए एक्ससीएस कलन विधि को विशेषीकृत किया। यूसीएस ने एक सरल, सटीकता-आधारित नियम फिटनेस के साथ-साथ सीखने के चरणों का पता लगाने/दोहन करने के पक्ष में सुदृढीकरण सीखने की रणनीति को हटा दिया, जो कई सुदृढीकरण शिक्षार्थियों की विशेषता है। बुल ने एक सरल सटीकता-आधारित एलसीएस प्रस्तुत किया[42] और एक सरल शक्ति-आधारित एलसीएस मिनिमल क्लासिफायर सिस्टम [43] एलसीएस ढांचे की बेहतर सैद्धांतिक समझ विकसित करने के लिए। [44] और बायोहेल,[45] पिट्सबर्ग-शैली एलसीएस को जैव सूचना विज्ञान अनुप्रयोगों में डेटा खनन और बड़े डेटासेट में मापनीयता के लिए डिज़ाइन किया गया है। 2008 में, ड्रगोवित्च ने एलसीएस कलन विधि की कुछ सैद्धांतिक परीक्षा सहित लर्निंग क्लासिफायर सिस्टम के डिजाइन और विश्लेषण नामक पुस्तक प्रकाशित की।[46] बुट्ज़ ने एक्ससीएसएफ के लिए ग्राफिकल यूज़र इंटरफ़ेस के भीतर पहला नियम ऑनलाइन लर्निंग विज़ुअलाइज़ेशन प्रस्तुत किया[1]। अर्बनोविच ने यूसीएस ढांचे का विस्तार किया और एक्सएसटी आरएसीएस की शुरुआत की, जो स्पष्ट रूप से शोर समस्या वाले क्षेत्र में पर्यवेक्षित सीखने के लिए डिज़ाइन किया गया है।[47] एक्सएस टीआर एसीएस ने डेटा में महत्वपूर्ण विशेषताओं की ओर कवरिंग और जेनेटिक कलन विधि को चलाने के लिए विशेषज्ञ ज्ञान को एकीकृत किया,[48] (2) दीर्घकालिक स्मृति का एक रूप जिसे विशेषता ट्रैकिंग कहा जाता है,[49] अधिक कुशल सीखने और विषम डेटा पैटर्न के लक्षण वर्णन की अनुमति, और (3) बकार्डिट के मिश्रित असतत-निरंतर विशेषता सूची प्रतिनिधित्व के समान एक नियम प्रतिनिधित्व।[50] बकार्डिट और अर्बनोविच दोनों ने एलसीएस नियमों की व्याख्या करने और डेटा माइनिंग के लिए ज्ञान की खोज करने के लिए सांख्यिकीय और विज़ुअलाइज़ेशन रणनीतियों की खोज की।[9][10] ब्राउन और इकबाल ने कोड टुकड़ों के रूप में बिल्डिंग ब्लॉक्स के पुन: उपयोग की अवधारणा की खोज की और सरल मल्टीप्लेक्सर समस्याओं से उपयोगी बिल्डिंग ब्लॉक्स सीखकर 135-बिट मल्टीप्लेक्सर बेंचमार्क समस्या को हल करने वाले पहले व्यक्ति थे।[51]एक्सएसट्राक्स 2.0 को बाद में मिशिगन-शैली एलसीएस स्केलेबिलिटी में सुधार करने के लिए प्रस्तुत किया गया, जिसने पहली बार 135-बिट मल्टीप्लेक्सर बेंचमार्क समस्या को सफलतापूर्वक हल किया।[52] एन-बिटबहुसंकेतक समस्या अत्यधिक एपिस्टासिस और समरूपता और विषमता है, जो इसे एक बहुत ही चुनौतीपूर्ण मशीन सीखने का कार्य बनाती है।

वेरिएंट

मिशिगन-स्टाइल लर्निंग क्लासिफायर सिस्टम

मिशिगन-शैली एलसीएस को नियमों की आबादी की विशेषता है जहां आनुवंशिक कलन विधि व्यक्तिगत नियमों के स्तर पर संचालित होता है और समाधान संपूर्ण नियम आबादी द्वारा दर्शाया जाता है। मिशिगन शैली प्रणाली भी क्रमिक रूप से सीखती है जो उन्हें सुदृढीकरण सीखने और पर्यवेक्षित सीखने के साथ-साथ ऑनलाइन और ऑफ़लाइन सीखने दोनों को करने की अनुमति देती है। मिशिगन-शैली प्रणालियों का लाभ यह है कि यह अधिक संख्या में समस्या क्षेत्रों पर लागू होती है, और वृद्धिशील सीखने के अनूठे लाभ हैं।

पिट्सबर्ग-स्टाइल लर्निंग क्लासिफायर सिस्टम

पिट्सबर्ग-शैली एलसीएस को परिवर्तनीय लंबाई नियम-सेटों की आबादी की विशेषता है जहां प्रत्येक नियम-सेट एक संभावित समाधान है। आनुवंशिक एल्गोरिथ्म सामान्यतः संपूर्ण नियम-सेट के स्तर पर संचालित होता है। पिट्सबर्ग-शैली प्रणालियाँ विशिष्ट रूप से क्रमबद्ध नियम सूचियों को विकसित कर सकती हैं, साथ ही एक डिफ़ॉल्ट नियम को भी नियोजित कर सकती हैं। इन प्रणालियों में छोटे नियम सेटों की पहचान करने का प्राकृतिक लाभ होता है, जिससे ये प्रणालियाँ मैन्युअल नियम निरीक्षण के संबंध में अधिक व्याख्या योग्य हो जाती हैं।

हाइब्रिड सिस्टम

ऐसी प्रणालियाँ भी प्रस्तावित की गई हैं जो दोनों प्रणालियों की प्रमुख शक्तियों को संयोजित करना चाहती हैं।

लाभ

  • अनुकूली: ऑनलाइन सीखने के स्थिति में वे बदलते परिवेश के अनुरूप ढल सकते हैं।
  • मॉडल मुक्त: वे पर्यावरण, या डेटा के भीतर जुड़ाव के पैटर्न के बारे में सीमित धारणाएँ बनाते हैं।
    • वे पूर्व ज्ञान पर भरोसा किए बिना जटिल, एपिस्टैटिक, विषम, या वितरित अंतर्निहित पैटर्न मॉडल कर सकते हैं।
    • वे डेटा में पूर्वानुमानित बनाम गैर-अनुमानित सुविधाओं की संख्या के बारे में कोई धारणा नहीं बनाते हैं।
  • एन्सेम्बल लर्नर: किसी दिए गए उदाहरण पर कोई एकल मॉडल लागू नहीं होता है जो सार्वभौमिक रूप से एक पूर्वानुमान प्रदान करता है। इसके अतिरिक्त नियमों का एक प्रासंगिक और प्रायः विरोधाभासी सेट 'वोट' का योगदान देता है जिसे एक अस्पष्ट पूर्वानुमान के रूप में समझा जा सकता है।
  • स्टोकेस्टिक शिक्षार्थी: गैर-नियतात्मक शिक्षा बड़े पैमाने पर या उच्च जटिलता वाली समस्याओं में फायदेमंद होती है जहां नियतात्मक या संपूर्ण शिक्षा कठिन हो जाती है।
  • परोक्ष रूप से बहुउद्देश्यीय: अधिकतम व्यापकता/सरलता को प्रोत्साहित करने वाले अंतर्निहित और स्पष्ट दबावों के साथ नियम सटीकता की ओर विकसित होते हैं। यह अंतर्निहित सामान्यीकरण दबाव एलसीएस के लिए अद्वितीय है। प्रभावी रूप से, अधिक सामान्य नियम, मैच सेट में अधिक बार दिखाई देंगे। बदले में, उनके पास माता-पिता के रूप में चुने जाने का अधिक बार अवसर होता है, और वे अपने अधिक सामान्य (जीनोम) को संतानों तक पहुंचाते हैं।
  • व्याख्यायोग्य: डेटा माइनिंग और ज्ञान खोज के हित में व्यक्तिगत एलसीएस नियम तार्किक हैं, और इन्हें मानवीय व्याख्या योग्य IF:THEN कथनों के रूप में बनाया जा सकता है। समग्र रूप से नियम जनसंख्या से महत्वपूर्ण विशेषताओं और जुड़ाव के पैटर्न की पहचान करते हुए वैश्विक ज्ञान खोज की अनुमति देने के लिए प्रभावी रणनीतियाँ भी प्रस्तुत की गई हैं।[9]
    • एकल या बहु-चरणीय समस्याएँ
    • पर्यवेक्षित, सुदृढीकरण या अपर्यवेक्षित शिक्षण
    • बाइनरी क्लास और मल्टी-क्लास वर्गीकरण
    • प्रतिगमन
    • पृथक या सतत विशेषताएं
    • स्वच्छ या शोर वाले समस्याग्रस्त क्षेत्र
    • संतुलित या असंतुलित डेटासेट।
    • गुम डेटा को समायोजित करता है

हानि

  • सीमित सॉफ्टवेयर उपलब्धता: सीमित संख्या में ओपन सोर्स, सुलभ एलसीएस कार्यान्वयन हैं, और यहां तक ​​कि बहुत कम हैं जो उपयोगकर्ता के अनुकूल या मशीन सीखने वाले चिकित्सकों के लिए सुलभ होने के लिए डिज़ाइन किए गए हैं।
  • व्याख्या: जबकि एलसीएस कलन विधि निश्चित रूप से कुछ उन्नत मशीन शिक्षार्थियों की तुलना में अधिक व्याख्या योग्य हैं, उपयोगकर्ताओं को नियमों के एक सेट की व्याख्या करनी चाहिए। नियम संकलन की विधियाँ और व्याख्या रणनीतियाँ सक्रिय अनुसंधान का क्षेत्र बनी हुई हैं।
  • सिद्धांत/अभिसरण प्रमाण: एलसीएस कलन विधि के पीछे सैद्धांतिक कार्य का एक अपेक्षाकृत छोटा समूह है। यह संभवतः उनकी सापेक्ष एल्गोरिथम जटिलता के साथ-साथ उनकी स्टोकेस्टिक प्रकृति के कारण है।
  • ओवरफिटिंग: किसी भी मशीन लर्नर की तरह, एलसीएस भी अंतर्निहित और स्पष्ट सामान्यीकरण दबावों के अतिरिक्त ओवरफिटिंग से पीड़ित हो सकता है।
  • रन पैरामीटर्स: एलसीएस में प्रायः अनुकूलन के लिए कई रन पैरामीटर होते हैं। सामान्यतः, दो महत्वपूर्ण मापदंडों के अपवाद के साथ अधिकांश मापदंडों को समुदाय द्वारा निर्धारित डिफ़ॉल्ट पर छोड़ा जा सकता है: अधिकतम नियम जनसंख्या आकार, और सीखने की पुनरावृत्तियों की अधिकतम संख्या। इन मापदंडों को अनुकूलित करना बहुत समस्या पर निर्भर होने की संभावना है।
  • कुख्याति: अपनी उम्र के अतिरिक्त, एलसीएस कलन विधि अभी भी मशीन लर्निंग समुदायों में भी व्यापक रूप से ज्ञात नहीं हैं। परिणामस्वरूप, अन्य स्थापित मशीन लर्निंग दृष्टिकोणों की तुलना में एलसीएस कलन विधि पर शायद ही कभी विचार किया जाता है। यह संभवतः निम्नलिखित कारकों के कारण है: (1) एलसीएस एक अपेक्षाकृत जटिल एल्गोरिथम दृष्टिकोण है, (2) एलसीएस, नियम-आधारित मॉडलिंग लगभग सभी अन्य मशीन लर्निंग दृष्टिकोणों की तुलना में मॉडलिंग का एक अलग प्रतिमान है। (3) एलसीएस सॉफ्टवेयर कार्यान्वयन उतने सामान्य नहीं हैं।
  • कम्प्यूटेशनल रूप से महंगा: यद्यपि कुछ संपूर्ण दृष्टिकोणों की तुलना में निश्चित रूप से अधिक व्यवहार्य है, एलसीएस कलन विधि कम्प्यूटेशनल रूप से महंगे हो सकते हैं। सरल, रैखिक सीखने की समस्याओं के लिए एलसीएस लागू करने की कोई आवश्यकता नहीं है। एलसीएस कलन विधि जटिल समस्या स्थानों, या समस्या स्थानों के लिए सबसे उपयुक्त हैं जिनमें थोड़ा पूर्व ज्ञान उपस्थित है।

समस्या क्षेत्र

  • अनुकूली-नियंत्रण
  • डेटा खनन
  • इंजीनियरिंग डिजाइन
  • फीचर चयन
  • फ़ंक्शन अनुमान
  • खेल-खेलें
  • छवि वर्गीकरण
  • ज्ञान प्रबंधन
  • चिकित्सा निदान
  • मॉडलिंग
  • मार्गदर्शन
  • अनुकूलन
  • पूर्वानुमान
  • पूछताछ करना
  • रोबोटिक्स
  • रूटिंग
  • नियम-प्रेरणा
  • शेड्यूलिंग
  • रणनीति

शब्दावली

"लर्निंग क्लासिफायर सिस्टम (एलसीएस)" नाम थोड़ा भ्रमक हो सकता है क्योंकि ऐसे कई मशीन लर्निंग कलन विधि हैं जो 'क्लासिफाई करना सीखते हैं'लेकिन वे एलसीएस नहीं होते। "रूल-आधारित मशीन लर्निंग" शब्द उपयुक्त हो सकता है क्योंकि इससे यह स्पष्ट रूप से समझा जा सकता है कि इन सिस्टमों के मूल रूप से 'रूल-आधारित' घटक को कैप्चर किया जाता है, लेकिन यह उन तकनीकों को भी समाविष्ट करता है जो एलसीएस के रूप में नहीं माने जाते हैं उदाहरण के लिए, असोसिएशन रूल लर्निंग या आर्टिफिशियल इम्यून सिस्टम्स।

अधिक सामान्य शब्द जैसे, 'जेनेटिक्स-आधारित मशीन लर्निंग', और यहां तक ​​कि 'जेनेटिक कलन विधि '[36] इसे यह संदर्भित करने के लिए भी लागू किया गया है कि सीखने की वर्गीकरण प्रणाली के रूप में अधिक विशिष्ट रूप से क्या परिभाषित किया जाएगा। जेनेटिक कलन विधि से उनकी समानता के कारण, पिट्सबर्ग-शैली शिक्षण क्लासिफायर सिस्टम को कभी-कभी सामान्य रूप से 'जेनेटिक कलन विधि ' के रूप में जाना जाता है। इसके अतिरिक्त, कुछ एलसीएस कलन विधि, या निकट से संबंधित विधियों को 'संज्ञानात्मक प्रणाली' के रूप में संदर्भित किया गया है,[13]'अनुकूली एजेंट', 'उत्पादन प्रणाली, या सामान्य रूप से 'वर्गीकरण प्रणाली' के रूप में।[53][54] शब्दावली में यह भिन्नता क्षेत्र में कुछ भ्रम उत्पन्न करती है।

2000 के दशक तक लगभग सभी शिक्षण क्लासिफायर सिस्टम विधियों को सुदृढीकरण सीखने की समस्याओं को ध्यान में रखकर विकसित किया गया था। परिणामस्वरूप, 'लर्निंग क्लासिफायर सिस्टम' शब्द को सामान्यतः आनुवंशिक कलन विधि की वैश्विक खोज के साथ 'ट्रायल-एंड-एरर' सुदृढीकरण सीखने के संयोजन के रूप में परिभाषित किया गया था। पर्यवेक्षित शिक्षण अनुप्रयोगों में रुचि और यहां तक ​​कि बिना पर्यवेक्षित शिक्षण ने भी इस शब्द के उपयोग और परिभाषा को व्यापक बना दिया है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 Stalph, Patrick O.; Butz, Martin V. (2010-02-01). "JavaXCSF: The XCSF Learning Classifier System in Java". SIGEVOlution. 4 (3): 16–19. doi:10.1145/1731888.1731890. ISSN 1931-8499. S2CID 16861908.
  2. 2.0 2.1 2.2 Urbanowicz, Ryan J.; Moore, Jason H. (2009-09-22). "Learning Classifier Systems: A Complete Introduction, Review, and Roadmap". Journal of Artificial Evolution and Applications (in English). 2009: 1–25. doi:10.1155/2009/736398. ISSN 1687-6229.
  3. Butz, M. V.; Lanzi, P. L.; Wilson, S. W. (2008-06-01). "Function Approximation With XCS: Hyperellipsoidal Conditions, Recursive Least Squares, and Compaction". IEEE Transactions on Evolutionary Computation. 12 (3): 355–376. doi:10.1109/TEVC.2007.903551. ISSN 1089-778X. S2CID 8861046.
  4. Dorigo, Marco (1995). "Alecsys and the AutonoMouse: Learning to control a real robot by distributed classifier systems". Machine Learning (in English). 19 (3): 209–240. doi:10.1007/BF00996270. ISSN 0885-6125.
  5. 5.0 5.1 Bernadó-Mansilla, Ester; Garrell-Guiu, Josep M. (2003-09-01). "Accuracy-Based Learning Classifier Systems: Models, Analysis and Applications to Classification Tasks". Evolutionary Computation. 11 (3): 209–238. doi:10.1162/106365603322365289. ISSN 1063-6560. PMID 14558911. S2CID 9086149.
  6. Bacardit, Jaume; Butz, Martin V. (2007-01-01). Kovacs, Tim; Llorà, Xavier; Takadama, Keiki; Lanzi, Pier Luca; Stolzmann, Wolfgang; Wilson, Stewart W. (eds.). लर्निंग क्लासिफायर सिस्टम. Lecture Notes in Computer Science (in English). Springer Berlin Heidelberg. pp. 282–290. CiteSeerX 10.1.1.553.4679. doi:10.1007/978-3-540-71231-2_19. ISBN 9783540712305.
  7. Introducing Rule-Based Machine Learning: A Practical Guide, Ryan J. Urbanowicz and Will Browne, see pp. 72-73 for Michigan-style architecture vs. Pittsburgh-style architecture.
  8. 8.0 8.1 8.2 Wilson, Stewart W. (1995-06-01). "सटीकता के आधार पर क्लासिफायर फिटनेस". Evol. Comput. 3 (2): 149–175. CiteSeerX 10.1.1.363.2210. doi:10.1162/evco.1995.3.2.149. ISSN 1063-6560. S2CID 18341635.
  9. 9.0 9.1 9.2 Urbanowicz, R. J.; Granizo-Mackenzie, A.; Moore, J. H. (2012-11-01). "मिशिगन-शैली शिक्षण क्लासिफायर सिस्टम के लिए सांख्यिकीय और विज़ुअलाइज़ेशन-निर्देशित ज्ञान खोज के साथ एक विश्लेषण पाइपलाइन". IEEE Computational Intelligence Magazine. 7 (4): 35–45. doi:10.1109/MCI.2012.2215124. ISSN 1556-603X. PMC 4244006. PMID 25431544.
  10. 10.0 10.1 Bacardit, Jaume; Llorà, Xavier (2013). "Large‐scale data mining using genetics‐based machine learning". Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 3 (1): 37–61. doi:10.1002/widm.1078. S2CID 43062613.
  11. Holland, John (1975). Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control, and artificial intelligence. Michigan Press. ISBN 9780262581110.
  12. Holland JH (1976) Adaptation. In: Rosen R, Snell F (eds) Progress in theoretical biology, vol 4. Academic Press, New York, pp 263–293
  13. 13.0 13.1 Holland JH, Reitman JS (1978) Cognitive systems based on adaptive algorithms Reprinted in: Evolutionary computation. The fossil record. In: David BF (ed) IEEE Press, New York 1998. ISBN 0-7803-3481-7
  14. 14.0 14.1 Lanzi, Pier Luca (2008-02-08). "Learning classifier systems: then and now". Evolutionary Intelligence (in English). 1 (1): 63–82. doi:10.1007/s12065-007-0003-3. ISSN 1864-5909. S2CID 27153843.
  15. Smith S (1980) A learning system based on genetic adaptive algorithms. Ph.D. thesis, Department of Computer Science, University of Pittsburgh
  16. Smith S (1983) Flexible learning of problem solving heuristics through adaptive search. In: Eighth international joint conference on articial intelligence. Morgan Kaufmann, Los Altos, pp 421–425
  17. De Jong KA (1988) Learning with genetic algorithms: an overview. Mach Learn 3:121–138
  18. 18.0 18.1 18.2 Holland, John H. "Escaping brittleness: the possibilities of general purpose learning algorithms applied to parallel rule-based system." Machine learning(1986): 593-623.
  19. Holland, John H. (1985-01-01). बकेट ब्रिगेड की संपत्तियाँ. pp. 1–7. ISBN 978-0805804263. {{cite book}}: |journal= ignored (help)
  20. Booker, L (1982-01-01). कार्य वातावरण के अनुकूलन के रूप में बुद्धिमान व्यवहार (Thesis). University of Michigan.
  21. 21.0 21.1 21.2 Wilson, S. W. "Knowledge growth in an artificial animal. Proceedings of the First International Conference on Genetic Algorithms and their Applications." (1985).
  22. Wilson, Stewart W. (1987). "क्लासिफायर सिस्टम और एनिमेट समस्या". Machine Learning (in English). 2 (3): 199–228. doi:10.1007/BF00058679. ISSN 0885-6125.
  23. Bonelli, Pierre; Parodi, Alexandre; Sen, Sandip; Wilson, Stewart (1990-01-01). NEWBOOLE: A Fast GBML System. pp. 153–159. ISBN 978-1558601413. {{cite book}}: |journal= ignored (help)
  24. Frey, Peter W.; Slate, David J. (1991). "हॉलैंड-शैली अनुकूली क्लासिफायर का उपयोग करके अक्षर पहचान". Machine Learning (in English). 6 (2): 161–182. doi:10.1007/BF00114162. ISSN 0885-6125.
  25. Valenzuela-Rendón, Manuel. "The Fuzzy Classifier System: A Classifier System for Continuously Varying Variables." In ICGA, pp. 346-353. 1991.
  26. Riolo, Rick L. (1988-01-01). लर्निंग क्लासिफायर सिस्टम में डिफ़ॉल्ट पदानुक्रम और नियमों के अनुक्रम का अनुभवजन्य अध्ययन (Thesis). Ann Arbor, MI, USA: University of Michigan.
  27. R.L., Riolo (1987-01-01). "बकेट ब्रिगेड का प्रदर्शन. I. क्लासिफायर का लंबा क्रम". Genetic Algorithms and Their Applications: Proceedings of the Second International Conference on Genetic Algorithms: July 28–31, 1987 at the Massachusetts Institute of Technology, Cambridge, MA (in English).
  28. R.L., Riolo (1987-01-01). "बकेट ब्रिगेड का प्रदर्शन. द्वितीय. डिफ़ॉल्ट पदानुक्रम". Genetic Algorithms and Their Applications: Proceedings of the Second International Conference on Genetic Algorithms: July 28–31, 1987 at the Massachusetts Institute of Technology, Cambridge, MA (in English).
  29. 29.0 29.1 W. Stolzmann, "Anticipatory classifier systems," in Proceedings of the 3rd Annual Genetic Programming Conference, pp. 658–664, 1998.
  30. Riolo, Rick L. (1990-01-01). क्लासिफायर सिस्टम में लुकहेड प्लानिंग और अव्यक्त शिक्षण. pp. 316–326. ISBN 978-0262631389. {{cite book}}: |journal= ignored (help)
  31. Watkins, Christopher John Cornish Hellaby. "Learning from delayed rewards." PhD diss., University of Cambridge, 1989.
  32. 32.0 32.1 Wilson, Stewart W. (1994-03-01). "ZCS: A Zeroth Level Classifier System". Evolutionary Computation. 2 (1): 1–18. CiteSeerX 10.1.1.363.798. doi:10.1162/evco.1994.2.1.1. ISSN 1063-6560. S2CID 17680778.
  33. Lanzi, P. L. (2002). "सुदृढीकरण सीखने के नजरिए से सीखना क्लासिफायर सिस्टम". Soft Computing (in English). 6 (3–4): 162–170. doi:10.1007/s005000100113. ISSN 1432-7643. S2CID 39103390.
  34. Kovacs, Timothy Michael Douglas. A Comparison of Strength and Accuracy-based Fitness in Learning and Classifier Systems. 2002.
  35. Kovacs, Tim. "Two views of classifier systems." In International Workshop on Learning Classifier Systems, pp. 74-87. Springer Berlin Heidelberg, 2001
  36. 36.0 36.1 Congdon, Clare Bates. "A comparison of genetic algorithms and other machine learning systems on a complex classification task from common disease research." PhD diss., The University of Michigan, 1995.
  37. Holmes, John H. (1996-01-01). "क्लिनिकल डेटा में ज्ञान की खोज के लिए आनुवंशिकी-आधारित मशीन लर्निंग दृष्टिकोण". Proceedings of the AMIA Annual Fall Symposium: 883. ISSN 1091-8280. PMC 2233061.
  38. Holmes, John H. "Discovering Risk of Disease with a Learning Classifier System." In ICGA, pp. 426-433. 1997.
  39. Holmes, John H., and Jennifer A. Sager. "Rule discovery in epidemiologic surveillance data using EpiXCS: an evolutionary computation approach." InConference on Artificial Intelligence in Medicine in Europe, pp. 444-452. Springer Berlin Heidelberg, 2005.
  40. Butz, Martin V. "Biasing exploration in an anticipatory learning classifier system." In International Workshop on Learning Classifier Systems, pp. 3-22. Springer Berlin Heidelberg, 2001.
  41. Wilson, Stewart W. (2002). "वर्गीकरणकर्ता जो कार्यों का अनुमान लगाते हैं". Natural Computing (in English). 1 (2–3): 211–234. doi:10.1023/A:1016535925043. ISSN 1567-7818. S2CID 23032802.
  42. Bull, Larry. "A simple accuracy-based learning classifier system." Learning Classifier Systems Group Technical Report UWELCSG03-005, University of the West of England, Bristol, UK (2003).
  43. Bull, Larry. "A simple payoff-based learning classifier system." InInternational Conference on Parallel Problem Solving from Nature, pp. 1032-1041. Springer Berlin Heidelberg, 2004.
  44. Peñarroya, Jaume Bacardit. "Pittsburgh genetic-based machine learning in the data mining era: representations, generalization, and run-time." PhD diss., Universitat Ramon Llull, 2004.
  45. Bacardit, Jaume; Burke, Edmund K.; Krasnogor, Natalio (2008-12-12). "नियम-आधारित विकासवादी शिक्षा की मापनीयता में सुधार". Memetic Computing (in English). 1 (1): 55–67. doi:10.1007/s12293-008-0005-4. ISSN 1865-9284. S2CID 775199.
  46. Drugowitsch, Jan (2008). लर्निंग क्लासिफायर सिस्टम का डिज़ाइन और विश्लेषण - स्प्रिंगर. Studies in Computational Intelligence. Vol. 139. doi:10.1007/978-3-540-79866-8. ISBN 978-3-540-79865-1.
  47. Urbanowicz, Ryan J., Gediminas Bertasius, and Jason H. Moore. "An extended michigan-style learning classifier system for flexible supervised learning, classification, and data mining." In International Conference on Parallel Problem Solving from Nature, pp. 211-221. Springer International Publishing, 2014.
  48. Urbanowicz, Ryan J., Delaney Granizo-Mackenzie, and Jason H. Moore. "Using expert knowledge to guide covering and mutation in a michigan style learning classifier system to detect epistasis and heterogeneity." InInternational Conference on Parallel Problem Solving from Nature, pp. 266-275. Springer Berlin Heidelberg, 2012.
  49. Urbanowicz, Ryan; Granizo-Mackenzie, Ambrose; Moore, Jason (2012-01-01). मिशिगन-शैली सुपरवाइज्ड लर्निंग क्लासिफायर सिस्टम के लिए इंस्टेंस-लिंक्ड एट्रिब्यूट ट्रैकिंग और फीडबैक. pp. 927–934. doi:10.1145/2330163.2330291. ISBN 9781450311779. S2CID 142534. {{cite book}}: |journal= ignored (help)
  50. Bacardit, Jaume; Krasnogor, Natalio (2009-01-01). बड़े पैमाने पर वर्गीकरण डोमेन के लिए एक मिश्रित असतत-निरंतर विशेषता सूची प्रतिनिधित्व. pp. 1155–1162. CiteSeerX 10.1.1.158.7314. doi:10.1145/1569901.1570057. ISBN 9781605583259. S2CID 10906515. {{cite book}}: |journal= ignored (help)
  51. Iqbal, Muhammad; Browne, Will N.; Zhang, Mengjie (2014-08-01). "जटिल, बड़े पैमाने की बूलियन समस्याओं को हल करने के लिए निकाले गए ज्ञान के बिल्डिंग ब्लॉक्स का पुन: उपयोग करना". IEEE Transactions on Evolutionary Computation. 18 (4): 465–480. doi:10.1109/tevc.2013.2281537. S2CID 525358.
  52. Urbanowicz, Ryan J.; Moore, Jason H. (2015-04-03). "ExSTraCS 2.0: description and evaluation of a scalable learning classifier system". Evolutionary Intelligence (in English). 8 (2–3): 89–116. doi:10.1007/s12065-015-0128-8. ISSN 1864-5909. PMC 4583133. PMID 26417393.
  53. Booker, L. B.; Goldberg, D. E.; Holland, J. H. (1989-09-01). "क्लासिफायर सिस्टम और जेनेटिक एल्गोरिदम" (PDF). Artificial Intelligence. 40 (1): 235–282. doi:10.1016/0004-3702(89)90050-7. hdl:2027.42/27777.
  54. Wilson, Stewart W., and David E. Goldberg. "A critical review of classifier systems." In Proceedings of the third international conference on Genetic algorithms, pp. 244-255. Morgan Kaufmann Publishers Inc., 1989.


बाहरी संबंध

वीडियो ट्यूटोरियल

वेबपेज

श्रेणी:विकासवादी कलन विधि