लर्निंग क्लासिफायर सिस्टम

From Vigyanwiki
Revision as of 12:35, 10 July 2023 by alpha>Indicwiki (Created page with "{{short description|Paradigm of rule-based machine learning methods}} File:Function approximation with LCS rules.jpg|thumb|एलसीएस नियमों का 2ड...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
एलसीएस नियमों का 2डी विज़ुअलाइज़ेशन एक 3डी फ़ंक्शन का अनुमान लगाना सीख रहा है। प्रत्येक नीला दीर्घवृत्त समाधान स्थान के भाग को कवर करने वाले एक व्यक्तिगत नियम का प्रतिनिधित्व करता है। (एक्ससीएसएफ से ली गई छवियों से अनुकूलित[1] मार्टिन बुट्ज़ की अनुमति से)

लर्निंग क्लासिफायर सिस्टम, या एलसीएस, नियम-आधारित मशीन लर्निंग विधियों का एक प्रतिमान है जो एक खोज घटक (उदाहरण के लिए आमतौर पर एक आनुवंशिक एल्गोरिदम) को एक सीखने के घटक के साथ जोड़ता है (या तो पर्यवेक्षित शिक्षण, सुदृढीकरण सीखने, या अनपर्यवेक्षित शिक्षण को निष्पादित करता है)।[2] लर्निंग क्लासिफायर सिस्टम संदर्भ-निर्भर नियमों के एक सेट की पहचान करना चाहते हैं जो भविष्यवाणियां करने के लिए सामूहिक रूप से ज्ञान को संग्रहीत और लागू करते हैं (उदाहरण के लिए व्यवहार मॉडलिंग,[3] सांख्यिकीय वर्गीकरण,[4][5] डेटा खनन,[5][6][7] प्रतिगमन विश्लेषण,[8] फ़ंक्शन सन्निकटन,[9] या रणनीति (गेम थ्योरी)). यह दृष्टिकोण जटिल व्यवहार्य क्षेत्र को छोटे, सरल भागों में विभाजित करने की अनुमति देता है।

सीखने के क्लासिफायर सिस्टम के पीछे की संस्थापक अवधारणाएँ एक कृत्रिम संज्ञानात्मक प्रणाली (यानी कृत्रिम बुद्धिमत्ता) बनाने के लिए नियम-आधारित एजेंटों का उपयोग करके जटिल अनुकूली प्रणालियों को मॉडल करने के प्रयासों से आई हैं।

कार्यप्रणाली

किसी दिए गए शिक्षण वर्गीकरण प्रणाली की वास्तुकला और घटक काफी परिवर्तनशील हो सकते हैं। एलसीएस को एक मशीन के रूप में सोचना उपयोगी है जिसमें कई इंटरैक्टिंग घटक शामिल हैं। किसी दिए गए समस्या डोमेन (जैसे एल्गोरिथम बिल्डिंग ब्लॉक) की मांगों के अनुरूप घटकों को जोड़ा या हटाया जा सकता है, या मौजूदा घटकों को संशोधित/विनिमय किया जा सकता है या एल्गोरिदम को कई अलग-अलग समस्या डोमेन में कार्य करने के लिए पर्याप्त लचीला बनाया जा सकता है। परिणामस्वरूप, एलसीएस प्रतिमान को कई समस्या डोमेन पर लचीले ढंग से लागू किया जा सकता है जो यंत्र अधिगम की मांग करते हैं। एलसीएस कार्यान्वयन के बीच प्रमुख विभाजन इस प्रकार हैं: (1) मिशिगन-शैली वास्तुकला बनाम पिट्सबर्ग-शैली वास्तुकला,[10] (2) सुदृढीकरण शिक्षण बनाम पर्यवेक्षित शिक्षण, (3) वृद्धिशील शिक्षण बनाम बैच शिक्षण, (4) ऑनलाइन मशीन लर्निंग बनाम ऑफ़लाइन शिक्षण, (5) शक्ति-आधारित फिटनेस बनाम सटीकता-आधारित फिटनेस, और (6) पूर्ण एक्शन मैपिंग बनाम सर्वश्रेष्ठ एक्शन मैपिंग। ये विभाजन आवश्यक रूप से परस्पर अनन्य नहीं हैं। उदाहरण के लिए, एक्ससीएस,[11]सबसे प्रसिद्ध और सबसे अच्छा अध्ययन किया गया एलसीएस एल्गोरिथ्म, मिशिगन-शैली है, इसे सुदृढीकरण सीखने के लिए डिज़ाइन किया गया था, लेकिन यह पर्यवेक्षित शिक्षण भी कर सकता है, वृद्धिशील शिक्षण लागू करता है जो ऑनलाइन या ऑफ़लाइन हो सकता है, सटीकता-आधारित फिटनेस लागू करता है, और एक पूर्ण कार्रवाई उत्पन्न करना चाहता है मानचित्रण.

एक सामान्य एलसीएस एल्गोरिदम के तत्व

पर्यवेक्षित शिक्षण को निष्पादित करने वाले एक सामान्य मिशिगन-शैली सीखने के क्लासिफायर सिस्टम सीखने के चक्र को दर्शाने वाला एक चरण-वार योजनाबद्ध

यह ध्यान में रखते हुए कि एलसीएस एक विशिष्ट विधि के बजाय आनुवंशिक-आधारित मशीन लर्निंग के लिए एक प्रतिमान है, निम्नलिखित एक सामान्य, आधुनिक (यानी पोस्ट-एक्ससीएस) एलसीएस एल्गोरिदम के प्रमुख तत्वों की रूपरेखा तैयार करता है। सरलता के लिए आइए हम पर्यवेक्षित शिक्षण के साथ मिशिगन शैली की वास्तुकला पर ध्यान केंद्रित करें। इस प्रकार के सामान्य एलसीएस में शामिल अनुक्रमिक चरणों को दर्शाते हुए दाईं ओर दिए गए चित्र देखें।

पर्यावरण

पर्यावरण डेटा का स्रोत है जिस पर एलसीएस सीखता है। यह एक ऑफ़लाइन, परिमित प्रशिक्षण डेटा सेट (डेटा खनन, सांख्यिकीय वर्गीकरण, या प्रतिगमन समस्या की विशेषता) या लाइव प्रशिक्षण उदाहरणों की एक ऑनलाइन अनुक्रमिक स्ट्रीम हो सकती है। यह माना जाता है कि प्रत्येक प्रशिक्षण उदाहरण में कुछ संख्या में विशेषताएं (जिन्हें गुण, या आश्रित और स्वतंत्र चर भी कहा जाता है), और रुचि का एक एकल समापन बिंदु (जिसे क्लास (सेट सिद्धांत), क्रिया, फेनोटाइप, भविष्यवाणी, या भी कहा जाता है) शामिल होता है। आश्रित और स्वतंत्र चर)। एलसीएस सीखने के भाग में फीचर चयन शामिल हो सकता है, इसलिए प्रशिक्षण डेटा में सभी सुविधाओं को जानकारीपूर्ण होने की आवश्यकता नहीं है। किसी इंस्टेंस के फ़ीचर मानों के सेट को आमतौर पर राज्य के रूप में जाना जाता है। सरलता के लिए आइए बूलियन डेटा प्रकार/बाइनरी संख्या सुविधाओं और बूलियन डेटा प्रकार/बाइनरी नंबर वर्ग के साथ एक उदाहरण समस्या डोमेन मान लें। मिशिगन-शैली प्रणालियों के लिए, प्रत्येक सीखने के चक्र (यानी वृद्धिशील शिक्षा) पर पर्यावरण से एक उदाहरण प्रशिक्षित किया जाता है। पिट्सबर्ग-शैली प्रणालियाँ बैच लर्निंग करती हैं, जहाँ प्रत्येक पुनरावृत्ति में अधिकांश या सभी प्रशिक्षण डेटा पर नियम सेट का मूल्यांकन किया जाता है।

नियम/वर्गीकरणकर्ता/जनसंख्या

एक नियम राज्य मूल्यों और कुछ पूर्वानुमानों के बीच एक संदर्भ पर निर्भर संबंध है। नियम आम तौर पर {IF:THEN} अभिव्यक्ति का रूप लेते हैं, (उदाहरण के लिए {IF 'स्थिति' फिर 'कार्रवाई'}, या अधिक विशिष्ट उदाहरण के रूप में, {IF 'लाल' और 'अष्टकोण' फिर 'स्टॉप-साइन'} ). एलसीएस और नियम-आधारित मशीन लर्निंग में एक महत्वपूर्ण अवधारणा यह है कि एक व्यक्तिगत नियम अपने आप में एक मॉडल नहीं है, क्योंकि नियम केवल तभी लागू होता है जब उसकी शर्त पूरी हो जाती है। किसी नियम को समाधान स्थान के स्थानीय-मॉडल के रूप में सोचें।

विभिन्न डेटा प्रकारों को संभालने के लिए नियमों को कई अलग-अलग तरीकों से प्रस्तुत किया जा सकता है (उदाहरण के लिए बाइनरी, असतत-मूल्यवान, क्रमसूचक, निरंतर-मूल्यवान)। बाइनरी डेटा को देखते हुए एलसीएस पारंपरिक रूप से एक टर्नरी नियम प्रतिनिधित्व लागू करता है (यानी नियमों में डेटा में प्रत्येक सुविधा के लिए 0, 1, या '#' शामिल हो सकता है)। 'परवाह न करें' प्रतीक (यानी '#') एक नियम की स्थिति के भीतर एक वाइल्ड कार्ड के रूप में कार्य करता है जो नियमों और सिस्टम को सुविधाओं और अनुमानित किए जाने वाले लक्ष्य समापन बिंदु के बीच संबंधों को सामान्य बनाने की अनुमति देता है। निम्नलिखित नियम पर विचार करें (#1###0 ~ 1) (अर्थात शर्त ~ क्रिया)। इस नियम की व्याख्या इस प्रकार की जा सकती है: यदि दूसरी विशेषता = 1 और छठी विशेषता = 0 तो वर्ग भविष्यवाणी = 1। हम कहेंगे कि इस नियम में दूसरी और छठी विशेषता निर्दिष्ट की गई थी, जबकि अन्य को सामान्यीकृत किया गया था। यह नियम और संबंधित भविष्यवाणी केवल उस उदाहरण पर लागू होती है जब नियम की स्थिति उदाहरण से संतुष्ट होती है। इसे आमतौर पर मिलान के रूप में जाना जाता है। मिशिगन-शैली एलसीएस में, प्रत्येक नियम की अपनी फिटनेस होती है, साथ ही इसके साथ जुड़े कई अन्य नियम-पैरामीटर होते हैं जो उस नियम की मौजूदा प्रतियों की संख्या (यानी संख्यात्मकता), नियम की उम्र, का वर्णन कर सकते हैं। इसकी सटीकता, या इसके इनाम की भविष्यवाणियों की सटीकता, और अन्य वर्णनात्मक या अनुभवात्मक आँकड़े। एक नियम को उसके मापदंडों के साथ अक्सर क्लासिफायरियर के रूप में जाना जाता है। मिशिगन-शैली प्रणालियों में, क्लासिफायर एक आबादी के भीतर समाहित होते हैं [पी] जिसमें उपयोगकर्ता द्वारा परिभाषित अधिकतम संख्या में क्लासिफायर होते हैं। अधिकांश स्टोकेस्टिक खोज एल्गोरिदम (उदाहरण के लिए विकासवादी एल्गोरिदम) के विपरीत, एलसीएस आबादी खाली शुरू होती है (यानी नियम आबादी को यादृच्छिक रूप से आरंभ करने की कोई आवश्यकता नहीं है)। इसके बजाय क्लासिफायर को शुरू में एक कवरिंग तंत्र के साथ आबादी के सामने पेश किया जाएगा।

किसी भी एलसीएस में, प्रशिक्षित मॉडल किसी एकल नियम/वर्गीकरणकर्ता के बजाय नियमों/वर्गीकरणकर्ताओं का एक सेट होता है। मिशिगन-शैली एलसीएस में, संपूर्ण प्रशिक्षित (और वैकल्पिक रूप से, संकुचित) वर्गीकरणकर्ता जनसंख्या भविष्यवाणी मॉडल बनाती है।

मिलान

एलसीएस के सबसे महत्वपूर्ण और अक्सर समय लेने वाले तत्वों में से एक मिलान प्रक्रिया है। एलसीएस सीखने के चक्र में पहला कदम पर्यावरण से एक एकल प्रशिक्षण उदाहरण लेता है और इसे [पी] में भेजता है जहां मिलान होता है। चरण दो में, अब [पी] में प्रत्येक नियम की तुलना प्रशिक्षण उदाहरण से की जाती है ताकि यह देखा जा सके कि कौन से नियम मेल खाते हैं (यानी वर्तमान उदाहरण के लिए प्रासंगिक रूप से प्रासंगिक हैं)। चरण तीन में, किसी भी मिलान नियम को मिलान सेट [एम] में ले जाया जाता है। एक नियम एक प्रशिक्षण उदाहरण से मेल खाता है यदि नियम शर्त में निर्दिष्ट सभी फीचर मान प्रशिक्षण उदाहरण में संबंधित फीचर मान के बराबर हैं। उदाहरण के लिए, यह मानते हुए कि प्रशिक्षण उदाहरण (001001 ~ 0) है, ये नियम मेल खाएंगे: (###0## ~ 0), (00###1 ~ 0), (#01001 ~ 1), लेकिन ये नियम (1##### ~ 0), (000##1 ~ 0), (#0#1#0 ~ 1) नहीं होगा। ध्यान दें कि मिलान में, नियम द्वारा निर्दिष्ट समापन बिंदु/क्रिया को ध्यान में नहीं रखा जाता है। परिणामस्वरूप, मिलान सेट में ऐसे क्लासिफायर शामिल हो सकते हैं जो परस्पर विरोधी कार्रवाइयों का प्रस्ताव देते हैं। चौथे चरण में, चूँकि हम पर्यवेक्षित शिक्षण कर रहे हैं, [एम] को एक सही सेट [सी] और एक गलत सेट [आई] में विभाजित किया गया है। एक मिलान नियम सही सेट में चला जाता है यदि यह सही कार्रवाई का प्रस्ताव करता है (प्रशिक्षण उदाहरण की ज्ञात कार्रवाई के आधार पर), अन्यथा यह [I] में चला जाता है। सुदृढीकरण सीखने वाले एलसीएस में, इसके बजाय एक एक्शन सेट [ए] बनाया जाएगा, क्योंकि सही कार्रवाई ज्ञात नहीं है।

ढकना

सीखने के चक्र में इस बिंदु पर, यदि कोई वर्गीकरणकर्ता इसे [एम] या [सी] में नहीं बनाता है (जैसा कि तब होता है जब जनसंख्या खाली शुरू होती है), कवरिंग तंत्र लागू किया जाता है (पांचवां चरण)। कवरिंग ऑनलाइन स्मार्ट जनसंख्या आरंभीकरण का एक रूप है। कवरिंग बेतरतीब ढंग से एक नियम उत्पन्न करता है जो वर्तमान प्रशिक्षण उदाहरण से मेल खाता है (और पर्यवेक्षित शिक्षण के मामले में, वह नियम भी सही कार्रवाई के साथ उत्पन्न होता है। यह मानते हुए कि प्रशिक्षण उदाहरण (001001 ~ 0) है, कवरिंग निम्नलिखित में से कोई भी नियम उत्पन्न कर सकता है: (#0#0## ~ 0), (001001 ~ 0), (#010## ~ 0)। कवर करना न केवल यह सुनिश्चित करता है कि प्रत्येक सीखने के चक्र में कम से कम एक सही, [सी] से मेल खाने वाला नियम है, बल्कि वह जनसंख्या में आरंभ किया गया कोई भी नियम कम से कम एक प्रशिक्षण उदाहरण से मेल खाएगा। यह एलसीएस को उन नियमों के खोज स्थान की खोज करने से रोकता है जो किसी भी प्रशिक्षण उदाहरण से मेल नहीं खाते हैं।

पैरामीटर अपडेट/क्रेडिट असाइनमेंट/लर्निंग

छठे चरण में, [एम] में किसी भी नियम के नियम मापदंडों को वर्तमान प्रशिक्षण उदाहरण से प्राप्त नए अनुभव को प्रतिबिंबित करने के लिए अद्यतन किया जाता है। एलसीएस एल्गोरिदम के आधार पर, इस चरण में कई अपडेट हो सकते हैं। पर्यवेक्षित शिक्षण के लिए, हम बस किसी नियम की सटीकता/त्रुटि को अपडेट कर सकते हैं। नियम सटीकता/त्रुटि मॉडल सटीकता/त्रुटि से भिन्न है, क्योंकि इसकी गणना संपूर्ण प्रशिक्षण डेटा पर नहीं की जाती है, बल्कि केवल उन सभी उदाहरणों पर की जाती है जिनसे यह मेल खाता है। नियम सटीकता की गणना नियम के सही सेट [सी] में होने की संख्या को मैच सेट [एम] में होने की संख्या से विभाजित करके की जाती है। नियम सटीकता को 'स्थानीय सटीकता' के रूप में माना जा सकता है। नियम फिटनेस को भी यहां अपडेट किया जाता है, और आमतौर पर इसकी गणना नियम सटीकता के एक फ़ंक्शन के रूप में की जाती है। फिटनेस की अवधारणा सीधे क्लासिक आनुवंशिक एल्गोरिदम से ली गई है। ध्यान रखें कि क्रेडिट असाइनमेंट और सीखने के लिए एलसीएस मापदंडों को कैसे अपडेट करता है, इस पर कई भिन्नताएं हैं।

उपग्रहण

सातवें चरण में, आमतौर पर एक सब्सम्प्शन तंत्र लागू किया जाता है। सब्सम्प्शन एक स्पष्ट सामान्यीकरण तंत्र है जो उन क्लासिफायरों को मर्ज करता है जो समस्या स्थान के अनावश्यक हिस्सों को कवर करते हैं। सब्ज्यूमिंग क्लासिफायर, सब्ज्यूम्ड क्लासिफायर को प्रभावी ढंग से अवशोषित कर लेता है (और इसकी संख्या बढ़ जाती है)। यह तभी हो सकता है जब सब्ज्यूमिंग क्लासिफायरियर अधिक सामान्य, उतना ही सटीक हो, और इसमें शामिल क्लासिफायरियर के सभी समस्या स्थान को कवर करता हो।

नियम खोज/आनुवंशिक एल्गोरिथ्म

आठवें चरण में, एलसीएस एक उच्च अभिजात्य आनुवंशिक एल्गोरिथ्म (जीए) को अपनाता है जो फिटनेस (योग्यतम की उत्तरजीविता) के आधार पर दो मूल वर्गीकरणकर्ताओं का चयन करेगा। माता-पिता का चयन आमतौर पर टूर्नामेंट चयन का उपयोग करके [सी] से किया जाता है। कुछ प्रणालियों ने रूलेट व्हील चयन या नियतात्मक चयन को लागू किया है, और या तो [पी] - पैनमिक्टिक चयन, या [एम]) से अलग-अलग मूल नियमों का चयन किया है। क्रॉसओवर (जेनेटिक एल्गोरिदम) और म्यूटेशन (जेनेटिक एल्गोरिदम) ऑपरेटरों को अब दो नए संतान नियम उत्पन्न करने के लिए लागू किया जाता है। इस बिंदु पर, माता-पिता और संतान दोनों के नियम [पी] पर वापस आ जाते हैं। एलसीएस जेनेटिक एल्गोरिदम अत्यधिक अभिजात्य है क्योंकि प्रत्येक सीखने की पुनरावृत्ति में, आबादी का विशाल बहुमत संरक्षित होता है। नियम की खोज वैकल्पिक रूप से किसी अन्य विधि द्वारा की जा सकती है, जैसे कि वितरण एल्गोरिदम का अनुमान, लेकिन जीए अब तक का सबसे आम दृष्टिकोण है। जीए जैसे विकासवादी एल्गोरिदम एक स्टोकेस्टिक खोज को नियोजित करते हैं, जो एलसीएस को एक स्टोकेस्टिक एल्गोरिदम बनाता है। एलसीएस चतुराई से खोज स्थान का पता लगाना चाहता है, लेकिन नियम संयोजनों की विस्तृत खोज नहीं करता है, और एक इष्टतम समाधान पर जुटने की गारंटी नहीं है।

विलोपन

सामान्य एलसीएस सीखने के चक्र में अंतिम चरण अधिकतम जनसंख्या आकार को बनाए रखना है। विलोपन तंत्र विलोपन के लिए क्लासिफायर का चयन करेगा (आमतौर पर रूलेट व्हील चयन का उपयोग करके)। किसी क्लासिफायरियर को हटाने के लिए चुने जाने की संभावना उसकी उपयुक्तता के व्युत्क्रमानुपाती होती है। जब किसी क्लासिफायर को हटाने के लिए चुना जाता है, तो इसका संख्यात्मकता पैरामीटर एक से कम हो जाता है। जब किसी क्लासिफायरियर की संख्या शून्य हो जाती है, तो उसे जनसंख्या से पूरी तरह हटा दिया जाता है।

प्रशिक्षण

एलसीएस कुछ उपयोगकर्ता परिभाषित संख्या में प्रशिक्षण पुनरावृत्तियों के लिए, या जब तक कुछ उपयोगकर्ता परिभाषित समाप्ति मानदंड पूरे नहीं हो जाते, इन चरणों के माध्यम से बार-बार चक्र करेगा। ऑनलाइन सीखने के लिए, एलसीएस पर्यावरण से प्रत्येक पुनरावृत्ति में एक पूरी तरह से नया प्रशिक्षण उदाहरण प्राप्त करेगा। ऑफ़लाइन सीखने के लिए, एलसीएस एक सीमित प्रशिक्षण डेटासेट के माध्यम से पुनरावृत्त करेगा। एक बार जब यह डेटासेट में अंतिम उदाहरण तक पहुंच जाता है, तो यह पहले उदाहरण पर वापस चला जाएगा और डेटासेट के माध्यम से फिर से चक्र करेगा।

नियम संघनन

एक बार प्रशिक्षण पूरा हो जाने पर, नियम जनसंख्या में अनिवार्य रूप से कुछ खराब, अनावश्यक और अनुभवहीन नियम शामिल होंगे। पोस्ट-प्रोसेसिंग चरण के रूप में नियम संघनन, या संक्षेपण अनुमान लागू करना आम बात है। यह परिणामी संकुचित नियम जनसंख्या एक भविष्यवाणी मॉडल के रूप में लागू होने के लिए तैयार है (उदाहरण के लिए परीक्षण उदाहरणों पर भविष्यवाणियां करें), और/या ज्ञान की खोज के लिए व्याख्या की जाए।

भविष्यवाणी

चाहे नियम संघनन लागू किया गया हो या नहीं, एलसीएस एल्गोरिदम का आउटपुट क्लासिफायर की आबादी है जिसे पहले से अनदेखे उदाहरणों पर भविष्यवाणियां करने के लिए लागू किया जा सकता है। भविष्यवाणी तंत्र स्वयं पर्यवेक्षित एलसीएस सीखने के चक्र का हिस्सा नहीं है, हालांकि यह सुदृढीकरण सीखने वाले एलसीएस सीखने के चक्र में एक महत्वपूर्ण भूमिका निभाएगा। अभी हम इस बात पर विचार करते हैं कि डेटा का परीक्षण करने के लिए भविष्यवाणियां करने के लिए भविष्यवाणी तंत्र को कैसे लागू किया जा सकता है। पूर्वानुमान लगाते समय, एलसीएस सीखने के घटकों को निष्क्रिय कर दिया जाता है ताकि आबादी आने वाले परीक्षण डेटा से सीखना जारी न रखे। एक परीक्षण उदाहरण [पी] को पास किया जाता है जहां हमेशा की तरह एक मैच सेट [एम] बनता है। इस बिंदु पर मैच सेट को भविष्यवाणी सरणी में अलग तरीके से पास किया जाता है। मैच सेट के नियम विभिन्न क्रियाओं की भविष्यवाणी कर सकते हैं, इसलिए एक वोटिंग योजना लागू की जाती है। एक साधारण वोटिंग योजना में, मिलान नियमों से सबसे मजबूत समर्थन वाले 'वोट' वाली कार्रवाई जीत जाती है, और चयनित भविष्यवाणी बन जाती है। सभी नियमों को समान वोट नहीं मिलता है। बल्कि किसी एक नियम के लिए वोट की ताकत आमतौर पर उसकी संख्या और उपयुक्तता पर निर्भर होती है। यह वोटिंग योजना और एलसीएस के ज्ञान को संग्रहीत करने की प्रकृति से पता चलता है कि एलसीएस एल्गोरिदम अंतर्निहित रूप से शिक्षार्थियों को इकट्ठा करते हैं।

व्याख्या

व्यक्तिगत एलसीएस नियम आमतौर पर मानव पठनीय IF:THEN अभिव्यक्ति हैं। एलसीएस भविष्यवाणी मॉडल का गठन करने वाले नियमों को विभिन्न नियम मापदंडों के आधार पर रैंक किया जा सकता है और मैन्युअल रूप से निरीक्षण किया जा सकता है। सांख्यिकीय और ग्राफ़िकल का उपयोग करके ज्ञान खोज का मार्गदर्शन करने के लिए वैश्विक रणनीतियाँ भी प्रस्तावित की गई हैं।[12][13]अन्य उन्नत मशीन लर्निंग दृष्टिकोणों के संबंध में, जैसे कि कृत्रिम तंत्रिका नेटवर्क, यादृच्छिक वन, या आनुवंशिक प्रोग्रामिंग, लर्निंग क्लासिफायर सिस्टम विशेष रूप से उन समस्याओं के लिए उपयुक्त हैं जिनके लिए व्याख्यात्मक समाधान की आवश्यकता होती है।

इतिहास

प्रारंभिक वर्ष

जॉन हेनरी हॉलैंड को उनकी अभूतपूर्व पुस्तक एडेप्टेशन इन नेचुरल एंड आर्टिफिशियल सिस्टम्स के माध्यम से जेनेटिक एल्गोरिदम (जीए) को लोकप्रिय बनाने के लिए जाना जाता था।[14] 1975 में और उन्होंने हॉलैंड के स्कीमा प्रमेय को औपचारिक रूप दिया। 1976 में, हॉलैंड ने जीए अवधारणा के विस्तार की संकल्पना की जिसे उन्होंने संज्ञानात्मक प्रणाली कहा,[15] और एडेप्टिव एल्गोरिदम पर आधारित कॉग्निटिव सिस्टम्स पेपर में पहली लर्निंग क्लासिफायर सिस्टम के रूप में जाने जाने वाले का पहला विस्तृत विवरण प्रदान किया गया।[16] कॉग्निटिव सिस्टम वन (CS-1) नाम की इस पहली प्रणाली की कल्पना एक मॉडलिंग टूल के रूप में की गई थी, जिसे मानव पठनीय नियमों की आबादी का उपयोग करके अज्ञात अंतर्निहित गतिशीलता के साथ एक वास्तविक प्रणाली (यानी पर्यावरण) को मॉडल करने के लिए डिज़ाइन किया गया था। लक्ष्य यह था कि नियमों का एक सेट बनाया जाए ताकि ऑनलाइन मशीन लर्निंग को कम भुगतान/इनाम (यानी सुदृढीकरण सीखना) के आधार पर पर्यावरण के अनुकूल बनाया जा सके और वास्तविक प्रणाली से मेल खाने वाले व्यवहार को उत्पन्न करने के लिए इन नियमों को लागू किया जा सके। इस प्रारंभिक, महत्वाकांक्षी कार्यान्वयन को बाद में अत्यधिक जटिल माना गया, जिससे असंगत परिणाम मिले।[2][17] 1980 की शुरुआत में, केनेथ ए डी जोंग और उनके छात्र स्टीफन स्मिथ ने (एलएस-1) के साथ नियम-आधारित मशीन लर्निंग के लिए एक अलग दृष्टिकोण अपनाया, जहां सीखने को ऑनलाइन अनुकूलन प्रक्रिया के बजाय ऑफ़लाइन अनुकूलन प्रक्रिया के रूप में देखा गया था।[18][19][20] यह नया दृष्टिकोण एक मानक आनुवंशिक एल्गोरिदम के समान था लेकिन नियमों के स्वतंत्र सेट विकसित किए। उस समय से मिशिगन विश्वविद्यालय में हॉलैंड द्वारा शुरू किए गए ऑनलाइन शिक्षण ढांचे से प्रेरित एलसीएस विधियों को मिशिगन-शैली एलसीएस के रूप में संदर्भित किया गया है, और पिट्सबर्ग विश्वविद्यालय में स्मिथ और डी जोंग से प्रेरित लोगों को पिट्सबर्ग-शैली के रूप में संदर्भित किया गया है। एल.सी.एस.[2][17] 1986 में, हॉलैंड ने वह विकसित किया जिसे अगले दशक के लिए मानक मिशिगन-शैली एलसीएस माना जाएगा।[21] एलसीएस अनुसंधान के शुरुआती दिनों में उभरी अन्य महत्वपूर्ण अवधारणाओं में शामिल हैं (1) क्रेडिट असाइनमेंट/सीखने के लिए बकेट ब्रिगेड एल्गोरिदम (बीबीए) की औपचारिकता,[22] (2) संपूर्ण जनसंख्या [पी] के बजाय एक सामान्य 'पर्यावरणीय क्षेत्र' (यानी मैच सेट [एम]) से मूल नियमों का चयन,[23] (3) कवरिंग, पहली बार क्रिएट ऑपरेटर के रूप में पेश किया गया,[24] (4) एक एक्शन सेट की औपचारिकता [ए],[24](5) एक सरलीकृत एल्गोरिथम वास्तुकला,[24](6) शक्ति-आधारित फिटनेस,[21](7) एकल-चरण, या पर्यवेक्षित सीखने की समस्याओं पर विचार[25] और सही सेट का परिचय [सी],[26] (8) सटीकता-आधारित फिटनेस[27] (9) एलसीएस के साथ फ़ज़ी लॉजिक का संयोजन[28] (जिसने बाद में फजी एलसीएस एल्गोरिदम की एक श्रृंखला को जन्म दिया), (10) बहु-चरणीय समस्याओं पर प्रदर्शन में सुधार के लिए लंबी कार्रवाई श्रृंखलाओं और डिफ़ॉल्ट पदानुक्रमों को प्रोत्साहित करना,[29][30][31] (11) अव्यक्त शिक्षा की जांच करना (जिसने बाद में प्रत्याशित क्लासिफायर सिस्टम (एसीएस) की एक नई शाखा को प्रेरित किया)[32]), और (12) पहली क्यू-लर्निंग-जैसी क्रेडिट असाइनमेंट तकनीक की शुरूआत।[33] हालाँकि इनमें से सभी अवधारणाएँ आधुनिक LCS एल्गोरिदम में लागू नहीं की गई हैं, प्रत्येक LCS प्रतिमान के विकास में मील का पत्थर थीं।

क्रांति

1990 के दशक के मध्य में दो घटनाओं के कारण क्लासिफायर सिस्टम सीखने में रुचि फिर से जागृत हुई; क्यू-लर्निंग|क्यू-लर्निंग एल्गोरिदम का विकास[34] सुदृढीकरण सीखने के लिए, और स्टीवर्ट विल्सन द्वारा महत्वपूर्ण रूप से सरलीकृत मिशिगन-शैली एलसीएस आर्किटेक्चर की शुरूआत।[11][35] विल्सन का जीरोथ-लेवल क्लासिफायर सिस्टम (ZCS)[35]हॉलैंड के मानक एलसीएस कार्यान्वयन के आधार पर एल्गोरिथम समझ बढ़ाने पर ध्यान केंद्रित किया गया।[21] यह, आंशिक रूप से, मूल बीबीए क्रेडिट असाइनमेंट के लिए आवश्यक नियम-बोली और आंतरिक संदेश सूची को हटाकर, और इसे हाइब्रिड बीबीए/क्यू-लर्निंग | क्यू-लर्निंग रणनीति के साथ बदलकर किया गया था। ZCS ने प्रदर्शित किया कि एक बहुत ही सरल LCS आर्किटेक्चर मूल, अधिक जटिल कार्यान्वयन के साथ-साथ अच्छा प्रदर्शन कर सकता है। हालाँकि, ZCS को अभी भी अति-सामान्य क्लासिफायर के प्रसार सहित प्रदर्शन कमियों का सामना करना पड़ा।

1995 में, विल्सन ने अपना ऐतिहासिक पेपर, सटीकता के आधार पर क्लासिफायर फिटनेस प्रकाशित किया जिसमें उन्होंने क्लासिफायर सिस्टम XCS की शुरुआत की।[11] XCS ने ZCS का सरलीकृत आर्किटेक्चर लिया और एक सटीकता-आधारित फिटनेस, एक विशिष्ट GA (एक्शन सेट [ए] में अभिनय), एक स्पष्ट सामान्यीकरण तंत्र जिसे सब्सम्प्शन कहा जाता है, और क्यू-लर्निंग | क्यू-लर्निंग क्रेडिट असाइनमेंट का एक अनुकूलन जोड़ा। . एक्ससीएस को सटीक और अधिकतम सामान्य क्लासिफायर विकसित करते हुए इष्टतम प्रदर्शन तक पहुंचने की क्षमता के साथ-साथ इसकी प्रभावशाली समस्या लचीलापन (सुदृढीकरण सीखने और पर्यवेक्षित सीखने दोनों को निष्पादित करने में सक्षम) द्वारा लोकप्रिय बनाया गया था। XCS बाद में सबसे प्रसिद्ध और सबसे अधिक अध्ययन किया जाने वाला LCS एल्गोरिदम बन गया और सटीकता-आधारित LCS के एक नए परिवार को परिभाषित किया। ZCS वैकल्पिक रूप से शक्ति-आधारित LCS का पर्याय बन गया। XCS इसलिए भी महत्वपूर्ण है, क्योंकि इसने LCS और सुदृढीकरण सीखने के क्षेत्र के बीच अंतर को सफलतापूर्वक पाट दिया है। XCS की सफलता के बाद, LCS को बाद में सामान्यीकरण क्षमता से संपन्न सुदृढीकरण शिक्षण प्रणालियों के रूप में वर्णित किया गया।[36] सुदृढीकरण सीखना आम तौर पर एक मूल्य फ़ंक्शन सीखना चाहता है जो राज्य/क्रिया स्थान का संपूर्ण प्रतिनिधित्व करता है। इसी तरह, एक्ससीएस का डिज़ाइन इसे पर्यावरण में उच्च भुगतान वाले स्थानों पर ध्यान केंद्रित करने के बजाय समस्या स्थान (यानी एक पूर्ण मानचित्र) का एक सर्व-समावेशी और सटीक प्रतिनिधित्व बनाने के लिए प्रेरित करता है (जैसा कि ताकत-आधारित एलसीएस के मामले में था)। वैचारिक रूप से, पूर्ण मानचित्र न केवल यह दर्शाता है कि आपको क्या करना चाहिए, या क्या सही है, बल्कि यह भी दर्शाता है कि आपको क्या नहीं करना चाहिए, या क्या गलत है। अलग तरह से, अधिकांश ताकत-आधारित एलसीएस, या विशेष रूप से पर्यवेक्षित शिक्षण एलसीएस सर्वोत्तम एक्शन मैप (या आंशिक मानचित्र) के रूप में कुशल सामान्यीकरण के नियम सेट की तलाश करते हैं। ताकत बनाम सटीकता-आधारित फिटनेस और पूर्ण बनाम सर्वोत्तम कार्य मानचित्रों के बीच तुलना की अधिक विस्तार से जांच की गई है।[37][38]


एक्ससीएस के मद्देनजर

XCS ने LCS एल्गोरिदम और अनुप्रयोगों की एक पूरी नई पीढ़ी के विकास को प्रेरित किया। 1995 में, कांगडन बीमारी की वास्तविक दुनिया की महामारी विज्ञान जांच में एलसीएस लागू करने वाले पहले व्यक्ति थे [39]होम्स द्वारा बारीकी से अनुसरण किया गया जिन्होंने BOOLE++ विकसित किया,[40] एपीसीएस,[41] और बाद में EpiXCS[42] महामारी विज्ञान वर्गीकरण के लिए. इन शुरुआती कार्यों ने बाद में जैव सूचना विज्ञान अनुप्रयोगों द्वारा जटिल और बड़े पैमाने पर डेटा खनन कार्यों में एलसीएस एल्गोरिदम को लागू करने में रुचि को प्रेरित किया। 1998 में, स्टोलज़मैन ने प्रत्याशित क्लासिफायर सिस्टम (एसीएस) की शुरुआत की जिसमें क्लासिक 'कंडीशन-एक्शन' प्रतिनिधित्व के बजाय 'कंडीशन-एक्शन-इफेक्ट' के रूप में नियम शामिल थे।[32] ACS को किसी वातावरण में सभी संभावित स्थितियों में किसी कार्रवाई के अवधारणात्मक परिणामों की भविष्यवाणी करने के लिए डिज़ाइन किया गया था। दूसरे शब्दों में, सिस्टम एक मॉडल विकसित करता है जो न केवल निर्दिष्ट करता है कि किसी दिए गए स्थिति में क्या करना है, बल्कि यह भी जानकारी प्रदान करता है कि किसी विशिष्ट कार्रवाई के निष्पादित होने के बाद क्या होगा। एलसीएस एल्गोरिदम का यह परिवार बहु-चरणीय समस्याओं, योजना बनाने, सीखने में तेजी लाने या अवधारणात्मक अलियासिंग को स्पष्ट करने के लिए सबसे उपयुक्त है (यानी जहां एक ही अवलोकन अलग-अलग राज्यों में प्राप्त किया जाता है लेकिन अलग-अलग कार्यों की आवश्यकता होती है)। बुट्ज़ ने बाद में एलसीएस के इस प्रत्याशित परिवार का अनुसरण करते हुए मूल पद्धति में कई सुधार विकसित किए।[43] 2002 में, विल्सन ने XCSF की शुरुआत की, जिसमें फ़ंक्शन सन्निकटन करने के लिए एक गणना की गई क्रिया को जोड़ा गया।[44] 2003 में, बर्नैडो-मैन्सिला ने एक सुपरवाइज्ड क्लासिफायर सिस्टम (यूसीएस) पेश किया, जिसने पर्यवेक्षित शिक्षण, एकल-चरण समस्याओं और सर्वोत्तम एक्शन सेट बनाने के कार्य के लिए एक्ससीएस एल्गोरिदम को विशेषीकृत किया। यूसीएस ने एक सरल, सटीकता-आधारित नियम फिटनेस के साथ-साथ सीखने के चरणों का पता लगाने/दोहन करने के पक्ष में सुदृढीकरण सीखने की रणनीति को हटा दिया, जो कई सुदृढीकरण शिक्षार्थियों की विशेषता है। बुल ने एक सरल सटीकता-आधारित LCS (YCS) पेश किया[45] और एक सरल शक्ति-आधारित एलसीएस मिनिमल क्लासिफायर सिस्टम (एमसीएस)[46] एलसीएस ढांचे की बेहतर सैद्धांतिक समझ विकसित करने के लिए। बकार्डिट ने GAssist की शुरुआत की[47] और बायोहेल,[48] पिट्सबर्ग-शैली एलसीएस को जैव सूचना विज्ञान अनुप्रयोगों में डेटा खनन और बड़े डेटासेट में scalability के लिए डिज़ाइन किया गया है। 2008 में, ड्रगोवित्च ने एलसीएस एल्गोरिदम की कुछ सैद्धांतिक परीक्षा सहित लर्निंग क्लासिफायर सिस्टम के डिजाइन और विश्लेषण नामक पुस्तक प्रकाशित की।[49] बुट्ज़ ने एक्ससीएसएफ के लिए ग्राफिकल यूज़र इंटरफ़ेस के भीतर पहला नियम ऑनलाइन लर्निंग विज़ुअलाइज़ेशन पेश किया[1](इस पृष्ठ के शीर्ष पर छवि देखें)। अर्बनोविच ने यूसीएस ढांचे का विस्तार किया और एक्सएसटीआरएसीएस की शुरुआत की, जो स्पष्ट रूप से शोर समस्या वाले डोमेन (जैसे महामारी विज्ञान और जैव सूचना विज्ञान) में पर्यवेक्षित सीखने के लिए डिज़ाइन किया गया है।[50] ExSTraCS ने डेटा में महत्वपूर्ण विशेषताओं की ओर कवरिंग और जेनेटिक एल्गोरिदम को चलाने के लिए (1) विशेषज्ञ ज्ञान को एकीकृत किया,[51] (2) दीर्घकालिक स्मृति का एक रूप जिसे विशेषता ट्रैकिंग कहा जाता है,[52] अधिक कुशल सीखने और विषम डेटा पैटर्न के लक्षण वर्णन की अनुमति, और (3) बकार्डिट के मिश्रित असतत-निरंतर विशेषता सूची प्रतिनिधित्व के समान एक लचीला नियम प्रतिनिधित्व।[53] बकार्डिट और अर्बनोविच दोनों ने एलसीएस नियमों की व्याख्या करने और डेटा माइनिंग के लिए ज्ञान की खोज करने के लिए सांख्यिकीय और विज़ुअलाइज़ेशन रणनीतियों की खोज की।[12][13] ब्राउन और इकबाल ने कोड टुकड़ों के रूप में बिल्डिंग ब्लॉक्स के पुन: उपयोग की अवधारणा की खोज की और सरल मल्टीप्लेक्सर समस्याओं से उपयोगी बिल्डिंग ब्लॉक्स सीखकर 135-बिट मल्टीप्लेक्सर बेंचमार्क समस्या को हल करने वाले पहले व्यक्ति थे।[54] ExSTraCS 2.0 को बाद में मिशिगन-शैली LCS स्केलेबिलिटी में सुधार करने के लिए पेश किया गया, जिसने पहली बार 135-बिट मल्टीप्लेक्सर बेंचमार्क समस्या को सफलतापूर्वक हल किया।[5] एन-बिट बहुसंकेतक समस्या अत्यधिक एपिस्टासिस और समरूपता और विषमता है, जो इसे एक बहुत ही चुनौतीपूर्ण मशीन सीखने का कार्य बनाती है।

वेरिएंट

मिशिगन-स्टाइल लर्निंग क्लासिफायर सिस्टम

मिशिगन-शैली एलसीएस को नियमों की आबादी की विशेषता है जहां आनुवंशिक एल्गोरिदम व्यक्तिगत नियमों के स्तर पर संचालित होता है और समाधान संपूर्ण नियम आबादी द्वारा दर्शाया जाता है। मिशिगन शैली प्रणाली भी क्रमिक रूप से सीखती है जो उन्हें सुदृढीकरण सीखने और पर्यवेक्षित सीखने के साथ-साथ ऑनलाइन और ऑफ़लाइन सीखने दोनों को करने की अनुमति देती है। मिशिगन-शैली प्रणालियों का लाभ यह है कि यह अधिक संख्या में समस्या क्षेत्रों पर लागू होती है, और वृद्धिशील सीखने के अनूठे लाभ हैं।

पिट्सबर्ग-स्टाइल लर्निंग क्लासिफायर सिस्टम

पिट्सबर्ग-शैली एलसीएस को परिवर्तनीय लंबाई नियम-सेटों की आबादी की विशेषता है जहां प्रत्येक नियम-सेट एक संभावित समाधान है। आनुवंशिक एल्गोरिथ्म आम तौर पर संपूर्ण नियम-सेट के स्तर पर संचालित होता है। पिट्सबर्ग-शैली प्रणालियाँ विशिष्ट रूप से क्रमबद्ध नियम सूचियों को विकसित कर सकती हैं, साथ ही एक डिफ़ॉल्ट नियम को भी नियोजित कर सकती हैं। इन प्रणालियों में छोटे नियम सेटों की पहचान करने का प्राकृतिक लाभ होता है, जिससे ये प्रणालियाँ मैन्युअल नियम निरीक्षण के संबंध में अधिक व्याख्या योग्य हो जाती हैं।

हाइब्रिड सिस्टम

ऐसी प्रणालियाँ भी प्रस्तावित की गई हैं जो दोनों प्रणालियों की प्रमुख शक्तियों को संयोजित करना चाहती हैं।

लाभ

  • अनुकूली: ऑनलाइन सीखने के मामले में वे बदलते परिवेश के अनुरूप ढल सकते हैं।
  • मॉडल मुक्त: वे पर्यावरण, या डेटा के भीतर जुड़ाव के पैटर्न के बारे में सीमित धारणाएँ बनाते हैं।
    • वे पूर्व ज्ञान पर भरोसा किए बिना जटिल, एपिस्टैटिक, विषम, या वितरित अंतर्निहित पैटर्न मॉडल कर सकते हैं।
    • वे डेटा में पूर्वानुमानित बनाम गैर-अनुमानित सुविधाओं की संख्या के बारे में कोई धारणा नहीं बनाते हैं।
  • एन्सेम्बल लर्नर: किसी दिए गए उदाहरण पर कोई एकल मॉडल लागू नहीं होता है जो सार्वभौमिक रूप से एक भविष्यवाणी प्रदान करता है। इसके बजाय नियमों का एक प्रासंगिक और अक्सर विरोधाभासी सेट 'वोट' का योगदान देता है जिसे एक अस्पष्ट भविष्यवाणी के रूप में समझा जा सकता है।
  • स्टोकेस्टिक शिक्षार्थी: गैर-नियतात्मक शिक्षा बड़े पैमाने पर या उच्च जटिलता वाली समस्याओं में फायदेमंद होती है जहां नियतात्मक या संपूर्ण शिक्षा कठिन हो जाती है।
  • परोक्ष रूप से बहुउद्देश्यीय: अधिकतम व्यापकता/सरलता को प्रोत्साहित करने वाले अंतर्निहित और स्पष्ट दबावों के साथ नियम सटीकता की ओर विकसित होते हैं। यह अंतर्निहित सामान्यीकरण दबाव एलसीएस के लिए अद्वितीय है। प्रभावी रूप से, अधिक सामान्य नियम, मैच सेट में अधिक बार दिखाई देंगे। बदले में, उनके पास माता-पिता के रूप में चुने जाने का अधिक बार अवसर होता है, और वे अपने अधिक सामान्य (जीनोम) को संतानों तक पहुंचाते हैं।
  • व्याख्यायोग्य: डेटा माइनिंग और ज्ञान खोज के हित में व्यक्तिगत एलसीएस नियम तार्किक हैं, और इन्हें मानवीय व्याख्या योग्य IF:THEN कथनों के रूप में बनाया जा सकता है। समग्र रूप से नियम जनसंख्या से महत्वपूर्ण विशेषताओं और जुड़ाव के पैटर्न की पहचान करते हुए वैश्विक ज्ञान खोज की अनुमति देने के लिए प्रभावी रणनीतियाँ भी पेश की गई हैं।[12]* लचीला अनुप्रयोग
    • एकल या बहु-चरणीय समस्याएँ
    • पर्यवेक्षित, सुदृढीकरण या अपर्यवेक्षित शिक्षण
    • बाइनरी क्लास और मल्टी-क्लास वर्गीकरण
    • प्रतिगमन
    • पृथक या सतत विशेषताएं (या दोनों प्रकार का कुछ मिश्रण)
    • स्वच्छ या शोर वाले समस्याग्रस्त डोमेन
    • संतुलित या असंतुलित डेटासेट।
    • गुम डेटा को समायोजित करता है (अर्थात प्रशिक्षण उदाहरणों में गुम फीचर मान)

नुकसान

  • सीमित सॉफ्टवेयर उपलब्धता: सीमित संख्या में ओपन सोर्स, सुलभ एलसीएस कार्यान्वयन हैं, और यहां तक ​​कि बहुत कम हैं जो उपयोगकर्ता के अनुकूल या मशीन सीखने वाले चिकित्सकों के लिए सुलभ होने के लिए डिज़ाइन किए गए हैं।
  • व्याख्या: जबकि एलसीएस एल्गोरिदम निश्चित रूप से कुछ उन्नत मशीन शिक्षार्थियों की तुलना में अधिक व्याख्या योग्य हैं, उपयोगकर्ताओं को नियमों के एक सेट (कभी-कभी एलसीएस मॉडल को समझने के लिए नियमों के बड़े सेट) की व्याख्या करनी चाहिए। नियम संकलन की विधियाँ और व्याख्या रणनीतियाँ सक्रिय अनुसंधान का क्षेत्र बनी हुई हैं।
  • सिद्धांत/अभिसरण प्रमाण: एलसीएस एल्गोरिदम के पीछे सैद्धांतिक कार्य का एक अपेक्षाकृत छोटा समूह है। यह संभवतः उनकी सापेक्ष एल्गोरिथम जटिलता (कई इंटरैक्टिंग घटकों को लागू करने) के साथ-साथ उनकी स्टोकेस्टिक प्रकृति के कारण है।
  • ओवरफिटिंग: किसी भी मशीन लर्नर की तरह, एलसीएस भी अंतर्निहित और स्पष्ट सामान्यीकरण दबावों के बावजूद ओवरफिटिंग से पीड़ित हो सकता है।
  • रन पैरामीटर्स: एलसीएस में अक्सर विचार/अनुकूलन के लिए कई रन पैरामीटर होते हैं। आमतौर पर, दो महत्वपूर्ण मापदंडों के अपवाद के साथ अधिकांश मापदंडों को समुदाय द्वारा निर्धारित डिफ़ॉल्ट पर छोड़ा जा सकता है: अधिकतम नियम जनसंख्या आकार, और सीखने की पुनरावृत्तियों की अधिकतम संख्या। इन मापदंडों को अनुकूलित करना बहुत समस्या पर निर्भर होने की संभावना है।
  • कुख्याति: अपनी उम्र के बावजूद, एलसीएस एल्गोरिदम अभी भी मशीन लर्निंग समुदायों में भी व्यापक रूप से ज्ञात नहीं हैं। परिणामस्वरूप, अन्य स्थापित मशीन लर्निंग दृष्टिकोणों की तुलना में एलसीएस एल्गोरिदम पर शायद ही कभी विचार किया जाता है। यह संभवतः निम्नलिखित कारकों के कारण है: (1) एलसीएस एक अपेक्षाकृत जटिल एल्गोरिथम दृष्टिकोण है, (2) एलसीएस, नियम-आधारित मॉडलिंग लगभग सभी अन्य मशीन लर्निंग दृष्टिकोणों की तुलना में मॉडलिंग का एक अलग प्रतिमान है। (3) एलसीएस सॉफ्टवेयर कार्यान्वयन उतने सामान्य नहीं हैं।
  • कम्प्यूटेशनल रूप से महंगा: हालांकि कुछ संपूर्ण दृष्टिकोणों की तुलना में निश्चित रूप से अधिक व्यवहार्य है, एलसीएस एल्गोरिदम कम्प्यूटेशनल रूप से महंगे हो सकते हैं। सरल, रैखिक सीखने की समस्याओं के लिए एलसीएस लागू करने की कोई आवश्यकता नहीं है। एलसीएस एल्गोरिदम जटिल समस्या स्थानों, या समस्या स्थानों के लिए सबसे उपयुक्त हैं जिनमें थोड़ा पूर्व ज्ञान मौजूद है।

समस्या डोमेन

  • अनुकूली-नियंत्रण
  • डेटा खनन
  • इंजीनियरिंग डिजाइन
  • फीचर चयन
  • फ़ंक्शन अनुमान
  • खेल-खेलें
  • छवि वर्गीकरण
  • ज्ञान प्रबंधन
  • चिकित्सा निदान
  • मॉडलिंग
  • मार्गदर्शन
  • अनुकूलन
  • भविष्यवाणी
  • पूछताछ करना
  • रोबोटिक्स
  • रूटिंग
  • नियम-प्रेरणा
  • शेड्यूलिंग
  • रणनीति

शब्दावली

नाम, लर्निंग क्लासिफायर सिस्टम (एलसीएस), थोड़ा भ्रामक है क्योंकि कई मशीन लर्निंग एल्गोरिदम हैं जो 'वर्गीकृत करना सीखते हैं' (उदाहरण के लिए निर्णय पेड़, कृत्रिम तंत्रिका नेटवर्क), लेकिन एलसीएस नहीं हैं। 'नियम-आधारित मशीन लर्निंग (नियम-आधारित मशीन लर्निंग)' शब्द उपयोगी है, क्योंकि यह इन प्रणालियों के आवश्यक 'नियम-आधारित' घटक को अधिक स्पष्ट रूप से पकड़ता है, लेकिन यह उन तरीकों का भी सामान्यीकरण करता है जिन्हें एलसीएस नहीं माना जाता है ( उदाहरण के लिए एसोसिएशन नियम सीखना, या कृत्रिम प्रतिरक्षा प्रणाली)। अधिक सामान्य शब्द जैसे, 'जेनेटिक्स-आधारित मशीन लर्निंग', और यहां तक ​​कि 'जेनेटिक एल्गोरिदम'[39] इसे यह संदर्भित करने के लिए भी लागू किया गया है कि सीखने की वर्गीकरण प्रणाली के रूप में अधिक विशिष्ट रूप से क्या परिभाषित किया जाएगा। जेनेटिक एल्गोरिदम से उनकी समानता के कारण, पिट्सबर्ग-शैली शिक्षण क्लासिफायर सिस्टम को कभी-कभी सामान्य रूप से 'जेनेटिक एल्गोरिदम' के रूप में जाना जाता है। इसके अलावा, कुछ एलसीएस एल्गोरिदम, या निकट से संबंधित तरीकों को 'संज्ञानात्मक प्रणाली' के रूप में संदर्भित किया गया है,[16]'अनुकूली एजेंट', 'उत्पादन प्रणाली (कंप्यूटर विज्ञान)', या सामान्य रूप से 'वर्गीकरण प्रणाली' के रूप में।[55][56] शब्दावली में यह भिन्नता क्षेत्र में कुछ भ्रम पैदा करती है।

2000 के दशक तक लगभग सभी शिक्षण क्लासिफायर सिस्टम विधियों को सुदृढीकरण सीखने की समस्याओं को ध्यान में रखकर विकसित किया गया था। परिणामस्वरूप, 'लर्निंग क्लासिफायर सिस्टम' शब्द को आमतौर पर आनुवंशिक एल्गोरिदम की वैश्विक खोज के साथ 'ट्रायल-एंड-एरर' सुदृढीकरण सीखने के संयोजन के रूप में परिभाषित किया गया था। पर्यवेक्षित शिक्षण अनुप्रयोगों में रुचि और यहां तक ​​कि बिना पर्यवेक्षित शिक्षण ने भी इस शब्द के उपयोग और परिभाषा को व्यापक बना दिया है।

यह भी देखें

संदर्भ

  1. 1.0 1.1 Stalph, Patrick O.; Butz, Martin V. (2010-02-01). "JavaXCSF: The XCSF Learning Classifier System in Java". SIGEVOlution. 4 (3): 16–19. doi:10.1145/1731888.1731890. ISSN 1931-8499. S2CID 16861908.
  2. 2.0 2.1 2.2 Urbanowicz, Ryan J.; Moore, Jason H. (2009-09-22). "Learning Classifier Systems: A Complete Introduction, Review, and Roadmap". Journal of Artificial Evolution and Applications (in English). 2009: 1–25. doi:10.1155/2009/736398. ISSN 1687-6229.
  3. Dorigo, Marco (1995). "Alecsys and the AutonoMouse: Learning to control a real robot by distributed classifier systems". Machine Learning (in English). 19 (3): 209–240. doi:10.1007/BF00996270. ISSN 0885-6125.
  4. Bernadó-Mansilla, Ester; Garrell-Guiu, Josep M. (2003-09-01). "Accuracy-Based Learning Classifier Systems: Models, Analysis and Applications to Classification Tasks". Evolutionary Computation. 11 (3): 209–238. doi:10.1162/106365603322365289. ISSN 1063-6560. PMID 14558911. S2CID 9086149.
  5. 5.0 5.1 5.2 Urbanowicz, Ryan J.; Moore, Jason H. (2015-04-03). "ExSTraCS 2.0: description and evaluation of a scalable learning classifier system". Evolutionary Intelligence (in English). 8 (2–3): 89–116. doi:10.1007/s12065-015-0128-8. ISSN 1864-5909. PMC 4583133. PMID 26417393.
  6. Bernadó, Ester; Llorà, Xavier; Garrell, Josep M. (2001-07-07). Lanzi, Pier Luca; Stolzmann, Wolfgang; Wilson, Stewart W. (eds.). लर्निंग क्लासिफायर सिस्टम में प्रगति. Lecture Notes in Computer Science (in English). Springer Berlin Heidelberg. pp. 115–132. doi:10.1007/3-540-48104-4_8. ISBN 9783540437932.
  7. Bacardit, Jaume; Butz, Martin V. (2007-01-01). Kovacs, Tim; Llorà, Xavier; Takadama, Keiki; Lanzi, Pier Luca; Stolzmann, Wolfgang; Wilson, Stewart W. (eds.). लर्निंग क्लासिफायर सिस्टम. Lecture Notes in Computer Science (in English). Springer Berlin Heidelberg. pp. 282–290. CiteSeerX 10.1.1.553.4679. doi:10.1007/978-3-540-71231-2_19. ISBN 9783540712305.
  8. Urbanowicz, Ryan; Ramanand, Niranjan; Moore, Jason (2015-01-01). Continuous Endpoint Data Mining with ExSTraCS: A Supervised Learning Classifier System. pp. 1029–1036. doi:10.1145/2739482.2768453. ISBN 9781450334884. S2CID 11908241. {{cite book}}: |journal= ignored (help)
  9. Butz, M. V.; Lanzi, P. L.; Wilson, S. W. (2008-06-01). "Function Approximation With XCS: Hyperellipsoidal Conditions, Recursive Least Squares, and Compaction". IEEE Transactions on Evolutionary Computation. 12 (3): 355–376. doi:10.1109/TEVC.2007.903551. ISSN 1089-778X. S2CID 8861046.
  10. Introducing Rule-Based Machine Learning: A Practical Guide, Ryan J. Urbanowicz and Will Browne, see pp. 72-73 for Michigan-style architecture vs. Pittsburgh-style architecture.
  11. 11.0 11.1 11.2 Wilson, Stewart W. (1995-06-01). "सटीकता के आधार पर क्लासिफायर फिटनेस". Evol. Comput. 3 (2): 149–175. CiteSeerX 10.1.1.363.2210. doi:10.1162/evco.1995.3.2.149. ISSN 1063-6560. S2CID 18341635.
  12. 12.0 12.1 12.2 Urbanowicz, R. J.; Granizo-Mackenzie, A.; Moore, J. H. (2012-11-01). "मिशिगन-शैली शिक्षण क्लासिफायर सिस्टम के लिए सांख्यिकीय और विज़ुअलाइज़ेशन-निर्देशित ज्ञान खोज के साथ एक विश्लेषण पाइपलाइन". IEEE Computational Intelligence Magazine. 7 (4): 35–45. doi:10.1109/MCI.2012.2215124. ISSN 1556-603X. PMC 4244006. PMID 25431544.
  13. 13.0 13.1 Bacardit, Jaume; Llorà, Xavier (2013). "Large‐scale data mining using genetics‐based machine learning". Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 3 (1): 37–61. doi:10.1002/widm.1078. S2CID 43062613.
  14. Holland, John (1975). Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control, and artificial intelligence. Michigan Press. ISBN 9780262581110.
  15. Holland JH (1976) Adaptation. In: Rosen R, Snell F (eds) Progress in theoretical biology, vol 4. Academic Press, New York, pp 263–293
  16. 16.0 16.1 Holland JH, Reitman JS (1978) Cognitive systems based on adaptive algorithms Reprinted in: Evolutionary computation. The fossil record. In: David BF (ed) IEEE Press, New York 1998. ISBN 0-7803-3481-7
  17. 17.0 17.1 Lanzi, Pier Luca (2008-02-08). "Learning classifier systems: then and now". Evolutionary Intelligence (in English). 1 (1): 63–82. doi:10.1007/s12065-007-0003-3. ISSN 1864-5909. S2CID 27153843.
  18. Smith S (1980) A learning system based on genetic adaptive algorithms. Ph.D. thesis, Department of Computer Science, University of Pittsburgh
  19. Smith S (1983) Flexible learning of problem solving heuristics through adaptive search. In: Eighth international joint conference on articial intelligence. Morgan Kaufmann, Los Altos, pp 421–425
  20. De Jong KA (1988) Learning with genetic algorithms: an overview. Mach Learn 3:121–138
  21. 21.0 21.1 21.2 Holland, John H. "Escaping brittleness: the possibilities of general purpose learning algorithms applied to parallel rule-based system." Machine learning(1986): 593-623.
  22. Holland, John H. (1985-01-01). बकेट ब्रिगेड की संपत्तियाँ. pp. 1–7. ISBN 978-0805804263. {{cite book}}: |journal= ignored (help)
  23. Booker, L (1982-01-01). कार्य वातावरण के अनुकूलन के रूप में बुद्धिमान व्यवहार (Thesis). University of Michigan.
  24. 24.0 24.1 24.2 Wilson, S. W. "Knowledge growth in an artificial animal. Proceedings of the First International Conference on Genetic Algorithms and their Applications." (1985).
  25. Wilson, Stewart W. (1987). "क्लासिफायर सिस्टम और एनिमेट समस्या". Machine Learning (in English). 2 (3): 199–228. doi:10.1007/BF00058679. ISSN 0885-6125.
  26. Bonelli, Pierre; Parodi, Alexandre; Sen, Sandip; Wilson, Stewart (1990-01-01). NEWBOOLE: A Fast GBML System. pp. 153–159. ISBN 978-1558601413. {{cite book}}: |journal= ignored (help)
  27. Frey, Peter W.; Slate, David J. (1991). "हॉलैंड-शैली अनुकूली क्लासिफायर का उपयोग करके अक्षर पहचान". Machine Learning (in English). 6 (2): 161–182. doi:10.1007/BF00114162. ISSN 0885-6125.
  28. Valenzuela-Rendón, Manuel. "The Fuzzy Classifier System: A Classifier System for Continuously Varying Variables." In ICGA, pp. 346-353. 1991.
  29. Riolo, Rick L. (1988-01-01). लर्निंग क्लासिफायर सिस्टम में डिफ़ॉल्ट पदानुक्रम और नियमों के अनुक्रम का अनुभवजन्य अध्ययन (Thesis). Ann Arbor, MI, USA: University of Michigan.
  30. R.L., Riolo (1987-01-01). "बकेट ब्रिगेड का प्रदर्शन. I. क्लासिफायर का लंबा क्रम". Genetic Algorithms and Their Applications: Proceedings of the Second International Conference on Genetic Algorithms: July 28–31, 1987 at the Massachusetts Institute of Technology, Cambridge, MA (in English).
  31. R.L., Riolo (1987-01-01). "बकेट ब्रिगेड का प्रदर्शन. द्वितीय. डिफ़ॉल्ट पदानुक्रम". Genetic Algorithms and Their Applications: Proceedings of the Second International Conference on Genetic Algorithms: July 28–31, 1987 at the Massachusetts Institute of Technology, Cambridge, MA (in English).
  32. 32.0 32.1 W. Stolzmann, "Anticipatory classifier systems," in Proceedings of the 3rd Annual Genetic Programming Conference, pp. 658–664, 1998.
  33. Riolo, Rick L. (1990-01-01). क्लासिफायर सिस्टम में लुकहेड प्लानिंग और अव्यक्त शिक्षण. pp. 316–326. ISBN 978-0262631389. {{cite book}}: |journal= ignored (help)
  34. Watkins, Christopher John Cornish Hellaby. "Learning from delayed rewards." PhD diss., University of Cambridge, 1989.
  35. 35.0 35.1 Wilson, Stewart W. (1994-03-01). "ZCS: A Zeroth Level Classifier System". Evolutionary Computation. 2 (1): 1–18. CiteSeerX 10.1.1.363.798. doi:10.1162/evco.1994.2.1.1. ISSN 1063-6560. S2CID 17680778.
  36. Lanzi, P. L. (2002). "सुदृढीकरण सीखने के नजरिए से सीखना क्लासिफायर सिस्टम". Soft Computing (in English). 6 (3–4): 162–170. doi:10.1007/s005000100113. ISSN 1432-7643. S2CID 39103390.
  37. Kovacs, Timothy Michael Douglas. A Comparison of Strength and Accuracy-based Fitness in Learning and Classifier Systems. 2002.
  38. Kovacs, Tim. "Two views of classifier systems." In International Workshop on Learning Classifier Systems, pp. 74-87. Springer Berlin Heidelberg, 2001
  39. 39.0 39.1 Congdon, Clare Bates. "A comparison of genetic algorithms and other machine learning systems on a complex classification task from common disease research." PhD diss., The University of Michigan, 1995.
  40. Holmes, John H. (1996-01-01). "क्लिनिकल डेटा में ज्ञान की खोज के लिए आनुवंशिकी-आधारित मशीन लर्निंग दृष्टिकोण". Proceedings of the AMIA Annual Fall Symposium: 883. ISSN 1091-8280. PMC 2233061.
  41. Holmes, John H. "Discovering Risk of Disease with a Learning Classifier System." In ICGA, pp. 426-433. 1997.
  42. Holmes, John H., and Jennifer A. Sager. "Rule discovery in epidemiologic surveillance data using EpiXCS: an evolutionary computation approach." InConference on Artificial Intelligence in Medicine in Europe, pp. 444-452. Springer Berlin Heidelberg, 2005.
  43. Butz, Martin V. "Biasing exploration in an anticipatory learning classifier system." In International Workshop on Learning Classifier Systems, pp. 3-22. Springer Berlin Heidelberg, 2001.
  44. Wilson, Stewart W. (2002). "वर्गीकरणकर्ता जो कार्यों का अनुमान लगाते हैं". Natural Computing (in English). 1 (2–3): 211–234. doi:10.1023/A:1016535925043. ISSN 1567-7818. S2CID 23032802.
  45. Bull, Larry. "A simple accuracy-based learning classifier system." Learning Classifier Systems Group Technical Report UWELCSG03-005, University of the West of England, Bristol, UK (2003).
  46. Bull, Larry. "A simple payoff-based learning classifier system." InInternational Conference on Parallel Problem Solving from Nature, pp. 1032-1041. Springer Berlin Heidelberg, 2004.
  47. Peñarroya, Jaume Bacardit. "Pittsburgh genetic-based machine learning in the data mining era: representations, generalization, and run-time." PhD diss., Universitat Ramon Llull, 2004.
  48. Bacardit, Jaume; Burke, Edmund K.; Krasnogor, Natalio (2008-12-12). "नियम-आधारित विकासवादी शिक्षा की मापनीयता में सुधार". Memetic Computing (in English). 1 (1): 55–67. doi:10.1007/s12293-008-0005-4. ISSN 1865-9284. S2CID 775199.
  49. Drugowitsch, Jan (2008). लर्निंग क्लासिफायर सिस्टम का डिज़ाइन और विश्लेषण - स्प्रिंगर. Studies in Computational Intelligence. Vol. 139. doi:10.1007/978-3-540-79866-8. ISBN 978-3-540-79865-1.
  50. Urbanowicz, Ryan J., Gediminas Bertasius, and Jason H. Moore. "An extended michigan-style learning classifier system for flexible supervised learning, classification, and data mining." In International Conference on Parallel Problem Solving from Nature, pp. 211-221. Springer International Publishing, 2014.
  51. Urbanowicz, Ryan J., Delaney Granizo-Mackenzie, and Jason H. Moore. "Using expert knowledge to guide covering and mutation in a michigan style learning classifier system to detect epistasis and heterogeneity." InInternational Conference on Parallel Problem Solving from Nature, pp. 266-275. Springer Berlin Heidelberg, 2012.
  52. Urbanowicz, Ryan; Granizo-Mackenzie, Ambrose; Moore, Jason (2012-01-01). मिशिगन-शैली सुपरवाइज्ड लर्निंग क्लासिफायर सिस्टम के लिए इंस्टेंस-लिंक्ड एट्रिब्यूट ट्रैकिंग और फीडबैक. pp. 927–934. doi:10.1145/2330163.2330291. ISBN 9781450311779. S2CID 142534. {{cite book}}: |journal= ignored (help)
  53. Bacardit, Jaume; Krasnogor, Natalio (2009-01-01). बड़े पैमाने पर वर्गीकरण डोमेन के लिए एक मिश्रित असतत-निरंतर विशेषता सूची प्रतिनिधित्व. pp. 1155–1162. CiteSeerX 10.1.1.158.7314. doi:10.1145/1569901.1570057. ISBN 9781605583259. S2CID 10906515. {{cite book}}: |journal= ignored (help)
  54. Iqbal, Muhammad; Browne, Will N.; Zhang, Mengjie (2014-08-01). "जटिल, बड़े पैमाने की बूलियन समस्याओं को हल करने के लिए निकाले गए ज्ञान के बिल्डिंग ब्लॉक्स का पुन: उपयोग करना". IEEE Transactions on Evolutionary Computation. 18 (4): 465–480. doi:10.1109/tevc.2013.2281537. S2CID 525358.
  55. Booker, L. B.; Goldberg, D. E.; Holland, J. H. (1989-09-01). "क्लासिफायर सिस्टम और जेनेटिक एल्गोरिदम" (PDF). Artificial Intelligence. 40 (1): 235–282. doi:10.1016/0004-3702(89)90050-7. hdl:2027.42/27777.
  56. Wilson, Stewart W., and David E. Goldberg. "A critical review of classifier systems." In Proceedings of the third international conference on Genetic algorithms, pp. 244-255. Morgan Kaufmann Publishers Inc., 1989.


बाहरी संबंध

वीडियो ट्यूटोरियल

वेबपेज

श्रेणी:विकासवादी एल्गोरिदम