डेटा प्रबंधन की समूह विधि: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
डेटा हैंडलिंग की समूह विधि (जीएमडीएच) मल्टी-पैरामीट्रिक डेटासेट के कंप्यूटर-आधारित गणितीय मॉडलिंग के लिए आगमनात्मक एल्गोरिदम का | '''डेटा हैंडलिंग की समूह विधि''' (जीएमडीएच) मल्टी-पैरामीट्रिक डेटासेट के कंप्यूटर-आधारित गणितीय मॉडलिंग के लिए आगमनात्मक एल्गोरिदम का वर्ग है जो कि मॉडल के पूरी तरह से स्वचालित संरचनात्मक और पैरामीट्रिक अनुकूलन की सुविधा देता है। | ||
जीएमडीएच का उपयोग [[डेटा खनन|डेटा माइनिंग]], नॉलेज डिस्कवरी, [[पूर्वानुमान|प्रेडिक्शन]] , काम्प्लेक्स सिस्टम मॉडलिंग, [[अनुकूलन (गणित)|ऑप्टिमाइजेशन (गणित)]] और पैटर्न पहचान जैसे क्षेत्रों में किया जाता है।<ref name="r1">{{cite book|last1=Madala|first1=H.R.|last2=Ivakhnenko|first2=O.G.|title=जटिल सिस्टम मॉडलिंग के लिए आगमनात्मक शिक्षण एल्गोरिदम|date=1994|publisher=CRC Press|location=Boca Raton|isbn=978-0849344381|url=http://articles.gmdh.net/theory/GMDHbook.zip|access-date=2019-11-17|archive-url=https://web.archive.org/web/20171231104312/http://articles.gmdh.net/theory/GMDHbook.zip|archive-date=2017-12-31|url-status=dead}}</ref> जीएमडीएच एल्गोरिदम को आगमनात्मक प्रक्रिया की विशेषता होती है जो धीरे-धीरे काम्प्लेक्स बहुपद मॉडलों को खोजती है और बाहरी मानदंड के माध्यम से सर्वोत्तम समाधान का चयन करती है। | जीएमडीएच का उपयोग [[डेटा खनन|डेटा माइनिंग]], नॉलेज डिस्कवरी, [[पूर्वानुमान|प्रेडिक्शन]] , काम्प्लेक्स सिस्टम मॉडलिंग, [[अनुकूलन (गणित)|ऑप्टिमाइजेशन (गणित)]] और पैटर्न पहचान जैसे क्षेत्रों में किया जाता है।<ref name="r1">{{cite book|last1=Madala|first1=H.R.|last2=Ivakhnenko|first2=O.G.|title=जटिल सिस्टम मॉडलिंग के लिए आगमनात्मक शिक्षण एल्गोरिदम|date=1994|publisher=CRC Press|location=Boca Raton|isbn=978-0849344381|url=http://articles.gmdh.net/theory/GMDHbook.zip|access-date=2019-11-17|archive-url=https://web.archive.org/web/20171231104312/http://articles.gmdh.net/theory/GMDHbook.zip|archive-date=2017-12-31|url-status=dead}}</ref> जीएमडीएच एल्गोरिदम को आगमनात्मक प्रक्रिया की विशेषता होती है जो धीरे-धीरे काम्प्लेक्स बहुपद मॉडलों को खोजती है और बाहरी मानदंड के माध्यम से सर्वोत्तम समाधान का चयन करती है। | ||
एकाधिक इनपुट और | एकाधिक इनपुट और आउटपुट वाला जीएमडीएच मॉडल बेस फ़ंक्शन (1) के घटकों का सबसेट है: | ||
: <math> Y(x_1,\dots,x_n)=a_0+\sum\limits_{i = 1}^m a_i f_i</math> | : <math> Y(x_1,\dots,x_n)=a_0+\sum\limits_{i = 1}^m a_i f_i</math> | ||
जहां ''f<sub>i</sub>'' प्राथमिक कार्य हैं जो इनपुट के विभिन्न सेटों पर निर्भर हैं, जिसमे a<sub>i</sub> गुणांक हैं और m आधार फ़ंक्शन घटकों की संख्या है। | जहां ''f<sub>i</sub>'' प्राथमिक कार्य हैं जो इनपुट के विभिन्न सेटों पर निर्भर हैं, जिसमे a<sub>i</sub> गुणांक हैं और m आधार फ़ंक्शन घटकों की संख्या है। | ||
सर्वोत्तम समाधान खोजने के लिए, जीएमडीएच एल्गोरिदम बेस फ़ंक्शन (1) के विभिन्न घटक उपसमुच्चय पर विचार करता है जिन्हें आंशिक मॉडल कहा जाता है। इन मॉडलों के गुणांकों का अनुमान न्यूनतम वर्ग विधि द्वारा लगाया जाता है। जीएमडीएच एल्गोरिदम धीरे-धीरे आंशिक मॉडल घटकों की संख्या बढ़ाता है और बाहरी मानदंड के न्यूनतम मूल्य द्वारा निरुपित इष्टतम कोम्प्लेक्सिटी के साथ | सर्वोत्तम समाधान खोजने के लिए, जीएमडीएच एल्गोरिदम बेस फ़ंक्शन (1) के विभिन्न घटक उपसमुच्चय पर विचार करता है जिन्हें आंशिक मॉडल कहा जाता है। इन मॉडलों के गुणांकों का अनुमान न्यूनतम वर्ग विधि द्वारा लगाया जाता है। जीएमडीएच एल्गोरिदम धीरे-धीरे आंशिक मॉडल घटकों की संख्या बढ़ाता है और बाहरी मानदंड के न्यूनतम मूल्य द्वारा निरुपित इष्टतम कोम्प्लेक्सिटी के साथ मॉडल संरचना खोजता है। इस प्रक्रिया को मॉडलों का स्व-संगठन कहा जाता है। | ||
जीएमडीएच में उपयोग किए जाने वाले पहले आधार फ़ंक्शन के रूप में, धीरे-धीरे काम्प्लेक्स कोलमोगोरोव-गैबोर बहुपद (2) था: | जीएमडीएच में उपयोग किए जाने वाले पहले आधार फ़ंक्शन के रूप में, धीरे-धीरे काम्प्लेक्स कोलमोगोरोव-गैबोर बहुपद (2) था: | ||
Line 17: | Line 17: | ||
समान्यत: दूसरी डिग्री तक के कार्यों वाले अधिक सरल आंशिक मॉडल का उपयोग किया जाता है।<ref name="r1" /> | समान्यत: दूसरी डिग्री तक के कार्यों वाले अधिक सरल आंशिक मॉडल का उपयोग किया जाता है।<ref name="r1" /> | ||
आगमनात्मक एल्गोरिदम को बहुपद इन्टेलीजेंस नेटवर्क के रूप में भी जाना जाता है। जुर्गन श्मिधुबर ने जीएमडीएच को पहली गहन शिक्षण विधियों में से | आगमनात्मक एल्गोरिदम को बहुपद इन्टेलीजेंस नेटवर्क के रूप में भी जाना जाता है। जुर्गन श्मिधुबर ने जीएमडीएच को पहली गहन शिक्षण विधियों में से बताया, और टिप्पणी की कि इसका उपयोग 1971 की प्रारंभ में आठ-परत इन्टेलीजेंस नेट को प्रशिक्षित करने के लिए किया गया था।<ref>{{cite journal |last=Schmidhuber |first=Jürgen |title=Deep learning in neural networks: An overview |journal=Neural Networks |volume=61 |year=2015 |pages=85–117 |arxiv=1404.7828 |doi=10.1016/j.neunet.2014.09.003|pmid=25462637 |s2cid=11715509 }}</ref><ref name="iva1971">{{Cite journal|last=Ivakhnenko|first=Alexey|date=1971|title=जटिल प्रणालियों का बहुपद सिद्धांत|url=http://gmdh.net/articles/history/polynomial.pdf |journal=IEEE Transactions on Systems, Man, and Cybernetics |pages=364–378|doi=10.1109/TSMC.1971.4308320|volume=SMC-1|issue=4}}</ref> | ||
==इतिहास | ==इतिहास == | ||
[[Image:Photo of Prof. Alexey G. Ivakhnenko.jpg|right|thumb|जीएमडीएच लेखक - सोवियत वैज्ञानिक प्रो. एलेक्सी जी. इवाख्नेंको।]]इस पद्धति की प्रारंभ 1968 में [[कीव]] में साइबरनेटिक्स संस्थान में प्रो. एलेक्सी ग्रिगोरेविच इवाख्नेंको या एलेक्सी जी. इवाख्नेंको द्वारा की गई थी। यह आगमनात्मक दृष्टिकोण प्रारंभ से ही | [[Image:Photo of Prof. Alexey G. Ivakhnenko.jpg|right|thumb|जीएमडीएच लेखक - सोवियत वैज्ञानिक प्रो. एलेक्सी जी. इवाख्नेंको।]]इस पद्धति की प्रारंभ 1968 में [[कीव]] में साइबरनेटिक्स संस्थान में प्रो. एलेक्सी ग्रिगोरेविच इवाख्नेंको या एलेक्सी जी. इवाख्नेंको द्वारा की गई थी। यह आगमनात्मक दृष्टिकोण प्रारंभ से ही कंप्यूटर-आधारित पद्धति थी, इसलिए कंप्यूटर प्रोग्राम और एल्गोरिदम का सेट नए सैद्धांतिक सिद्धांतों के आधार पर प्राप्त प्राथमिक व्यावहारिक परिणाम थे। लेखक की ओपन कोड शेयरिंग नीति की फलस्वरूप यह विधि विश्व भर में बड़ी संख्या में वैज्ञानिक प्रयोगशालाओं में तेजी से स्थापित हो गई। चूँकि अधिकांश नियमित कार्य कंप्यूटर पर स्थानांतरित हो जाते हैं, वस्तुनिष्ठ परिणाम पर मानव प्रभाव का प्रभाव कम हो जाता है। वास्तव में, इस दृष्टिकोण को [[ कृत्रिम होशियारी |आर्टिफिशियल इन्टेलीजेंस]] थीसिस के कार्यान्वयन में से माना जा सकता है, जिसमें कहा गया है कि कंप्यूटर मनुष्यों के लिए शक्तिशाली सलाहकार के रूप में कार्य कर सकता है। | ||
जीएमडीएच के विकास में विज्ञान के विभिन्न क्षेत्रों से विचारों का संश्लेषण सम्मिलित है: "ब्लैक बॉक्स" की साइबरनेटिक अवधारणा और जोड़ीदार विशेषताओं के क्रमिक आनुवंशिक चयन का सिद्धांत, गोडेल की अपूर्णता प्रमेय और गैबोर का "निर्णय चयन की स्वतंत्रता" का सिद्धांत<ref>{{cite book|last1=Gabor|first1=D.|title=योजना के परिप्रेक्ष्य. आर्थिक सहयोग और विकास संगठन|date=1971|publisher=Imp.Coll.|location=London}}</ref> अधेमर की गलतता और बीयर के बाहरी परिवर्धन का सिद्धांत है।<ref>{{cite book|last1=Beer|first1=S.|title=साइबरनेटिक्स और प्रबंधन|date=1959|publisher=English Univ. Press|location=London}}</ref> | जीएमडीएच के विकास में विज्ञान के विभिन्न क्षेत्रों से विचारों का संश्लेषण सम्मिलित है: "ब्लैक बॉक्स" की साइबरनेटिक अवधारणा और जोड़ीदार विशेषताओं के क्रमिक आनुवंशिक चयन का सिद्धांत, गोडेल की अपूर्णता प्रमेय और गैबोर का "निर्णय चयन की स्वतंत्रता" का सिद्धांत<ref>{{cite book|last1=Gabor|first1=D.|title=योजना के परिप्रेक्ष्य. आर्थिक सहयोग और विकास संगठन|date=1971|publisher=Imp.Coll.|location=London}}</ref> अधेमर की गलतता और बीयर के बाहरी परिवर्धन का सिद्धांत है।<ref>{{cite book|last1=Beer|first1=S.|title=साइबरनेटिक्स और प्रबंधन|date=1959|publisher=English Univ. Press|location=London}}</ref> | ||
जीएमडीएच अनिश्चितता के अनुसार प्रयोगात्मक डेटा के लिए मॉडल की संरचनात्मक-पैरामीट्रिक पहचान के लिए समस्याओं को हल करने की मूल विधि है। ऐसी समस्या गणितीय मॉडल के निर्माण में होती है जो जांच की गई वस्तु या प्रक्रिया के अज्ञात पैटर्न का अनुमान लगाती है।<ref>{{cite book|last1=Ivakhnenko|first1=O.G.|last2=Lapa|first2=V.G.|title=साइबरनेटिक्स और पूर्वानुमान तकनीक|url=https://archive.org/details/cyberneticsforec0000ivak|url-access=registration|date=1967|publisher=American Elsevier|edition=Modern Analytic and Computational Methods in Science and Mathematics, v.8}}</ref> यह इसके बारे में उस जानकारी का उपयोग करता है जो डेटा में निहित है। जीएमडीएच निम्नलिखित सिद्धांतों के सक्रिय अनुप्रयोग द्वारा मॉडलिंग के अन्य विधियों से भिन्न है: स्वचालित मॉडल निर्माण, अनिर्णायक निर्णय, और इष्टतम कोम्प्लेक्सिटी के मॉडल खोजने के लिए बाहरी मानदंडों द्वारा निरंतर चयन और इसमें स्वचालित मॉडल संरचना निर्माण के लिए | जीएमडीएच अनिश्चितता के अनुसार प्रयोगात्मक डेटा के लिए मॉडल की संरचनात्मक-पैरामीट्रिक पहचान के लिए समस्याओं को हल करने की मूल विधि है। ऐसी समस्या गणितीय मॉडल के निर्माण में होती है जो जांच की गई वस्तु या प्रक्रिया के अज्ञात पैटर्न का अनुमान लगाती है।<ref>{{cite book|last1=Ivakhnenko|first1=O.G.|last2=Lapa|first2=V.G.|title=साइबरनेटिक्स और पूर्वानुमान तकनीक|url=https://archive.org/details/cyberneticsforec0000ivak|url-access=registration|date=1967|publisher=American Elsevier|edition=Modern Analytic and Computational Methods in Science and Mathematics, v.8}}</ref> यह इसके बारे में उस जानकारी का उपयोग करता है जो डेटा में निहित है। जीएमडीएच निम्नलिखित सिद्धांतों के सक्रिय अनुप्रयोग द्वारा मॉडलिंग के अन्य विधियों से भिन्न है: स्वचालित मॉडल निर्माण, अनिर्णायक निर्णय, और इष्टतम कोम्प्लेक्सिटी के मॉडल खोजने के लिए बाहरी मानदंडों द्वारा निरंतर चयन और इसमें स्वचालित मॉडल संरचना निर्माण के लिए मूल बहुस्तरीय प्रक्रिया थी, जो जोड़ीदार क्रमिक विशेषताओं पर विचार करते हुए जैविक चयन की प्रक्रिया का अनुकरण करती है। ऐसी प्रक्रिया वर्तमान में डीप लर्निंग नेटवर्क में उपयोग की जाती है<ref>{{cite journal|last1=Takao|first1=S.|last2=Kondo|first2=S.|last3=Ueno|first3=J.|last4=Kondo|first4=T.|title=गहन प्रतिक्रिया जीएमडीएच-प्रकार तंत्रिका नेटवर्क और एमआरआई मस्तिष्क छवियों के चिकित्सा छवि विश्लेषण के लिए इसका अनुप्रयोग|journal=Artificial Life and Robotics|volume=23|issue=2|date=2017|pages=161–172|doi=10.1007/s10015-017-0410-1|s2cid=44190434}}</ref> इष्टतम मॉडल की तुलना करने और चुनने के लिए, डेटा नमूने के दो या अधिक उपसमूहों का उपयोग किया जाता है। इससे प्रारंभिक धारणाओं से बचना संभव हो जाता है, क्योंकि नमूना विभाजन इष्टतम मॉडल के स्वचालित निर्माण के समय विभिन्न प्रकार की अनिश्चितता को स्पष्ट रूप से स्वीकार करता है। | ||
विकास के समय नोइज़ी डेटा और [[शोर (इलेक्ट्रॉनिक्स)|नोइज़ी(इलेक्ट्रॉनिक्स)]] के साथ [[चैनल (संचार)]] से गुजरने वाले सिग्नल के लिए मॉडल बनाने की समस्या के | विकास के समय नोइज़ी डेटा और [[शोर (इलेक्ट्रॉनिक्स)|नोइज़ी(इलेक्ट्रॉनिक्स)]] के साथ [[चैनल (संचार)]] से गुजरने वाले सिग्नल के लिए मॉडल बनाने की समस्या के मध्य जैविक सादृश्य स्थापित किया गया था।<ref name="r7">{{cite book|last1=Ivahnenko|first1=O.G.|title=जटिल प्रणालियों के लिए मॉडल स्व-संगठन की आगमनात्मक विधि|date=1982|publisher=Naukova Dumka|location=Kyiv|url=http://articles.gmdh.net/theory/bookInductModel.pdf|access-date=2019-11-18|archive-url=https://web.archive.org/web/20171231104130/http://articles.gmdh.net/theory/bookInductModel.pdf|archive-date=2017-12-31|url-status=dead}}</ref> इससे नोइज़ी-प्रतिरक्षा मॉडलिंग के सिद्धांत की नींव रखना संभव हो गया था।<ref name="r3">{{cite book |last1=Ivakhnenko |first1=O.G. |last2=Stepashko |first2=V.S. |title=शोर प्रतिरक्षा मॉडलिंग (मॉडलिंग की न्यूस प्रतिरक्षा)|date=1985 |publisher=Naukova Dumka |location=Kyiv |url=http://articles.gmdh.net/theory/bookNoiseIm.pdf |access-date=2019-11-18 |archive-url=https://web.archive.org/web/20171231104218/http://articles.gmdh.net/theory/bookNoiseIm.pdf |archive-date=2017-12-31 |url-status=dead }}</ref> इस सिद्धांत का मुख्य परिणाम यह है कि इष्टतम पूर्वानुमानित मॉडल की कोम्प्लेक्सिटी डेटा में अनिश्चितता के स्तर पर निर्भर करती है: यह स्तर जितना अधिक होगा (उदाहरण के लिए नोइज़ी के कारण) - उतना ही सरल इष्टतम मॉडल (कम अनुमानित मापदंडों के साथ) होना चाहिए। इसने [[फजी सेट]] में नोइज़ी भिन्नता के स्तर के लिए इष्टतम मॉडल कोम्प्लेक्सिटी के स्वचालित अनुकूलन की [[संरचनात्मक प्रेरण]] विधि के रूप में जीएमडीएच सिद्धांत के विकास की प्रारंभ किया था। इसलिए, जीएमडीएच को अधिकांशतः प्रयोगात्मक डेटा से [[ज्ञान निष्कर्षण|नॉलेज एस्ट्रक्शन]] के लिए मूल सूचना प्रौद्योगिकी माना जाता है। | ||
1968-1971 की अवधि पहचान, पैटर्न पहचान और अल्पकालिक पूर्वानुमान की समस्याओं के समाधान के लिए केवल नियमितता मानदंड के अनुप्रयोग की विशेषता है। संदर्भ फ़ंक्शन के रूप में बहुपद, लॉजिकल नेट्स फ़ज़ी ज़ादेह सेट और बेयस संभाव्यता सूत्र का उपयोग किया गया था। नए दृष्टिकोण के साथ पूर्वानुमान की अत्यधिक स्पष्टता से लेखक प्रेरित हुए। नोइज़ी प्रतिरक्षा की जांच नहीं की गई। | 1968-1971 की अवधि पहचान, पैटर्न पहचान और अल्पकालिक पूर्वानुमान की समस्याओं के समाधान के लिए केवल नियमितता मानदंड के अनुप्रयोग की विशेषता है। संदर्भ फ़ंक्शन के रूप में बहुपद, लॉजिकल नेट्स फ़ज़ी ज़ादेह सेट और बेयस संभाव्यता सूत्र का उपयोग किया गया था। नए दृष्टिकोण के साथ पूर्वानुमान की अत्यधिक स्पष्टता से लेखक प्रेरित हुए। नोइज़ी प्रतिरक्षा की जांच नहीं की गई। | ||
Line 33: | Line 33: | ||
अवधि 1972-1975 नोइज़ी वाले डेटा और अपूर्ण सूचना आधार के मॉडलिंग की समस्या का समाधान किया गया। जिससे नोइज़ी प्रतिरोधक क्षमता बढ़ाने के लिए बहुमानदंड चयन और अतिरिक्त प्राथमिक जानकारी का उपयोग प्रस्तावित किया गया था। सर्वोत्तम प्रयोगों से पता चला है कि अतिरिक्त मानदंड द्वारा इष्टतम मॉडल की विस्तारित परिभाषा के साथ नोइज़ी स्तर सिग्नल से दस गुना अधिक हो सकता है। फिर शैनन के सामान्य संचार सिद्धांत के प्रमेय का उपयोग करके इसमें सुधार किया गया था। | अवधि 1972-1975 नोइज़ी वाले डेटा और अपूर्ण सूचना आधार के मॉडलिंग की समस्या का समाधान किया गया। जिससे नोइज़ी प्रतिरोधक क्षमता बढ़ाने के लिए बहुमानदंड चयन और अतिरिक्त प्राथमिक जानकारी का उपयोग प्रस्तावित किया गया था। सर्वोत्तम प्रयोगों से पता चला है कि अतिरिक्त मानदंड द्वारा इष्टतम मॉडल की विस्तारित परिभाषा के साथ नोइज़ी स्तर सिग्नल से दस गुना अधिक हो सकता है। फिर शैनन के सामान्य संचार सिद्धांत के प्रमेय का उपयोग करके इसमें सुधार किया गया था। | ||
अवधि 1976-1979 बहुस्तरीय जीएमडीएच एल्गोरिदम के अभिसरण की जांच की | अवधि 1976-1979 बहुस्तरीय जीएमडीएच एल्गोरिदम के अभिसरण की जांच की गई थी। तब यह दिखाया गया कि कुछ बहुस्तरीय एल्गोरिदम में बहुपरतीय त्रुटि होती है - जो नियंत्रण प्रणालियों की स्थैतिक त्रुटि के समान होती है। 1977 में बहुस्तरीय जीएमडीएच एल्गोरिदम द्वारा वस्तुनिष्ठ प्रणाली विश्लेषण समस्याओं का समाधान प्रस्तावित किया गया था। यह पता चला कि मानदंड समूह द्वारा छँटाई करने से समीकरणों की एकमात्र इष्टतम प्रणाली मिलती है और इसलिए काम्प्लेक्स वस्तु तत्वों, उनके मुख्य इनपुट और आउटपुट वेरिएबल को दिखाया जाता है। | ||
अवधि 1980-1988 अनेक महत्वपूर्ण सैद्धान्तिक परिणाम प्राप्त | अवधि 1980-1988 अनेक महत्वपूर्ण सैद्धान्तिक परिणाम प्राप्त हुए थे। जिसने यह स्पष्ट हो गया कि दीर्घकालिक पूर्वानुमान के लिए पूर्ण भौतिक मॉडल का उपयोग नहीं किया जा सकता है। तथा यह भी सिद्ध हो गया है कि जीएमडीएच के गैर-भौतिक मॉडल प्रतिगमन विश्लेषण के भौतिक मॉडल की तुलना में अनुमान और पूर्वानुमान के लिए अधिक स्पष्ट हैं। मॉडलिंग के लिए दो भिन्न-भिन्न समय के पैमाने का उपयोग करने वाले दो-स्तरीय एल्गोरिदम विकसित किए गए थे। | ||
1989 से फजी ऑब्जेक्ट के गैर-पैरामीट्रिक मॉडलिंग के लिए नए एल्गोरिदम (एसी, ओसीसी, पीएफ) और विशेषज्ञ प्रणालियों के लिए एसएलपी विकसित और जांच की गई।<ref>{{cite journal |last1=Ivakhnenko |first1=O.G. |last2=Ivakhnenko |first2=G.A. |date=1995 |title=डेटा हैंडलिंग की समूह पद्धति (जीएमडीएच) के एल्गोरिदम द्वारा हल की जा सकने वाली समस्याओं की समीक्षा|url=http://www.gmdh.net/articles/review/algorith.pdf |journal=Pattern Recognition and Image Analysis |volume=5 |issue=4 |pages=527–535 |citeseerx=10.1.1.19.2971 }}</ref> जीएमडीएच विकास के वर्तमान चरण को मल्टीप्रोसेसर कंप्यूटरों के लिए गहन शिक्षण न्यूरोनेट और समानांतर आगमनात्मक एल्गोरिदम के विकास के रूप में वर्णित किया जा सकता है। | 1989 से फजी ऑब्जेक्ट के गैर-पैरामीट्रिक मॉडलिंग के लिए नए एल्गोरिदम (एसी, ओसीसी, पीएफ) और विशेषज्ञ प्रणालियों के लिए एसएलपी विकसित और जांच की गई।<ref>{{cite journal |last1=Ivakhnenko |first1=O.G. |last2=Ivakhnenko |first2=G.A. |date=1995 |title=डेटा हैंडलिंग की समूह पद्धति (जीएमडीएच) के एल्गोरिदम द्वारा हल की जा सकने वाली समस्याओं की समीक्षा|url=http://www.gmdh.net/articles/review/algorith.pdf |journal=Pattern Recognition and Image Analysis |volume=5 |issue=4 |pages=527–535 |citeseerx=10.1.1.19.2971 }}</ref> जीएमडीएच विकास के वर्तमान चरण को मल्टीप्रोसेसर कंप्यूटरों के लिए गहन शिक्षण न्यूरोनेट और समानांतर आगमनात्मक एल्गोरिदम के विकास के रूप में वर्णित किया जा सकता है। | ||
Line 41: | Line 41: | ||
== बाहरी मानदंड == | == बाहरी मानदंड == | ||
बाहरी मानदंड जीएमडीएच की प्रमुख विशेषताओं में से | बाहरी मानदंड जीएमडीएच की प्रमुख विशेषताओं में से है। मानदंड मॉडल की आवश्यकताओं का वर्णन करता है, उदाहरण के लिए न्यूनतम वर्गों का न्यूनतमकरण। इसकी गणना सदैव डेटा नमूने के भिन्न भाग के साथ की जाती है जिसका उपयोग गुणांक के अनुमान के लिए नहीं किया गया है। इससे इनपुट डेटा में अनिश्चितता के स्तर के अनुसार इष्टतम कोम्प्लेक्सिटी के मॉडल का चयन करना संभव हो जाता है। अनेक लोकप्रिय मानदंड हैं: | ||
* नियमितता का मानदंड (सीआर) - नमूना B पर | * नियमितता का मानदंड (सीआर) - नमूना B पर मॉडल का न्यूनतम वर्ग | ||
* न्यूनतम पूर्वाग्रह या संगति का मानदंड - दो | * न्यूनतम पूर्वाग्रह या संगति का मानदंड - दो भिन्न-भिन्न नमूनों A और B, के आधार पर विकसित दो मॉडलों के अनुमानित आउटपुट (या गुणांक वैक्टर) के मध्य अंतर की वर्ग त्रुटि, नमूना B पर अनुमानित वर्ग आउटपुट द्वारा विभाजित किया जाता है। जहाँ इसका उपयोग करके मॉडल की तुलना यह सुसंगत मॉडल प्राप्त करने और नोइज़ी वाले डेटा से छिपे हुए भौतिक नियम को पुनर्प्राप्त करने में सक्षम बनाता है।<ref name="r1" /> | ||
*क्रॉस-वैलिडेशन मानदंड। | *क्रॉस-वैलिडेशन मानदंड। | ||
== जीएमडीएच का उपयोग करके मॉडल विकास का | == जीएमडीएच का उपयोग करके मॉडल विकास का सरल विवरण == | ||
जीएमडीएच का उपयोग करके मॉडलिंग के लिए, केवल चयन मानदंड और अधिकतम मॉडल कोम्प्लेक्सिटी पूर्व-चयनित हैं। फिर, डिज़ाइन प्रक्रिया पहली परत से प्रारंभ होती है और आगे बढ़ती है। छिपी हुई परतों में परतों और न्यूरॉन्स की संख्या, मॉडल संरचना स्वचालित रूप से निर्धारित होती है। स्वीकार्य इनपुट के सभी संभावित संयोजनों (सभी संभावित न्यूरॉन्स) पर विचार किया जा सकता है। फिर बहुपद गुणांकों को उपलब्ध न्यूनतम विधियों में से | जीएमडीएच का उपयोग करके मॉडलिंग के लिए, केवल चयन मानदंड और अधिकतम मॉडल कोम्प्लेक्सिटी पूर्व-चयनित हैं। फिर, डिज़ाइन प्रक्रिया पहली परत से प्रारंभ होती है और आगे बढ़ती है। छिपी हुई परतों में परतों और न्यूरॉन्स की संख्या, मॉडल संरचना स्वचालित रूप से निर्धारित होती है। स्वीकार्य इनपुट के सभी संभावित संयोजनों (सभी संभावित न्यूरॉन्स) पर विचार किया जा सकता है। फिर बहुपद गुणांकों को उपलब्ध न्यूनतम विधियों में से जैसे एकवचन मूल्य अपघटन (प्रशिक्षण डेटा के साथ) का उपयोग करके निर्धारित किया जाता है। फिर, उत्तम बाहरी मानदंड मान वाले न्यूरॉन्स (डेटा के परीक्षण के लिए) रखे जाते हैं, और अन्य हटा दिए जाते हैं। यदि परत के सर्वश्रेष्ठ न्यूरॉन के लिए बाहरी मानदंड न्यूनतम तक पहुंच जाता है या रुकने वाले मानदंड से अधिक हो जाता है, तो नेटवर्क डिज़ाइन पूरा हो जाता है और अंतिम परत के सर्वश्रेष्ठ न्यूरॉन की बहुपद अभिव्यक्ति को गणितीय पूर्वानुमान फ़ंक्शन के रूप में पेश किया जाता है; यदि नहीं, तो अगली परत तैयार हो जाएगी और यह प्रक्रिया चलती रहेगी।<ref>{{Cite journal|last1=Sohani|first1=Ali|last2=Sayyaadi|first2=Hoseyn|last3=Hoseinpoori|first3=Sina|date=2016-09-01|title=जीएमडीएच प्रकार तंत्रिका नेटवर्क का उपयोग करके एम-चक्र क्रॉस-फ्लो अप्रत्यक्ष बाष्पीकरणीय कूलर की मॉडलिंग और बहुउद्देश्यीय अनुकूलन|journal=International Journal of Refrigeration|volume=69|pages=186–204|doi=10.1016/j.ijrefrig.2016.05.011}}</ref> | ||
==जीएमडीएच-प्रकार इन्टेलीजेंस नेटवर्क== | ==जीएमडीएच-प्रकार इन्टेलीजेंस नेटवर्क == | ||
आंशिक मॉडल पर विचार के लिए ऑर्डर चुनने के अनेक | आंशिक मॉडल पर विचार के लिए ऑर्डर चुनने के अनेक भिन्न-भिन्न विधि हैं। जीएमडीएच में उपयोग किया जाने वाला सबसे पहला विचार आदेश और जिसे मूल रूप से मल्टीलेयर इंडक्टिव प्रक्रिया कहा जाता है, सबसे लोकप्रिय है। यह बेस फ़ंक्शन से उत्पन्न धीरे-धीरे काम्प्लेक्स मॉडलों को छांटना है। सर्वोत्तम मॉडल को न्यूनतम बाहरी मानदंड विशेषता द्वारा दर्शाया जाता है। बहुस्तरीय प्रक्रिया न्यूरॉन्स के बहुपद सक्रियण कार्य के साथ [[कृत्रिम तंत्रिका नेटवर्क|आर्टिफिशियल इन्टेलीजेंस नेटवर्क]] के समान है। इसलिए, ऐसे दृष्टिकोण वाले एल्गोरिदम को समान्यत: जीएमडीएच-प्रकार न्यूरल नेटवर्क या पॉलीनोमियल न्यूरल नेटवर्क के रूप में जाना जाता है। ली ने दिखाया कि जीएमडीएच-प्रकार के इन्टेलीजेंस नेटवर्क ने सिंगल एक्सपोनेंशियल स्मूथ, डबल एक्सपोनेंशियल स्मूथ, एआरआईएमए और बैक-प्रोपेगेशन न्यूरल नेटवर्क जैसे शास्त्रीय पूर्वानुमान एल्गोरिदम से उत्तम प्रदर्शन किया था।<ref>{{Cite journal|last1=Li|first1=Rita Yi Man |last2=Fong |first2=Simon |last3=Chong|first3=Kyle Weng Sang |date=2017 |title=Forecasting the REITs and stock indices: Group Method of Data Handling Neural Network approach |journal=Pacific Rim Property Research Journal |volume=23 |issue=2 |pages=123–160 |doi=10.1080/14445921.2016.1225149|s2cid=157150897 }}</ref> | ||
==कॉम्बिनेटोरियल जीएमडीएच== | ==कॉम्बिनेटोरियल जीएमडीएच== | ||
[[Image:Combinatorial_GMDH_optimal_complexity.png|right|thumb|चित्र .1। विभिन्न कोम्प्लेक्सिटी वाले कॉम्बिनेटोरियल जीएमडीएच मॉडल के लिए नियमितता के मानदंड के न्यूनतम मूल्यों का | [[Image:Combinatorial_GMDH_optimal_complexity.png|right|thumb|चित्र .1। विभिन्न कोम्प्लेक्सिटी वाले कॉम्बिनेटोरियल जीएमडीएच मॉडल के लिए नियमितता के मानदंड के न्यूनतम मूल्यों का विशिष्ट वितरण।]]आंशिक मॉडलों पर विचार करने के लिए और महत्वपूर्ण दृष्टिकोण जो अधिक से अधिक लोकप्रिय हो रहा है वह संयुक्त खोज है जो या तो सीमित है या पूर्ण है। इस दृष्टिकोण के बहुपद इन्टेलीजेंस नेटवर्क के प्रतियोगिता के कुछ लाभ हैं, किंतु इसके लिए अधिक कम्प्यूटेशनल शक्ति की आवश्यकता होती है और इस प्रकार यह बड़ी संख्या में इनपुट वाली वस्तुओं के लिए प्रभावी नहीं है। कॉम्बिनेटोरियल जीएमडीएच की महत्वपूर्ण उपलब्धि यह है कि यदि इनपुट डेटा में नोइज़ी का स्तर शून्य से अधिक है तो यह रैखिक प्रतिगमन दृष्टिकोण से पूरी तरह से उत्तम प्रदर्शन करता है। यह गारंटी देता है कि संपूर्ण सॉर्टिंग के समय सबसे इष्टतम मॉडल स्थापित किया जाएगा। | ||
बेसिक कॉम्बिनेटोरियल एल्गोरिदम निम्नलिखित चरण बनाता है: | बेसिक कॉम्बिनेटोरियल एल्गोरिदम निम्नलिखित चरण बनाता है: | ||
* डेटा सैंपल को कम से कम दो सैंपल A | * डेटा सैंपल को कम से कम दो सैंपल A और B. में विभाजित करता है। | ||
* निरंतर बढ़ती कोम्प्लेक्सिटी के साथ आंशिक मॉडल के अनुसार A से उप-नमूने उत्पन्न करता है। | * निरंतर बढ़ती कोम्प्लेक्सिटी के साथ आंशिक मॉडल के अनुसार A से उप-नमूने उत्पन्न करता है। | ||
* मॉडल कोम्प्लेक्सिटी की प्रत्येक परत पर आंशिक मॉडल के गुणांक का अनुमान लगाता है। | * मॉडल कोम्प्लेक्सिटी की प्रत्येक परत पर आंशिक मॉडल के गुणांक का अनुमान लगाता है। | ||
Line 68: | Line 68: | ||
* इष्टतम कोम्प्लेक्सिटी के चयनित मॉडल के लिए संपूर्ण डेटा नमूने पर गुणांकों की पुनर्गणना करें। | * इष्टतम कोम्प्लेक्सिटी के चयनित मॉडल के लिए संपूर्ण डेटा नमूने पर गुणांकों की पुनर्गणना करें। | ||
जीएमडीएच-प्रकार के इन्टेलीजेंस नेटवर्क के विपरीत, कॉम्बिनेटोरियल एल्गोरिदम समान्यत: कोम्प्लेक्सिटी के निश्चित स्तर पर नहीं रुकता है क्योंकि मानदंड मान में वृद्धि का | जीएमडीएच-प्रकार के इन्टेलीजेंस नेटवर्क के विपरीत, कॉम्बिनेटोरियल एल्गोरिदम समान्यत: कोम्प्लेक्सिटी के निश्चित स्तर पर नहीं रुकता है क्योंकि मानदंड मान में वृद्धि का बिंदु केवल स्थानीय न्यूनतम हो सकता है, चित्र 1 देखें। | ||
==एल्गोरिदम== | ==एल्गोरिदम== | ||
Line 88: | Line 88: | ||
==सॉफ़्टवेयर की सूची== | ==सॉफ़्टवेयर की सूची== | ||
* [https://web.archive.org/web/20080213145150/http://neuron.felk.cvut.cz/game/project.html फर्जी गेम प्रोजेक्ट] - विवर्त स्रोत। क्रॉस-प्लेटफ़ॉर्म। | * [https://web.archive.org/web/20080213145150/http://neuron.felk.cvut.cz/game/project.html फर्जी गेम प्रोजेक्ट] - विवर्त स्रोत। क्रॉस-प्लेटफ़ॉर्म। | ||
* [https://web.archive.org/web/20080418084252/http://research.guilan.ac.ir/gevom/ | * [https://web.archive.org/web/20080418084252/http://research.guilan.ac.ir/gevom/ जीवोम] - शैक्षणिक उपयोग के लिए अनुरोध पर निःशुल्क। केवल विंडोज़. | ||
* [https://gmdhsoftware.com/predictive-analytics-software | * [https://gmdhsoftware.com/predictive-analytics-software जीएमडीएच शेल] - जीएमडीएच-आधारित, पूर्वानुमानित विश्लेषण और समय श्रृंखला पूर्वानुमान सॉफ्टवेयर। निःशुल्क शैक्षणिक लाइसेंसिंग और निःशुल्क परीक्षण संस्करण उपलब्ध है। केवल विंडोज़. | ||
* [http://www.knowledgeminer.eu/about.html नॉलेजमाइनर] - वाणिज्यिक उत्पाद। केवल मैक ओएस एक्स। निःशुल्क डेमो संस्करण उपलब्ध है। | * [http://www.knowledgeminer.eu/about.html नॉलेजमाइनर] - वाणिज्यिक उत्पाद। केवल मैक ओएस एक्स। निःशुल्क डेमो संस्करण उपलब्ध है। | ||
* [http://pnn.pnnsoft.com/index.html पीएनएन डिस्कवरी क्लाइंट] - वाणिज्यिक उत्पाद। | * [http://pnn.pnnsoft.com/index.html पीएनएन डिस्कवरी क्लाइंट] - वाणिज्यिक उत्पाद। | ||
* [http://sourceforge.net/projects/sciengyrpf/ साइंसी आरपीएफ!] - फ्रीवेयर, ओपन सोर्स। | * [http://sourceforge.net/projects/sciengyrpf/ साइंसी आरपीएफ!] - फ्रीवेयर, ओपन सोर्स। | ||
* [http://wgmdh.irb.hr/en/project/ | * [http://wgmdh.irb.hr/en/project/ डब्ल्यूजीएमडीएच] - [[वेका (मशीन लर्निंग)]] प्लगइन, ओपन सोर्स। | ||
* [https://cran.r-project.org/web/packages/GMDH/ R पैकेज] - विवर्त स्रोत। | * [https://cran.r-project.org/web/packages/GMDH/ R पैकेज] - विवर्त स्रोत। | ||
* [https://CRAN.R-project.org/package=GMDHreg प्रतिगमन कार्यों के लिए आर पैकेज] - विवर्त स्रोत। | * [https://CRAN.R-project.org/package=GMDHreg प्रतिगमन कार्यों के लिए आर पैकेज] - विवर्त स्रोत। |
Revision as of 11:45, 9 August 2023
डेटा हैंडलिंग की समूह विधि (जीएमडीएच) मल्टी-पैरामीट्रिक डेटासेट के कंप्यूटर-आधारित गणितीय मॉडलिंग के लिए आगमनात्मक एल्गोरिदम का वर्ग है जो कि मॉडल के पूरी तरह से स्वचालित संरचनात्मक और पैरामीट्रिक अनुकूलन की सुविधा देता है।
जीएमडीएच का उपयोग डेटा माइनिंग, नॉलेज डिस्कवरी, प्रेडिक्शन , काम्प्लेक्स सिस्टम मॉडलिंग, ऑप्टिमाइजेशन (गणित) और पैटर्न पहचान जैसे क्षेत्रों में किया जाता है।[1] जीएमडीएच एल्गोरिदम को आगमनात्मक प्रक्रिया की विशेषता होती है जो धीरे-धीरे काम्प्लेक्स बहुपद मॉडलों को खोजती है और बाहरी मानदंड के माध्यम से सर्वोत्तम समाधान का चयन करती है।
एकाधिक इनपुट और आउटपुट वाला जीएमडीएच मॉडल बेस फ़ंक्शन (1) के घटकों का सबसेट है:
जहां fi प्राथमिक कार्य हैं जो इनपुट के विभिन्न सेटों पर निर्भर हैं, जिसमे ai गुणांक हैं और m आधार फ़ंक्शन घटकों की संख्या है।
सर्वोत्तम समाधान खोजने के लिए, जीएमडीएच एल्गोरिदम बेस फ़ंक्शन (1) के विभिन्न घटक उपसमुच्चय पर विचार करता है जिन्हें आंशिक मॉडल कहा जाता है। इन मॉडलों के गुणांकों का अनुमान न्यूनतम वर्ग विधि द्वारा लगाया जाता है। जीएमडीएच एल्गोरिदम धीरे-धीरे आंशिक मॉडल घटकों की संख्या बढ़ाता है और बाहरी मानदंड के न्यूनतम मूल्य द्वारा निरुपित इष्टतम कोम्प्लेक्सिटी के साथ मॉडल संरचना खोजता है। इस प्रक्रिया को मॉडलों का स्व-संगठन कहा जाता है।
जीएमडीएच में उपयोग किए जाने वाले पहले आधार फ़ंक्शन के रूप में, धीरे-धीरे काम्प्लेक्स कोलमोगोरोव-गैबोर बहुपद (2) था:
समान्यत: दूसरी डिग्री तक के कार्यों वाले अधिक सरल आंशिक मॉडल का उपयोग किया जाता है।[1]
आगमनात्मक एल्गोरिदम को बहुपद इन्टेलीजेंस नेटवर्क के रूप में भी जाना जाता है। जुर्गन श्मिधुबर ने जीएमडीएच को पहली गहन शिक्षण विधियों में से बताया, और टिप्पणी की कि इसका उपयोग 1971 की प्रारंभ में आठ-परत इन्टेलीजेंस नेट को प्रशिक्षित करने के लिए किया गया था।[2][3]
इतिहास
इस पद्धति की प्रारंभ 1968 में कीव में साइबरनेटिक्स संस्थान में प्रो. एलेक्सी ग्रिगोरेविच इवाख्नेंको या एलेक्सी जी. इवाख्नेंको द्वारा की गई थी। यह आगमनात्मक दृष्टिकोण प्रारंभ से ही कंप्यूटर-आधारित पद्धति थी, इसलिए कंप्यूटर प्रोग्राम और एल्गोरिदम का सेट नए सैद्धांतिक सिद्धांतों के आधार पर प्राप्त प्राथमिक व्यावहारिक परिणाम थे। लेखक की ओपन कोड शेयरिंग नीति की फलस्वरूप यह विधि विश्व भर में बड़ी संख्या में वैज्ञानिक प्रयोगशालाओं में तेजी से स्थापित हो गई। चूँकि अधिकांश नियमित कार्य कंप्यूटर पर स्थानांतरित हो जाते हैं, वस्तुनिष्ठ परिणाम पर मानव प्रभाव का प्रभाव कम हो जाता है। वास्तव में, इस दृष्टिकोण को आर्टिफिशियल इन्टेलीजेंस थीसिस के कार्यान्वयन में से माना जा सकता है, जिसमें कहा गया है कि कंप्यूटर मनुष्यों के लिए शक्तिशाली सलाहकार के रूप में कार्य कर सकता है।
जीएमडीएच के विकास में विज्ञान के विभिन्न क्षेत्रों से विचारों का संश्लेषण सम्मिलित है: "ब्लैक बॉक्स" की साइबरनेटिक अवधारणा और जोड़ीदार विशेषताओं के क्रमिक आनुवंशिक चयन का सिद्धांत, गोडेल की अपूर्णता प्रमेय और गैबोर का "निर्णय चयन की स्वतंत्रता" का सिद्धांत[4] अधेमर की गलतता और बीयर के बाहरी परिवर्धन का सिद्धांत है।[5]
जीएमडीएच अनिश्चितता के अनुसार प्रयोगात्मक डेटा के लिए मॉडल की संरचनात्मक-पैरामीट्रिक पहचान के लिए समस्याओं को हल करने की मूल विधि है। ऐसी समस्या गणितीय मॉडल के निर्माण में होती है जो जांच की गई वस्तु या प्रक्रिया के अज्ञात पैटर्न का अनुमान लगाती है।[6] यह इसके बारे में उस जानकारी का उपयोग करता है जो डेटा में निहित है। जीएमडीएच निम्नलिखित सिद्धांतों के सक्रिय अनुप्रयोग द्वारा मॉडलिंग के अन्य विधियों से भिन्न है: स्वचालित मॉडल निर्माण, अनिर्णायक निर्णय, और इष्टतम कोम्प्लेक्सिटी के मॉडल खोजने के लिए बाहरी मानदंडों द्वारा निरंतर चयन और इसमें स्वचालित मॉडल संरचना निर्माण के लिए मूल बहुस्तरीय प्रक्रिया थी, जो जोड़ीदार क्रमिक विशेषताओं पर विचार करते हुए जैविक चयन की प्रक्रिया का अनुकरण करती है। ऐसी प्रक्रिया वर्तमान में डीप लर्निंग नेटवर्क में उपयोग की जाती है[7] इष्टतम मॉडल की तुलना करने और चुनने के लिए, डेटा नमूने के दो या अधिक उपसमूहों का उपयोग किया जाता है। इससे प्रारंभिक धारणाओं से बचना संभव हो जाता है, क्योंकि नमूना विभाजन इष्टतम मॉडल के स्वचालित निर्माण के समय विभिन्न प्रकार की अनिश्चितता को स्पष्ट रूप से स्वीकार करता है।
विकास के समय नोइज़ी डेटा और नोइज़ी(इलेक्ट्रॉनिक्स) के साथ चैनल (संचार) से गुजरने वाले सिग्नल के लिए मॉडल बनाने की समस्या के मध्य जैविक सादृश्य स्थापित किया गया था।[8] इससे नोइज़ी-प्रतिरक्षा मॉडलिंग के सिद्धांत की नींव रखना संभव हो गया था।[9] इस सिद्धांत का मुख्य परिणाम यह है कि इष्टतम पूर्वानुमानित मॉडल की कोम्प्लेक्सिटी डेटा में अनिश्चितता के स्तर पर निर्भर करती है: यह स्तर जितना अधिक होगा (उदाहरण के लिए नोइज़ी के कारण) - उतना ही सरल इष्टतम मॉडल (कम अनुमानित मापदंडों के साथ) होना चाहिए। इसने फजी सेट में नोइज़ी भिन्नता के स्तर के लिए इष्टतम मॉडल कोम्प्लेक्सिटी के स्वचालित अनुकूलन की संरचनात्मक प्रेरण विधि के रूप में जीएमडीएच सिद्धांत के विकास की प्रारंभ किया था। इसलिए, जीएमडीएच को अधिकांशतः प्रयोगात्मक डेटा से नॉलेज एस्ट्रक्शन के लिए मूल सूचना प्रौद्योगिकी माना जाता है।
1968-1971 की अवधि पहचान, पैटर्न पहचान और अल्पकालिक पूर्वानुमान की समस्याओं के समाधान के लिए केवल नियमितता मानदंड के अनुप्रयोग की विशेषता है। संदर्भ फ़ंक्शन के रूप में बहुपद, लॉजिकल नेट्स फ़ज़ी ज़ादेह सेट और बेयस संभाव्यता सूत्र का उपयोग किया गया था। नए दृष्टिकोण के साथ पूर्वानुमान की अत्यधिक स्पष्टता से लेखक प्रेरित हुए। नोइज़ी प्रतिरक्षा की जांच नहीं की गई।
अवधि 1972-1975 नोइज़ी वाले डेटा और अपूर्ण सूचना आधार के मॉडलिंग की समस्या का समाधान किया गया। जिससे नोइज़ी प्रतिरोधक क्षमता बढ़ाने के लिए बहुमानदंड चयन और अतिरिक्त प्राथमिक जानकारी का उपयोग प्रस्तावित किया गया था। सर्वोत्तम प्रयोगों से पता चला है कि अतिरिक्त मानदंड द्वारा इष्टतम मॉडल की विस्तारित परिभाषा के साथ नोइज़ी स्तर सिग्नल से दस गुना अधिक हो सकता है। फिर शैनन के सामान्य संचार सिद्धांत के प्रमेय का उपयोग करके इसमें सुधार किया गया था।
अवधि 1976-1979 बहुस्तरीय जीएमडीएच एल्गोरिदम के अभिसरण की जांच की गई थी। तब यह दिखाया गया कि कुछ बहुस्तरीय एल्गोरिदम में बहुपरतीय त्रुटि होती है - जो नियंत्रण प्रणालियों की स्थैतिक त्रुटि के समान होती है। 1977 में बहुस्तरीय जीएमडीएच एल्गोरिदम द्वारा वस्तुनिष्ठ प्रणाली विश्लेषण समस्याओं का समाधान प्रस्तावित किया गया था। यह पता चला कि मानदंड समूह द्वारा छँटाई करने से समीकरणों की एकमात्र इष्टतम प्रणाली मिलती है और इसलिए काम्प्लेक्स वस्तु तत्वों, उनके मुख्य इनपुट और आउटपुट वेरिएबल को दिखाया जाता है।
अवधि 1980-1988 अनेक महत्वपूर्ण सैद्धान्तिक परिणाम प्राप्त हुए थे। जिसने यह स्पष्ट हो गया कि दीर्घकालिक पूर्वानुमान के लिए पूर्ण भौतिक मॉडल का उपयोग नहीं किया जा सकता है। तथा यह भी सिद्ध हो गया है कि जीएमडीएच के गैर-भौतिक मॉडल प्रतिगमन विश्लेषण के भौतिक मॉडल की तुलना में अनुमान और पूर्वानुमान के लिए अधिक स्पष्ट हैं। मॉडलिंग के लिए दो भिन्न-भिन्न समय के पैमाने का उपयोग करने वाले दो-स्तरीय एल्गोरिदम विकसित किए गए थे।
1989 से फजी ऑब्जेक्ट के गैर-पैरामीट्रिक मॉडलिंग के लिए नए एल्गोरिदम (एसी, ओसीसी, पीएफ) और विशेषज्ञ प्रणालियों के लिए एसएलपी विकसित और जांच की गई।[10] जीएमडीएच विकास के वर्तमान चरण को मल्टीप्रोसेसर कंप्यूटरों के लिए गहन शिक्षण न्यूरोनेट और समानांतर आगमनात्मक एल्गोरिदम के विकास के रूप में वर्णित किया जा सकता है।
बाहरी मानदंड
बाहरी मानदंड जीएमडीएच की प्रमुख विशेषताओं में से है। मानदंड मॉडल की आवश्यकताओं का वर्णन करता है, उदाहरण के लिए न्यूनतम वर्गों का न्यूनतमकरण। इसकी गणना सदैव डेटा नमूने के भिन्न भाग के साथ की जाती है जिसका उपयोग गुणांक के अनुमान के लिए नहीं किया गया है। इससे इनपुट डेटा में अनिश्चितता के स्तर के अनुसार इष्टतम कोम्प्लेक्सिटी के मॉडल का चयन करना संभव हो जाता है। अनेक लोकप्रिय मानदंड हैं:
- नियमितता का मानदंड (सीआर) - नमूना B पर मॉडल का न्यूनतम वर्ग
- न्यूनतम पूर्वाग्रह या संगति का मानदंड - दो भिन्न-भिन्न नमूनों A और B, के आधार पर विकसित दो मॉडलों के अनुमानित आउटपुट (या गुणांक वैक्टर) के मध्य अंतर की वर्ग त्रुटि, नमूना B पर अनुमानित वर्ग आउटपुट द्वारा विभाजित किया जाता है। जहाँ इसका उपयोग करके मॉडल की तुलना यह सुसंगत मॉडल प्राप्त करने और नोइज़ी वाले डेटा से छिपे हुए भौतिक नियम को पुनर्प्राप्त करने में सक्षम बनाता है।[1]
- क्रॉस-वैलिडेशन मानदंड।
जीएमडीएच का उपयोग करके मॉडल विकास का सरल विवरण
जीएमडीएच का उपयोग करके मॉडलिंग के लिए, केवल चयन मानदंड और अधिकतम मॉडल कोम्प्लेक्सिटी पूर्व-चयनित हैं। फिर, डिज़ाइन प्रक्रिया पहली परत से प्रारंभ होती है और आगे बढ़ती है। छिपी हुई परतों में परतों और न्यूरॉन्स की संख्या, मॉडल संरचना स्वचालित रूप से निर्धारित होती है। स्वीकार्य इनपुट के सभी संभावित संयोजनों (सभी संभावित न्यूरॉन्स) पर विचार किया जा सकता है। फिर बहुपद गुणांकों को उपलब्ध न्यूनतम विधियों में से जैसे एकवचन मूल्य अपघटन (प्रशिक्षण डेटा के साथ) का उपयोग करके निर्धारित किया जाता है। फिर, उत्तम बाहरी मानदंड मान वाले न्यूरॉन्स (डेटा के परीक्षण के लिए) रखे जाते हैं, और अन्य हटा दिए जाते हैं। यदि परत के सर्वश्रेष्ठ न्यूरॉन के लिए बाहरी मानदंड न्यूनतम तक पहुंच जाता है या रुकने वाले मानदंड से अधिक हो जाता है, तो नेटवर्क डिज़ाइन पूरा हो जाता है और अंतिम परत के सर्वश्रेष्ठ न्यूरॉन की बहुपद अभिव्यक्ति को गणितीय पूर्वानुमान फ़ंक्शन के रूप में पेश किया जाता है; यदि नहीं, तो अगली परत तैयार हो जाएगी और यह प्रक्रिया चलती रहेगी।[11]
जीएमडीएच-प्रकार इन्टेलीजेंस नेटवर्क
आंशिक मॉडल पर विचार के लिए ऑर्डर चुनने के अनेक भिन्न-भिन्न विधि हैं। जीएमडीएच में उपयोग किया जाने वाला सबसे पहला विचार आदेश और जिसे मूल रूप से मल्टीलेयर इंडक्टिव प्रक्रिया कहा जाता है, सबसे लोकप्रिय है। यह बेस फ़ंक्शन से उत्पन्न धीरे-धीरे काम्प्लेक्स मॉडलों को छांटना है। सर्वोत्तम मॉडल को न्यूनतम बाहरी मानदंड विशेषता द्वारा दर्शाया जाता है। बहुस्तरीय प्रक्रिया न्यूरॉन्स के बहुपद सक्रियण कार्य के साथ आर्टिफिशियल इन्टेलीजेंस नेटवर्क के समान है। इसलिए, ऐसे दृष्टिकोण वाले एल्गोरिदम को समान्यत: जीएमडीएच-प्रकार न्यूरल नेटवर्क या पॉलीनोमियल न्यूरल नेटवर्क के रूप में जाना जाता है। ली ने दिखाया कि जीएमडीएच-प्रकार के इन्टेलीजेंस नेटवर्क ने सिंगल एक्सपोनेंशियल स्मूथ, डबल एक्सपोनेंशियल स्मूथ, एआरआईएमए और बैक-प्रोपेगेशन न्यूरल नेटवर्क जैसे शास्त्रीय पूर्वानुमान एल्गोरिदम से उत्तम प्रदर्शन किया था।[12]
कॉम्बिनेटोरियल जीएमडीएच
आंशिक मॉडलों पर विचार करने के लिए और महत्वपूर्ण दृष्टिकोण जो अधिक से अधिक लोकप्रिय हो रहा है वह संयुक्त खोज है जो या तो सीमित है या पूर्ण है। इस दृष्टिकोण के बहुपद इन्टेलीजेंस नेटवर्क के प्रतियोगिता के कुछ लाभ हैं, किंतु इसके लिए अधिक कम्प्यूटेशनल शक्ति की आवश्यकता होती है और इस प्रकार यह बड़ी संख्या में इनपुट वाली वस्तुओं के लिए प्रभावी नहीं है। कॉम्बिनेटोरियल जीएमडीएच की महत्वपूर्ण उपलब्धि यह है कि यदि इनपुट डेटा में नोइज़ी का स्तर शून्य से अधिक है तो यह रैखिक प्रतिगमन दृष्टिकोण से पूरी तरह से उत्तम प्रदर्शन करता है। यह गारंटी देता है कि संपूर्ण सॉर्टिंग के समय सबसे इष्टतम मॉडल स्थापित किया जाएगा।
बेसिक कॉम्बिनेटोरियल एल्गोरिदम निम्नलिखित चरण बनाता है:
- डेटा सैंपल को कम से कम दो सैंपल A और B. में विभाजित करता है।
- निरंतर बढ़ती कोम्प्लेक्सिटी के साथ आंशिक मॉडल के अनुसार A से उप-नमूने उत्पन्न करता है।
- मॉडल कोम्प्लेक्सिटी की प्रत्येक परत पर आंशिक मॉडल के गुणांक का अनुमान लगाता है।
- नमूना B पर मॉडल के लिए बाहरी मानदंड के मूल्य की गणना करता है।
- मानदंड के न्यूनतम मूल्य द्वारा निरुपित सर्वोत्तम मॉडल (मॉडल का सेट) चुनता है।
- इष्टतम कोम्प्लेक्सिटी के चयनित मॉडल के लिए संपूर्ण डेटा नमूने पर गुणांकों की पुनर्गणना करें।
जीएमडीएच-प्रकार के इन्टेलीजेंस नेटवर्क के विपरीत, कॉम्बिनेटोरियल एल्गोरिदम समान्यत: कोम्प्लेक्सिटी के निश्चित स्तर पर नहीं रुकता है क्योंकि मानदंड मान में वृद्धि का बिंदु केवल स्थानीय न्यूनतम हो सकता है, चित्र 1 देखें।
एल्गोरिदम
- कॉम्बिनेटोरियल (कोम्बी)
- बहुस्तरीय पुनरावृत्त (एमआईए)
- जीएन
- वस्तुनिष्ठ प्रणाली विश्लेषण (ओएसए)
- हार्मोनिक
- दो स्तरीय (एआरआईएमएडी)
- गुणक-योगात्मक (एमएए)
- वस्तुनिष्ठ कंप्यूटर क्लस्टरीकरण (ओसीसी);
- पॉइंटिंग फिंगर (पीएफ) क्लस्टराइजेशन एल्गोरिदम;
- एनालॉग कॉम्प्लेक्सिंग (एसी)
- हार्मोनिक पुनर्विवेचन
- सांख्यिकीय निर्णयों के बहुस्तरीय सिद्धांत (एमटीएसडी) के आधार पर एल्गोरिदम
- अनुकूली मॉडल विकास का समूह (गेम)
सॉफ़्टवेयर की सूची
- फर्जी गेम प्रोजेक्ट - विवर्त स्रोत। क्रॉस-प्लेटफ़ॉर्म।
- जीवोम - शैक्षणिक उपयोग के लिए अनुरोध पर निःशुल्क। केवल विंडोज़.
- जीएमडीएच शेल - जीएमडीएच-आधारित, पूर्वानुमानित विश्लेषण और समय श्रृंखला पूर्वानुमान सॉफ्टवेयर। निःशुल्क शैक्षणिक लाइसेंसिंग और निःशुल्क परीक्षण संस्करण उपलब्ध है। केवल विंडोज़.
- नॉलेजमाइनर - वाणिज्यिक उत्पाद। केवल मैक ओएस एक्स। निःशुल्क डेमो संस्करण उपलब्ध है।
- पीएनएन डिस्कवरी क्लाइंट - वाणिज्यिक उत्पाद।
- साइंसी आरपीएफ! - फ्रीवेयर, ओपन सोर्स।
- डब्ल्यूजीएमडीएच - वेका (मशीन लर्निंग) प्लगइन, ओपन सोर्स।
- R पैकेज - विवर्त स्रोत।
- प्रतिगमन कार्यों के लिए आर पैकेज - विवर्त स्रोत।
- एमआईए एल्गोरिदम की पायथन लाइब्रेरी - विवर्त स्रोत।
संदर्भ
- ↑ 1.0 1.1 1.2 Madala, H.R.; Ivakhnenko, O.G. (1994). जटिल सिस्टम मॉडलिंग के लिए आगमनात्मक शिक्षण एल्गोरिदम. Boca Raton: CRC Press. ISBN 978-0849344381. Archived from the original on 2017-12-31. Retrieved 2019-11-17.
- ↑ Schmidhuber, Jürgen (2015). "Deep learning in neural networks: An overview". Neural Networks. 61: 85–117. arXiv:1404.7828. doi:10.1016/j.neunet.2014.09.003. PMID 25462637. S2CID 11715509.
- ↑ Ivakhnenko, Alexey (1971). "जटिल प्रणालियों का बहुपद सिद्धांत" (PDF). IEEE Transactions on Systems, Man, and Cybernetics. SMC-1 (4): 364–378. doi:10.1109/TSMC.1971.4308320.
- ↑ Gabor, D. (1971). योजना के परिप्रेक्ष्य. आर्थिक सहयोग और विकास संगठन. London: Imp.Coll.
- ↑ Beer, S. (1959). साइबरनेटिक्स और प्रबंधन. London: English Univ. Press.
- ↑ Ivakhnenko, O.G.; Lapa, V.G. (1967). साइबरनेटिक्स और पूर्वानुमान तकनीक (Modern Analytic and Computational Methods in Science and Mathematics, v.8 ed.). American Elsevier.
- ↑ Takao, S.; Kondo, S.; Ueno, J.; Kondo, T. (2017). "गहन प्रतिक्रिया जीएमडीएच-प्रकार तंत्रिका नेटवर्क और एमआरआई मस्तिष्क छवियों के चिकित्सा छवि विश्लेषण के लिए इसका अनुप्रयोग". Artificial Life and Robotics. 23 (2): 161–172. doi:10.1007/s10015-017-0410-1. S2CID 44190434.
- ↑ Ivahnenko, O.G. (1982). जटिल प्रणालियों के लिए मॉडल स्व-संगठन की आगमनात्मक विधि (PDF). Kyiv: Naukova Dumka. Archived from the original (PDF) on 2017-12-31. Retrieved 2019-11-18.
- ↑ Ivakhnenko, O.G.; Stepashko, V.S. (1985). शोर प्रतिरक्षा मॉडलिंग (मॉडलिंग की न्यूस प्रतिरक्षा) (PDF). Kyiv: Naukova Dumka. Archived from the original (PDF) on 2017-12-31. Retrieved 2019-11-18.
- ↑ Ivakhnenko, O.G.; Ivakhnenko, G.A. (1995). "डेटा हैंडलिंग की समूह पद्धति (जीएमडीएच) के एल्गोरिदम द्वारा हल की जा सकने वाली समस्याओं की समीक्षा" (PDF). Pattern Recognition and Image Analysis. 5 (4): 527–535. CiteSeerX 10.1.1.19.2971.
- ↑ Sohani, Ali; Sayyaadi, Hoseyn; Hoseinpoori, Sina (2016-09-01). "जीएमडीएच प्रकार तंत्रिका नेटवर्क का उपयोग करके एम-चक्र क्रॉस-फ्लो अप्रत्यक्ष बाष्पीकरणीय कूलर की मॉडलिंग और बहुउद्देश्यीय अनुकूलन". International Journal of Refrigeration. 69: 186–204. doi:10.1016/j.ijrefrig.2016.05.011.
- ↑ Li, Rita Yi Man; Fong, Simon; Chong, Kyle Weng Sang (2017). "Forecasting the REITs and stock indices: Group Method of Data Handling Neural Network approach". Pacific Rim Property Research Journal. 23 (2): 123–160. doi:10.1080/14445921.2016.1225149. S2CID 157150897.
बाहरी संबंध
अग्रिम पठन
- A.G. Ivakhnenko. Heuristic Self-Organization in Problems of Engineering Cybernetics, Automatica, vol.6, 1970 — p. 207-219.
- S.J. Farlow. Self-Organizing Methods in Modelling: GMDH Type Algorithms. New-York, Bazel: Marcel Decker Inc., 1984, 350 p.
- H.R. Madala, A.G. Ivakhnenko. Inductive Learning Algorithms for Complex Systems Modeling. CRC Press, Boca Raton, 1994.