एन्सेम्बल लर्निंग: Difference between revisions

From Vigyanwiki
 
(2 intermediate revisions by one other user not shown)
Line 157: Line 157:
[[परिवर्तन का पता लगाना (जीआईएस)|परिवर्तन संसूचन (जीआईएस)]] एक [[छवि विश्लेषण]] समस्या है, जिसमें उन स्थानों की पहचान सम्मिलित है जहां समय के साथ भूमि आच्छद बदल गया है। परिवर्तन संसूचन (जीआईएस) का व्यापक रूप से [[शहरी विकास]], वन गतिशीलता, [[भूमि उपयोग]] और [[आपदा निगरानी तारामंडल]] जैसे क्षेत्रों में उपयोग किया जाता है। <ref name="s2">{{cite journal |last1=Du |first1=Peijun |last2=Liu |first2=Sicong |last3=Xia |first3=Junshi |last4=Zhao |first4=Yindi |title=मल्टी-टेम्पोरल रिमोट सेंसिंग छवियों से परिवर्तन का पता लगाने के लिए सूचना संलयन तकनीक|journal=Information Fusion |date=January 2013 |volume=14 |issue=1 |pages=19–27 |doi=10.1016/j.inffus.2012.05.003}}</ref>
[[परिवर्तन का पता लगाना (जीआईएस)|परिवर्तन संसूचन (जीआईएस)]] एक [[छवि विश्लेषण]] समस्या है, जिसमें उन स्थानों की पहचान सम्मिलित है जहां समय के साथ भूमि आच्छद बदल गया है। परिवर्तन संसूचन (जीआईएस) का व्यापक रूप से [[शहरी विकास]], वन गतिशीलता, [[भूमि उपयोग]] और [[आपदा निगरानी तारामंडल]] जैसे क्षेत्रों में उपयोग किया जाता है। <ref name="s2">{{cite journal |last1=Du |first1=Peijun |last2=Liu |first2=Sicong |last3=Xia |first3=Junshi |last4=Zhao |first4=Yindi |title=मल्टी-टेम्पोरल रिमोट सेंसिंग छवियों से परिवर्तन का पता लगाने के लिए सूचना संलयन तकनीक|journal=Information Fusion |date=January 2013 |volume=14 |issue=1 |pages=19–27 |doi=10.1016/j.inffus.2012.05.003}}</ref>


परिवर्तन संसूचन में समुच्चय वर्गीकार के प्रारम्भिक अनुप्रयोगों को बहुसंख्यक [[बहुलता मतदान]], [[बायेसियन मॉडल औसत|बायेसियन प्रतिरूप औसतीकरण]],<ref>{{cite journal |last1=Zhao |first1=Kaiguang |last2=Wulder |first2=Michael A |last3=Hu |first3=Tongx |last4=Bright |first4=Ryan |last5=Wu |first5=Qiusheng |last6=Qin |first6=Haiming |last7=Li |first7=Yang |title=Detecting change-point, trend, and seasonality in satellite time series data to track abrupt changes and nonlinear dynamics: A Bayesian ensemble algorithm |journal=Remote Sensing of Environment |date=2019 |volume=232 |page=111181 |doi=10.1016/j.rse.2019.04.034 |bibcode=2019RSEnv.232k1181Z |s2cid=201310998 |url=https://go.osu.edu/beast2019}}</ref> और [[अधिकतम पश्च संभावना]] के साथ अभिकल्पित किया गया है। <ref>Defined by Bruzzone et al. (2002)<!-- ref name="Bruzzone_et_al_2002" --> as "The data class that receives the largest number of votes is taken as the class of the input pattern", this is ''simple majority'', more accurately described as ''plurality'' voting.</ref> <ref name="Bruzzone_et_al_2002">{{cite journal |last1=Bruzzone |first1=Lorenzo |last2=Cossu |first2=Roberto |last3=Vernazza |first3=Gianni |title=मल्टीटेम्पोरल रिमोट-सेंसिंग छवियों के आंशिक रूप से अप्रशिक्षित वर्गीकरण के लिए पैरामीट्रिक और गैर-पैरामीट्रिक एल्गोरिदम का संयोजन|journal=Information Fusion |date=December 2002 |volume=3 |issue=4 |pages=289–297 |doi=10.1016/S1566-2535(02)00091-X|url=http://eprints.biblio.unitn.it/105/1/24.pdf }}</ref> समय के साथ उपग्रह डेटा की वृद्धि को देखते हुए, पिछले दशक में छवि सम्मुच्चय से निरंतर परिवर्तन का पता लगाने के लिए समय श्रृंखला विधियों का अधिक उपयोग देखा गया है। रेफरी>{{cite journal |last1=Theodomir |first1=Mugiraneza |last2=Nascetti |first2=Andrea |last3=Ban. |first3=Yifang |title=लैंडसैट टाइम सीरीज़ और लैंडट्रेंड-गूगल अर्थ इंजन क्लाउड कंप्यूटिंग के साथ शहरी भूमि कवर परिवर्तन प्रक्षेप पथ की निरंतर निगरानी|journal=Remote Sensing |date=2020 |volume=12 |issue=18 |page=2883|doi=10.3390/rs12182883 |bibcode=2020RemS...12.2883M |doi-access=free }}</ref> एक उदाहरण BEAST नामक बायेसियन समुच्चय चेंजपॉइंट संसूचक विधि है, जिसमें सॉफ्टवेयर R, Python और मैटलैब में Rbeast संवेष्टक के रूप में उपलब्ध है। <ref>{{cite web |last1=Li |first1=Yang |last2=Zhao |first2=Kaiguang |last3=Hu |first3=Tongxi |last4=Zhang |first4=Xuesong |title=जानवर: परिवर्तन-बिंदु का पता लगाने और समय श्रृंखला अपघटन के लिए एक बायेसियन एन्सेम्बल एल्गोरिदम|website=[[GitHub]] |url=https://github.com/zhaokg/Rbeast}}<nowiki></ref>
परिवर्तन संसूचन में समुच्चय वर्गीकार के प्रारम्भिक अनुप्रयोगों को बहुसंख्यक [[बहुलता मतदान]], [[बायेसियन मॉडल औसत|बायेसियन प्रतिरूप औसतीकरण]],<ref>{{cite journal |last1=Zhao |first1=Kaiguang |last2=Wulder |first2=Michael A |last3=Hu |first3=Tongx |last4=Bright |first4=Ryan |last5=Wu |first5=Qiusheng |last6=Qin |first6=Haiming |last7=Li |first7=Yang |title=Detecting change-point, trend, and seasonality in satellite time series data to track abrupt changes and nonlinear dynamics: A Bayesian ensemble algorithm |journal=Remote Sensing of Environment |date=2019 |volume=232 |page=111181 |doi=10.1016/j.rse.2019.04.034 |bibcode=2019RSEnv.232k1181Z |s2cid=201310998 |url=https://go.osu.edu/beast2019}}</ref> और [[अधिकतम पश्च संभावना]] के साथ अभिकल्पित किया गया है। <ref>Defined by Bruzzone et al. (2002)<!-- ref name="Bruzzone_et_al_2002" --> as "The data class that receives the largest number of votes is taken as the class of the input pattern", this is ''simple majority'', more accurately described as ''plurality'' voting.</ref> <ref name="Bruzzone_et_al_2002">{{cite journal |last1=Bruzzone |first1=Lorenzo |last2=Cossu |first2=Roberto |last3=Vernazza |first3=Gianni |title=मल्टीटेम्पोरल रिमोट-सेंसिंग छवियों के आंशिक रूप से अप्रशिक्षित वर्गीकरण के लिए पैरामीट्रिक और गैर-पैरामीट्रिक एल्गोरिदम का संयोजन|journal=Information Fusion |date=December 2002 |volume=3 |issue=4 |pages=289–297 |doi=10.1016/S1566-2535(02)00091-X|url=http://eprints.biblio.unitn.it/105/1/24.pdf }}</ref> समय के साथ उपग्रह डेटा की वृद्धि को देखते हुए, पिछले दशक में छवि सम्मुच्चय से निरंतर परिवर्तन का पता लगाने के लिए समय श्रृंखला विधियों का अधिक उपयोग देखा गया है। <ref>{{cite journal |last1=Theodomir |first1=Mugiraneza |last2=Nascetti |first2=Andrea |last3=Ban. |first3=Yifang |title=लैंडसैट टाइम सीरीज़ और लैंडट्रेंड-गूगल अर्थ इंजन क्लाउड कंप्यूटिंग के साथ शहरी भूमि कवर परिवर्तन प्रक्षेप पथ की निरंतर निगरानी|journal=Remote Sensing |date=2020 |volume=12 |issue=18 |page=2883|doi=10.3390/rs12182883 |bibcode=2020RemS...12.2883M |doi-access=free }}</ref> एक उदाहरण BEAST नामक बायेसियन समुच्चय चेंजपॉइंट संसूचक विधि है, जिसमें सॉफ्टवेयर R, Python और मैटलैब में Rbeast संवेष्टक के रूप में उपलब्ध है। <ref>{{cite web |last1=Li |first1=Yang |last2=Zhao |first2=Kaiguang |last3=Hu |first3=Tongxi |last4=Zhang |first4=Xuesong |title=जानवर: परिवर्तन-बिंदु का पता लगाने और समय श्रृंखला अपघटन के लिए एक बायेसियन एन्सेम्बल एल्गोरिदम|website=[[GitHub]] |url=https://github.com/zhaokg/Rbeast}}</ref>


[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
Line 246: Line 246:
[[Category: Machine Translated Page]]
[[Category: Machine Translated Page]]
[[Category:Created On 07/12/2023]]
[[Category:Created On 07/12/2023]]
[[Category:Vigyan Ready]]

Latest revision as of 21:56, 18 December 2023

सांख्यिकी और यंत्र अधिगम में, अकेले किसी भी घटक अधिगम कलन विधि से प्राप्त किए जा सकने वाले बेहतर पूर्वानुमानित प्रदर्शन प्राप्त करने के लिए समुच्चय विधियाँ कई अधिगम कलन विधि का उपयोग करती हैं। [1][2][3]

सांख्यिकीय यांत्रिकी में एक सांख्यिकीय समूह के विपरीत, जो सामान्यतः अनंत होता है, एक यंत्र अधिगम समूह में वैकल्पिक प्रतिरूप का केवल एक ठोस सीमित सम्मुच्चय होता है, लेकिन सामान्यतः उन विकल्पों के बीच अधिक विभक्तिग्राही संरचना उपस्थित होने की अनुमति मिलती है।

समीक्षा

पर्यवेक्षित अधिगम कलन विधि एक उपयुक्त परिकल्पना खोजने के लिए एक परिकल्पना स्थान के माध्यम से खोज करने का कार्य करते हैं जो किसी विशेष समस्या के साथ अच्छी भविष्यवाणी करेगा। [4] भले ही परिकल्पना स्थान में ऐसी परिकल्पनाएँ हों जो किसी विशेष समस्या के लिए बहुत उपयुक्त हों, एक अच्छी परिकल्पना ढूँढना बहुत कठिन हो सकता है। समूह कई परिकल्पनाओं को जोड़कर (आशापूर्वक) एक बेहतर परिकल्पना बनाते हैं। समूहन शब्द सामान्यतः उन तरीकों के लिए आरक्षित होता है जो एक ही आधार शिक्षार्थी का उपयोग करके कई परिकल्पनाएँ उत्पन्न करते हैं।

विविध वर्गीकार प्रणाली के व्यापक शब्द में उन परिकल्पनाओं का संकरण भी सम्मिलित है जो समान आधार शिक्षार्थी द्वारा प्रेरित नहीं हैं।

किसी एकल प्रतिरूप की भविष्यवाणी के मूल्यांकन की तुलना में किसी समूह की भविष्यवाणी का मूल्यांकन करने के लिए सामान्यतः अधिक गणना की आवश्यकता होती है। एक अर्थ में, सामूहिक अधिगम को बहुत अधिक अतिरिक्त गणना करके खराब अधिगम कलन विधि की भरपाई करने के एक तरीके के रूप में सोचा जा सकता है। दूसरी ओर, विकल्प एक गैर-संयोजन प्रणाली पर बहुत अधिक सीखना है। एक एकल विधि के लिए संसाधन उपयोग में वृद्धि की तुलना में दो या दो से अधिक तरीकों पर उस वृद्धि का उपयोग करके गणना, भंडारण, या संचार संसाधनों में समान वृद्धि के लिए समग्र सटीकता में सुधार करने में एक संयोजन प्रणाली अधिक कुशल हो सकती है। विनिश्चय ट्री अधिगम जैसे तीव्र कलन विधि का उपयोग सामान्यतः संयोजन विधियों (उदाहरण के लिए, यादृच्छिक वन) में किया जाता है, हालांकि धीमे कलन विधि भी संयोजन तकनीकों से लाभ उठा सकते हैं।

सादृश्य से, संयोजन तकनीकों का उपयोग अनिरीक्षित अधिगम परिदृश्यों में भी किया गया है, उदाहरण के लिए सर्वसम्मति गुच्छन या विसंगति का पता लगाने में किया गया है।

संयोजन सिद्धांत

अनुभभार्य रूप से, जब प्रतिरूप के बीच महत्वपूर्ण विविधता होती है तो समूह बेहतर परिणाम देते हैं। [5][6] इसलिए, कई संयोजन विधियां अपने द्वारा संयोजित प्रतिरूप के बीच विविधता को बढ़ावा देना चाहती हैं। [7][8] यद्यपि संभवतः गैर-सहज ज्ञान युक्त, अधिक यादृच्छिक कलन विधि (जैसे यादृच्छिक निर्णय ट्री) का उपयोग बहुत जानबूझकर कलन विधि (जैसे परिक्षय-कम करने वाले निर्णय ट्री) की तुलना में एक शक्तिशाली समूह तैयार करने के लिए किया जा सकता है।[9] हालाँकि, विभिन्न प्रकार के शक्तिशाली अधिगम कलन विधि का उपयोग उन तकनीकों का उपयोग करने से अधिक प्रभावी दिखाया गया है जो विविधता को बढ़ावा देने के लिए प्रतिरूप को शक्तिहीन करने का प्रयास करते हैं। [10] प्रतिगमन कार्यों के लिए सहसंबंध का उपयोग करके प्रतिरूप के अधिगम चरण में विविधता बढ़ाना संभव है [11] या वर्गीकरण कार्यों के लिए तिर्यक् परिक्षय जैसे सूचना उपायों का उपयोग करना है। [12]

सैद्धांतिक रूप से, कोई विविधता की अवधारणा को उचित ठहरा सकता है क्योंकि एक संयोजन प्रणाली की त्रुटि दर की निचली सीमा को सटीकता, विविधता और दूसरे शब्द में विघटित किया जा सकता है। [13]


समुच्चय आकार

जबकि किसी समूह के घटक वर्गीकरणकर्ताओं की संख्या भविष्यवाणी की सटीकता पर बहुत प्रभाव डालती है, इस समस्या को संबोधित करने वाले अध्ययनों की संख्या सीमित है। समूह आकार और बड़े डेटा स्ट्रीम की मात्रा और वेग का प्राथमिक निर्धारण इसे ऑनलाइन समूह वर्गीकरणकर्ताओं के लिए और भी महत्वपूर्ण बनाता है। घटकों की उचित संख्या निर्धारित करने के लिए अधिकतर सांख्यिकीय परीक्षणों का उपयोग किया गया। हाल ही में, एक सैद्धांतिक रूपरेखा ने सुझाव दिया कि किसी समूह के लिए घटक वर्गीकार की एक आदर्श संख्या होती है, जैसे कि वर्गीकार की इस संख्या से अधिक या कम होने से सटीकता खराब हो जाएगी। इसे संयोजन निर्माण में घटते प्रतिफल का नियम कहा जाता है। उनके सैद्धांतिक ढांचे से पता चलता है कि क्लास लेबल के रूप में समान संख्या में स्वतंत्र घटक वर्गीकार का उपयोग करने से उच्चतम सटीकता मिलती है। [14][15]


समुच्चय के सामान्य प्रकार

बेयस इष्टतम वर्गीकार

बेयस इष्टतम वर्गीकार एक वर्गीकरण तकनीक है। यह परिकल्पना क्षेत्र की सभी परिकल्पनाओं का एक समूह है। औसतीकरणन, कोई भी अन्य समूह इससे बेहतर प्रदर्शन नहीं कर सकता। [16] नाइव बेयस वर्गीकार इसका एक संस्करण है जो मानता है कि डेटा वर्ग पर सशर्त रूप से स्वतंत्र है और गणना को अधिक व्यवहार्य बनाता है। प्रत्येक परिकल्पना को इस संभावना के अनुपात में मत दिया जाता है कि यदि वह परिकल्पना सत्य थी तो अधिगम डेटासम्मुच्चय को एक प्रणाली से प्रतिरूप लिया जाएगा। परिमित आकार के अधिगम डेटा की सुविधा के लिए, प्रत्येक परिकल्पना के मत को उस परिकल्पना की पूर्व संभावना से भी गुणा किया जाता है। बेयस इष्टतम वर्गीकार को निम्नलिखित समीकरण के साथ व्यक्त किया जा सकता है:

जहाँ अनुमानित वर्ग है, सभी संभावित वर्गों का समुच्चय है, परिकल्पना स्थान है, एक संभावना को संदर्भित करता है, और अधिगम डेटा है। एक समूह के रूप में, बेयस इष्टतम वर्गीकार एक ऐसी परिकल्पना का प्रतिनिधित्व करता है जो में जरूरी नहीं है। हालाँकि, बेयस इष्टतम वर्गीकार द्वारा प्रस्तुत परिकल्पना, संयोजन स्थान में इष्टतम परिकल्पना है (सभी संभावित संयोजनों का स्थान जिसमें केवल परिकल्पनाएँ सम्मिलित हैं)।

इस सूत्र को बेयस प्रमेय का उपयोग करके पुन: स्थापित किया जा सकता है, जो कहता है कि पिछला भाग पूर्व की संभावना के समय के समानुपाती होता है:

इस तरह,


बूटस्ट्रैप समुच्चयन (बैगिंग)

एक मूल सम्मुच्चय से तीन डेटा सम्मुच्चय बूटस्ट्रैप किए गए। उदाहरण ए सम्मुच्चय 1 में दो बार आता है क्योंकि इन्हें प्रतिस्थापन के साथ चुना गया है।

बूटस्ट्रैप समुच्चयन में बूटस्ट्रैप्ड डेटा सम्मुच्चय पर एक समूह को प्रशिक्षित करना सम्मिलित है। प्रतिस्थापन के साथ मूल अधिगम डेटा सम्मुच्चय से चयन करके एक बूटस्ट्रैप्ड सम्मुच्चय बनाया जाता है। इस प्रकार, एक बूटस्ट्रैप सम्मुच्चय में एक दिया गया उदाहरण शून्य, एक या एकाधिक बार हो सकता है। विविध विशेषताओं की खोज को प्रोत्साहित करने के लिए, कलाकारों की टुकड़ी के दलों के पास सुविधाओं पर सीमाएं भी हो सकती हैं (उदाहरण के लिए, निर्णय ट्री के नोड्स)। [17] बूटस्ट्रैप सम्मुच्चय और विशेषता विचारों में स्थानीय जानकारी का भिन्नता समूह में विविधता को बढ़ावा देती है, और समूह को शक्तिशाली कर सकती है। [18] अत्युपपन्न को कम करने के लिए, किसी दल को आउट-ऑफ-बैग सम्मुच्चय (उदाहरण जो इसके बूटस्ट्रैप सम्मुच्चय में नहीं हैं) का उपयोग करके मान्य किया जा सकता है। [19] अनुमान सामूहिक दलों की भविष्यवाणियों के मतदान द्वारा किया जाता है, जिसे समुच्चयन कहा जाता है। इसे नीचे चार निर्णय ट्री के समूह के साथ चित्रित किया गया है। क्वेरी उदाहरण को प्रत्येक ट्री द्वारा वर्गीकृत किया गया है। क्योंकि चार में से तीन सकारात्मक वर्ग की भविष्यवाणी करते हैं, समूह का समग्र वर्गीकरण सकारात्मक है। दिखाए गए जैसे यादृच्छिक वन बैगिंग का एक सामान्य अनुप्रयोग है।

निर्णय वृक्षों के समूह के लिए एकत्रीकरण प्रक्रिया का एक उदाहरण। व्यक्तिगत वर्गीकरणों को एकत्रित किया जाता है, और एक समग्र वर्गीकरण प्राप्त किया जाता है।

वर्धन

वर्धन में पहले से सीखे गए प्रतिरूप द्वारा गलत वर्गीकृत किए गए अधिगम डेटा पर बल देकर क्रमिक प्रतिरूप को प्रशिक्षित करना सम्मिलित है। प्रारंभ में, सभी डेटा (डी1) का भार समान होता है और इसका उपयोग आधार प्रतिरूप M1 को सीखने के लिए किया जाता है। एम1 द्वारा गलत वर्गीकृत किए गए उदाहरणों को सही ढंग से वर्गीकृत किए गए उदाहरणों से अधिक महत्व दिया गया है। इस बूस्टेड डेटा (डी2) का उपयोग दूसरे आधार प्रतिरूप एम2 इत्यादि को प्रशिक्षित करने के लिए किया जाता है। अनुमान मतदान से लगाया जाता है।

कुछ स्तिथियों में, वर्धन से बैगिंग की तुलना में बेहतर सटीकता प्राप्त हुई है, लेकिन यह अधिक फिट हो जाती है। वर्धन का सबसे सामान्य कार्यान्वयन एडाबूस्ट है, लेकिन कुछ नए कलन विधि बेहतर परिणाम प्राप्त करने की सूचना देते हैं।

बायेसियन प्रतिरूप औसतीकरण

बायेसियन प्रतिरूप औसतीकरण (बीएमए) डेटा को देखते हुए उनकी पिछली संभावनाओं के आधार पर प्रतिरूप की भविष्यवाणियों के औसतीकरण के आधार पर भविष्यवाणियां करता है। [20] बीएमए सामान्यतः एकल प्रतिरूप की तुलना में बेहतर उत्तर देने के लिए जाना जाता है, उदाहरण के लिए, चरणबद्ध प्रतिगमन के माध्यम से, विशेष रूप से जहां बहुत अलग प्रतिरूप का अधिगम सम्मुच्चय में लगभग समान प्रदर्शन होता है लेकिन अन्यथा काफी अलग प्रदर्शन हो सकता है।

बेयस प्रमेय के किसी भी उपयोग के साथ प्रश्न पूर्व का है, यानी, संभावना (संभवतः व्यक्तिपरक) कि प्रत्येक प्रतिरूप किसी दिए गए उद्देश्य के लिए उपयोग करने के लिए सबसे अच्छा है। वैचारिक रूप से, बीएमए का उपयोग किसी भी पूर्व के साथ किया जा सकता है। आर संवेष्टक समुच्चयबीएमए [21] और बीएमए [22] द्वारा बायेसियन सूचना मानदंड, (बीआईसी), राफ्टरी (1995) के बाद निहित पूर्व का उपयोग करें। [23] आर संवेष्टक बीएएस वैकल्पिक प्रतिरूप के साथ-साथ गुणांकों पर अकैके सूचना मानदंड (एआईसी) और अन्य मानदंडों द्वारा निहित प्राथमिकताओं के उपयोग का समर्थन करता है। [24]

बीआईसी और एआईसी के बीच अंतर कंजूसी के लिए प्राथमिकता की ताकत है। प्रतिरूप जटिलता के लिए बीआईसी का दंड है, जबकि एआईसी का है। बड़े-प्रतिरूप स्पर्शोन्मुख सिद्धांत यह स्थापित करता है कि यदि कोई सर्वोत्तम प्रतिरूप है, तो बढ़ते प्रतिरूप आकार के साथ, बीआईसी दृढ़ता से सुसंगत है, यानी, लगभग निश्चित रूप से इसे ढूंढ लेगा, जबकि एआईसी नहीं कर सकता है, क्योंकि एआईसी प्रतिरूप पर अत्यधिक पश्चगामी संभावना रखना जारी रख सकता है। वे आवश्यकता से अधिक जटिल हैं। दूसरी ओर, एआईसी और एआईसीसी स्पर्शोन्मुख रूप से "कुशल" हैं (यानी, न्यूनतम माध्य वर्ग भविष्यवाणी त्रुटि), जबकि बीआईसी नहीं है। [25]

हौस्सलर एट अल. (1994) से पता चला कि जब बीएमए का उपयोग वर्गीकरण के लिए किया जाता है, तो इसकी अपेक्षित त्रुटि बेयस इष्टतम वर्गीकार की अपेक्षित त्रुटि से अधिकतम दोगुनी होती है। [26] बर्नहैम और एंडरसन (1998, 2002) ने व्यापक दर्शकों को बायेसियन प्रतिरूप के औसतीकरण के बुनियादी विचारों से परिचित कराने और कार्यप्रणाली को लोकप्रिय बनाने में बहुत योगदान दिया। [27] सॉफ़्टवेयर की उपलब्धता, जिसमें अन्य निःशुल्क ओपन-सोर्स संवेष्टक भी सम्मिलित हैं R ऊपर बताए गए तरीकों से परे, तरीकों को व्यापक दर्शकों के लिए सुलभ बनाने में मदद मिली थी।[28]


बायेसियन प्रतिरूप संयोजन

बायेसियन प्रतिरूप संयोजन (बीएमसी) बायेसियन प्रतिरूप औसतीकरण (बीएमए) के लिए एक कलन विधि सुधार है। समूह में प्रत्येक प्रतिरूप का व्यक्तिगत रूप से प्रतिरूप लेने के स्थान पर, यह संभावित संयोजनों के स्थान से प्रतिरूप लेता है (समान मापदंडों वाले डिरिचलेट वितरण से यादृच्छिक रूप से खींचे गए प्रतिरूप भार के साथ)। यह संशोधन बीएमए की एक ही प्रतिरूप को सारा भार देने की प्रवृत्ति पर काबू पाता है। हालाँकि बीएमसी, बीएमए की तुलना में कुछ हद तक कम्प्यूटेशनल रूप से महंगा है, लेकिन यह नाटकीय रूप से बेहतर परिणाम देता है। बीएमसी को बीएमए और बैगिंग की तुलना में औसतीकरणन (सांख्यिकीय महत्व के साथ) बेहतर दिखाया गया है।[29] प्रतिरूप भार की गणना करने के लिए बेयस नियम के उपयोग के लिए प्रत्येक प्रतिरूप में दिए गए डेटा की संभावना की गणना करने की आवश्यकता होती है। सामान्यतः, संयोजन में कोई भी प्रतिरूप बिल्कुल वैसा वितरण नहीं है जिससे अधिगम डेटा उत्पन्न किया गया था, इसलिए उन सभी को इस अवधि के लिए शून्य के करीब मान प्राप्त होता है। यह अच्छी तरह से काम करेगा यदि समुच्चय इतना बड़ा हो कि पूरे प्रतिरूप-समष्टि का प्रतिरूप ले सके, लेकिन यह संभवतः ही संभव है। नतीजतन, अधिगम डेटा में प्रत्येक प्रतिरूप समूह के भार को उस प्रतिरूप की ओर स्थानांतरित कर देगा जो अधिगम डेटा के वितरण के सबसे करीब है। यह अनिवार्य रूप से प्रतिरूप चयन करने के लिए एक अनावश्यक रूप से जटिल विधि को कम कर देता है।

एक समूह के लिए संभावित भार को एक प्रसमुच्चय पर मिथ्या के रूप में देखा जा सकता है। प्रसमुच्चय के प्रत्येक शीर्ष पर, सारा भार संयोजन में एक ही प्रतिरूप को दिया जाता है। बीएमए उस शीर्ष की ओर अभिसरण करता है जो अधिगम डेटा के वितरण के सबसे करीब है। इसके विपरीत, बीएमसी उस बिंदु की ओर अभिसरण करती है जहां यह वितरण प्रसमुच्चय पर बहिर्विष्ट करता है। दूसरे शब्दों में, एक प्रतिरूप का चयन करने के स्थान पर जो उत्पादक वितरण के सबसे करीब है, यह उन प्रतिरूप के संयोजन की तलाश करता है जो उत्पादक वितरण के सबसे करीब हैं।

प्रतिरूप की एक श्रृंखला से सर्वोत्तम प्रतिरूप का चयन करने के लिए तिर्यक्-सत्यापन का उपयोग करके बीएमए के परिणामों का प्रायः अनुमान लगाया जा सकता है। इसी तरह, संभावित भार के यादृच्छिक प्रतिरूप से सर्वोत्तम संयोजन संयोजन का चयन करने के लिए तिर्यक्-सत्यापन का उपयोग करके बीएमसी के परिणामों का अनुमान लगाया जा सकता है।

प्रतिरूप का समूह

प्रतिरूप का समूह एक सामूहिक तकनीक है जिसमें प्रत्येक समस्या के लिए सर्वोत्तम प्रतिरूप चुनने के लिए एक प्रतिरूप चयन कलन विधि का उपयोग किया जाता है। जब केवल एक समस्या के साथ परीक्षण किया जाता है, तो प्रतिरूप का समूह सम्मुच्चय में सबसे अच्छे प्रतिरूप की तुलना में कोई बेहतर परिणाम नहीं दे सकती है, लेकिन जब कई समस्याओं का मूल्यांकन किया जाता है, तो यह सामान्यतः सम्मुच्चय में किसी भी प्रतिरूप की तुलना में औसतीकरणन बहुत बेहतर परिणाम देगा।

प्रतिरूप-चयन के लिए उपयोग किया जाने वाला सबसे सामान्य तरीका तिर्यक्-पुष्टीकरण (सांख्यिकी) चयन (कभी-कभी बेक-ऑफ प्रतियोगिता भी कहा जाता है) है। इसे निम्नलिखित छद्म कोड के साथ वर्णित किया गया है:

For each model m in the bucket:
    Do c times: (where 'c' is some constant)
        Randomly divide the training dataset into two sets: A and B
        Train m with A
        Test m with B
Select the model that obtains the highest average score

तिर्यक्-पुष्टीकरण चयन को इस प्रकार संक्षेपित किया जा सकता है: अधिगम सम्मुच्चय के साथ उन सभी को आज़माएं, और जो सबसे अच्छा काम करता है उसे चुना जाता है। [30]

परिसारण तिर्यक्-पुष्टीकरण चयन का एक सामान्यीकरण है। इसमें यह तय करने के लिए एक अन्य अधिगम प्रतिरूप को प्रशिक्षित करना सम्मिलित है कि समस्या को हल करने के लिए समूह में कौन सा प्रतिरूप सबसे उपयुक्त है। प्रायः, परिसारण प्रतिरूप के लिए एक परसेप्ट्रॉन का उपयोग किया जाता है। इसका उपयोग सर्वोत्तम प्रतिरूप चुनने के लिए किया जा सकता है, या इसका उपयोग समूह में प्रत्येक प्रतिरूप की भविष्यवाणियों को एक रैखिक भार देने के लिए किया जा सकता है।

जब समस्याओं के एक बड़े सम्मुच्चय के साथ प्रतिरूप का समूह का उपयोग किया जाता है, तो कुछ ऐसे प्रतिरूप को प्रशिक्षित करने से बचना वांछनीय हो सकता है जिन्हें प्रशिक्षित करने में लंबा समय लगता है। लैंडमार्क अधिगम एक मेटा-अधिगम दृष्टिकोण है जो इस समस्या को हल करना चाहता है। इसमें समूह में केवल तीव्र (लेकिन सटीक) कलन विधि का अधिगम सम्मिलित है, और फिर इन कलन विधि के प्रदर्शन का उपयोग करके यह निर्धारित करने में मदद मिलती है कि कौन सी धीमी (लेकिन सटीक) कलन विधि सबसे अच्छा काम करने की संभावना है। [31]


चितिकरण

चितिकरण (कभी-कभी चितीयित सामान्यीकरण कहा जाता है) में कई अन्य अधिगम कलन विधि की भविष्यवाणियों को संयोजित करने के लिए एक प्रतिरूप को प्रशिक्षित करना सम्मिलित है। सबसे पहले, अन्य सभी कलन विधि को उपलब्ध डेटा का उपयोग करके प्रशिक्षित किया जाता है, फिर एक संयोजक कलन विधि (अंतिम अनुमानक) को अतिरिक्त निविष्ट के रूप में अन्य कलन विधि (आधार अनुमानक) की सभी भविष्यवाणियों का उपयोग करके या तिर्यक्-मान्य भविष्यवाणियों का उपयोग करके अंतिम भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है। आधार अनुमानकों से जो अत्युपपन्न को रोक सकते हैं। [32] यदि एक स्वेच्छाचारी संयोजक कलन विधि का उपयोग किया जाता है, तो चितिकरण सैद्धांतिक रूप से इस लेख में वर्णित किसी भी संयोजन तकनीक का प्रतिनिधित्व कर सकती है, हालांकि, व्यवहार में, एक तार्किक परावर्तन प्रतिरूप का उपयोग प्रायः संयोजक के रूप में किया जाता है।

चितिकरण सामान्यतः प्रशिक्षित प्रतिरूप में से किसी एक की तुलना में बेहतर प्रदर्शन देती है। [33] इसका उपयोग पर्यवेक्षित अधिगम कार्यों (प्रतिगमन वर्गीकरण और दूरस्थ शिक्षा आदि) [34] और बिना पर्यवेक्षित अधिगम (घनत्व अनुमान) दोनों पर सफलतापूर्वक किया गया है। [35][36] इसका उपयोग बैगिंग की त्रुटि दर का अनुमान लगाने के लिए भी किया गया है। [3][37] यह बायेसियन प्रतिरूप-औसतीकरण से बेहतर प्रदर्शन करने की सूचना दी गई है। [38] नेटफ्लिक्स प्रतियोगिता में शीर्ष प्रदर्शन करने वाले दो खिलाड़ियों ने सम्मिश्रण का उपयोग किया, जिसे चितिकरण का एक रूप माना जा सकता है। [39]


मतदान

मतदान एकजुटता का दूसरा रूप है। उदाहरण देखें भारित बहुमत एल्गोरिथ्म (यंत्र अधिगम)

सांख्यिकी संवेष्टक में कार्यान्वयन

  • आर: कम से कम तीन संवेष्टक बायेसियन प्रतिरूप औसत उपकरण प्रदान करते हैं, जिसमें BMS (बायेसियन प्रतिरूप चयन के लिए एक संक्षिप्त नाम) संवेष्टक, BAS (बायेसियन अनुकूली प्रतिचयन के लिए एक संक्षिप्त नाम) संवेष्टक, और BMA वेष्टन सम्मिलित हैं। [40]
  • पायथन: स्किकिट-लर्न, पायथन में यंत्र अधिगम के लिए एक संवेष्टक, बैगिंग, मतदान और औसतीकरण तरीकों के संवेष्टक सहित सामूहिक अधिगम के लिए संवेष्टक प्रदान करता है।
  • मैटलैब: वर्गीकरण समूह सांख्यिकी और यंत्र अधिगम टूलबॉक्स में कार्यान्वित किए जाते हैं। [41]


समुच्चय अधिगम एप्लीकेशन

हाल के वर्षों में, बढ़ती कम्प्यूटेशनल शक्ति के कारण, जो एक उचित समय सीमा में बड़े समूह अधिगम में अधिगम की अनुमति देता है, समूह अधिगम अनुप्रयोगों की संख्या तेजी से बढ़ी है। [42] समुच्चय वर्गीकार के कुछ अनुप्रयोगों में सम्मिलित हैं:

सुदूर संवेदन

क्षेत्र आच्छादन मानचित्रण

क्षेत्र आच्छादन मानचित्रण पृथ्वी अवलोकन उपग्रह संवेदक के प्रमुख अनुप्रयोगों में से एक है, जो लक्ष्य क्षेत्रों की सतह पर स्थित सामग्रियों और वस्तुओं की पहचान करने के लिए सुदूर संवेदन और भू-स्थानिक डेटा का उपयोग करता है। सामान्यतः, लक्षित सामग्रियों के वर्गों में सड़कें, इमारतें, नदियाँ, झीलें और वनस्पति सम्मिलित हैं। [43] कृत्रिम तंत्रिका संजाल पर आधारित कुछ अलग अधिगम दृष्टिकोण,[44] कर्नेल प्रमुख घटक विश्लेषण (केपीसीए),[45] वर्धन (यंत्र अधिगम) के साथ निर्णयावली,[46] [43][47] और एकाधिक वर्गीकार प्रणाली की स्वचालित अभिकल्पना,[48] क्षेत्र आच्छादन मानचित्रण की कुशलतापूर्वक पहचान करने का प्रस्ताव है।

परिवर्तन संसूचन

परिवर्तन संसूचन (जीआईएस) एक छवि विश्लेषण समस्या है, जिसमें उन स्थानों की पहचान सम्मिलित है जहां समय के साथ भूमि आच्छद बदल गया है। परिवर्तन संसूचन (जीआईएस) का व्यापक रूप से शहरी विकास, वन गतिशीलता, भूमि उपयोग और आपदा निगरानी तारामंडल जैसे क्षेत्रों में उपयोग किया जाता है। [49]

परिवर्तन संसूचन में समुच्चय वर्गीकार के प्रारम्भिक अनुप्रयोगों को बहुसंख्यक बहुलता मतदान, बायेसियन प्रतिरूप औसतीकरण,[50] और अधिकतम पश्च संभावना के साथ अभिकल्पित किया गया है। [51] [52] समय के साथ उपग्रह डेटा की वृद्धि को देखते हुए, पिछले दशक में छवि सम्मुच्चय से निरंतर परिवर्तन का पता लगाने के लिए समय श्रृंखला विधियों का अधिक उपयोग देखा गया है। [53] एक उदाहरण BEAST नामक बायेसियन समुच्चय चेंजपॉइंट संसूचक विधि है, जिसमें सॉफ्टवेयर R, Python और मैटलैब में Rbeast संवेष्टक के रूप में उपलब्ध है। [54]

कंप्यूटर सुरक्षा

डिस्ट्रिब्यूटेड डिनायल-ऑफ-सर्विस

डिनायल-ऑफ-सर्विस अटैक सबसे हानिकारक साइबर अटैक में से एक है जो किसी इंटरनेट सर्विस प्रदाता पर हो सकता है। [42] एकल वर्गीकार के आउटपुट को संयोजित करके, समुच्चय वर्गीकार वैध फ़्लैश क्राउड से ऐसे अटैक का पता लगाने और भेदभाव करने की कुल त्रुटि को कम करते हैं। [55]


मैलवेयर संसूचक

यंत्र अधिगम तकनीकों के उपयोग से कंप्यूटर वायरस, कंप्यूटर वर्म , ट्रोजेन हॉर्सेज, रैंसमवेयर और स्पाइवेयर जैसे मैलवेयर कोड का डॉक्यूमेंट कैटेगोराइज़ेशन प्रॉब्लम से प्रेरित है। [56] सामूहिक अधिगम प्रणालियों ने इस क्षेत्र में उचित प्रभावकारिता दिखाई है। [57][58]


धृष्टागम संसूचक

एक धृष्टागम संसूचक सिस्टम एक धृष्टागम का पता लगाने की प्रक्रिया की तरह धृष्टागम कोड की पहचान करने के लिएसंगणक संजाल या कंप्यूटर सिस्टम की निगरानी करती है। समुच्चय अधिगम ऐसी निगरानी प्रणालियों को उनकी कुल त्रुटि को कम करने में सफलतापूर्वक सहायता करता है। [59][60]


फेस रिकग्निशन

फेस रिकग्निशन, जो हाल ही में पैटर्न रिकग्निशन के सबसे लोकप्रिय अनुसंधान क्षेत्रों में से एक बन गया है, किसी व्यक्ति की डिजिटल इमेज द्वारा पहचान या सत्यापन का काम करता है। [61]

गैबोर फिशर वर्गीकार और स्वतंत्र घटक विश्लेषण पर आधारित पदानुक्रमित समूह डेटा प्री-प्रोसेसिंग तकनीक इस क्षेत्र में नियोजित कुछ प्रारम्भिक समूह हैं। [62][63][64]


इमोशन रिकग्निशन

जबकि स्पीच रिकग्निशन मुख्य रूप से गहन अधिगम पर आधारित है क्योंकि इस क्षेत्र के अधिकांश उद्योग के खिलाड़ी जैसे गूगल, माइक्रोसॉफ्ट और आईबीएम बताते हैं कि उनकी वाक् पहचान की मुख्य तकनीक इस दृष्टिकोण पर आधारित है, वाक्-आधारित इमोशन रिकग्निशन का प्रदर्शन भी सामूहिक शिक्षा के साथ संतोषजनक हो सकता है। [65][66]

इमोशन रिकग्निशन में भी इसका सफलतापूर्वक उपयोग किया जा रहा है। [67][68][69]


छल संसूचक

छल संसूचक का काम काले धन को वैध बनाना, क्रेडिट कार्ड धोखाधड़ी और दूरसंचार धोखाधड़ी जैसे बैंक धोखाधड़ी की पहचान करना है, जिसमें अनुसंधान और यंत्र अधिगम के अनुप्रयोगों के विशाल क्षेत्र हैं। क्योंकि सामूहिक अधिगम सामान्य व्यवहार प्रतिरूपण की मजबूती में सुधार करता है, इसे बैंकिंग और क्रेडिट कार्ड प्रणालियों में ऐसे धोखाधड़ी वाली स्तिथियों और गतिविधियों का पता लगाने के लिए एक कुशल तकनीक के रूप में प्रस्तावित किया गया है। [70][71]


वित्तीय निर्णय लेना

वित्तीय निर्णय लेने में व्यावसायिक विफलता की भविष्यवाणी की सटीकता एक बहुत ही महत्वपूर्ण स्तिथि है। इसलिए, वित्तीय संकट और वित्तीय संकट की भविष्यवाणी करने के लिए अलग-अलग समूह वर्गीकरण प्रस्तावित हैं। [72] इसके अतिरिक्त, व्यापार-आधारित हेरफेर समस्या में, जहां व्यापारी खरीद और बिक्री गतिविधियों के माध्यम से संग्रह की कीमतों में हेरफेर करने का प्रयास करते हैं, शेयर बाजार डेटा में परिवर्तनों का विश्लेषण करने और संग्रह मूल्य बाजार में हेरफेर के संदिग्ध लक्षण का पता लगाने के लिए समूह वर्गीकरणकर्ताओं की आवश्यकता होती है। [72]


औषधि

एमआरआई डेटासम्मुच्चय के आधार पर तंत्रिकासंज्ञानात्मक (यानी अल्जाइमर या पेशीतान दुष्पोषण) का पता लगाने जैसे तंत्रिका विज्ञान, प्रोटिओमिक्स और चिकित्सा निदान और ग्रीवा कोशिका विज्ञान वर्गीकरण में समुच्चय वर्गीकार को सफलतापूर्वक लागू किया गया है।[73][74][75] [76][77]


यह भी देखें

संदर्भ

  1. Opitz, D.; Maclin, R. (1999). "Popular ensemble methods: An empirical study". Journal of Artificial Intelligence Research. 11: 169–198. doi:10.1613/jair.614.
  2. Polikar, R. (2006). "Ensemble based systems in decision making". IEEE Circuits and Systems Magazine. 6 (3): 21–45. doi:10.1109/MCAS.2006.1688199. S2CID 18032543.
  3. 3.0 3.1 Rokach, L. (2010). "Ensemble-based classifiers". Artificial Intelligence Review. 33 (1–2): 1–39. doi:10.1007/s10462-009-9124-7. hdl:11323/1748. S2CID 11149239.
  4. Blockeel H. (2011). "Hypothesis Space". मशीन लर्निंग का विश्वकोश. pp. 511–513. doi:10.1007/978-0-387-30164-8_373. ISBN 978-0-387-30768-8.
  5. Kuncheva, L. and Whitaker, C., Measures of diversity in classifier ensembles, Machine Learning, 51, pp. 181-207, 2003
  6. Sollich, P. and Krogh, A., Learning with ensembles: How overfitting can be useful, Advances in Neural Information Processing Systems, volume 8, pp. 190-196, 1996.
  7. Brown, G. and Wyatt, J. and Harris, R. and Yao, X., Diversity creation methods: a survey and categorisation., Information Fusion, 6(1), pp.5-20, 2005.
  8. Adeva, J. J. García; Cerviño, Ulises; Calvo, R. (December 2005). "पाठ श्रेणीकारों के समुच्चय में सटीकता और विविधता" (PDF). CLEI Journal. 8 (2): 1:1–1:12. doi:10.19153/cleiej.8.2.1.
  9. Ho, T., Random Decision Forests, Proceedings of the Third International Conference on Document Analysis and Recognition, pp. 278-282, 1995.
  10. Gashler, M.; Giraud-Carrier, C.; Martinez, T. (2008). "Decision Tree Ensemble: Small Heterogeneous is Better Than Large Homogeneous" (PDF). 2008 Seventh International Conference on Machine Learning and Applications. Vol. 2008. pp. 900–905. doi:10.1109/ICMLA.2008.154. ISBN 978-0-7695-3495-4. S2CID 614810.
  11. Liu, Y.; Yao, X. (December 1999). "नकारात्मक सहसंबंध के माध्यम से सीखने को सम्मिलित करें". Neural Networks (in English). 12 (10): 1399–1404. doi:10.1016/S0893-6080(99)00073-8. ISSN 0893-6080. PMID 12662623.
  12. Shoham, Ron; Permuter, Haim (2019). "Amended Cross-Entropy Cost: An Approach for Encouraging Diversity in Classification Ensemble (Brief Announcement)". साइबर सुरक्षा क्रिप्टोग्राफी और मशीन लर्निंग. Lecture Notes in Computer Science. Vol. 11527. pp. 202–207. doi:10.1007/978-3-030-20951-3_18. ISBN 978-3-030-20950-6. S2CID 189926552.
  13. Terufumi Morishita et al, Rethinking Fano’s Inequality in Ensemble Learning, International Conference on Machine Learning, 2022
  14. R. Bonab, Hamed; Can, Fazli (2016). डेटा स्ट्रीम में ऑनलाइन एन्सेम्बल के लिए क्लासिफायर की आदर्श संख्या पर एक सैद्धांतिक रूपरेखा. CIKM. USA: ACM. p. 2053.
  15. Bonab, Hamed; Can, Fazli (2017). "Less is More: A Comprehensive Framework for the Number of Components of Ensemble Classifiers". arXiv:1709.02925 [cs.LG].
  16. Tom M. Mitchell, Machine Learning, 1997, pp. 175
  17. Salman, R., Alzaatreh, A., Sulieman, H., & Faisal, S. (2021). A Bootstrap Framework for Aggregating within and between Feature Selection Methods. Entropy (Basel, Switzerland), 23(2), 200. doi:10.3390/e23020200
  18. Breiman, L., Bagging Predictors, Machine Learning, 24(2), pp.123-140, 1996. doi:10.1007/BF00058655
  19. Brodeur, Z. P., Herman, J. D., & Steinschneider, S. (2020). Bootstrap aggregation and cross-validation methods to reduce overfitting in reservoir control policy search. Water Resources Research, 56, e2020WR027184. doi:10.1029/2020WR027184
  20. e.g., No label or title -- debug: Q98974344, Wikidata Q98974344
  21. No label or title -- debug: Q98972500, Wikidata Q98972500
  22. No label or title -- debug: Q91674106, Wikidata Q91674106.
  23. No label or title -- debug: Q91670340, Wikidata Q91670340
  24. No label or title -- debug: Q98974089, Wikidata Q98974089.
  25. No label or title -- debug: Q62568358, Wikidata Q62568358, ch. 4.
  26. Haussler, David; Kearns, Michael; Schapire, Robert E. (1994). "सूचना सिद्धांत और वीसी आयाम का उपयोग करके बायेसियन सीखने की नमूना जटिलता पर सीमाएं". Machine Learning. 14: 83–113. doi:10.1007/bf00993163.
  27. No label or title -- debug: Q62670082, Wikidata Q62670082 and No label or title -- debug: Q76889160, Wikidata Q76889160.
  28. The Wikiversity article on Searching R Packages mentions several ways to find available packages for something like this. For example, “sos::findFn('{Bayesian model averaging}')” from within R will search for help files in contributed packages that includes the search term and open two tabs in the default browser. The first will list all the help files found sorted by package. The second summarizes the packages found, sorted by the apparent strength of the match.
  29. Monteith, Kristine; Carroll, James; Seppi, Kevin; Martinez, Tony. (2011). Turning Bayesian Model Averaging into Bayesian Model Combination (PDF). Proceedings of the International Joint Conference on Neural Networks IJCNN'11. pp. 2657–2663.
  30. Saso Dzeroski, Bernard Zenko, Is Combining Classifiers Better than Selecting the Best One, Machine Learning, 2004, pp. 255-273
  31. Bensusan, Hilan; Giraud-Carrier, Christophe (2000). "Discovering Task Neighbourhoods through Landmark Learning Performances" (PDF). डेटा खनन और ज्ञान खोज के सिद्धांत. Lecture Notes in Computer Science. Vol. 1910. pp. 325–330. doi:10.1007/3-540-45372-5_32. ISBN 978-3-540-41066-9.
  32. "1.11. Ensemble methods".
  33. Wolpert (1992). "स्टैक्ड सामान्यीकरण". Neural Networks. 5 (2): 241–259. doi:10.1016/s0893-6080(05)80023-1.
  34. Ozay, M.; Yarman Vural, F. T. (2013). "एक नई फ़ज़ी स्टैक्ड सामान्यीकरण तकनीक और उसके प्रदर्शन का विश्लेषण". arXiv:1204.0171 [cs.LG].
  35. Breiman, Leo (1996). "स्टैक्ड प्रतिगमन". Machine Learning. 24: 49–64. doi:10.1007/BF00117832.
  36. Smyth, Padhraic; Wolpert, David (1999). "स्टैकिंग के माध्यम से घनत्व अनुमानकों का रैखिक संयोजन" (PDF). Machine Learning. 36 (1): 59–83. doi:10.1023/A:1007511322260. S2CID 16006860.
  37. Wolpert, David H.; MacReady, William G. (1999). "बैगिंग की सामान्यीकरण त्रुटि का अनुमान लगाने की एक प्रभावी विधि" (PDF). Machine Learning. 35 (1): 41–55. doi:10.1023/A:1007519102914. S2CID 14357246.
  38. Clarke, B., Bayes model averaging and stacking when model approximation error cannot be ignored, Journal of Machine Learning Research, pp 683-712, 2003
  39. Sill, J.; Takacs, G.; Mackey, L.; Lin, D. (2009). "फ़ीचर-भारित रैखिक स्टैकिंग". arXiv:0911.0460 [cs.LG].
  40. "BMA: Bayesian Model Averaging". The Comprehensive R Archive Network. Retrieved September 9, 2016.
  41. "वर्गीकरण समूह". MATLAB & Simulink. Retrieved June 8, 2017.
  42. 42.0 42.1 Woźniak, Michał; Graña, Manuel; Corchado, Emilio (March 2014). "हाइब्रिड सिस्टम के रूप में मल्टीपल क्लासिफायर सिस्टम का सर्वेक्षण". Information Fusion. 16: 3–17. doi:10.1016/j.inffus.2013.04.006. hdl:10366/134320. S2CID 11632848.
  43. 43.0 43.1 Rodriguez-Galiano, V.F.; Ghimire, B.; Rogan, J.; Chica-Olmo, M.; Rigol-Sanchez, J.P. (January 2012). "भूमि-आवरण वर्गीकरण के लिए यादृच्छिक वन वर्गीकरणकर्ता की प्रभावशीलता का आकलन". ISPRS Journal of Photogrammetry and Remote Sensing. 67: 93–104. Bibcode:2012JPRS...67...93R. doi:10.1016/j.isprsjprs.2011.11.002.
  44. Giacinto, Giorgio; Roli, Fabio (August 2001). "छवि वर्गीकरण उद्देश्यों के लिए प्रभावी तंत्रिका नेटवर्क संयोजन का डिज़ाइन". Image and Vision Computing. 19 (9–10): 699–707. CiteSeerX 10.1.1.11.5820. doi:10.1016/S0262-8856(01)00045-2.
  45. Xia, Junshi; Yokoya, Naoto; Iwasaki, Yakira (March 2017). "A novel ensemble classifier of hyperspectral and LiDAR data using morphological features". 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). pp. 6185–6189. doi:10.1109/ICASSP.2017.7953345. ISBN 978-1-5090-4117-6. S2CID 40210273.
  46. Mochizuki, S.; Murakami, T. (November 2012). "मशीन लर्निंग एल्गोरिदम के साथ ऑब्जेक्ट-ओरिएंटेड छवि वर्गीकरण का उपयोग करके भूमि कवर मैपिंग की सटीकता तुलना". 33rd Asian Conference on Remote Sensing 2012, ACRS 2012. 1: 126–133.
  47. Liu, Dan; Toman, Elizabeth; Fuller, Zane; Chen, Gang; Londo, Alexis; Xuesong, Zhang; Kaiguang, Zhao (2018). "Integration of historical map and aerial imagery to characterize long-term land-use change and landscape dynamics: An object-based analysis via Random Forests" (PDF). Ecological Indicators. 95 (1): 595-605. doi:10.1016/j.ecolind.2018.08.004. S2CID 92025959.
  48. Giacinto, G.; Roli, F.; Fumera, G. (September 2000). "Design of effective multiple classifier systems by clustering of classifiers". Proceedings 15th International Conference on Pattern Recognition. ICPR-2000. Vol. 2. pp. 160–163. CiteSeerX 10.1.1.11.5328. doi:10.1109/ICPR.2000.906039. ISBN 978-0-7695-0750-7. S2CID 2625643.
  49. Du, Peijun; Liu, Sicong; Xia, Junshi; Zhao, Yindi (January 2013). "मल्टी-टेम्पोरल रिमोट सेंसिंग छवियों से परिवर्तन का पता लगाने के लिए सूचना संलयन तकनीक". Information Fusion. 14 (1): 19–27. doi:10.1016/j.inffus.2012.05.003.
  50. Zhao, Kaiguang; Wulder, Michael A; Hu, Tongx; Bright, Ryan; Wu, Qiusheng; Qin, Haiming; Li, Yang (2019). "Detecting change-point, trend, and seasonality in satellite time series data to track abrupt changes and nonlinear dynamics: A Bayesian ensemble algorithm". Remote Sensing of Environment. 232: 111181. Bibcode:2019RSEnv.232k1181Z. doi:10.1016/j.rse.2019.04.034. S2CID 201310998.
  51. Defined by Bruzzone et al. (2002) as "The data class that receives the largest number of votes is taken as the class of the input pattern", this is simple majority, more accurately described as plurality voting.
  52. Bruzzone, Lorenzo; Cossu, Roberto; Vernazza, Gianni (December 2002). "मल्टीटेम्पोरल रिमोट-सेंसिंग छवियों के आंशिक रूप से अप्रशिक्षित वर्गीकरण के लिए पैरामीट्रिक और गैर-पैरामीट्रिक एल्गोरिदम का संयोजन" (PDF). Information Fusion. 3 (4): 289–297. doi:10.1016/S1566-2535(02)00091-X.
  53. Theodomir, Mugiraneza; Nascetti, Andrea; Ban., Yifang (2020). "लैंडसैट टाइम सीरीज़ और लैंडट्रेंड-गूगल अर्थ इंजन क्लाउड कंप्यूटिंग के साथ शहरी भूमि कवर परिवर्तन प्रक्षेप पथ की निरंतर निगरानी". Remote Sensing. 12 (18): 2883. Bibcode:2020RemS...12.2883M. doi:10.3390/rs12182883.
  54. Li, Yang; Zhao, Kaiguang; Hu, Tongxi; Zhang, Xuesong. "जानवर: परिवर्तन-बिंदु का पता लगाने और समय श्रृंखला अपघटन के लिए एक बायेसियन एन्सेम्बल एल्गोरिदम". GitHub.
  55. Raj Kumar, P. Arun; Selvakumar, S. (July 2011). "न्यूरल क्लासिफायर के एक समूह का उपयोग करके सेवा हमले का पता लगाने का वितरित इनकार". Computer Communications. 34 (11): 1328–1341. doi:10.1016/j.comcom.2011.01.012.
  56. Shabtai, Asaf; Moskovitch, Robert; Elovici, Yuval; Glezer, Chanan (February 2009). "Detection of malicious code by applying machine learning classifiers on static features: A state-of-the-art survey". Information Security Technical Report. 14 (1): 16–29. doi:10.1016/j.istr.2009.03.003.
  57. Zhang, Boyun; Yin, Jianping; Hao, Jingbo; Zhang, Dingxing; Wang, Shulin (2007). "Malicious Codes Detection Based on Ensemble Learning". स्वायत्त और विश्वसनीय कंप्यूटिंग. Lecture Notes in Computer Science. Vol. 4610. pp. 468–477. doi:10.1007/978-3-540-73547-2_48. ISBN 978-3-540-73546-5.
  58. Menahem, Eitan; Shabtai, Asaf; Rokach, Lior; Elovici, Yuval (February 2009). "मल्टी-इंड्यूसर एन्सेम्बल लागू करके मैलवेयर का पता लगाने में सुधार करना". Computational Statistics & Data Analysis. 53 (4): 1483–1494. CiteSeerX 10.1.1.150.2722. doi:10.1016/j.csda.2008.10.015.
  59. Locasto, Michael E.; Wang, Ke; Keromytis, Angeles D.; Salvatore, J. Stolfo (2005). "FLIPS: Hybrid Adaptive Intrusion Prevention". घुसपैठ का पता लगाने में हालिया प्रगति. Lecture Notes in Computer Science. Vol. 3858. pp. 82–101. CiteSeerX 10.1.1.60.3798. doi:10.1007/11663812_5. ISBN 978-3-540-31778-4.
  60. Giacinto, Giorgio; Perdisci, Roberto; Del Rio, Mauro; Roli, Fabio (January 2008). "वन-क्लास क्लासिफायर के मॉड्यूलर समूह द्वारा कंप्यूटर नेटवर्क में घुसपैठ का पता लगाना". Information Fusion. 9 (1): 69–82. CiteSeerX 10.1.1.69.9132. doi:10.1016/j.inffus.2006.10.002.
  61. Mu, Xiaoyan; Lu, Jiangfeng; Watta, Paul; Hassoun, Mohamad H. (July 2009). "Weighted voting-based ensemble classifiers with application to human face recognition and voice recognition". 2009 International Joint Conference on Neural Networks. pp. 2168–2171. doi:10.1109/IJCNN.2009.5178708. ISBN 978-1-4244-3548-7. S2CID 18850747.
  62. Yu, Su; Shan, Shiguang; Chen, Xilin; Gao, Wen (April 2006). "Hierarchical ensemble of Gabor Fisher classifier for face recognition". 7th International Conference on Automatic Face and Gesture Recognition (FGR06). pp. 91–96. doi:10.1109/FGR.2006.64. ISBN 978-0-7695-2503-7. S2CID 1513315.
  63. Su, Y.; Shan, S.; Chen, X.; Gao, W. (September 2006). "Patch-Based Gabor Fisher Classifier for Face Recognition". 18th International Conference on Pattern Recognition (ICPR'06). Vol. 2. pp. 528–531. doi:10.1109/ICPR.2006.917. ISBN 978-0-7695-2521-1. S2CID 5381806.
  64. Liu, Yang; Lin, Yongzheng; Chen, Yuehui (July 2008). "Ensemble Classification Based on ICA for Face Recognition". 2008 Congress on Image and Signal Processing. pp. 144–148. doi:10.1109/CISP.2008.581. ISBN 978-0-7695-3119-9. S2CID 16248842.
  65. Rieger, Steven A.; Muraleedharan, Rajani; Ramachandran, Ravi P. (2014). "Speech based emotion recognition using spectral feature extraction and an ensemble of KNN classifiers". The 9th International Symposium on Chinese Spoken Language Processing. pp. 589–593. doi:10.1109/ISCSLP.2014.6936711. ISBN 978-1-4799-4219-0. S2CID 31370450.
  66. Krajewski, Jarek; Batliner, Anton; Kessel, Silke (October 2010). "Comparing Multiple Classifiers for Speech-Based Detection of Self-Confidence - A Pilot Study". 2010 20th International Conference on Pattern Recognition (PDF). pp. 3716–3719. doi:10.1109/ICPR.2010.905. ISBN 978-1-4244-7542-1. S2CID 15431610.
  67. Rani, P. Ithaya; Muneeswaran, K. (25 May 2016). "आंख और मुंह के टेम्पोरल गैबर फीचर्स का उपयोग करके वीडियो अनुक्रमों में चेहरे की भावनाओं को पहचानें". Multimedia Tools and Applications. 76 (7): 10017–10040. doi:10.1007/s11042-016-3592-y. S2CID 20143585.
  68. Rani, P. Ithaya; Muneeswaran, K. (August 2016). "आंख और मुंह के क्षेत्रों के आधार पर चेहरे की भावना की पहचान". International Journal of Pattern Recognition and Artificial Intelligence. 30 (7): 1655020. doi:10.1142/S021800141655020X.
  69. Rani, P. Ithaya; Muneeswaran, K (28 March 2018). "चेहरे के घटकों के आधार पर भावना की पहचान". Sādhanā. 43 (3). doi:10.1007/s12046-018-0801-6.
  70. Louzada, Francisco; Ara, Anderson (October 2012). "Bagging k-dependence probabilistic networks: An alternative powerful fraud detection tool". Expert Systems with Applications. 39 (14): 11583–11592. doi:10.1016/j.eswa.2012.04.024.
  71. Sundarkumar, G. Ganesh; Ravi, Vadlamani (January 2015). "बैंकिंग और बीमा में असंतुलित डेटासेट के खनन के लिए एक नवीन हाइब्रिड अंडरसैंपलिंग विधि". Engineering Applications of Artificial Intelligence. 37: 368–377. doi:10.1016/j.engappai.2014.09.019.
  72. 72.0 72.1 Kim, Yoonseong; Sohn, So Young (August 2012). "सहकर्मी समूह विश्लेषण का उपयोग करके स्टॉक धोखाधड़ी का पता लगाना". Expert Systems with Applications. 39 (10): 8986–8992. doi:10.1016/j.eswa.2012.02.025.
  73. Savio, A.; García-Sebastián, M.T.; Chyzyk, D.; Hernandez, C.; Graña, M.; Sistiaga, A.; López de Munain, A.; Villanúa, J. (August 2011). "संरचनात्मक एमआरआई के वीबीएम विश्लेषण से निकाले गए फीचर वैक्टर के आधार पर तंत्रिका-संज्ञानात्मक विकार का पता लगाना". Computers in Biology and Medicine. 41 (8): 600–610. doi:10.1016/j.compbiomed.2011.05.010. PMID 21621760.
  74. Ayerdi, B.; Savio, A.; Graña, M. (June 2013). "Meta-ensembles of Classifiers for Alzheimer's Disease Detection Using Independent ROI Features". इंजीनियरिंग और चिकित्सा अनुप्रयोगों में प्राकृतिक और कृत्रिम संगणना. Lecture Notes in Computer Science. Vol. 7931. pp. 122–130. doi:10.1007/978-3-642-38622-0_13. ISBN 978-3-642-38621-3.
  75. Gu, Quan; Ding, Yong-Sheng; Zhang, Tong-Liang (April 2015). "निम्न समरूपता में जी-प्रोटीन-युग्मित रिसेप्टर वर्गों की एक संयोजन वर्गीकरण आधारित भविष्यवाणी". Neurocomputing. 154: 110–118. doi:10.1016/j.neucom.2014.12.013.
  76. Xue, Dan; Zhou, Xiaomin; Li, Chen; Yao, Yudong; Rahaman, Md Mamunur; Zhang, Jinghua; Chen, Hao; Zhang, Jinpeng; Qi, Shouliang; Sun, Hongzan (2020). "सर्वाइकल हिस्टोपैथोलॉजी छवि वर्गीकरण के लिए ट्रांसफर लर्निंग और एन्सेम्बल लर्निंग तकनीकों का एक अनुप्रयोग". IEEE Access. 8: 104603–104618. doi:10.1109/ACCESS.2020.2999816. ISSN 2169-3536. S2CID 219689893.
  77. Manna, Ankur; Kundu, Rohit; Kaplun, Dmitrii; Sinitca, Aleksandr; Sarkar, Ram (December 2021). "ग्रीवा कोशिका विज्ञान के वर्गीकरण के लिए सीएनएन मॉडल का एक अस्पष्ट रैंक-आधारित समूह". Scientific Reports (in English). 11 (1): 14538. Bibcode:2021NatSR..1114538M. doi:10.1038/s41598-021-93783-8. ISSN 2045-2322. PMC 8282795. PMID 34267261.


अग्रिम पठन


बाहरी संबंध