क्लस्टर-वेटेड मॉडलिंग: Difference between revisions

Revision as of 10:13, 18 July 2023

डेटा माइनिंग में, क्लस्टर-वेटेड मॉडलिंग (सीडब्ल्यूएम) मॉडल (क्लस्टर) के एक सेट का उपयोग करके घनत्व अनुमान के आधार पर इनपुट (स्वतंत्र चर) से आउटपुट (आश्रित चर) की गैर-रेखीय पूर्वानुमान के लिए एक एल्गोरिदम-आधारित दृष्टिकोण है। इनपुट स्पेस के उप-क्षेत्र में उपयुक्त समग्र दृष्टिकोण संयुक्त रूप से इनपुट-आउटपुट स्पेस में काम करता है और एक प्रारंभिक संस्करण नील गेर्शेनफेल्ड द्वारा प्रस्तावित किया गया था।।^[1]^[2]

मॉडल का मूल रूप

इनपुट-आउटपुट समस्या के क्लस्टर-वेटेड मॉडलिंग की प्रक्रिया को निम्नानुसार रेखांकित किया जा सकता है।^[2] इनपुट वेरिएबल x से आउटपुट वेरिएबल y के लिए अनुमानित मान बनाने के लिए, मॉडलिंग और अंशांकन प्रक्रिया एक संयुक्त संभाव्यता वितरण,p(y,x). पर आती है। यहां चर एक-चर, बहुभिन्नरूपी या समय-श्रृंखला हो सकते हैं। सुविधा के लिए, किसी भी मॉडल मापदंड को यहां नोटेशन में निरुपित नहीं किया गया है और इनके कई अलग-अलग उपचार संभव हैं, जिसमें अंशांकन में एक कदम के रूप में उन्हें निश्चित मानों पर सेट करना या बायेसियन विश्लेषण का उपयोग करके उनका इलाज करना सम्मिलित है। आवश्यक पूर्वानुमानित मान नियमित संभाव्यता वितरण p(y|x) का निर्माण करके प्राप्त किए जाते हैं, जिससे नियमित अपेक्षित मूल्य का उपयोग करके पूर्वानुमान प्राप्त की जा सकती है, नियमित भिन्नता अनिश्चितता का संकेत प्रदान करती है।

मॉडलिंग का महत्वपूर्ण चरण यह है कि p(y|x) को मिश्रण मॉडल के रूप में निम्नलिखित रूप माना जाता है:

p(y,x)=\sum _{1}^{n}w_{j}p_{j}(y,x),

जहां n समूहों की संख्या है और {w_j} वे वज़न हैं जिनका योग एक होता है। कार्य p_j(y,x) संयुक्त संभाव्यता घनत्व फ़ंक्शन हैं जो प्रत्येक n क्लस्टर से संबंधित हैं। इन कार्यों को एक नियमित और सीमांत वितरण में अपघटन का उपयोग करके तैयार किया गया है:

p_{j}(y,x)=p_{j}(y|x)p_{j}(x),

जहाँ:

p_j(y|x) x दिए गए y की पूर्वानुमान करने के लिए एक मॉडल है, और यह देखते हुए कि इनपुट-आउटपुट जोड़ी को x के मान के आधार पर क्लस्टर j के साथ जोड़ा जाना चाहिए। यह मॉडल सरलतम स्थितियों में एक प्रतिगमन विश्लेषण हो सकता है।

p_j(x) औपचारिक रूप से x के मानों के लिए एक घनत्व है, यह देखते हुए कि इनपुट-आउटपुट जोड़ी को क्लस्टर j के साथ जोड़ा जाना चाहिए। समूहों के बीच इन कार्यों के सापेक्ष आकार यह निर्धारित करते हैं कि x का कोई विशेष मान किसी दिए गए क्लस्टर-केंद्र से जुड़ा है या नहीं जिसमे यह घनत्व क्लस्टर-केंद्र का प्रतिनिधित्व करने वाले मापदंड पर केंद्रित एक गाऊसी फ़ंक्शन हो सकता है।

प्रतिगमन विश्लेषण के समान ही, समग्र मॉडलिंग रणनीति के हिस्से के रूप में प्रारंभिक डेटा परिवर्तन पर विचार करना महत्वपूर्ण होगा यदि मॉडल के मुख्य घटक क्लस्टर-वार स्थिति घनत्व के लिए सरल प्रतिगमन मॉडल और सामान्य वितरण हैं क्लस्टर-भार घनत्व p_j(x). है।

सामान्य संस्करण

मूल सीडब्लूएम एल्गोरिदम प्रत्येक इनपुट क्लस्टर के लिए एक एकल आउटपुट क्लस्टर देता है। चूँकि सीडब्लूएम को कई क्लस्टरों तक बढ़ाया जा सकता है जो अभी भी एक ही इनपुट क्लस्टर से जुड़े हुए हैं।^[3] सीडब्लूएम में प्रत्येक क्लस्टर गॉसियन इनपुट क्षेत्र में स्थानीयकृत है, और इसमें अपना स्वयं का प्रशिक्षित स्थानीय मॉडल सम्मिलित है।^[4] इसे एक बहुमुखी अनुमान एल्गोरिदम के रूप में मान्यता प्राप्त है जो सरलता, व्यापकता और लचीलापन प्रदान करता है; यहां तक कि जब फीडफॉरवर्ड स्तरित नेटवर्क को प्राथमिकता दी जा सकती है, तब भी इसे कभी-कभी प्रशिक्षण समस्या की प्रकृति पर दूसरी राय के रूप में उपयोग किया जाता है।^[5]

गेर्शेनफेल्ड द्वारा प्रस्तावित मूल रूप दो नवाचारों का वर्णन करता है:

सीडब्ल्यूएम को डेटा की निरंतर स्ट्रीम के साथ काम करने में सक्षम बनाना है
सीडब्लूएम मापदंड समायोजन प्रक्रिया में आने वाली स्थानीय मिनिमा की समस्या का समाधान है ^[5]

सीडब्लूएम का उपयोग प्रिंटर अनुप्रयोगों में मीडिया को वर्गीकृत करने के लिए किया जा सकता है, जिसमें आउटपुट उत्पन्न करने के लिए कम से कम दो मापदंड का उपयोग किया जाता है जिसमें इनपुट मापदंड पर संयुक्त निर्भरता होती है।^[6]

संदर्भ

↑ Gershenfeld, N (1997). "अरेखीय अनुमान और क्लस्टर-भारित मॉडलिंग". Annals of the New York Academy of Sciences. 808: 18–24. Bibcode:1997NYASA.808...18G. doi:10.1111/j.1749-6632.1997.tb51651.x. S2CID 85736539.
↑ ^2.0 ^2.1 Gershenfeld, N.; Schoner; Metois, E. (1999). "समय-श्रृंखला विश्लेषण के लिए क्लस्टर-भारित मॉडलिंग". Nature. 397 (6717): 329–332. Bibcode:1999Natur.397..329G. doi:10.1038/16873. S2CID 204990873.
↑ Feldkamp, L.A.; Prokhorov, D.V.; Feldkamp, T.M. (2001). "मल्टीक्लस्टर के साथ क्लस्टर-भारित मॉडलिंग". International Joint Conference on Neural Networks. 3 (1): 1710–1714. doi:10.1109/IJCNN.2001.938419. S2CID 60819260.
↑ Boyden, Edward S. "Tree-based Cluster Weighted Modeling: Towards A Massively Parallel Real-Time Digital Stradivarius" (PDF). Cambridge, MA: MIT Media Lab. {{cite journal}}: Cite journal requires |journal= (help)
↑ ^5.0 ^5.1 Prokhorov, क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण Danil V.; Lee A. Feldkamp; Timothy M. Feldkamp. "क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण" (PDF). Dearborn, MI: Ford Research Laboratory. {{cite journal}}: Cite journal requires |journal= (help)
↑ Gao, Jun; Ross R. Allen (2003-07-24). "मीडिया वर्गीकरण के लिए क्लस्टर-भारित मॉडलिंग". Palo Alto, CA: World Intellectual Property Organization. Archived from the original on 2012-12-12. {{cite journal}}: Cite journal requires |journal= (help)

[1] Gershenfeld, N (1997). "अरेखीय अनुमान और क्लस्टर-भारित मॉडलिंग". Annals of the New York Academy of Sciences. 808: 18–24. Bibcode:1997NYASA.808...18G. doi:10.1111/j.1749-6632.1997.tb51651.x. S2CID 85736539.

[nature-2] 2.0 ^2.1 Gershenfeld, N.; Schoner; Metois, E. (1999). "समय-श्रृंखला विश्लेषण के लिए क्लस्टर-भारित मॉडलिंग". Nature. 397 (6717): 329–332. Bibcode:1999Natur.397..329G. doi:10.1038/16873. S2CID 204990873.

[feldkamp-3] Feldkamp, L.A.; Prokhorov, D.V.; Feldkamp, T.M. (2001). "मल्टीक्लस्टर के साथ क्लस्टर-भारित मॉडलिंग". International Joint Conference on Neural Networks. 3 (1): 1710–1714. doi:10.1109/IJCNN.2001.938419. S2CID 60819260.

[mit-4] Boyden, Edward S. "Tree-based Cluster Weighted Modeling: Towards A Massively Parallel Real-Time Digital Stradivarius" (PDF). Cambridge, MA: MIT Media Lab. {{cite journal}}: Cite journal requires |journal= (help)

[dearborn-5] 5.0 ^5.1 Prokhorov, क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण Danil V.; Lee A. Feldkamp; Timothy M. Feldkamp. "क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण" (PDF). Dearborn, MI: Ford Research Laboratory. {{cite journal}}: Cite journal requires |journal= (help)

[media-6] Gao, Jun; Ross R. Allen (2003-07-24). "मीडिया वर्गीकरण के लिए क्लस्टर-भारित मॉडलिंग". Palo Alto, CA: World Intellectual Property Organization. Archived from the original on 2012-12-12. {{cite journal}}: Cite journal requires |journal= (help)

[1]

[2]

[3]

[4]

[5]

[6]

@@ Line 1: / Line 1: @@
-डेटा माइनिंग में, '''क्लस्टर-वेटेड मॉडलिंग''' (सीडब्ल्यूएम) मॉडल (क्लस्टर) के एक सेट का उपयोग करके घनत्व अनुमान के आधार पर इनपुट (स्वतंत्र चर) से आउटपुट (आश्रित चर) की गैर-रेखीय पूर्वानुमान  के लिए एक एल्गोरिदम-आधारित दृष्टिकोण है। इनपुट स्पेस के उप-क्षेत्र में उपयुक्त समग्र दृष्टिकोण संयुक्त रूप से इनपुट-आउटपुट स्पेस में काम करता है और एक प्रारंभिक संस्करण नील गेर्शेनफेल्ड द्वारा प्रस्तावित किया गया था।।<ref>{{cite journal | last1 = Gershenfeld | first1 = N | year = 1997 | title = अरेखीय अनुमान और क्लस्टर-भारित मॉडलिंग| journal = Annals of the New York Academy of Sciences | volume = 808 | pages = 18–24 | doi = 10.1111/j.1749-6632.1997.tb51651.x | bibcode = 1997NYASA.808...18G | s2cid = 85736539 }}</ref><ref name="nature">{{cite journal | last1 = Gershenfeld | first1 = N. | last2 = Schoner | last3 = Metois | first3 = E. | year = 1999 | title = समय-श्रृंखला विश्लेषण के लिए क्लस्टर-भारित मॉडलिंग| journal = Nature | volume = 397 | issue = 6717| pages = 329–332 | doi=10.1038/16873| bibcode = 1999Natur.397..329G | s2cid = 204990873 }}</ref>
+डेटा माइनिंग में, '''क्लस्टर-वेटेड मॉडलिंग''' (सीडब्ल्यूएम) मॉडल (क्लस्टर) के एक सेट का उपयोग करके घनत्व अनुमान के आधार पर इनपुट (स्वतंत्र चर) से आउटपुट (आश्रित चर) की गैर-रेखीय पूर्वानुमान के लिए एक एल्गोरिदम-आधारित दृष्टिकोण है। इनपुट स्पेस के उप-क्षेत्र में उपयुक्त समग्र दृष्टिकोण संयुक्त रूप से इनपुट-आउटपुट स्पेस में काम करता है और एक प्रारंभिक संस्करण नील गेर्शेनफेल्ड द्वारा प्रस्तावित किया गया था।।<ref>{{cite journal | last1 = Gershenfeld | first1 = N | year = 1997 | title = अरेखीय अनुमान और क्लस्टर-भारित मॉडलिंग| journal = Annals of the New York Academy of Sciences | volume = 808 | pages = 18–24 | doi = 10.1111/j.1749-6632.1997.tb51651.x | bibcode = 1997NYASA.808...18G | s2cid = 85736539 }}</ref><ref name="nature">{{cite journal | last1 = Gershenfeld | first1 = N. | last2 = Schoner | last3 = Metois | first3 = E. | year = 1999 | title = समय-श्रृंखला विश्लेषण के लिए क्लस्टर-भारित मॉडलिंग| journal = Nature | volume = 397 | issue = 6717| pages = 329–332 | doi=10.1038/16873| bibcode = 1999Natur.397..329G | s2cid = 204990873 }}</ref>
 ==मॉडल का मूल रूप==
-इनपुट-आउटपुट समस्या के क्लस्टर-वेटेड मॉडलिंग की प्रक्रिया को निम्नानुसार रेखांकित किया जा सकता है।<ref name=nature/> इनपुट वेरिएबल x से आउटपुट वेरिएबल y के लिए अनुमानित मान बनाने के लिए, मॉडलिंग और अंशांकन प्रक्रिया एक [[संयुक्त संभाव्यता वितरण]],''p''(''y'',''x''). पर आती है। यहां चर एक-चर, बहुभिन्नरूपी या समय-श्रृंखला हो सकते हैं। सुविधा के लिए, किसी भी मॉडल मापदंड को यहां नोटेशन में निरुपित नहीं किया गया है और इनके कई अलग-अलग उपचार संभव हैं, जिसमें अंशांकन में एक कदम के रूप में उन्हें निश्चित मानों पर सेट करना या [[बायेसियन विश्लेषण]] का उपयोग करके उनका इलाज करना सम्मिलित  है। आवश्यक पूर्वानुमानित मान नियमित  [[सशर्त संभाव्यता वितरण|संभाव्यता वितरण]] p(y|x) का निर्माण करके प्राप्त किए जाते हैं, जिससे [[सशर्त अपेक्षित मूल्य|नियमित अपेक्षित मूल्य]] का उपयोग करके पूर्वानुमान  प्राप्त की जा सकती है, नियमित भिन्नता अनिश्चितता का संकेत प्रदान करती है।
+इनपुट-आउटपुट समस्या के क्लस्टर-वेटेड मॉडलिंग की प्रक्रिया को निम्नानुसार रेखांकित किया जा सकता है।<ref name=nature/> इनपुट वेरिएबल x से आउटपुट वेरिएबल y के लिए अनुमानित मान बनाने के लिए, मॉडलिंग और अंशांकन प्रक्रिया एक [[संयुक्त संभाव्यता वितरण]],''p''(''y'',''x''). पर आती है। यहां चर एक-चर, बहुभिन्नरूपी या समय-श्रृंखला हो सकते हैं। सुविधा के लिए, किसी भी मॉडल मापदंड को यहां नोटेशन में निरुपित नहीं किया गया है और इनके कई अलग-अलग उपचार संभव हैं, जिसमें अंशांकन में एक कदम के रूप में उन्हें निश्चित मानों पर सेट करना या [[बायेसियन विश्लेषण]] का उपयोग करके उनका इलाज करना सम्मिलित है। आवश्यक पूर्वानुमानित मान नियमित [[सशर्त संभाव्यता वितरण|संभाव्यता वितरण]] p(y|x) का निर्माण करके प्राप्त किए जाते हैं, जिससे [[सशर्त अपेक्षित मूल्य|नियमित अपेक्षित मूल्य]] का उपयोग करके पूर्वानुमान प्राप्त की जा सकती है, नियमित भिन्नता अनिश्चितता का संकेत प्रदान करती है।
 मॉडलिंग का महत्वपूर्ण चरण यह है कि p(y|x) को [[मिश्रण मॉडल]] के रूप में निम्नलिखित रूप माना जाता है:
@@ Line 15: / Line 15: @@
 :<math>p_j(y,x)=p_j(y|x)p_j(x), </math>
 जहाँ:
-:*p<sub>j</sub>(y|x) x दिए गए y की पूर्वानुमान  करने के लिए एक मॉडल है, और यह देखते हुए कि इनपुट-आउटपुट जोड़ी को x के मान के आधार पर क्लस्टर j के साथ जोड़ा जाना चाहिए। यह मॉडल सरलतम स्थितियों में एक [[प्रतिगमन विश्लेषण]] हो सकता है।
+:*p<sub>j</sub>(y|x) x दिए गए y की पूर्वानुमान करने के लिए एक मॉडल है, और यह देखते हुए कि इनपुट-आउटपुट जोड़ी को x के मान के आधार पर क्लस्टर j के साथ जोड़ा जाना चाहिए। यह मॉडल सरलतम स्थितियों में एक [[प्रतिगमन विश्लेषण]] हो सकता है।
 :*p<sub>j</sub>(x) औपचारिक रूप से x के मानों के लिए एक घनत्व है, यह देखते हुए कि इनपुट-आउटपुट जोड़ी को क्लस्टर j के साथ जोड़ा जाना चाहिए। समूहों के बीच इन कार्यों के सापेक्ष आकार यह निर्धारित करते हैं कि x का कोई विशेष मान किसी दिए गए क्लस्टर-केंद्र से जुड़ा है या नहीं जिसमे यह घनत्व क्लस्टर-केंद्र का प्रतिनिधित्व करने वाले मापदंड पर केंद्रित एक गाऊसी फ़ंक्शन हो सकता है।
-प्रतिगमन विश्लेषण के समान ही, समग्र मॉडलिंग रणनीति के हिस्से के रूप में प्रारंभिक [[डेटा परिवर्तन]] पर विचार करना महत्वपूर्ण होगा यदि मॉडल के मुख्य घटक क्लस्टर-वार स्थिति घनत्व के लिए सरल प्रतिगमन मॉडल और [[सामान्य वितरण]] हैं क्लस्टर-भार घनत्व  ''p<sub>j</sub>''(''x''). है।
+प्रतिगमन विश्लेषण के समान ही, समग्र मॉडलिंग रणनीति के हिस्से के रूप में प्रारंभिक [[डेटा परिवर्तन]] पर विचार करना महत्वपूर्ण होगा यदि मॉडल के मुख्य घटक क्लस्टर-वार स्थिति घनत्व के लिए सरल प्रतिगमन मॉडल और [[सामान्य वितरण]] हैं क्लस्टर-भार घनत्व ''p<sub>j</sub>''(''x''). है।
 ==सामान्य संस्करण==
@@ Line 26: / Line 26: @@
 गेर्शेनफेल्ड द्वारा प्रस्तावित मूल रूप दो नवाचारों का वर्णन करता है:
 * सीडब्ल्यूएम को डेटा की निरंतर स्ट्रीम के साथ काम करने में सक्षम बनाना है
-* सीडब्लूएम मापदंड  समायोजन प्रक्रिया में आने वाली स्थानीय मिनिमा की समस्या का समाधान है <ref name="dearborn">{{cite journal|last=Prokhorov|first=क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण Danil V.|author2=Lee A. Feldkamp |author3=Timothy M. Feldkamp |title=क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण|publisher=Ford Research Laboratory|location=Dearborn, MI|url=http://home.comcast.net/~dvp/cwm.pdf}}</ref>
+* सीडब्लूएम मापदंड समायोजन प्रक्रिया में आने वाली स्थानीय मिनिमा की समस्या का समाधान है <ref name="dearborn">{{cite journal|last=Prokhorov|first=क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण Danil V.|author2=Lee A. Feldkamp |author3=Timothy M. Feldkamp |title=क्लस्टर-भारित मॉडलिंग के लिए एक नया दृष्टिकोण|publisher=Ford Research Laboratory|location=Dearborn, MI|url=http://home.comcast.net/~dvp/cwm.pdf}}</ref>
-सीडब्लूएम का उपयोग प्रिंटर अनुप्रयोगों में मीडिया को वर्गीकृत करने के लिए किया जा सकता है, जिसमें आउटपुट उत्पन्न करने के लिए कम से कम दो मापदंड  का उपयोग किया जाता है जिसमें इनपुट मापदंड  पर संयुक्त निर्भरता होती है।<ref name="media">{{cite journal|last=Gao|first=Jun|author2=Ross R. Allen|date=2003-07-24|title=मीडिया वर्गीकरण के लिए क्लस्टर-भारित मॉडलिंग|publisher=World Intellectual Property Organization|location=Palo Alto, CA|url=http://www.wipo.int/pctdb/en/wo.jsp?wo=2003059630|archive-url=https://archive.today/20121212003528/http://www.wipo.int/pctdb/en/wo.jsp?wo=2003059630|url-status=dead|archive-date=2012-12-12}}</ref>
+सीडब्लूएम का उपयोग प्रिंटर अनुप्रयोगों में मीडिया को वर्गीकृत करने के लिए किया जा सकता है, जिसमें आउटपुट उत्पन्न करने के लिए कम से कम दो मापदंड का उपयोग किया जाता है जिसमें इनपुट मापदंड पर संयुक्त निर्भरता होती है।<ref name="media">{{cite journal|last=Gao|first=Jun|author2=Ross R. Allen|date=2003-07-24|title=मीडिया वर्गीकरण के लिए क्लस्टर-भारित मॉडलिंग|publisher=World Intellectual Property Organization|location=Palo Alto, CA|url=http://www.wipo.int/pctdb/en/wo.jsp?wo=2003059630|archive-url=https://archive.today/20121212003528/http://www.wipo.int/pctdb/en/wo.jsp?wo=2003059630|url-status=dead|archive-date=2012-12-12}}</ref>

Anonymous

Search

क्लस्टर-वेटेड मॉडलिंग: Difference between revisions

Namespaces

More

Page actions

Revision as of 10:13, 18 July 2023

मॉडल का मूल रूप

सामान्य संस्करण

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

क्लस्टर-वेटेड मॉडलिंग: Difference between revisions

Revision as of 10:13, 18 July 2023

मॉडल का मूल रूप

सामान्य संस्करण

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Categories