फैक्टोरियल कोड: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(8 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Data representation for machine learning}}
{{Short description|Data representation for machine learning}}
'''फैक्टोरियल कोड''' अधिकांश वास्तविक विश्व डेटा सेट में डेटा सदिश होते हैं जिनके व्यक्तिगत घटक [[सांख्यिकीय रूप से स्वतंत्र]] नहीं होते हैं। दूसरे शब्दों में, किसी तत्व का मूल्य जानने से डेटा सदिश में तत्वों के मूल्य के बारे में जानकारी मिलेगी। जब ऐसा होता है, तब डेटा का एक फैक्टोरियल कोड बनाना वांछनीय हो सकता है, अर्थात, प्रत्येक डेटा सदिश का एक नया सदिश-मूल्य [[प्रतिनिधित्व (गणित)]] जिससे यह परिणामी कोड सदिश (हानि-मुक्त कोडिंग) द्वारा विशिष्ट रूप से एन्कोड किया जा सके, किन्तु कोड घटक सांख्यिकीय रूप से स्वतंत्र हैं।
'''फैक्टोरियल कोड''' अधिकांश वास्तविक विश्व डेटा समुच्चय में डेटा सदिश होते हैं जिनके व्यक्तिगत घटक [[सांख्यिकीय रूप से स्वतंत्र]] नहीं होते हैं। दूसरे शब्दों में, किसी तत्व का मूल्य जानने से डेटा सदिश में तत्वों के मूल्य के बारे में जानकारी मिलती है। जब ऐसा होता है, तब डेटा का फैक्टोरियल कोड बनाना वांछनीय हो सकता है, अर्थात, प्रत्येक डेटा सदिश का नया सदिश-मूल्य [[प्रतिनिधित्व (गणित)]] जिससे यह परिणामी कोड सदिश (हानि-मुक्त कोडिंग) द्वारा विशिष्ट रूप से एन्कोड किया जा सके, किन्तु कोड घटक सांख्यिकीय रूप से स्वतंत्र होती हैं।


बाद में पर्यवेक्षित शिक्षण सामान्यतः तब बढ़िया काम करता है जब कच्चे इनपुट डेटा को पहली बार ऐसे फैक्टोरियल कोड में अनुवादित किया जाता है। इस प्रकार उदाहरण के लिए, मान लीजिए कि अंतिम लक्ष्य अत्यधिक अनावश्यक पिक्सेल वाली छवियों को वर्गीकृत करना है। एक अनुभवहीन बेयस क्लासिफायर यह मान लेगा कि पिक्सेल सांख्यिकीय रूप से स्वतंत्र [[यादृच्छिक चर]] हैं और इसलिए अच्छे परिणाम देने में विफल रहते हैं। चूँकि, यदि डेटा को पहले तथ्यात्मक तरीके से एन्कोड किया गया है, तब अनुभवहीन बेयस क्लासिफायरियर अपने [[वैश्विक इष्टतम]] प्रदर्शन को प्राप्त करेगा (श्मिधुबर एट अल 1996 से समानता किया गया है)।
बाद में पर्यवेक्षित शिक्षण सामान्यतः तब बढ़िया काम करता है जब रॉ इनपुट डेटा को पहली बार इस प्रकार के फैक्टोरियल कोड में अनुवादित किया जाता है। उदाहरण के लिए, मान लीजिए कि अंतिम लक्ष्य अत्यधिक अनावश्यक पिक्सेल वाली छवियों को वर्गीकृत करना है। अनुभवहीन बेयस क्लासिफायर यह मान लेगा कि पिक्सेल सांख्यिकीय रूप से स्वतंत्र [[यादृच्छिक चर]] हैं और इसलिए अच्छे परिणाम देने में विफल रहते हैं। चूँकि, यदि डेटा को पहले तथ्यात्मक विधि से एन्कोड किया गया है, तब अनुभवहीन बेयस क्लासिफायरियर अपने [[वैश्विक इष्टतम]] प्रदर्शन को प्राप्त करेगा (श्मिधुबर एट अल 1996 से समानता किया गया है)।


फैक्टोरियल कोड बनाने के लिए, [[ होरेस बारलो |होरेस बारलो]] और सहकर्मियों ने बाइनरी अंक प्रणाली कोड (1989) के कोड घटकों की [[ अंश |अंश]] एन्ट्रॉपी के योग को कम करने का सुझाव दिया। जुर्गन श्मिडहुबर (1992) ने भविष्यवक्ताओं और बाइनरी [ सुविधा ([[ यंत्र अधिगम ]]) ] [[डिटेक्टरों]] के संदर्भ में समस्या को फिर से तैयार किया, प्रत्येक को इनपुट के रूप में कच्चा डेटा प्राप्त हुआ। प्रत्येक डिटेक्टर के लिए एक भविष्यवक्ता होता है जो अन्य डिटेक्टरों को देखता है और विभिन्न इनपुट सदिश या छवियों के उत्तर में अपने स्वयं के डिटेक्टर के आउटपुट की भविष्यवाणी करना सीखता है। किन्तु प्रत्येक डिटेक्टर यथासंभव अप्रत्याशित बनने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है। इस उद्देश्य फ़ंक्शन का वैश्विक इष्टतम विशेषता डिटेक्टरों के आउटपुट में वितरित फैशन में दर्शाए गए एक फैक्टोरियल कोड से मेल खाता है।
फैक्टोरियल कोड बनाने के लिए, [[ होरेस बारलो |होरेस बारलो]] और सहकर्मियों ने बाइनरी अंक प्रणाली कोड (1989) के कोड घटकों की [[ अंश |अंश]] एन्ट्रॉपी के योग को कम करने का सुझाव दिया गया है। जुर्गन श्मिडहुबर (1992) ने भविष्यवक्ताओं और बाइनरी [ सुविधा ([[ यंत्र अधिगम ]]) ] [[डिटेक्टरों]] के संदर्भ में समस्या को फिर से तैयार किया, प्रत्येक को इनपुट के रूप में रॉ डेटा प्राप्त हुआ। प्रत्येक डिटेक्टर के लिए भविष्यवक्ता होता है जो अन्य डिटेक्टरों को देखता है और विभिन्न इनपुट सदिश या छवियों के उत्तर में अपने स्वयं के डिटेक्टर के आउटपुट की भविष्यवाणी करना सीखता है। किन्तु प्रत्येक डिटेक्टर यथासंभव अप्रत्याशित बनने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है। इस उद्देश्य फ़ंक्शन का वैश्विक इष्टतम विशेषता डिटेक्टरों के आउटपुट में वितरित फैशन में दर्शाए गए फैक्टोरियल कोड से मेल खाता है।


पेन्स्की, रॉसेट और फेडर (2016, 2017) ने परिमित वर्णमाला आकारों पर [[स्वतंत्र घटक विश्लेषण]] के संदर्भ में इस समस्या का और अध्ययन किया। इस प्रकार प्रमेयों की एक श्रृंखला के माध्यम से वह दिखाते हैं कि फैक्टोरियल कोडिंग समस्या को एक शाखा और बाउंड सर्च ट्री एल्गोरिदम के साथ त्रुटिहीन रूप से हल किया जा सकता है, इस प्रकार या रैखिक समस्याओं की एक श्रृंखला के साथ कसकर अनुमानित किया जा सकता है। इसके अतिरिक्त ,वह एक सरल परिवर्तन (अर्थात्, व्यवस्था क्रमपरिवर्तन) प्रस्तुत करते हैं जो इष्टतम समाधान का एक लालची किन्तु बहुत प्रभावी अनुमान प्रदान करता है। व्यावहारिक रूप से, वह दिखाते हैं कि सावधानीपूर्वक कार्यान्वयन के साथ, व्यवस्था क्रम परिवर्तन के अनुकूल गुणों को एक असम्बद्ध रूप से इष्टतम गणनीय जटिलता में प्राप्त किया जा सकता है। इस प्रकार महत्वपूर्ण रूप से, वह सैद्धांतिक गारंटी प्रदान करते हैं, इस प्रकार यह दिखाते हुए कि चूंकि प्रत्येक यादृच्छिक सदिश को स्वतंत्र घटकों में कुशलतापूर्वक विघटित नहीं किया जा सकता है, अधिकांश सदिश बहुत अच्छी तरह से विघटित होते हैं (अर्थात, एक छोटी स्थिर निवेश के साथ), जैसे-जैसे आयाम बढ़ता है। इसके अतिरिक्त,वह अनेक सेटअपों (2017) में डेटा संपीड़न के लिए फैक्टोरियल कोड के उपयोग का प्रदर्शन करते हैं।
पेन्स्की, रॉसमुच्चय और फेडर (2016, 2017) ने परिमित वर्णमाला आकारों पर [[स्वतंत्र घटक विश्लेषण]] के संदर्भ में इस समस्या का और अध्ययन किया गया है। इस प्रकार प्रमेयों की श्रृंखला के माध्यम से वह दिखाते हैं कि फैक्टोरियल कोडिंग समस्या को शाखा और बाउंड सर्च ट्री एल्गोरिदम के साथ त्रुटिहीन रूप से हल किया जा सकता है, इस प्रकार या रैखिक समस्याओं की श्रृंखला के साथ कसकर अनुमानित किया जा सकता है। इसके अतिरिक्त ,वह सरल परिवर्तन (अर्थात्, व्यवस्था क्रमपरिवर्तन) प्रस्तुत करते हैं जो इष्टतम समाधान का लालची किन्तु बहुत प्रभावी अनुमान प्रदान करता है। व्यावहारिक रूप से, वह दिखाते हैं कि सावधानीपूर्वक कार्यान्वयन के साथ, व्यवस्था क्रम परिवर्तन के अनुकूल गुणों को असम्बद्ध रूप से इष्टतम गणनीय जटिलता में प्राप्त किया जा सकता है। इस प्रकार महत्वपूर्ण रूप से, वह सैद्धांतिक गारंटी प्रदान करते हैं, इस प्रकार यह दिखाते हुए कि चूंकि प्रत्येक यादृच्छिक सदिश को स्वतंत्र घटकों में कुशलतापूर्वक विघटित नहीं किया जा सकता है, अधिकांश सदिश बहुत अच्छी तरह से विघटित होते हैं (अर्थात, छोटी स्थिर निवेश के साथ), जैसे-जैसे आयाम बढ़ता है। इसके अतिरिक्त,वह अनेक समुच्चयअपों (2017) में डेटा संपीड़न के लिए फैक्टोरियल कोड के उपयोग का प्रदर्शन करते हैं।


== यह भी देखें ==
== यह भी देखें ==
Line 24: Line 24:
* A. Painsky, S. Rosset and M. Feder. Generalized independent component analysis over finite alphabets. IEEE Transactions on Information Theory, 62(2):1038-1053, 2016
* A. Painsky, S. Rosset and M. Feder. Generalized independent component analysis over finite alphabets. IEEE Transactions on Information Theory, 62(2):1038-1053, 2016
* A. Painsky, S. Rosset and M. Feder. Large Alphabet Source Coding using Independent Component Analysis. IEEE Transactions on Information Theory, 63(10):6514 - 6529, 2017
* A. Painsky, S. Rosset and M. Feder. Large Alphabet Source Coding using Independent Component Analysis. IEEE Transactions on Information Theory, 63(10):6514 - 6529, 2017
[[Category: स्वतंत्रता (संभावना सिद्धांत)]] [[Category: संकेत आगे बढ़ाना]]


[[Category: Machine Translated Page]]
[[Category:Created On 24/07/2023]]
[[Category:Created On 24/07/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Short description with empty Wikidata description]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:संकेत आगे बढ़ाना]]
[[Category:स्वतंत्रता (संभावना सिद्धांत)]]

Latest revision as of 11:17, 14 August 2023

फैक्टोरियल कोड अधिकांश वास्तविक विश्व डेटा समुच्चय में डेटा सदिश होते हैं जिनके व्यक्तिगत घटक सांख्यिकीय रूप से स्वतंत्र नहीं होते हैं। दूसरे शब्दों में, किसी तत्व का मूल्य जानने से डेटा सदिश में तत्वों के मूल्य के बारे में जानकारी मिलती है। जब ऐसा होता है, तब डेटा का फैक्टोरियल कोड बनाना वांछनीय हो सकता है, अर्थात, प्रत्येक डेटा सदिश का नया सदिश-मूल्य प्रतिनिधित्व (गणित) जिससे यह परिणामी कोड सदिश (हानि-मुक्त कोडिंग) द्वारा विशिष्ट रूप से एन्कोड किया जा सके, किन्तु कोड घटक सांख्यिकीय रूप से स्वतंत्र होती हैं।

बाद में पर्यवेक्षित शिक्षण सामान्यतः तब बढ़िया काम करता है जब रॉ इनपुट डेटा को पहली बार इस प्रकार के फैक्टोरियल कोड में अनुवादित किया जाता है। उदाहरण के लिए, मान लीजिए कि अंतिम लक्ष्य अत्यधिक अनावश्यक पिक्सेल वाली छवियों को वर्गीकृत करना है। अनुभवहीन बेयस क्लासिफायर यह मान लेगा कि पिक्सेल सांख्यिकीय रूप से स्वतंत्र यादृच्छिक चर हैं और इसलिए अच्छे परिणाम देने में विफल रहते हैं। चूँकि, यदि डेटा को पहले तथ्यात्मक विधि से एन्कोड किया गया है, तब अनुभवहीन बेयस क्लासिफायरियर अपने वैश्विक इष्टतम प्रदर्शन को प्राप्त करेगा (श्मिधुबर एट अल 1996 से समानता किया गया है)।

फैक्टोरियल कोड बनाने के लिए, होरेस बारलो और सहकर्मियों ने बाइनरी अंक प्रणाली कोड (1989) के कोड घटकों की अंश एन्ट्रॉपी के योग को कम करने का सुझाव दिया गया है। जुर्गन श्मिडहुबर (1992) ने भविष्यवक्ताओं और बाइनरी [ सुविधा (यंत्र अधिगम ) ] डिटेक्टरों के संदर्भ में समस्या को फिर से तैयार किया, प्रत्येक को इनपुट के रूप में रॉ डेटा प्राप्त हुआ। प्रत्येक डिटेक्टर के लिए भविष्यवक्ता होता है जो अन्य डिटेक्टरों को देखता है और विभिन्न इनपुट सदिश या छवियों के उत्तर में अपने स्वयं के डिटेक्टर के आउटपुट की भविष्यवाणी करना सीखता है। किन्तु प्रत्येक डिटेक्टर यथासंभव अप्रत्याशित बनने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है। इस उद्देश्य फ़ंक्शन का वैश्विक इष्टतम विशेषता डिटेक्टरों के आउटपुट में वितरित फैशन में दर्शाए गए फैक्टोरियल कोड से मेल खाता है।

पेन्स्की, रॉसमुच्चय और फेडर (2016, 2017) ने परिमित वर्णमाला आकारों पर स्वतंत्र घटक विश्लेषण के संदर्भ में इस समस्या का और अध्ययन किया गया है। इस प्रकार प्रमेयों की श्रृंखला के माध्यम से वह दिखाते हैं कि फैक्टोरियल कोडिंग समस्या को शाखा और बाउंड सर्च ट्री एल्गोरिदम के साथ त्रुटिहीन रूप से हल किया जा सकता है, इस प्रकार या रैखिक समस्याओं की श्रृंखला के साथ कसकर अनुमानित किया जा सकता है। इसके अतिरिक्त ,वह सरल परिवर्तन (अर्थात्, व्यवस्था क्रमपरिवर्तन) प्रस्तुत करते हैं जो इष्टतम समाधान का लालची किन्तु बहुत प्रभावी अनुमान प्रदान करता है। व्यावहारिक रूप से, वह दिखाते हैं कि सावधानीपूर्वक कार्यान्वयन के साथ, व्यवस्था क्रम परिवर्तन के अनुकूल गुणों को असम्बद्ध रूप से इष्टतम गणनीय जटिलता में प्राप्त किया जा सकता है। इस प्रकार महत्वपूर्ण रूप से, वह सैद्धांतिक गारंटी प्रदान करते हैं, इस प्रकार यह दिखाते हुए कि चूंकि प्रत्येक यादृच्छिक सदिश को स्वतंत्र घटकों में कुशलतापूर्वक विघटित नहीं किया जा सकता है, अधिकांश सदिश बहुत अच्छी तरह से विघटित होते हैं (अर्थात, छोटी स्थिर निवेश के साथ), जैसे-जैसे आयाम बढ़ता है। इसके अतिरिक्त,वह अनेक समुच्चयअपों (2017) में डेटा संपीड़न के लिए फैक्टोरियल कोड के उपयोग का प्रदर्शन करते हैं।

यह भी देखें

संदर्भ

  • Horace Barlow, T. P. Kaushal, and G. J. Mitchison. Finding minimum entropy codes. Neural Computation, 1:412-423, 1989.
  • Jürgen Schmidhuber. Learning factorial codes by predictability minimization. Neural Computation, 4(6):863-879, 1992
  • J. Schmidhuber and M. Eldracher and B. Foltin. Semilinear predictability minimization produces well-known feature detectors. Neural Computation, 8(4):773-786, 1996
  • A. Painsky, S. Rosset and M. Feder. Generalized independent component analysis over finite alphabets. IEEE Transactions on Information Theory, 62(2):1038-1053, 2016
  • A. Painsky, S. Rosset and M. Feder. Large Alphabet Source Coding using Independent Component Analysis. IEEE Transactions on Information Theory, 63(10):6514 - 6529, 2017