सामान्यीकरण (सांख्यिकी): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Statistical procedure}}
{{short description|Statistical procedure}}
{{Use American English|date=March 2021}}
 
{{Use mdy dates|date=March 2021}}
{{other uses|सामान्यीकरण स्थिरांक}}
{{other uses|सामान्यीकरण स्थिरांक}}
आँकड़ों और आँकड़ों के अनुप्रयोगों में, सामान्यीकरण के कई अर्थ हो सकते हैं।<ref name=Dodge/>सरलतम मामलों में, रेटिंग के सामान्यीकरण का अर्थ है विभिन्न पैमानों पर मापे गए मानों को सामान्य रूप से सामान्य पैमाने पर समायोजित करना, अक्सर औसत से पहले। अधिक जटिल मामलों में, सामान्यीकरण अधिक परिष्कृत समायोजन को संदर्भित कर सकता है जहां समायोजित मूल्यों के संपूर्ण संभावना वितरण को संरेखण में लाने का इरादा है। शैक्षिक मूल्यांकन में अंकों के सामान्यीकरण के मामले में, वितरण को [[ सामान्य वितरण ]] के साथ संरेखित करने का इरादा हो सकता है। संभाव्यता वितरण के सामान्यीकरण के लिए एक अलग दृष्टिकोण [[ [[ मात्रा ]]त्मक सामान्यीकरण ]] है, जहां विभिन्न उपायों की मात्राओं को संरेखण में लाया जाता है।
आँकड़ों और आँकड़ों के अनुप्रयोगों में, सामान्यीकरण के कई अर्थ हो सकते हैं।<ref name=Dodge/> सरलतम स्थितियों में, रेटिंग के सामान्यीकरण का अर्थ है विभिन्न पैमानों पर मापे गए मानों को सामान्य रूप से सामान्य पैमाने पर समायोजित करना, अधिकांशतः औसत से पहले इसे समायोजित कर लिया जाता हैं। अधिक जटिल स्थितियों में, सामान्यीकरण अधिक परिष्कृत समायोजन को संदर्भित कर सकता है जहां समायोजित मूल्यों के संपूर्ण संभावना वितरण को संरेखण में लाने का आशय है। शैक्षिक मूल्यांकन में अंकों के सामान्यीकरण के स्थिति में, वितरण को [[ सामान्य वितरण |सामान्य वितरण]] के साथ संरेखित करने का आशय हो सकता है। संभाव्यता वितरण के सामान्यीकरण के लिए अलग दृष्टिकोण [[ [[ मात्रा |मात्रा]] त्मक सामान्यीकरण ]] है, जहां विभिन्न उपायों की मात्राओं को संरेखण में लाया जाता है।


आँकड़ों में एक अन्य उपयोग में, सामान्यीकरण आँकड़ों के स्थानांतरित और स्केल किए गए संस्करणों के निर्माण को संदर्भित करता है, जहाँ आशय यह है कि ये सामान्यीकृत मान विभिन्न डेटासेट के लिए सामान्यीकृत मूल्यों की तुलना की अनुमति देते हैं, जो कुछ सकल प्रभावों के प्रभाव को समाप्त करता है, जैसा कि एक [[ विसंगति समय श्रृंखला ]] में। कुछ आकार चर के सापेक्ष मूल्यों पर पहुंचने के लिए कुछ प्रकार के सामान्यीकरण में केवल एक पुनर्संरचना शामिल होती है। [[ माप के स्तर ]]ों के संदर्भ में, ऐसे अनुपात केवल ''अनुपात'' मापन के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), न कि ''अंतराल'' माप (जहां केवल दूरियां अर्थपूर्ण हैं, लेकिन अनुपात नहीं)।
आँकड़ों में अन्य उपयोग में, सामान्यीकरण आँकड़ों के स्थानांतरित और स्केल किए गए संस्करणों के निर्माण को संदर्भित करता है, जहाँ आशय यह है कि ये सामान्यीकृत मान विभिन्न डेटासेट के लिए सामान्यीकृत मूल्यों की तुलना की अनुमति देते हैं, जो कुछ सकल प्रभावों के प्रभाव को समाप्त करता है, जैसा कि [[ विसंगति समय श्रृंखला |विसंगति समय श्रृंखला]] में। कुछ आकार चर के सापेक्ष मूल्यों पर पहुंचने के लिए कुछ प्रकार के सामान्यीकरण में केवल पुनर्संरचना सम्मलित होती है। [[ माप के स्तर |माप के स्तर]] के संदर्भ में, ऐसे अनुपात केवल ''अनुपात'' मापन के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), न कि ''अंतराल'' माप (जहां केवल दूरियां अर्थपूर्ण हैं, लेकिन अनुपात नहीं)।


सैद्धांतिक आँकड़ों में, पैरामीट्रिक सामान्यीकरण अक्सर [[ निर्णायक मात्रा ]] में ले जा सकता है - ऐसे कार्य जिनके नमूना वितरण मापदंडों पर निर्भर नहीं होते हैं - और सहायक आँकड़ों के लिए - महत्वपूर्ण मात्राएँ जो बिना मापदंडों को जाने, टिप्पणियों से गणना की जा सकती हैं।
सैद्धांतिक आँकड़ों में, पैरामीट्रिक सामान्यीकरण अधिकांशतः [[ निर्णायक मात्रा |निर्णायक मात्रा]] में ले जा सकता है - ऐसे कार्य जिनके नमूना वितरण मापदंडों पर निर्भर नहीं होते हैं - और सहायक आँकड़ों के लिए - महत्वपूर्ण मात्राएँ जो बिना मापदंडों को जाने, टिप्पणियों से गणना की जा सकती हैं।


== उदाहरण ==
== उदाहरण ==
आँकड़ों में विभिन्न प्रकार के सामान्यीकरण हैं - त्रुटियों, अवशिष्टों, साधनों और [[ मानक विचलन ]] के गैर-आयामी अनुपात, जो कि [[ स्केल अपरिवर्तनीय ]] हैं - जिनमें से कुछ को निम्नानुसार संक्षेपित किया जा सकता है। ध्यान दें कि माप के स्तरों के संदर्भ में, ये अनुपात केवल अनुपात माप के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), अंतराल माप नहीं (जहां केवल दूरी सार्थक हैं, लेकिन अनुपात नहीं)। यह भी देखें :श्रेणी:सांख्यिकीय अनुपात।
आँकड़ों में विभिन्न प्रकार के सामान्यीकरण हैं - त्रुटियों, अवशिष्टों, साधनों और [[ मानक विचलन |मानक विचलन]] के गैर-आयामी अनुपात, जो कि [[ स्केल अपरिवर्तनीय |स्केल अपरिवर्तनीय]] हैं - जिनमें से कुछ को निम्नानुसार संक्षेपित किया जा सकता है। ध्यान दें कि माप के स्तरों के संदर्भ में, ये अनुपात केवल अनुपात माप के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), अंतराल माप नहीं (जहां केवल दूरी सार्थक हैं, लेकिन अनुपात नहीं)। यह भी देखें :श्रेणी:सांख्यिकीय अनुपात।
{| class="wikitable"
{| class="wikitable"
! Name !!  Formula !! Use
! नाम !!  सूत्र !! उपयोग
|-
|-
| [[Standard score]] || <math>\frac{X - \mu}{\sigma}</math> || Normalizing errors when population parameters are known. Works well for populations that are [[normal distribution|normally distributed]]<ref>{{Cite book|url=https://books.google.com/books?id=mviJQgAACAAJ|title=Statistics: Fourth International Student Edition|last1=Freedman|first1=David|last2=Pisani|first2=Robert|last3=Purves|first3=Roger|date=2007-02-20|publisher=W.W. Norton & Company|isbn=9780393930436|language=en}}</ref>
| [[Standard score|मानक प्राप्तांक]] || <math>\frac{X - \mu}{\sigma}</math> || जनसंख्या पैरामीटर ज्ञात होने पर त्रुटियों को सामान्य करना। सामान्य रूप से वितरित आबादी के लिए अच्छी तरह से काम करता है।<ref>{{Cite book|url=https://books.google.com/books?id=mviJQgAACAAJ|title=Statistics: Fourth International Student Edition|last1=Freedman|first1=David|last2=Pisani|first2=Robert|last3=Purves|first3=Roger|date=2007-02-20|publisher=W.W. Norton & Company|isbn=9780393930436|language=en}}</ref>
|-
|-
| [[Student's t-statistic]] ||  <math>\frac{\widehat\beta - \beta_0}{\operatorname{s.e.}(\widehat\beta)}</math> || the departure of the estimated value of a parameter from its hypothesized value, normalized by its standard error.
| [[Student's t-statistic|विद्यार्थी का टी-सांख्यिकी]] ||  <math>\frac{\widehat\beta - \beta_0}{\operatorname{s.e.}(\widehat\beta)}</math> || इसकी मानक त्रुटि द्वारा सामान्यीकृत, इसके परिकल्पित मूल्य से एक पैरामीटर के अनुमानित मूल्य का प्रस्थान करता है।
|-
|-
| [[Studentized residual]] || <math>\frac{\hat \varepsilon_i}{\hat \sigma_i} = \frac{X_i - \hat \mu_i}{\hat \sigma_i}</math> || Normalizing residuals when parameters are estimated, particularly across different data points in [[regression analysis]].
| [[Studentized residual|विद्यार्थी अवशिष्ट]] || <math>\frac{\hat \varepsilon_i}{\hat \sigma_i} = \frac{X_i - \hat \mu_i}{\hat \sigma_i}</math> || जब मापदंडों का अनुमान लगाया जाता है, तो अवशेषों को सामान्य करना, विशेष रूप से प्रतिगमन विश्लेषण में विभिन्न डेटा बिंदुओं पर केंद्रित रहता है।
|-
|-
| [[Standardized moment]] || <math>\frac{\mu_k}{\sigma^k}</math> || Normalizing moments, using the standard deviation <math>\sigma</math> as a measure of scale.
| [[Standardized moment|मानकीकृत क्षण]] || <math>\frac{\mu_k}{\sigma^k}</math> || मानक विचलन का उपयोग करते हुए क्षणों को <math>\sigma</math> पैमाने के उपाय के रूप में सामान्य करना ।
|-
|-
| [[Coefficient of variation|Coefficient of<br> variation]] || <math>\frac{\sigma}{\mu}</math>  || Normalizing dispersion, using the mean <math>\mu</math> as a measure of scale, particularly for positive distribution such as the [[exponential distribution]] and [[Poisson distribution]].
| [[Coefficient of variation|का गुणांक]]
[[Coefficient of variation|उतार-चढ़ाव]]
| <math>\frac{\sigma}{\mu}</math>  || माध्य का उपयोग करते हुए फैलाव को सामान्य करना <math>\mu</math> पैमाने के एक उपाय के रूप में, विशेष रूप से सकारात्मक वितरण जैसे कि घातीय वितरण और पॉसॉन वितरण के लिए।
|-  
|-  
| [[Feature scaling#Rescaling_(min-max_normalization)|Min-max feature scaling]]  ||<math>X' = \frac{X - X_{\min}}{X_{\max} - X_{\min}}</math>  || [[Feature scaling]] is used to bring all values into the range [0,1]. This is also called unity-based normalization. This can be generalized to restrict the range of values in the dataset between any arbitrary points <math> a </math> and <math> b </math>, using for example <math> X' = a + \frac{\left(X-X_{\min}\right)\left(b-a\right)}{X_{\max} - X_{\min}} </math>.
| [[Feature scaling#Rescaling_(min-max_normalization)|न्यूनतम-अधिकतम सुविधा स्केलिंग]]  ||<math>X' = \frac{X - X_{\min}}{X_{\max} - X_{\min}}</math>  || फ़ीचर स्केलिंग का उपयोग सभी मानों को [0,1] श्रेणी में लाने के लिए किया जाता है। इसे एकता-आधारित सामान्यीकरण भी कहा जाता है। इसे किसी भी स्वैच्छिक बिंदुओं के बीच डेटासेट में मानों की श्रेणी को प्रतिबंधित करने के लिए <math> a </math> और <math> b </math> को सामान्यीकृत किया जा सकता है , उदाहरण के लिए
<math> X' = a + \frac{\left(X-X_{\min}\right)\left(b-a\right)}{X_{\max} - X_{\min}} </math>.
|-
|-
|}
|}
ध्यान दें कि कुछ अन्य अनुपात, जैसे भिन्नता-से-माध्य अनुपात <math display="inline">\left(\frac{\sigma^2}{\mu}\right)</math>, सामान्यीकरण के लिए भी किया जाता है, लेकिन गैर-आयामी नहीं हैं: इकाइयां रद्द नहीं होती हैं, और इस प्रकार अनुपात में इकाइयां होती हैं, और यह स्केल-इनवेरिएंट नहीं है।
ध्यान दें कि कुछ अन्य अनुपात, जैसे भिन्नता-से-माध्य अनुपात <math display="inline">\left(\frac{\sigma^2}{\mu}\right)</math>, सामान्यीकरण के लिए भी किया जाता है, लेकिन गैर-आयामी नहीं हैं: इकाइयां नष्ट नहीं होती हैं, और इस प्रकार अनुपात में इकाइयां होती हैं, और यह स्केल-इनवेरिएंट नहीं है।


== अन्य प्रकार ==
== अन्य प्रकार ==
अन्य गैर-आयामी सामान्यीकरण जिनका उपयोग वितरण पर बिना किसी धारणा के किया जा सकता है:
अन्य गैर-आयामी सामान्यीकरण जिनका उपयोग वितरण पर बिना किसी धारणा के किया जा सकता है:
* [[ प्रतिशतक ]]ों का असाइनमेंट। यह मानकीकृत परीक्षणों पर आम है। मात्रात्मक सामान्यीकरण भी देखें।
* [[ प्रतिशतक ]]का असाइनमेंट। यह मानकीकृत परीक्षणों पर सरल है। मात्रात्मक सामान्यीकरण भी देखें।
* स्थिरांकों को जोड़कर और/या गुणा करके सामान्यीकरण इसलिए मान 0 और 1 के बीच आते हैं। इसका उपयोग संभाव्यता घनत्व समारोह के लिए किया जाता है, जैसे कि भौतिक रसायन विज्ञान जैसे क्षेत्रों में संभावनाओं को निर्दिष्ट करने के लिए। {{math|{{abs|''ψ''}}<sup>2</sup>}}.
* स्थिरांकों को जोड़कर और/या गुणा करके सामान्यीकरण इसलिए मान 0 और 1 के बीच आते हैं। इसका उपयोग संभाव्यता घनत्व समारोह के लिए किया जाता है, जैसे कि भौतिक रसायन विज्ञान जैसे क्षेत्रों में संभावनाओं को {{math|{{abs|''ψ''}}<sup>2</sup>}} द्वारा निर्दिष्ट करने के लिए उपयोग किया जाता हैं।


== यह भी देखें ==
== यह भी देखें ==
Line 47: Line 49:
}}
}}


[[Category:सांख्यिकीय अनुपात]][[श्रेणी:सांख्यिकीय डेटा परिवर्तन]][[श्रेणी: तुल्यता (गणित)]]
[[Category:सांख्यिकीय अनुपात]]
 
 
[[Category: Machine Translated Page]]
[[Category: Machine Translated Page]]
[[Category:Created On 05/01/2023]]
[[Category:Created On 05/01/2023]]

Revision as of 00:31, 18 January 2023

आँकड़ों और आँकड़ों के अनुप्रयोगों में, सामान्यीकरण के कई अर्थ हो सकते हैं।[1] सरलतम स्थितियों में, रेटिंग के सामान्यीकरण का अर्थ है विभिन्न पैमानों पर मापे गए मानों को सामान्य रूप से सामान्य पैमाने पर समायोजित करना, अधिकांशतः औसत से पहले इसे समायोजित कर लिया जाता हैं। अधिक जटिल स्थितियों में, सामान्यीकरण अधिक परिष्कृत समायोजन को संदर्भित कर सकता है जहां समायोजित मूल्यों के संपूर्ण संभावना वितरण को संरेखण में लाने का आशय है। शैक्षिक मूल्यांकन में अंकों के सामान्यीकरण के स्थिति में, वितरण को सामान्य वितरण के साथ संरेखित करने का आशय हो सकता है। संभाव्यता वितरण के सामान्यीकरण के लिए अलग दृष्टिकोण [[ मात्रा त्मक सामान्यीकरण ]] है, जहां विभिन्न उपायों की मात्राओं को संरेखण में लाया जाता है।

आँकड़ों में अन्य उपयोग में, सामान्यीकरण आँकड़ों के स्थानांतरित और स्केल किए गए संस्करणों के निर्माण को संदर्भित करता है, जहाँ आशय यह है कि ये सामान्यीकृत मान विभिन्न डेटासेट के लिए सामान्यीकृत मूल्यों की तुलना की अनुमति देते हैं, जो कुछ सकल प्रभावों के प्रभाव को समाप्त करता है, जैसा कि विसंगति समय श्रृंखला में। कुछ आकार चर के सापेक्ष मूल्यों पर पहुंचने के लिए कुछ प्रकार के सामान्यीकरण में केवल पुनर्संरचना सम्मलित होती है। माप के स्तर के संदर्भ में, ऐसे अनुपात केवल अनुपात मापन के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), न कि अंतराल माप (जहां केवल दूरियां अर्थपूर्ण हैं, लेकिन अनुपात नहीं)।

सैद्धांतिक आँकड़ों में, पैरामीट्रिक सामान्यीकरण अधिकांशतः निर्णायक मात्रा में ले जा सकता है - ऐसे कार्य जिनके नमूना वितरण मापदंडों पर निर्भर नहीं होते हैं - और सहायक आँकड़ों के लिए - महत्वपूर्ण मात्राएँ जो बिना मापदंडों को जाने, टिप्पणियों से गणना की जा सकती हैं।

उदाहरण

आँकड़ों में विभिन्न प्रकार के सामान्यीकरण हैं - त्रुटियों, अवशिष्टों, साधनों और मानक विचलन के गैर-आयामी अनुपात, जो कि स्केल अपरिवर्तनीय हैं - जिनमें से कुछ को निम्नानुसार संक्षेपित किया जा सकता है। ध्यान दें कि माप के स्तरों के संदर्भ में, ये अनुपात केवल अनुपात माप के लिए मायने रखते हैं (जहां माप के अनुपात अर्थपूर्ण हैं), अंतराल माप नहीं (जहां केवल दूरी सार्थक हैं, लेकिन अनुपात नहीं)। यह भी देखें :श्रेणी:सांख्यिकीय अनुपात।

नाम सूत्र उपयोग
मानक प्राप्तांक जनसंख्या पैरामीटर ज्ञात होने पर त्रुटियों को सामान्य करना। सामान्य रूप से वितरित आबादी के लिए अच्छी तरह से काम करता है।[2]
विद्यार्थी का टी-सांख्यिकी इसकी मानक त्रुटि द्वारा सामान्यीकृत, इसके परिकल्पित मूल्य से एक पैरामीटर के अनुमानित मूल्य का प्रस्थान करता है।
विद्यार्थी अवशिष्ट जब मापदंडों का अनुमान लगाया जाता है, तो अवशेषों को सामान्य करना, विशेष रूप से प्रतिगमन विश्लेषण में विभिन्न डेटा बिंदुओं पर केंद्रित रहता है।
मानकीकृत क्षण मानक विचलन का उपयोग करते हुए क्षणों को पैमाने के उपाय के रूप में सामान्य करना ।
का गुणांक

उतार-चढ़ाव

माध्य का उपयोग करते हुए फैलाव को सामान्य करना पैमाने के एक उपाय के रूप में, विशेष रूप से सकारात्मक वितरण जैसे कि घातीय वितरण और पॉसॉन वितरण के लिए।
न्यूनतम-अधिकतम सुविधा स्केलिंग फ़ीचर स्केलिंग का उपयोग सभी मानों को [0,1] श्रेणी में लाने के लिए किया जाता है। इसे एकता-आधारित सामान्यीकरण भी कहा जाता है। इसे किसी भी स्वैच्छिक बिंदुओं के बीच डेटासेट में मानों की श्रेणी को प्रतिबंधित करने के लिए और को सामान्यीकृत किया जा सकता है , उदाहरण के लिए

.

ध्यान दें कि कुछ अन्य अनुपात, जैसे भिन्नता-से-माध्य अनुपात , सामान्यीकरण के लिए भी किया जाता है, लेकिन गैर-आयामी नहीं हैं: इकाइयां नष्ट नहीं होती हैं, और इस प्रकार अनुपात में इकाइयां होती हैं, और यह स्केल-इनवेरिएंट नहीं है।

अन्य प्रकार

अन्य गैर-आयामी सामान्यीकरण जिनका उपयोग वितरण पर बिना किसी धारणा के किया जा सकता है:

  • प्रतिशतक का असाइनमेंट। यह मानकीकृत परीक्षणों पर सरल है। मात्रात्मक सामान्यीकरण भी देखें।
  • स्थिरांकों को जोड़कर और/या गुणा करके सामान्यीकरण इसलिए मान 0 और 1 के बीच आते हैं। इसका उपयोग संभाव्यता घनत्व समारोह के लिए किया जाता है, जैसे कि भौतिक रसायन विज्ञान जैसे क्षेत्रों में संभावनाओं को |ψ|2 द्वारा निर्दिष्ट करने के लिए उपयोग किया जाता हैं।

यह भी देखें

संदर्भ

  1. Dodge, Y (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9 (entry for normalization of scores)
  2. Freedman, David; Pisani, Robert; Purves, Roger (2007-02-20). Statistics: Fourth International Student Edition (in English). W.W. Norton & Company. ISBN 9780393930436.