स्टेम-और-लीफ डिस्प्ले: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
[[File:stemplot_primes.svg|thumb|upright=0.5|100 से कम की [[अभाज्य संख्या]]ओं का तना-और-पत्ती आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं]] | [[File:stemplot_primes.svg|thumb|upright=0.5|100 से कम की [[अभाज्य संख्या]]ओं का तना-और-पत्ती आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं]] | ||
स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट | स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के [[आकार]] को देखने में सहायता के लिए [[हिस्टोग्राम]] के समान ग्राफिकल प्रारूप में [[मात्रात्मक डेटा]] प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में [[आर्थर बाउली]] के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर [[जॉन तुकी]] की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।<ref>{{Cite book | ||
| edition = 1 | | edition = 1 | ||
| publisher = Pearson | | publisher = Pearson | ||
Line 12: | Line 12: | ||
| url-access = registration | | url-access = registration | ||
| url = https://archive.org/details/exploratorydataa00tuke_0 | | url = https://archive.org/details/exploratorydataa00tuke_0 | ||
}}</ref> | }}</ref> आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है। | ||
इस कथानक को ऑक्टेव में क्रियान्वित किया गया | इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है।<ref>[https://octave.sourceforge.io/octave/function/stemleaf.html Function in Octave]</ref><ref>[https://www.rdocumentation.org/packages/graphics/versions/3.6.1/topics/stem Function in R]</ref>स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात वाला शब्द प्रायः दूसरे चार्ट प्रकार को संदर्भित करता है। साधारण स्टेम प्लॉट सामान्य ''x'' अक्ष पर ''y'' मानों के मैट्रिक्स को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य ''x'' मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत ''y'' मानों की पहचान करने का उल्लेख कर सकता है।<ref>Examples: [http://www.mathworks.com/help/matlab/ref/stem.html MATLAB's] and [http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.stem Matplotlib's] stem functions. They do ''not'' create a stem-and-leaf display.</ref> | ||
स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, | |||
हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और गैर-पैरामीट्रिक आंकड़ों की ओर | हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और गैर-पैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है। | ||
== निर्माण == | == निर्माण == | ||
स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को पहले आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध सेट दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा: | |||
: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106 | : 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106 | ||
इसके | इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं। | ||
इस उदाहरण में, | इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा। | ||
स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं। | |||
यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 | यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)। | ||
:<math> | :<math> | ||
Line 44: | Line 44: | ||
\end{array} | \end{array} | ||
</math> | </math> | ||
: | :की: <math>6 \mid 3 = 63</math> | ||
: | :लीफ इकाई: 1.0 | ||
:स्टेम | :स्टेम इकाई: 10.0 | ||
स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित सेट के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा: | |||
: −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8 | : −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8 | ||
ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने | ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक कि अधिक जटिल डेटा सेट के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है: | ||
:<math> | :<math> | ||
Line 72: | Line 72: | ||
== उपयोग == | == उपयोग == | ||
स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे | स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और [[मोड (सांख्यिकी)]] शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा सेट (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा सेट के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए [[डॉट प्लॉट (सांख्यिकी)]] उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा सेट के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर [[ रेखा - चित्र |बॉक्स- प्लॉट]] या हिस्टोग्राम अधिक उपयुक्त हो सकता है। | ||
== | ==असंख्यात्मक उपयोग== | ||
<पूर्व शैली= लाइन-ऊंचाई:0.9;मार्जिन:0;पैडिंग:0.5ex;ओवरफ्लो:छिपा हुआ;प्रदर्शन:इनलाइन-ब्लॉक;फ्लोट:दाएं; > | <पूर्व शैली= लाइन-ऊंचाई:0.9;मार्जिन:0;पैडिंग:0.5ex;ओवरफ्लो:छिपा हुआ;प्रदर्शन:इनलाइन-ब्लॉक;फ्लोट:दाएं; > | ||
a│abdeghilmnrstwxy | a│abdeghilmnrstwxy | ||
Line 102: | Line 102: | ||
y│aeou | y│aeou | ||
z│aeo</pre> | z│aeo</pre> | ||
स्टेम-एंड-लीफ डिस्प्ले का उपयोग गैर-संख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स [[ खरोंचना ]] वर्ड्स (यूएस के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में उनके | स्टेम-एंड-लीफ डिस्प्ले का उपयोग गैर-संख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स [[ खरोंचना ]] वर्ड्स (यूएस के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में उनके प्रारंभी अक्षरों के साथ मान्य दो-अक्षर वाले शब्दों के इस उदाहरण में, यह सरलता से देखा जा सकता है कि तीन सबसे आम [[प्रारंभिक]] हैं {{mono|o}}, {{mono|a}} और {{mono|e}}.<ref>Gideon Goldin, [http://gideongoldin.com/stem-leaf-plot-for-twoletter-scrabble-words ''Two-Letter Scrabble Words Visualized as Stem and Leaf Plot''], 2020-10-01</ref> | ||
{{Annotated image | {{Annotated image | ||
| image = Stem-and-leaf_time_tables_in_Japanese_train_stations.jpg | | image = Stem-and-leaf_time_tables_in_Japanese_train_stations.jpg |
Revision as of 22:46, 12 July 2023
स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के आकार को देखने में सहायता के लिए हिस्टोग्राम के समान ग्राफिकल प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में आर्थर बाउली के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।[1] आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है।
इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है।[2][3]स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात वाला शब्द प्रायः दूसरे चार्ट प्रकार को संदर्भित करता है। साधारण स्टेम प्लॉट सामान्य x अक्ष पर y मानों के मैट्रिक्स को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत y मानों की पहचान करने का उल्लेख कर सकता है।[4]
हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और गैर-पैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है।
निर्माण
स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को पहले आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध सेट दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:
- 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106
इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।
इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।
स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।
यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)।
- की:
- लीफ इकाई: 1.0
- स्टेम इकाई: 10.0
स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित सेट के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:
- −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8
ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक कि अधिक जटिल डेटा सेट के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है:
- चाबी:
उपयोग
स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा सेट (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा सेट के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए डॉट प्लॉट (सांख्यिकी) उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा सेट के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर बॉक्स- प्लॉट या हिस्टोग्राम अधिक उपयुक्त हो सकता है।
असंख्यात्मक उपयोग
<पूर्व शैली= लाइन-ऊंचाई:0.9;मार्जिन:0;पैडिंग:0.5ex;ओवरफ्लो:छिपा हुआ;प्रदर्शन:इनलाइन-ब्लॉक;फ्लोट:दाएं; > a│abdeghilmnrstwxy b│aeioy सी│ह d│aeio e│adefhlmnrstwx च|अय g│iou h│aimo i│dfnost ज│आओ k│aioy l│aio m│aeimouy n│aeouy o│bdefhikmnoprsuwxy p│aeio क्यू│i र│ई s│hiot t│aeio u│ghmnprst वी│ w│eo x│iu y│aeou
z│aeo
स्टेम-एंड-लीफ डिस्प्ले का उपयोग गैर-संख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स खरोंचना वर्ड्स (यूएस के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में उनके प्रारंभी अक्षरों के साथ मान्य दो-अक्षर वाले शब्दों के इस उदाहरण में, यह सरलता से देखा जा सकता है कि तीन सबसे आम प्रारंभिक हैं o, a और e.[5]
टिप्पणियाँ
- ↑ Tukey, John W. (1977). Exploratory Data Analysis (1 ed.). Pearson. ISBN 0-201-07616-0.
- ↑ Function in Octave
- ↑ Function in R
- ↑ Examples: MATLAB's and Matplotlib's stem functions. They do not create a stem-and-leaf display.
- ↑ Gideon Goldin, Two-Letter Scrabble Words Visualized as Stem and Leaf Plot, 2020-10-01
संदर्भ
- Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3
- Elliott, Jane; Catherine Marsh (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists (2nd ed.). Polity Press. ISBN 0-7456-2282-8.