स्टेम-और-लीफ डिस्प्ले: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 2: Line 2:
[[File:stemplot_primes.svg|thumb|upright=0.5|100 से कम की [[अभाज्य संख्या]]ओं का तना-और-पत्ती आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं]]
[[File:stemplot_primes.svg|thumb|upright=0.5|100 से कम की [[अभाज्य संख्या]]ओं का तना-और-पत्ती आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं]]


स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के [[आकार]] को देखने में सहायता के लिए [[हिस्टोग्राम]] के समान ग्राफिकल प्रारूप में [[मात्रात्मक डेटा]] प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में [[आर्थर बाउली]] के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर [[जॉन तुकी]] की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।<ref>{{Cite book
'''स्टेम-एंड-लीफ डिस्प्ले''' या स्टेम-एंड-लीफ प्लॉट वितरण के [[आकार]] को देखने में सहायता के लिए [[हिस्टोग्राम]] के समान ग्राफिकल प्रारूप में [[मात्रात्मक डेटा]] प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में [[आर्थर बाउली]] के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर [[जॉन तुकी]] की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।<ref>{{Cite book
| edition = 1
| edition = 1
| publisher = Pearson
| publisher = Pearson

Revision as of 22:46, 12 July 2023

100 से कम की अभाज्य संख्याओं का तना-और-पत्ती आलेख दर्शाता है कि सबसे अधिक बार आने वाले दहाई अंक 0 और 1 हैं जबकि सबसे कम 9 हैं

स्टेम-एंड-लीफ डिस्प्ले या स्टेम-एंड-लीफ प्लॉट वितरण के आकार को देखने में सहायता के लिए हिस्टोग्राम के समान ग्राफिकल प्रारूप में मात्रात्मक डेटा प्रस्तुत करने के लिए उपकरण है, वे 1900 दशक के प्रारंभ में आर्थर बाउली के कार्य से विकसित हुए, और शोधपूर्ण डेटा विश्लेषण पर जॉन तुकी की पुस्तक के प्रकाशन के पश्चात 1980 के दशक में स्टैम्पलॉट्स का अधिक उपयोग किया जाने लगा। उन वर्षों के समय लोकप्रियता उनके मोनोस्पेस्ड (टाइपराइटर) टाइपस्टाइल के उपयोग के कारण है जिसने उस समय की कंप्यूटर तकनीक को सरलता से ग्राफिक्स का उत्पादन करने की अनुमति दी थी।[1] आधुनिक कंप्यूटरों की उत्तम ग्राफ़िक क्षमताओं का तात्पर्य है कि इन तकनीकों का उपयोग कम किया जाता है।

इस कथानक को ऑक्टेव और R में क्रियान्वित किया गया है।[2][3]स्टेम-एंड-लीफ प्लॉट को स्टेमप्लॉट भी कहा जाता है, किंतु पश्चात वाला शब्द प्रायः दूसरे चार्ट प्रकार को संदर्भित करता है। साधारण स्टेम प्लॉट सामान्य x अक्ष पर y मानों के मैट्रिक्स को प्लॉट करने और ऊर्ध्वाधर रेखा के साथ सामान्य x मान की पहचान करने और रेखा पर प्रतीकों के साथ व्यक्तिगत y मानों की पहचान करने का उल्लेख कर सकता है।[4]

हिस्टोग्राम के विपरीत, स्टेम-एंड-लीफ डिस्प्ले मूल डेटा को कम से कम दो महत्वपूर्ण अंकों तक बनाए रखता है, और डेटा को क्रम में रखता है, जिससे ऑर्डर-आधारित अनुमान और गैर-पैरामीट्रिक आंकड़ों की ओर चरण सरल हो जाता है।

निर्माण

स्टेम-एंड-लीफ डिस्प्ले का निर्माण करने के लिए, अवलोकनों को पहले आरोही क्रम में क्रमबद्ध किया जाना चाहिए: यह सबसे सरलता से किया जा सकता है यदि बिना क्रमबद्ध लीफ के साथ स्टेम-एंड-लीफ डिस्प्ले का उपाय बनाकर हाथ से कार्य किया जाए, फिर क्रमबद्ध किया जाए अंतिम स्टेम-एंड-लीफ डिस्प्ले करने के लिए लीफ यहां डेटा मानों का क्रमबद्ध सेट दिया गया है जिसका उपयोग निम्नलिखित उदाहरण में किया जाएगा:

44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

इसके पश्चात, यह निर्धारित किया जाना चाहिए कि स्टेम क्या प्रतिनिधित्व करेंगे और लीफ क्या प्रतिनिधित्व करेंगी। सामान्यतः, लीफ में संख्या का अंतिम अंक होता है और स्टेम में अन्य सभी अंक होते हैं। अधिक बड़ी संख्याओं की स्तिथि में, डेटा मानों को विशेष स्थानीय मान (जैसे सैकड़ों स्थान) पर पूर्णांकित किया जा सकता है जिसका उपयोग लीफ के लिए किया जाएगा। गोलाकार स्थानीय मान के बाईं ओर के शेष अंक स्टेम के रूप में उपयोग किए जाते हैं।

इस उदाहरण में, लीफ इकाई के स्थान का प्रतिनिधित्व करती है और स्टेम शेष संख्या (दस के स्थान और उच्चतर) का प्रतिनिधित्व करेगा।

स्टेम-एंड-लीफ डिस्प्ले ऊर्ध्वाधर रेखा द्वारा भिन्न किए गए दो स्तंभों के साथ खींचा गया है। स्टेम ऊर्ध्वाधर रेखा के बाईं ओर सूचीबद्ध हैं। यह महत्वपूर्ण है कि प्रत्येक स्टेम को केवल एक बार सूचीबद्ध किया जाए और कोई भी संख्या न छोड़ी जाए, भले ही इसका तात्पर्य यह हो कि कुछ स्टेम में लीफ नहीं हैं। लीफ प्रत्येक स्टेम के दाईं ओर पंक्ति में बढ़ते क्रम में सूचीबद्ध हैं।

यह ध्यान रखना महत्वपूर्ण है कि जब डेटा में कोई संख्या दोहराई जाती है (जैसे कि दो 72) तो प्लॉट को उसे प्रतिबिंबित करना चाहिए (इसलिए प्लॉट 7 2 2 5 6 7 जैसा दिखेगा जब इसमें संख्याएं 72 72 75 76 होंगी) 77)।

की:
लीफ इकाई: 1.0
स्टेम इकाई: 10.0

स्टेम-एंड-लीफ डिस्प्ले बनाने के लिए गोलाई की आवश्यकता हो सकती है। डेटा के निम्नलिखित सेट के आधार पर, नीचे दिया गया स्टेम प्लॉट बनाया जाएगा:

−23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

ऋणात्मक संख्याओं के लिए, स्टेम इकाई के सामने ऋणात्मक रखा जाता है, जो अभी भी मान X/10 है। अपूर्णांकों को गोल किया जाता है। इससे स्टेम-एंड-लीफ डिस्प्ले के प्लॉट को अपना आकार बनाए रखने की अनुमति मिली, यहां तक ​​कि अधिक जटिल डेटा सेट के लिए भी जैसा कि नीचे दिए गए इस उदाहरण में है:

चाबी:

उपयोग

स्टेम-एंड-लीफ डिस्प्ले डेटा के सापेक्ष घनत्व और आकार को प्रदर्शित करने के लिए उपयोगी होते हैं, जिससे पाठक को वितरण का त्वरित अवलोकन मिलता है। वे संख्यात्मक डेटा को (अधिकांश) बनाए रखते हैं, प्रायः पूर्ण अखंडता के साथ वे आउटलेर्स को हाइलाइट करने और मोड (सांख्यिकी) शोध के लिए भी उपयोगी हैं। चूँकि, स्टेम-एंड-लीफ डिस्प्ले केवल मध्यम आकार के डेटा सेट (लगभग 15-150 डेटा पॉइंट) के लिए उपयोगी हैं। अधिक छोटे डेटा सेट के साथ स्टेम-एंड-लीफ डिस्प्ले अधिक कम उपयोग का हो सकता है, क्योंकि निश्चित वितरण गुणों को स्थापित करने के लिए उचित संख्या में डेटा बिंदुओं की आवश्यकता होती है। ऐसे डेटा के लिए डॉट प्लॉट (सांख्यिकी) उत्तम उपयुक्त हो सकता है। अधिक बड़े डेटा सेट के साथ, स्टेम-एंड-लीफ डिस्प्ले अधिक अव्यवस्थित हो जाएगा, क्योंकि प्रत्येक डेटा बिंदु को संख्यात्मक रूप से दर्शाया जाना चाहिए। डेटा का आकार बढ़ने पर बॉक्स- प्लॉट या हिस्टोग्राम अधिक उपयुक्त हो सकता है।

असंख्यात्मक उपयोग

<पूर्व शैली= लाइन-ऊंचाई:0.9;मार्जिन:0;पैडिंग:0.5ex;ओवरफ्लो:छिपा हुआ;प्रदर्शन:इनलाइन-ब्लॉक;फ्लोट:दाएं; > a│abdeghilmnrstwxy b│aeioy सी│ह d│aeio e│adefhlmnrstwx च|अय g│iou h│aimo i│dfnost ज│आओ k│aioy l│aio m│aeimouy n│aeouy o│bdefhikmnoprsuwxy p│aeio क्यू│i र│ई s│hiot t│aeio u│ghmnprst वी│ w│eo x│iu y│aeou

z│aeo

स्टेम-एंड-लीफ डिस्प्ले का उपयोग गैर-संख्यात्मक जानकारी देने के लिए भी किया जा सकता है। कोलिन्स खरोंचना वर्ड्स (यूएस के बाहर स्क्रैबल टूर्नामेंट में उपयोग की जाने वाली शब्द सूची) में उनके प्रारंभी अक्षरों के साथ मान्य दो-अक्षर वाले शब्दों के इस उदाहरण में, यह सरलता से देखा जा सकता है कि तीन सबसे आम प्रारंभिक हैं o, a और e.[5]

{{{annotations}}}

Some railway timetables use stem-and-leaf displays with hours as stems and minutes as leaves

टिप्पणियाँ

  1. Tukey, John W. (1977). Exploratory Data Analysis (1 ed.). Pearson. ISBN 0-201-07616-0.
  2. Function in Octave
  3. Function in R
  4. Examples: MATLAB's and Matplotlib's stem functions. They do not create a stem-and-leaf display.
  5. Gideon Goldin, Two-Letter Scrabble Words Visualized as Stem and Leaf Plot, 2020-10-01


संदर्भ

  • Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference pp. 49–54 John Wiley and Sons. ISBN 0-471-32936-3
  • Elliott, Jane; Catherine Marsh (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists (2nd ed.). Polity Press. ISBN 0-7456-2282-8.