चतुर्थांश

From Vigyanwiki

सांख्यिकी में, चतुर्थांश एक प्रकार का परिमाण है जो अधिक-या-कम समान आकार का दत्तानुसारी बिन्दु की संख्या को चार भागों में विभाजित करता है, या 'तिमाही', है। चतुर्थांश की गणना करने के लिए आँकड़े को सबसे छोटे से सबसे बड़े क्रम में क्रमबद्ध किया जाना चाहिए; इस प्रकार, चतुर्थांश क्रम सांख्यिकी का एक रूप है। तीन मुख्य चतुर्थांश इस प्रकार हैं:

  • पहला चतुर्थांश (Q1) को सबसे छोटी संख्या (नमूना न्यूनतम) और आँकड़ा समुच्चय के माध्यिका के बीच की मध्य संख्या के रूप में परिभाषित किया गया है। इसे निम्न या 25वें अनुभवजन्य चतुर्थांश के रूप में भी जाना जाता है, क्योंकि 25% आँकड़े इस बिंदु से नीचे है।
  • दूसरा चतुर्थांश (Q2) आँकड़ा समुच्चय का माध्यिका है; इस प्रकार 50% आँकड़े इस बिंदु के नीचे स्थित है।
  • तीसरा चतुर्थांश (Q3) माध्यिका और आँकड़ा समुच्चय के उच्चतम मान (नमूना अधिकतम और न्यूनतम) के बीच का मध्य मान है। इसे ऊपरी या 75वें अनुभवजन्य चतुर्थांश के रूप में जाना जाता है, क्योंकि 75% आँकड़े इस बिंदु के नीचे स्थित है।[1]

न्यूनतम और अधिकतम आँकड़े (जो चतुर्थांश भी हैं) के साथ, ऊपर वर्णित तीन चतुर्थांश आँकड़े का पांच-संख्या सारांश प्रदान करते हैं। यह सारांश आँकड़ों में महत्वपूर्ण है क्योंकि यह माध्य (सांख्यिकी) और आँकड़े के सांख्यिकीय प्रसार दोनों के बारे में जानकारी प्रदान करता है। यदि आँकड़ा समुच्चय एक तरफ तिरछा है तो निचले और ऊपरी चतुर्थांश को जानने से इस बात की जानकारी मिलती है कि प्रसार कितना बड़ा है । चूँकि चतुर्थांश दत्तानुसारी बिन्दु की संख्या को समान रूप से विभाजित करते हैं, श्रेणी (सांख्यिकी) चतुर्थांश (अर्थात्, Q3-Q2Q2-Q1) के बीच समान नहीं होती है। और इसके बजाय अन्तःचतुर्थक श्रेणी (आईक्यूआर) के रूप में जाना जाता है। जबकि अधिकतम और न्यूनतम भी आँकड़े के प्रसार को दिखाते हैं, आँकड़े में पुरान्त:शायी की उपस्थिति, और मध्य 50% के बीच प्रसार में अंतर आँकड़े और पुरान्त:शायी दत्तानुसारी बिन्दु ऊपरी और निचले चतुर्थांश विशिष्ट दत्तानुसारी बिन्दु के स्थान पर अधिक विस्तृत जानकारी प्रदान कर सकते हैं।[2]

परिभाषाएँ

रेखा - चित्र (चतुर्थांश और एक अन्तःचतुर्थक श्रेणी के साथ) और एक सामान्य N(0,1σ) का प्रायिकता घनत्व फलन (pdf)2) आबादी
प्रतीक नाम परिभाषा
Q1
  • पहला चतुर्थक

निम्न चतुर्थांश 25 वाँ प्रतिशतक

सबसे कम 25% डेटा को उच्चतम 75% से अलग करता है
Q2
डेटा सेट को आधा कर देता है
Q3 तीसरा चतुर्थक

ऊपरी चतुर्थक

75 वाँ प्रतिशतक

उच्चतम 25% डेटा को निम्नतम 75% से विभाजित करता है

कंप्यूटिंग के तरीके

असतत वितरण

असतत वितरण के लिए, चतुर्थांश मानो के चयन पर कोई सार्वभौमिक सहमति नहीं है।[3]

विधि 1

  1. क्रमित आँकड़ा समुच्चय को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
    • यदि मूल क्रमित आँकड़ा समुच्चय में विषम संख्या में दत्तानुसारी बिन्दु हैं, तो माध्यिका (क्रमित सूची में केंद्रीय मान) को आधे में सम्मिलित न करें।
    • यदि मूल क्रमित आँकड़ा समुच्चय में दत्तानुसारी बिन्दु की संख्या सम है, तो इस आँकड़ा समुच्चय को ठीक आधे में विभाजित करें।
  2. निचला चतुर्थांश मान आँकड़े के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थांश मान आँकड़े के ऊपरी आधे हिस्से का माध्यिका है।

यह नियम टीआई-83 कैलकुलेटर बॉक्सप्लॉट और 1-वार स्टैट्स फ़ंक्शंस द्वारा नियोजित है।

विधि 2

  1. क्रमित आँकड़ा समुच्चय को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
    • यदि मूल क्रमित आँकड़ा समुच्चय में विषम संख्या में दत्तानुसारी बिन्दु हैं, तो दोनों हिस्सों में माध्यिका (क्रमित सूची में केंद्रीय मान) सम्मिलित करें।
    • यदि मूल क्रमित आँकड़ा समुच्चय में सम संख्या में दत्तानुसारी बिन्दु हैं, तो इस आँकड़ा समुच्चय को ठीक आधे में विभाजित करें।
  2. निचला चतुर्थांश मान आँकड़े के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थांश मान आँकड़े के ऊपरी आधे हिस्से का माध्यिका है।

इस पद्धति द्वारा प्राप्त मानो को जॉन टुकी के हिंज के रूप में भी जाना जाता है;[4] मिडहिन्ज भी देखें।

विधि 3

  1. यदि दत्तानुसारी बिन्दु की संख्या सम है, तो विधि 3 उपरोक्त विधि 1 या विधि 2 के समान ही प्रारम्भ होती है और आप माध्यिका को दत्तानुसारी बिन्दु के रूप में सम्मिलित करना या न करना चुन सकते हैं। यदि आप माध्यिका को नए दत्तानुसारी बिन्दु के रूप में सम्मिलित करना चुनते हैं, तो विधि 3 के चरण 2 या 3 पर आगे बढ़ें क्योंकि अब आपके पास विषम संख्या में दत्तानुसारी बिन्दु हैं।
  2. यदि (4n+1) दत्तानुसारी बिन्दु हैं, तो निचला चतुर्थांश n वें आँकड़े मान का 25% और (n+1)वें आँकड़े मान का 75% है; ऊपरी चतुर्थांश (3n+1)वें दत्तानुसारी बिन्दु का 75% और (3n+2)वें दत्तानुसारी बिन्दु का 25% है।
  3. यदि (4n+3) दत्तानुसारी बिन्दु हैं, तो निम्न चतुर्थांश (n+1)वें आँकड़े मान का 75% और (n+2)वें आँकड़े मान का 25% है; ऊपरी चतुर्थांश (3n+2)वें दत्तानुसारी बिन्दु का 25% और (3n+3)वें दत्तानुसारी बिन्दु का 75% है।

विधि 4

अगर हमारे पास क्रमित आँकड़ा समुच्चय है , हम अंतर्वेशन के लिए दत्तानुसारी बिन्दु के बीच प्रक्षेपित कर सकते हैं वें अनुभवजन्य चतुर्थांश यदि में है चतुर्थांश हैं। यदि हम किसी संख्या के पूर्णांक भाग को निरूपित करते हैं द्वारा , तो अनुभवजन्य चतुर्थांश फलन द्वारा दिया जाता है,

,

जहाँ और .[1]

आँकड़ा समुच्चय के पहले, दूसरे और तीसरे चतुर्थांश को खोजने के लिए , , और क्रमश हम मूल्यांकन करेंगे।

उदाहरण 1

क्रमित आँकड़ा समुच्चय: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

विधि 1 विधि 2 विधि 3 विधि 4
Q1 15 25.5 20.25 15
Q2 40 40 40 40
Q3 43 42.5 42.75 43

उदाहरण 2

क्रमित आँकड़ा समुच्चय: 7, 15, 36, 39, 40, 41

चूंकि दत्तानुसारी बिन्दु की संख्या सम है, इसलिए पहले तीन तरीके समान परिणाम देते हैं।

विधि 1 विधि 2 विधि 3 विधि 4
Q1 15 15 15 13
Q2 37.5 37.5 37.5 37.5
Q3 40 40 40 40.25

निरंतर संभाव्यता वितरण

सामान्य वितरण के संचयी वितरण फलन पर चतुर्थांश

यदि हम निरंतर संभाव्यता वितरण को परिभाषित करते हैं जहाँ एक वास्तविक संख्या यादृच्छिक चर है, इसका संचयी वितरण फलन (सीडीएफ) द्वारा दिया जाता है,

.[1]

संचयी वितरण फलन प्रायिकता देता है कि यादृच्छिक चर , मान से कम है इसलिए, जब पहला चतुर्थांश का मान है, जब दूसरा चतुर्थांश है, और जब तीसरा चतुर्थांश है [5] चतुर्थांश फलन के मान के साथ पाया जा सकता है जहाँ पहले चतुर्थांश के लिए, दूसरी चतुर्थांश के लिए, और तीसरे चतुर्थांश के लिए है। चतुर्थांश फलन संचयी वितरण फलन का व्युत्क्रम है यदि संचयी वितरण फलन एकदिष्ट फलन है।

पुरान्त:शायी

ऐसी विधियाँ हैं जिनके द्वारा सांख्यिकी और सांख्यिकीय विश्लेषण के क्षेत्र में पुरान्त:शायी की जाँच की जा सकती है। पुरान्त:शायी स्थान (माध्य) या ब्याज की प्रक्रिया के पैमाने (परिवर्तनशीलता) में बदलाव के परिणामस्वरूप हो सकते हैं।[6] पुरान्त:शायी एक नमूना आबादी का प्रमाण भी हो सकता है जिसका वितरण असामान्य है या संदूषित जनसंख्या आँकड़ा समुच्चय है। परिणाम स्वरुप, जैसा कि वर्णनात्मक आंकड़ों का मूल विचार है, जब एक पुरान्त:शायी का सामना करना पड़ता है, तो हमें इस मान को पुरान्त:शायी कारण या उत्पत्ति के आगे के विश्लेषण के द्वारा समझाना होता है। चरम प्रेक्षणों के स्थितियों में, जो दुर्लभ घटना नहीं हैं, विशिष्ट मानो का विश्लेषण किया जाना चाहिए। चतुर्थांश के मामले में, इंटरक्वेरटाइल रेंज (आईक्यूआर) का उपयोग आँकड़े को चिह्नित करने के लिए किया जा सकता है जब आँकड़े को तिरछा करने वाले चरम हो सकते हैं; श्रेणी (सांख्यिकी) और मानक विचलन की तुलना में इंटरक्वेर्टाइल रेंज अपेक्षाकृत मजबूत आंकड़ा है (जिसे कभी-कभी प्रतिरोध भी कहा जाता है)। पुरान्त:शायी की जांच करने और बाड़, ऊपरी और निचली सीमाओं को निर्धारित करने के लिए गणितीय विधि भी है जिससे पुरान्त:शायी की जांच की जा सकती है।

पहले और तीसरे चतुर्थांश और इंटरक्वेर्टाइल रेंज को ऊपर बताए अनुसार निर्धारित करने के बाद, निम्नलिखित सूत्र का उपयोग करके बाड़ की गणना की जाती है:

आउटलेयर्स के साथ बॉक्सप्लॉट आरेख
जहां Q1 और Q3 क्रमशः प्रथम और तृतीय चतुर्थांश हैं। निचली बाड़ निचली सीमा है और ऊपरी बाड़ आँकड़े की ऊपरी सीमा है, और इन परिभाषित सीमाओं के बाहर सम्मिलित किसी भी आँकड़े को पुरान्त:शायी माना जा सकता है। निचली बाड़ के नीचे या ऊपरी बाड़ के ऊपर कुछ भी ऐसा मामला माना जा सकता है। बाड़ दिशानिर्देश प्रदान करते हैं जिसके द्वारा पुरान्त:शायी परिभाषित किया जा सकता है, जिसे अन्य तरीकों से परिभाषित किया जा सकता है। बाड़ एक सीमा को परिभाषित करती है जिसके बाहर पुरान्त:शायी सम्मिलित होता है; इसे चित्रित करने का एक तरीक बाड़ की सीमा है, जिसके बाहर पुरान्त:शायी लोगों के विपरीत पुरान्त:शायी लोग हैं। निचले और ऊपरी बाड़ के साथ-साथ पुरान्त:शायी को रेखा - चित्र द्वारा दर्शाया जाना आम है। बॉक्सप्लॉट के लिए, केवल लंबवत ऊंचाई कल्पित किए गए आँकड़ा समुच्चय से मेल खाती है जबकि बॉक्स की क्षैतिज चौड़ाई अप्रासंगिक है। बॉक्सप्लॉट में बाड़ के बाहर स्थित पुरान्त:शायी को प्रतीक के किसी भी विकल्प के रूप में चिह्नित किया जा सकता है, जैसे कि x या o है। बाड़ को कभी-कभी व्हिस्कर्स के रूप में भी जाना जाता है, जबकि पूरे भूखंड दृश्य को बॉक्स-एंड-व्हिस्कर प्लॉट कहा जाता है।

इंटरक्वेर्टाइल रेंज और बॉक्सप्लॉट सुविधाओं की गणना करके उत्पन्न किए गए आँकड़े में एक पुरान्त:शायी को स्पॉट करते समय, गलती से इसे साक्ष्य के रूप में देखना आसान हो सकता है कि जनसंख्या गैर-सामान्य है या नमूना संदूषित है। हालाँकि, इस विधि को जनसंख्या की सामान्यता निर्धारित करने के लिए परिकल्पना परीक्षण का स्थान नहीं लेना चाहिए। नमूना आकार के आधार पर पुरान्त:शायी का महत्व अलग-अलग होता है। यदि नमूना छोटा है, तो अंतःचतुर्थक श्रेणियां प्राप्त करने की अधिक संभावना है जो गैर-प्रतिनिधित्वात्मक रूप से छोटी हैं, जिससे बाड़ संकरी हो जाती है। इसलिए, पुरान्त:शायी के रूप में चिह्नित किए गए आँकड़े को खोजने की अधिक संभावना होती है।[7]

चतुर्थांश के लिए कंप्यूटर सॉफ्टवेयर

परिवेश प्रकार्य चतुर्थक पद्धति
माइक्रोसॉफ्ट एक्सेल QUARTILE.EXC विधि 4
माइक्रोसॉफ्ट एक्सेल QUARTILE.INC विधि 3
टीआई-8X श्रृंखला कैलकुलेटर 1-वार आँकड़े विधि 1
आर फाइवनम विधि 2
पायथन numpy.percentile विधि 3
पायथन pandas.DataFrame.describe विधि 3

एक्सेल:

एक्सेल फलन क्वार्टीले (सरणी, क्वार्ट) ऊपर से विधि 3 का उपयोग करते हुए आँकड़े की दी गई सरणी के लिए वांछित चतुर्थांश मान प्रदान करता है। चतुर्थांश फलन में, सरणी संख्याओं का आँकड़ा समुच्चय है जिसका विश्लेषण किया जा रहा है और क्वार्ट निम्नलिखित 5 मानों में से कोई भी है जिसके आधार पर चतुर्थांश की गणना की जा रही है। [8]

क्वार्ट आउटपुट चतुर्थांश मान
0 न्यूनतम मान
1 निचला चतुर्थक (25वां प्रतिशतक)
2 माध्यिका
3 ऊपरी चतुर्थक (75वां प्रतिशतक)
4 अधिकतम मान

मैटलैब:

मैटलैब में चतुर्थांश की गणना करने के लिए, फलन चतुर्थांश (A,p) का उपयोग किया जा सकता है। जहाँ A विश्लेषण किए जा रहे आँकड़े का सदिश है और p वह प्रतिशत है जो नीचे बताए अनुसार चतुर्थांश से संबंधित है। [9]

p आउटपुट चतुर्थांश मान
0 न्यूनतम मान
0.25 निचला चतुर्थक (25वां प्रतिशतक)
0.5 माध्यिका
0.75 ऊपरी चतुर्थक (75वां प्रतिशतक)
1 अधिकतम मान

यह भी देखें

  • पांच अंकों का सारांश
  • रेंज (सांख्यिकी)
  • रेखा - चित्र
  • अन्तःचतुर्थक श्रेणी
  • सारांश आँकड़े
  • चतुर्थांश

संदर्भ

  1. 1.0 1.1 1.2 A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946–. London: Springer. 2005. pp. 236-238. ISBN 978-1-85233-896-1. OCLC 262680588.{{cite book}}: CS1 maint: others (link)
  2. Knoch, Jessica (February 23, 2018). "How are Quartiles Used in Statistics?". Magoosh. Archived from the original on 2019-12-10. Retrieved February 24, 2023.
  3. Hyndman, Rob J; Fan, Yanan (November 1996). "सांख्यिकीय पैकेज में नमूना मात्राएँ". American Statistician. 50 (4): 361–365. doi:10.2307/2684934. JSTOR 2684934.
  4. Tukey, John Wilder (1977). अन्वेषणात्मक डेटा विश्लेषण. ISBN 978-0-201-07616-5.
  5. "6. Distribution and Quantile Functions" (PDF). math.bme.hu.
  6. Walfish, Steven (November 2006). "सांख्यिकीय बाह्य विधि की समीक्षा". Pharmaceutical Technology.
  7. Dawson, Robert (July 1, 2011). "How Significant is a Boxplot Outlier?". Journal of Statistics Education. 19 (2). doi:10.1080/10691898.2011.11889610.
  8. "How to use the Excel QUARTILE function | Exceljet". exceljet.net. Retrieved December 11, 2019.
  9. "Quantiles of a data set – MATLAB quantile". www.mathworks.com. Retrieved December 11, 2019.


पुरान्त:शायी संबंध