चतुर्थांश
आंकड़े में, एक चतुर्थक एक प्रकार का परिमाण है जो डेटा बिंदुओं की संख्या को चार भागों में विभाजित करता है, या 'तिमाही', अधिक-या-कम समान आकार का। चतुर्थक की गणना करने के लिए डेटा को सबसे छोटे से सबसे बड़े क्रम में क्रमबद्ध किया जाना चाहिए; इस प्रकार, चतुर्थक आदेश आँकड़ा का एक रूप है। तीन मुख्य चतुर्थक इस प्रकार हैं:
- पहला चतुर्थक (Q1) को सबसे छोटी संख्या (नमूना न्यूनतम) और डेटा सेट के माध्यिका के बीच की मध्य संख्या के रूप में परिभाषित किया गया है। इसे निम्न या 25वें अनुभवजन्य चतुर्थक के रूप में भी जाना जाता है, क्योंकि 25% डेटा इस बिंदु से नीचे है।
- दूसरा चतुर्थक (क्यू2) डेटा सेट का माध्यिका है; इस प्रकार 50% डेटा इस बिंदु के नीचे स्थित है।
- तीसरा चतुर्थक (क्यू3) माध्यिका और डेटा सेट के उच्चतम मान (नमूना अधिकतम और न्यूनतम) के बीच का मध्य मान है। इसे ऊपरी या 75वें अनुभवजन्य चतुर्थक के रूप में जाना जाता है, क्योंकि 75% डेटा इस बिंदु के नीचे स्थित है।[1] न्यूनतम और अधिकतम डेटा (जो चतुर्थक भी हैं) के साथ, ऊपर वर्णित तीन चतुर्थक डेटा का पांच-संख्या सारांश प्रदान करते हैं। यह सारांश आँकड़ों में महत्वपूर्ण है क्योंकि यह माध्य (सांख्यिकी) और डेटा के सांख्यिकीय फैलाव दोनों के बारे में जानकारी प्रदान करता है। निचले और ऊपरी चतुर्थक को जानने से इस बात की जानकारी मिलती है कि प्रसार कितना बड़ा है और यदि डेटासेट एक तरफ तिरछा है। चूँकि चतुर्थक डेटा बिंदुओं की संख्या को समान रूप से विभाजित करते हैं, श्रेणी (सांख्यिकी) चतुर्थक (अर्थात्, Q) के बीच समान नहीं होती है।3-क्यू2 ≠ क्यू2-क्यू1) और इसके बजाय अन्तःचतुर्थक श्रेणी (IQR) के रूप में जाना जाता है। जबकि अधिकतम और न्यूनतम भी डेटा के प्रसार को दिखाते हैं, ऊपरी और निचले चतुर्थक विशिष्ट डेटा बिंदुओं के स्थान पर अधिक विस्तृत जानकारी प्रदान कर सकते हैं, डेटा में ग़ैर की उपस्थिति, और मध्य 50% के बीच प्रसार में अंतर डेटा और बाहरी डेटा बिंदु।[2]
परिभाषाएँ
Symbol | Names | Definition |
---|---|---|
Q1 |
|
splits off the lowest 25% of data from the highest 75% |
Q2 |
|
cuts data set in half |
Q3 |
|
splits off the highest 25% of data from the lowest 75% |
कंप्यूटिंग के तरीके
असतत वितरण
असतत वितरण के लिए, चतुर्थक मूल्यों के चयन पर कोई सार्वभौमिक सहमति नहीं है।[3]
विधि 1
- ऑर्डर किए गए डेटा सेट को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
- यदि मूल आदेशित डेटा सेट में विषम संख्या में डेटा बिंदु हैं, तो माध्यिका (आदेशित सूची में केंद्रीय मान) को आधे में शामिल न करें।
- यदि मूल क्रमित डेटा सेट में डेटा बिंदुओं की संख्या सम है, तो इस डेटा सेट को ठीक आधे में विभाजित करें।
- निचला चतुर्थक मान डेटा के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थक मान डेटा के ऊपरी आधे हिस्से का माध्यिका है।
यह नियम TI-83 कैलकुलेटर बॉक्सप्लॉट और 1-वार स्टैट्स फ़ंक्शंस द्वारा नियोजित है।
विधि 2
- ऑर्डर किए गए डेटा सेट को दो-हिस्सों में विभाजित करने के लिए माध्यिका का उपयोग करें।
- यदि मूल आदेशित डेटा सेट में विषम संख्या में डेटा बिंदु हैं, तो दोनों हिस्सों में माध्यिका (आदेशित सूची में केंद्रीय मान) शामिल करें।
- यदि मूल आदेशित डेटा सेट में सम संख्या में डेटा बिंदु हैं, तो इस डेटा सेट को ठीक आधे में विभाजित करें।
- निचला चतुर्थक मान डेटा के निचले आधे हिस्से का माध्यिका है। ऊपरी चतुर्थक मान डेटा के ऊपरी आधे हिस्से का माध्यिका है।
इस पद्धति द्वारा प्राप्त मूल्यों को जॉन टुकी के हिंज के रूप में भी जाना जाता है;[4] पीछा करना भी देखें।
विधि 3
- यदि डेटा बिंदुओं की संख्या सम है, तो विधि 3 उपरोक्त विधि 1 या विधि 2 के समान ही शुरू होती है और आप माध्यिका को डेटा बिंदु के रूप में शामिल करना या न करना चुन सकते हैं। यदि आप माध्यिका को एक नए डेटा बिंदु के रूप में शामिल करना चुनते हैं, तो विधि 3 के चरण 2 या 3 पर आगे बढ़ें क्योंकि अब आपके पास विषम संख्या में डेटा बिंदु हैं।
- यदि (4n+1) डेटा बिंदु हैं, तो निचला चतुर्थक nवें डेटा मान का 25% और (n+1)वें डेटा मान का 75% है; ऊपरी चतुर्थक (3n+1)वें डेटा बिंदु का 75% और (3n+2)वें डेटा बिंदु का 25% है।
- यदि (4n+3) डेटा बिंदु हैं, तो निम्न चतुर्थक (n+1)वें डेटा मान का 75% और (n+2)वें डेटा मान का 25% है; ऊपरी चतुर्थक (3n+2)वें डेटा बिंदु का 25% और (3n+3)वें डेटा बिंदु का 75% है।
विधि 4
अगर हमारे पास ऑर्डर किया गया डेटासेट है , हम खोजने के लिए डेटा बिंदुओं के बीच प्रक्षेपित कर सकते हैं वें अनुभवजन्य मात्रा यदि में है मात्रा। यदि हम किसी संख्या के पूर्णांक भाग को निरूपित करते हैं द्वारा , तो अनुभवजन्य क्वांटाइल फ़ंक्शन द्वारा दिया जाता है,
,
कहाँ और .[1]
डेटासेट के पहले, दूसरे और तीसरे चतुर्थक को खोजने के लिए हम मूल्यांकन करेंगे , , और क्रमश।
उदाहरण 1
क्रमित डेटा सेट: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Method 1 | Method 2 | Method 3 | Method 4 | |
---|---|---|---|---|
Q1 | 15 | 25.5 | 20.25 | 15 |
Q2 | 40 | 40 | 40 | 40 |
Q3 | 43 | 42.5 | 42.75 | 43 |
उदाहरण 2
आदेशित डेटा सेट: 7, 15, 36, 39, 40, 41
चूंकि डेटा बिंदुओं की संख्या सम है, इसलिए पहले तीन तरीके समान परिणाम देते हैं।
Method 1 | Method 2 | Method 3 | Method 4 | |
---|---|---|---|---|
Q1 | 15 | 15 | 15 | 13 |
Q2 | 37.5 | 37.5 | 37.5 | 37.5 |
Q3 | 40 | 40 | 40 | 40.25 |
निरंतर संभाव्यता वितरण
यदि हम निरंतर संभाव्यता वितरण को परिभाषित करते हैं कहाँ एक वास्तविक संख्या यादृच्छिक चर है, इसका संचयी वितरण फलन (CDF) द्वारा दिया जाता है,
.[1]
संचयी बंटन फलन प्रायिकता देता है कि यादृच्छिक चर मान से कम है . इसलिए, पहला चतुर्थक का मान है कब , दूसरा चतुर्थक है कब , और तीसरा चतुर्थक है कब .[5] के मान मात्रात्मक समारोह के साथ पाया जा सकता है कहाँ पहले चतुर्थक के लिए, दूसरी चतुर्थक के लिए, और तीसरे चतुर्थक के लिए। क्वांटाइल फ़ंक्शन संचयी वितरण फ़ंक्शन का व्युत्क्रम है यदि संचयी वितरण फ़ंक्शन मोनोटोनिक फ़ंक्शन है।
बाहरी कारकों के कारण
ऐसी विधियाँ हैं जिनके द्वारा सांख्यिकी और सांख्यिकीय विश्लेषण के क्षेत्र में आउटलेयर की जाँच की जा सकती है। आउटलेयर स्थान (माध्य) या ब्याज की प्रक्रिया के पैमाने (परिवर्तनशीलता) में बदलाव के परिणामस्वरूप हो सकते हैं।[6] आउटलेयर एक नमूना आबादी का प्रमाण भी हो सकता है जिसका वितरण असामान्य है या दूषित जनसंख्या डेटा सेट है। नतीजतन, जैसा कि वर्णनात्मक आंकड़ों का मूल विचार है, जब एक बाहरी का सामना करना पड़ता है, तो हमें इस मूल्य को बाहरी कारण या उत्पत्ति के आगे के विश्लेषण के द्वारा समझाना होगा। चरम प्रेक्षणों के मामलों में, जो एक दुर्लभ घटना नहीं हैं, विशिष्ट मूल्यों का विश्लेषण किया जाना चाहिए। चतुर्थक के मामले में, इंटरक्वेरटाइल रेंज (IQR) का उपयोग डेटा को चिह्नित करने के लिए किया जा सकता है जब डेटा को तिरछा करने वाले चरम हो सकते हैं; श्रेणी (सांख्यिकी) और मानक विचलन की तुलना में इंटरक्वेर्टाइल रेंज एक अपेक्षाकृत मजबूत आंकड़ा है (जिसे कभी-कभी प्रतिरोध भी कहा जाता है)। आउटलेयर की जांच करने और बाड़, ऊपरी और निचली सीमाओं को निर्धारित करने के लिए एक गणितीय विधि भी है जिससे आउटलेयर की जांच की जा सके।
पहले और तीसरे चतुर्थक और इंटरक्वेर्टाइल रेंज को ऊपर बताए अनुसार निर्धारित करने के बाद, निम्नलिखित सूत्र का उपयोग करके बाड़ की गणना की जाती है:
- जहां क्यू1 और क्यू3 क्रमशः प्रथम और तृतीय चतुर्थक हैं। निचली बाड़ निचली सीमा है और ऊपरी बाड़ डेटा की ऊपरी सीमा है, और इन परिभाषित सीमाओं के बाहर मौजूद किसी भी डेटा को बाहरी माना जा सकता है। निचली बाड़ के नीचे या ऊपरी बाड़ के ऊपर कुछ भी ऐसा मामला माना जा सकता है। बाड़ एक दिशानिर्देश प्रदान करते हैं जिसके द्वारा एक बाहरी परिभाषित किया जा सकता है, जिसे अन्य तरीकों से परिभाषित किया जा सकता है। बाड़ एक सीमा को परिभाषित करती है जिसके बाहर एक बाहरी मौजूद होता है; इसे चित्रित करने का एक तरीका एक बाड़ की सीमा है, जिसके बाहर बाहरी लोगों के विपरीत बाहरी लोग हैं। निचले और ऊपरी बाड़ के साथ-साथ आउटलेयर को रेखा - चित्र द्वारा दर्शाया जाना आम है। एक बॉक्सप्लॉट के लिए, केवल लंबवत ऊंचाई विज़ुअलाइज़ किए गए डेटा सेट से मेल खाती है जबकि बॉक्स की क्षैतिज चौड़ाई अप्रासंगिक है। बॉक्सप्लॉट में बाड़ के बाहर स्थित आउटलेयर को प्रतीक के किसी भी विकल्प के रूप में चिह्नित किया जा सकता है, जैसे कि x या o। बाड़ को कभी-कभी मूंछ के रूप में भी जाना जाता है, जबकि पूरे भूखंड दृश्य को बॉक्स-एंड-व्हिस्कर प्लॉट कहा जाता है।
इंटरक्वेर्टाइल रेंज और बॉक्सप्लॉट सुविधाओं की गणना करके सेट किए गए डेटा में एक आउटलाइयर को स्पॉट करते समय, गलती से इसे साक्ष्य के रूप में देखना आसान हो सकता है कि जनसंख्या गैर-सामान्य है या नमूना दूषित है। हालाँकि, इस विधि को जनसंख्या की सामान्यता निर्धारित करने के लिए एक परिकल्पना परीक्षण का स्थान नहीं लेना चाहिए। नमूना आकार के आधार पर आउटलेयर का महत्व अलग-अलग होता है। यदि नमूना छोटा है, तो अंतःचतुर्थक श्रेणियां प्राप्त करने की अधिक संभावना है जो गैर-प्रतिनिधित्वात्मक रूप से छोटी हैं, जिससे बाड़ संकरी हो जाती है। इसलिए, आउटलेयर के रूप में चिह्नित किए गए डेटा को खोजने की अधिक संभावना होगी।[7]
चतुर्थक के लिए कंप्यूटर सॉफ्टवेयर
Environment | Function | Quartile Method |
---|---|---|
Microsoft Excel | QUARTILE.EXC | Method 4 |
Microsoft Excel | QUARTILE.INC | Method 3 |
TI-8X series calculators | 1-Var Stats | Method 1 |
R | fivenum | Method 2 |
Python | numpy.percentile | Method 3 |
Python | pandas.DataFrame.describe | Method 3 |
एक्सेल:
एक्सेल फ़ंक्शन QUARTILE(सरणी, क्वार्ट) ऊपर से विधि 3 का उपयोग करते हुए डेटा की दी गई सरणी के लिए वांछित चतुर्थक मान प्रदान करता है। चतुर्थक फ़ंक्शन में, सरणी संख्याओं का डेटासेट है जिसका विश्लेषण किया जा रहा है और क्वार्ट निम्नलिखित 5 मानों में से कोई भी है जिसके आधार पर चतुर्थक की गणना की जा रही है। [8]
Quart | Output QUARTILE Value |
---|---|
0 | Minimum value |
1 | Lower Quartile (25th percentile) |
2 | Median |
3 | Upper Quartile (75th percentile) |
4 | Maximum value |
मतलब:
मैटलैब में चतुर्थक की गणना करने के लिए, फ़ंक्शन क्वांटाइल (ए, पी) का उपयोग किया जा सकता है। जहाँ A विश्लेषण किए जा रहे डेटा का सदिश है और p वह प्रतिशत है जो नीचे बताए अनुसार चतुर्थक से संबंधित है। [9]
p | Output QUARTILE Value |
---|---|
0 | Minimum value |
0.25 | Lower Quartile (25th percentile) |
0.5 | Median |
0.75 | Upper Quartile (75th percentile) |
1 | Maximum value |
यह भी देखें
- पांच अंकों का सारांश
- रेंज (सांख्यिकी)
- रेखा - चित्र
- अन्तःचतुर्थक श्रेणी
- सारांश आँकड़े
- क्वांटाइल
संदर्भ
- ↑ 1.0 1.1 1.2 A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946–. London: Springer. 2005. pp. 236-238. ISBN 978-1-85233-896-1. OCLC 262680588.
{{cite book}}
: CS1 maint: others (link) - ↑ Knoch, Jessica (February 23, 2018). "How are Quartiles Used in Statistics?". Magoosh. Archived from the original on December 10, 2019. Retrieved February 24, 2023.
- ↑ Hyndman, Rob J; Fan, Yanan (November 1996). "सांख्यिकीय पैकेज में नमूना मात्राएँ". American Statistician. 50 (4): 361–365. doi:10.2307/2684934. JSTOR 2684934.
- ↑ Tukey, John Wilder (1977). अन्वेषणात्मक डेटा विश्लेषण. ISBN 978-0-201-07616-5.
- ↑ "6. Distribution and Quantile Functions" (PDF). math.bme.hu.
- ↑ Walfish, Steven (November 2006). "सांख्यिकीय बाह्य विधि की समीक्षा". Pharmaceutical Technology.
- ↑ Dawson, Robert (July 1, 2011). "How Significant is a Boxplot Outlier?". Journal of Statistics Education. 19 (2). doi:10.1080/10691898.2011.11889610.
- ↑ "How to use the Excel QUARTILE function | Exceljet". exceljet.net. Retrieved December 11, 2019.
- ↑ "Quantiles of a data set – MATLAB quantile". www.mathworks.com. Retrieved December 11, 2019.
बाहरी संबंध
- Quartile – from MathWorld Includes references and compares various methods to compute quartiles
- Quartiles – From MathForum.org
- Quartiles calculator – simple quartiles calculator
- Quartiles – An example how to calculate it