समग्र कार्य: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Type of function in database management}} | {{Short description|Type of function in database management}} | ||
[[डेटाबेस प्रबंधन]] में, समग्र फ़ंक्शन या एकत्रीकरण फ़ंक्शन [[सबरूटीन]] है | [[डेटाबेस प्रबंधन]] में, '''समग्र फ़ंक्शन''' या एकत्रीकरण फ़ंक्शन ऐसे [[सबरूटीन]] है, जिसमें एकल [[सारांश आँकड़े|सारांशित आँकड़े]] बनाने के लिए कई पंक्तियों में उपस्थित मानों को एक साथ संसाधित किया जाता है। | ||
[[File:Aggregation - Entity Relationship Diagram.png|thumb|(चित्र 1) इकाई संबंध आरेख एकत्रीकरण का प्रतिनिधित्व।]]सामान्य समग्र | [[File:Aggregation - Entity Relationship Diagram.png|thumb|(चित्र 1) इकाई संबंध आरेख एकत्रीकरण का प्रतिनिधित्व।]]सामान्य समग्र फ़ंक्शन्स में निम्न बिंदु उपस्थित रहते हैं: | ||
* [[औसत]] ( | * [[औसत]] (अर्ताथ, अंकगणितीय माध्य) | ||
*[[गिनती]] | *[[गिनती]] | ||
* [[अधिकतम]] | * [[अधिकतम]] | ||
Line 13: | Line 13: | ||
*संक्षेप | *संक्षेप | ||
अन्य में | अन्य में उपस्थित हैं: | ||
* नानमीन ( | * नानमीन (अर्ताथ NaN मानों को नगण्य मानना, जिसे शून्य या शून्य के रूप में भी जाना जाता है) | ||
* [[मानक विचलन]] | * [[मानक विचलन]] | ||
औपचारिक रूप से, समग्र फ़ंक्शन इनपुट के रूप में [[सेट (कंप्यूटर विज्ञान)]], मल्टीसेट (अमूर्त डेटा प्रकार) (बैग), या कुछ इनपुट डोमेन से [[सूची (कंप्यूटिंग)]] लेता है। {{mvar|''I''}} और आउटपुट डोमेन के तत्व को आउटपुट करता है {{mvar|''O''}}.{{sfn|Jesus|Baquero|Almeida|2011|loc=2 Problem Definition, pp. 3}} इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि <code>SUM</code>, या भिन्न हो सकता है, जैसे कि के लिए <code>COUNT</code> | औपचारिक रूप से, समग्र फ़ंक्शन इनपुट के रूप में [[सेट (कंप्यूटर विज्ञान)]], मल्टीसेट (अमूर्त डेटा प्रकार) (बैग), या कुछ इनपुट डोमेन से [[सूची (कंप्यूटिंग)]] लेता है। {{mvar|''I''}} और आउटपुट डोमेन के तत्व को आउटपुट करता है {{mvar|''O''}}.{{sfn|Jesus|Baquero|Almeida|2011|loc=2 Problem Definition, pp. 3}} इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि <code>SUM</code>, या भिन्न हो सकता है, जैसे कि के लिए <code>COUNT</code> इसका प्रमुख उदाहरण हैं। | ||
समग्र | समग्र फ़ंक्शन सामान्यतः कई [[प्रोग्रामिंग भाषा|प्रोग्रामिंग लैंग्वेज]], [[स्प्रेडशीट|स्प्रेडशीट्स]] और रिलेशनल बीजगणित में उपस्थित होते हैं। इस प्रकार <code>listagg</code> e> फ़ंक्शन, जैसे SQL:2016 मानक में परिभाषित है<ref name=":0"> | ||
{{cite web | {{cite web | ||
|url=https://dzone.com/articles/big-news-in-databases-new-sql-standard-cloud-wars | |url=https://dzone.com/articles/big-news-in-databases-new-sql-standard-cloud-wars | ||
Line 32: | Line 32: | ||
}} | }} | ||
</ref> | </ref> | ||
एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है। | एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है। | ||
इकाई-संबंध मॉडल में, एकत्रीकरण को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है ताकि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।<ref>{{Cite book |last=Elmasri |first=Ramez |url=https://www.worldcat.org/oclc/913842106 |title=डेटाबेस सिस्टम की बुनियादी बातें|date=2016 |others=Sham Navathe |isbn=978-0-13-397077-7 |edition=Seventh |location=Hoboken, NJ |pages=133 |oclc=913842106}}</ref> | इकाई-संबंध मॉडल में, एकत्रीकरण को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है ताकि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।<ref>{{Cite book |last=Elmasri |first=Ramez |url=https://www.worldcat.org/oclc/913842106 |title=डेटाबेस सिस्टम की बुनियादी बातें|date=2016 |others=Sham Navathe |isbn=978-0-13-397077-7 |edition=Seventh |location=Hoboken, NJ |pages=133 |oclc=913842106}}</ref> | ||
== विघटित समुच्चय कार्य == | == विघटित समुच्चय कार्य == | ||
समग्र फ़ंक्शन बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। वितरित कंप्यूटिंग में, ऐसी गणनाओं को छोटे टुकड़ों में विभाजित करना वांछनीय है, और | '''समग्र फ़ंक्शन''' बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। वितरित कंप्यूटिंग में, ऐसी गणनाओं को छोटे टुकड़ों में विभाजित करना वांछनीय है, और किसी फंक्शन को सामान्यतः [[समानांतर कंप्यूटिंग]], विभाजन और विक्ट्री एल्गोरिथ्म के माध्यम से वितरित करना है। | ||
कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में | कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में उपस्थित <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code> का उपयोग किया जाता हैं। इसकी अन्य स्थितियों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में उपस्थित <code>AVERAGE</code> (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और <code>RANGE</code> अधिकतम और न्यूनतम पर ध्यान रखना, अंत में घटाना उपस्थित होता हैं। इस प्रकार इसकी अन्य स्थितियों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, चूंकि कुछ स्थितियों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में उपस्थित <code>DISTINCT COUNT</code> (गणना-विशिष्ट समस्या), <code>MEDIAN</code>, और <code>MODE</code> को सम्मिलित किया जाता हैं। | ||
ऐसे फ़ंक्शंस को विघटित | ऐसे फ़ंक्शंस को विघटित युनिफाइट फंक्शंस या विघटित समुच्चय कार्य कहा जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} इसका सबसे सरल स्व-विघटित युनिफाइट फंक्शंस के रूप में संदर्भित किया जा सकता है, जिन्हें उन फंक्शंस {{mvar|''f''}} के रूप में परिभाषित किया गया है, जैसे कि मर्ज ऑपरेटर {{tmath|\diamond}} है, जो इस प्रकार हैं कि- | ||
:<math>f(X \uplus Y) = f(X) \diamond f(Y)</math> | :<math>f(X \uplus Y) = f(X) \diamond f(Y)</math> | ||
कहाँ {{tmath|\uplus}} मल्टीसेट्स का संघ है | कहाँ {{tmath|\uplus}} मल्टीसेट्स का संघ है, जिसे [[मोनोइड समरूपता]] के रूप में देख सकते हैं। | ||
उदाहरण के लिए, <code>SUM</code>: | उदाहरण के लिए, <code>SUM</code>: | ||
:<math>\operatorname{SUM}({x}) = x</math>, सिंगलटन के लिए; | :<math>\operatorname{SUM}({x}) = x</math>, सिंगलटन के लिए; | ||
:<math>\operatorname{SUM}(X \uplus Y) = \operatorname{SUM}(X) + \operatorname{SUM}(Y)</math>, अर्थात विलय {{tmath|\diamond}} बस | :<math>\operatorname{SUM}(X \uplus Y) = \operatorname{SUM}(X) + \operatorname{SUM}(Y)</math>, अर्थात विलय {{tmath|\diamond}} बस संयोजन है. | ||
<code>COUNT</code>: | <code>COUNT</code>: | ||
:<math>\operatorname{COUNT}({x}) = 1</math>, | :<math>\operatorname{COUNT}({x}) = 1</math>, | ||
Line 68: | Line 69: | ||
:<math>\operatorname{MIN}(X \uplus Y) = \min\bigl(\operatorname{MIN}(X), \operatorname{MIN}(Y)\bigr)</math>. | :<math>\operatorname{MIN}(X \uplus Y) = \min\bigl(\operatorname{MIN}(X), \operatorname{MIN}(Y)\bigr)</math>. | ||
ध्यान दें कि स्व-विघटित | यहाँ पर ध्यान दें कि स्व-विघटित युनिफाइट फंक्शंस को अलग-अलग लागू करके साथ ही जोड़ा भी जा सकता है, औपचारिक रूप से, उत्पाद लेने के उद्देश्य से इसका उपयोग करते हैं। इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है, जिसके आधार पर <code>SUM</code> और <code>COUNT</code> ही समय में दो नंबरों को ट्रैक करके इसका पता लगाया जाता हैं। | ||
अधिक सामान्यतः, कोई विघटित एकत्रीकरण फ़ंक्शन {{mvar|''f''}} को परिभाषित कर सकता है, इसके आधार पर अंतिम फ़ंक्शन की संरचना {{mvar|''g''}} के रूप में व्यक्त किया जा सकता है, और स्व-विघटित एकत्रीकरण फ़ंक्शन {{mvar|''h''}} के लिए <math>f = g \circ h, f(X) = g(h(X))</math> के रूप में परिभाषित किया जाता हैं। उदाहरण के लिए, <code>AVERAGE</code>=<code>SUM</code>/<code>COUNT</code> और <code>RANGE</code>=<code>MAX</code>−<code>MIN</code> इसका मुख्य उदाहरण हैं। | |||
[[MapReduce|मैप रिड्यूस]] फ्रेमवर्क में, इन चरणों को प्रारंभिक कमी के रूप में व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान को संयोजित करने के लिए दो एकत्रीकरण बाइनरी को संयोजित करके और अंतिम कमी के सहायक मान पर अंतिम फ़ंक्शन के रूप में जाना जाता है।{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, pp. 2–4}} इस कारण विघटित होने वाले एकत्रीकरण को शफ़ल चरण से पहले ले जाना प्रारंभिक कमी के विशेष भाग के रूप में जाना जाता है,{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, p. 1}} | |||
ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के अतिरिक्त [[OLAP घन]] में पूर्व-गणना किए गए परिणामों पर एकत्रीकरण प्रश्नों की गणना करने की अनुमति देते हैं।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, इसका समर्थन करना सरल है, इसके आधार पर <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code> OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना कठिन हो जाता है, इस प्रकार <code>MEDIAN</code> के लिए इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए। | |||
== अन्य विघटित समुच्चय फंक्शन == | |||
समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: इसके मानों का कुल (Σx<sub>i</sub> = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)<sub>i</sub><sup>2</sup>=SUM(x<sup>2</sup>)) के समान होती हैं।<ref>Ing. Óscar Bonilla, MBA</ref> | |||
<code>AVG</code>:<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) * \operatorname{COUNT}(X) + \operatorname{AVG}(Y) * \operatorname{COUNT}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>या<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{SUM}(X) + \operatorname{SUM}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>या, केवल यदि COUNT(X)=COUNT(Y)<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) + \operatorname{AVG}(Y)\bigr) / 2</math><br><code>SUM(x<sup>2</sup>)</code>: | |||
समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है<math display="block">\operatorname{SUM}(X^2 \uplus Y^2) = \operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)</math><br><code>STDDEV</code>: | |||
सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास है<ref>[[Standard deviation#Identities and mathematical properties]]</ref><math display="block">\operatorname{STDDEV}(X) = s(x) = \sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^2} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - (\overline{x})^2} | |||
सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास है<ref>[[Standard deviation#Identities and mathematical properties]]</ref> | |||
<math display=block>\operatorname{STDDEV}(X) = s(x) = \sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^2} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - (\overline{x})^2} | |||
= \sqrt{\operatorname{SUM}(x^2) / \operatorname{COUNT}(x) - \operatorname{AVG}(x) ^2} | = \sqrt{\operatorname{SUM}(x^2) / \operatorname{COUNT}(x) - \operatorname{AVG}(x) ^2} | ||
</math> | </math>इसका अर्ताथ यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।<math display="block">\operatorname{STDDEV}(X \uplus Y) = \sqrt{\operatorname{SUM}(X^2 \uplus Y^2) / \operatorname{COUNT}(X \uplus Y) - \operatorname{AVG}(X \uplus Y) ^2}</math><math display="block">\operatorname{STDDEV}(X \uplus Y) = \sqrt{\bigl(\operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y) \bigr) - \bigl((\operatorname{SUM}(X) + \operatorname{SUM}(Y)) / (\operatorname{COUNT}(X) + \operatorname{COUNT}(Y))\bigr)^2}</math> | ||
इसका | |||
<math display=block>\operatorname{STDDEV}(X \uplus Y) = \sqrt{\operatorname{SUM}(X^2 \uplus Y^2) / \operatorname{COUNT}(X \uplus Y) - \operatorname{AVG}(X \uplus Y) ^2}</math> | |||
<math display=block>\operatorname{STDDEV}(X \uplus Y) = \sqrt{\bigl(\operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y) \bigr) - \bigl((\operatorname{SUM}(X) + \operatorname{SUM}(Y)) / (\operatorname{COUNT}(X) + \operatorname{COUNT}(Y))\bigr)^2}</math> | |||
==यह भी देखें== | ==यह भी देखें== | ||
*क्रॉस-सारणीकरण उर्फ आकस्मिकता तालिका | *क्रॉस-सारणीकरण उर्फ आकस्मिकता तालिका | ||
*[[डेटा ड्रिलिंग]] | *[[डेटा ड्रिलिंग]] | ||
*[[डेटा खनन]] | *[[डेटा खनन|डेटा माइनिंग]] | ||
*[[डाटा प्रासेसिंग]] | *[[डाटा प्रासेसिंग]] | ||
*निकालें, रूपांतरित करें, लोड करें | *निकालें, रूपांतरित करें, लोड करें | ||
Line 108: | Line 99: | ||
*ओलाप क्यूब | *ओलाप क्यूब | ||
*ऑनलाइन विश्लेषणात्मक प्रक्रिया | *ऑनलाइन विश्लेषणात्मक प्रक्रिया | ||
*[[पिवट तालिका]] | *[[पिवट तालिका|पिवट टेबल]] | ||
*संबंधपरक बीजगणित | *संबंधपरक बीजगणित | ||
*अविभाज्य वस्तुओं पर उपयोगिता कार्य | *अविभाज्य वस्तुओं पर उपयोगिता कार्य, उपयोगिता कार्यों का [[समुच्चय]] | ||
*[[विश्लेषण के लिए एक्सएमएल]] | *[[विश्लेषण के लिए एक्सएमएल]] | ||
*एग्रीगेटआईक्यू | *एग्रीगेटआईक्यू | ||
*मानचित्र | *मानचित्र में कमी | ||
==संदर्भ== | ==संदर्भ== |
Revision as of 21:30, 7 August 2023
डेटाबेस प्रबंधन में, समग्र फ़ंक्शन या एकत्रीकरण फ़ंक्शन ऐसे सबरूटीन है, जिसमें एकल सारांशित आँकड़े बनाने के लिए कई पंक्तियों में उपस्थित मानों को एक साथ संसाधित किया जाता है।
सामान्य समग्र फ़ंक्शन्स में निम्न बिंदु उपस्थित रहते हैं:
- औसत (अर्ताथ, अंकगणितीय माध्य)
- गिनती
- अधिकतम
- माध्यिका
- न्यूनतम
- मोड (सांख्यिकी)
- रेंज (सांख्यिकी)
- संक्षेप
अन्य में उपस्थित हैं:
- नानमीन (अर्ताथ NaN मानों को नगण्य मानना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
- मानक विचलन
औपचारिक रूप से, समग्र फ़ंक्शन इनपुट के रूप में सेट (कंप्यूटर विज्ञान), मल्टीसेट (अमूर्त डेटा प्रकार) (बैग), या कुछ इनपुट डोमेन से सूची (कंप्यूटिंग) लेता है। I और आउटपुट डोमेन के तत्व को आउटपुट करता है O.[1] इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि SUM
, या भिन्न हो सकता है, जैसे कि के लिए COUNT
इसका प्रमुख उदाहरण हैं।
समग्र फ़ंक्शन सामान्यतः कई प्रोग्रामिंग लैंग्वेज, स्प्रेडशीट्स और रिलेशनल बीजगणित में उपस्थित होते हैं। इस प्रकार listagg
e> फ़ंक्शन, जैसे SQL:2016 मानक में परिभाषित है[2]
एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है।
इकाई-संबंध मॉडल में, एकत्रीकरण को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है ताकि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।[3]
विघटित समुच्चय कार्य
समग्र फ़ंक्शन बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। वितरित कंप्यूटिंग में, ऐसी गणनाओं को छोटे टुकड़ों में विभाजित करना वांछनीय है, और किसी फंक्शन को सामान्यतः समानांतर कंप्यूटिंग, विभाजन और विक्ट्री एल्गोरिथ्म के माध्यम से वितरित करना है।
कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में उपस्थित COUNT
, MAX
, MIN
, और SUM
का उपयोग किया जाता हैं। इसकी अन्य स्थितियों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में उपस्थित AVERAGE
(योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और RANGE
अधिकतम और न्यूनतम पर ध्यान रखना, अंत में घटाना उपस्थित होता हैं। इस प्रकार इसकी अन्य स्थितियों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, चूंकि कुछ स्थितियों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में उपस्थित DISTINCT COUNT
(गणना-विशिष्ट समस्या), MEDIAN
, और MODE
को सम्मिलित किया जाता हैं।
ऐसे फ़ंक्शंस को विघटित युनिफाइट फंक्शंस या विघटित समुच्चय कार्य कहा जाता है।[4] इसका सबसे सरल स्व-विघटित युनिफाइट फंक्शंस के रूप में संदर्भित किया जा सकता है, जिन्हें उन फंक्शंस f के रूप में परिभाषित किया गया है, जैसे कि मर्ज ऑपरेटर है, जो इस प्रकार हैं कि-
कहाँ मल्टीसेट्स का संघ है, जिसे मोनोइड समरूपता के रूप में देख सकते हैं।
उदाहरण के लिए, SUM
:
- , सिंगलटन के लिए;
- , अर्थात विलय बस संयोजन है.
COUNT
:
- ,
- .
MAX
:
- ,
- .
MIN
:
- ,[2]
- .
यहाँ पर ध्यान दें कि स्व-विघटित युनिफाइट फंक्शंस को अलग-अलग लागू करके साथ ही जोड़ा भी जा सकता है, औपचारिक रूप से, उत्पाद लेने के उद्देश्य से इसका उपयोग करते हैं। इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है, जिसके आधार पर SUM
और COUNT
ही समय में दो नंबरों को ट्रैक करके इसका पता लगाया जाता हैं।
अधिक सामान्यतः, कोई विघटित एकत्रीकरण फ़ंक्शन f को परिभाषित कर सकता है, इसके आधार पर अंतिम फ़ंक्शन की संरचना g के रूप में व्यक्त किया जा सकता है, और स्व-विघटित एकत्रीकरण फ़ंक्शन h के लिए के रूप में परिभाषित किया जाता हैं। उदाहरण के लिए, AVERAGE
=SUM
/COUNT
और RANGE
=MAX
−MIN
इसका मुख्य उदाहरण हैं।
मैप रिड्यूस फ्रेमवर्क में, इन चरणों को प्रारंभिक कमी के रूप में व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान को संयोजित करने के लिए दो एकत्रीकरण बाइनरी को संयोजित करके और अंतिम कमी के सहायक मान पर अंतिम फ़ंक्शन के रूप में जाना जाता है।[5] इस कारण विघटित होने वाले एकत्रीकरण को शफ़ल चरण से पहले ले जाना प्रारंभिक कमी के विशेष भाग के रूप में जाना जाता है,[6]
ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के अतिरिक्त OLAP घन में पूर्व-गणना किए गए परिणामों पर एकत्रीकरण प्रश्नों की गणना करने की अनुमति देते हैं।[7] उदाहरण के लिए, इसका समर्थन करना सरल है, इसके आधार पर COUNT
, MAX
, MIN
, और SUM
OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना कठिन हो जाता है, इस प्रकार MEDIAN
के लिए इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।
अन्य विघटित समुच्चय फंक्शन
समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: इसके मानों का कुल (Σxi = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)i2=SUM(x2)) के समान होती हैं।[8]
AVG
:
SUM(x2)
:
समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है
STDDEV
:
सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास है[9]
यह भी देखें
- क्रॉस-सारणीकरण उर्फ आकस्मिकता तालिका
- डेटा ड्रिलिंग
- डेटा माइनिंग
- डाटा प्रासेसिंग
- निकालें, रूपांतरित करें, लोड करें
- फ़ोल्ड (उच्च-क्रम फ़ंक्शन)
- ग्रुप बाय (एसक्यूएल), एसक्यूएल क्लॉज
- ओलाप क्यूब
- ऑनलाइन विश्लेषणात्मक प्रक्रिया
- पिवट टेबल
- संबंधपरक बीजगणित
- अविभाज्य वस्तुओं पर उपयोगिता कार्य, उपयोगिता कार्यों का समुच्चय
- विश्लेषण के लिए एक्सएमएल
- एग्रीगेटआईक्यू
- मानचित्र में कमी
संदर्भ
उद्धरण
- ↑ Jesus, Baquero & Almeida 2011, 2 Problem Definition, pp. 3.
- ↑ 2.0 2.1
Winand, Markus (2017-05-15). "Big News in Databases: New SQL Standard, Cloud Wars, and ACIDRain (Spring 2017)". DZone. Retrieved 2017-06-10.
In December 2016, ISO released a new version of the SQL standard. It introduces new features such as row pattern matching, listagg, date and time formatting, and JSON support.
- ↑ Elmasri, Ramez (2016). डेटाबेस सिस्टम की बुनियादी बातें. Sham Navathe (Seventh ed.). Hoboken, NJ. p. 133. ISBN 978-0-13-397077-7. OCLC 913842106.
{{cite book}}
: CS1 maint: location missing publisher (link) - ↑ Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
- ↑ Yu, Gunda & Isard 2009, 2. Distributed Aggregation, pp. 2–4.
- ↑ Yu, Gunda & Isard 2009, 2. Distributed Aggregation, p. 1.
- ↑ Zhang 2017, p. 1.
- ↑ Ing. Óscar Bonilla, MBA
- ↑ Standard deviation#Identities and mathematical properties
ग्रन्थसूची
- Yu, Yuan; Gunda, Pradeep Kumar; Isard, Michael (2009). Distributed aggregation for data-parallel computing: interfaces and implementations. ACM SIGOPS 22nd symposium on Operating systems principles. ACM. pp. 247–260. doi:10.1145/1629575.1629600.
- Jesus, Paulo; Baquero, Carlos; Almeida, Paulo Sérgio (2011). "A Survey of Distributed Data Aggregation Algorithms". arXiv:1110.0725 [cs.DC].
- Zhang, Chao (2017). Symmetric and Asymmetric Aggregate Function in Massively Parallel Computing (Technical report).
अग्रिम पठन
- Grabisch, Michel; Marichal, Jean-Luc; Mesiar, Radko; Pap, Endre (2009). Aggregation functions. Encyclopedia of Mathematics and its Applications. Vol. 127. Cambridge: Cambridge University Press. ISBN 978-0-521-51926-7. Zbl 1196.00002.
- Oracle Aggregate Functions: MAX, MIN, COUNT, SUM, AVG Examples