समग्र कार्य: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(4 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{Short description|Type of function in database management}}
{{Short description|Type of function in database management}}


[[डेटाबेस प्रबंधन]] में, समग्र फ़ंक्शन या एकत्रीकरण फ़ंक्शन [[सबरूटीन]] है जहां एकल [[सारांश आँकड़े]] बनाने के लिए कई पंक्तियों के मानों को साथ संसाधित किया जाता है।
[[डेटाबेस प्रबंधन]] में, '''ऐग्रीगेट फ़ंक्शन''' या युनिफाइड फ़ंक्शन ऐसे [[सबरूटीन]] है, जिसमें एकल [[सारांश आँकड़े|सारांशित आँकडों]] को बनाने के लिए कई पंक्तियों में उपस्थित मानों को एक साथ संसाधित किया जाता है।
[[File:Aggregation - Entity Relationship Diagram.png|thumb|(चित्र 1) इकाई संबंध आरेख एकत्रीकरण का प्रतिनिधित्व।]]सामान्य समग्र कार्यों में शामिल हैं:
[[File:Aggregation - Entity Relationship Diagram.png|thumb|(चित्र 1) इकाई संबंध आरेख युनिफाइड का प्रतिनिधित्व।]]सामान्य ऐग्रीगेट फ़ंक्शन्स में निम्न बिंदु उपस्थित रहते हैं:


* [[औसत]] (यानी, अंकगणितीय माध्य)
* [[औसत]] (अर्ताथ, अंकगणितीय माध्य)
*[[गिनती]]
*[[गिनती]]
* [[अधिकतम]]
* [[अधिकतम]]
Line 13: Line 13:
*संक्षेप
*संक्षेप


अन्य में शामिल हैं:
अन्य में उपस्थित हैं:


* नानमीन (मतलब NaN मानों को अनदेखा करना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
* नाॅनमीन (अर्ताथ NaN मानों को नगण्य मानना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
* [[मानक विचलन]]
* [[मानक विचलन]]


औपचारिक रूप से, समग्र फ़ंक्शन इनपुट के रूप में [[सेट (कंप्यूटर विज्ञान)]], मल्टीसेट (अमूर्त डेटा प्रकार) (बैग), या कुछ इनपुट डोमेन से [[सूची (कंप्यूटिंग)]] लेता है। {{mvar|''I''}} और आउटपुट डोमेन के तत्व को आउटपुट करता है {{mvar|''O''}}.{{sfn|Jesus|Baquero|Almeida|2011|loc=2 Problem Definition, pp. 3}} इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि <code>SUM</code>, या भिन्न हो सकता है, जैसे कि के लिए <code>COUNT</code>.
औपचारिक रूप से, ऐग्रीगेट फ़ंक्शन इनपुट के रूप में [[सेट (कंप्यूटर विज्ञान)]], मल्टीसेट (डेटा का प्रकार) (बैग), या कुछ इनपुट डोमेन से [[सूची (कंप्यूटिंग)]] लेता है। जिसके आधार पर {{mvar|''I''}} और आउटपुट डोमेन के तत्व को {{mvar|''O''}} आउटपुट करता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2 Problem Definition, pp. 3}} इस प्रकार इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि <code>SUM</code>, या भिन्न हो सकता है, जैसे कि के लिए <code>COUNT</code> इसका प्रमुख उदाहरण हैं।


समग्र कार्य आम तौर पर कई [[प्रोग्रामिंग भाषा]]ओं, [[स्प्रेडशीट]]्स और रिलेशनल बीजगणित में होते हैं। <code>listagg</code> e> फ़ंक्शन, जैसा कि SQL:2016 मानक में परिभाषित है<ref name=":0">
ऐग्रीगेट फ़ंक्शन सामान्यतः कई [[प्रोग्रामिंग भाषा|प्रोग्रामिंग लैंग्वेज]], [[स्प्रेडशीट|स्प्रेडशीट्स]] और रिलेशनल बीजगणित में उपस्थित होते हैं। इस प्रकार <code>listagg</code> e> फ़ंक्शन, जैसे SQL:2016 मानक में परिभाषित है<ref name=":0">
{{cite web
{{cite web
  |url=https://dzone.com/articles/big-news-in-databases-new-sql-standard-cloud-wars
  |url=https://dzone.com/articles/big-news-in-databases-new-sql-standard-cloud-wars
Line 32: Line 32:
}}
}}
</ref>
</ref>
एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है।
एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है।


इकाई-संबंध मॉडल में, एकत्रीकरण को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है ताकि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।<ref>{{Cite book |last=Elmasri |first=Ramez |url=https://www.worldcat.org/oclc/913842106 |title=डेटाबेस सिस्टम की बुनियादी बातें|date=2016 |others=Sham Navathe |isbn=978-0-13-397077-7 |edition=Seventh |location=Hoboken, NJ |pages=133 |oclc=913842106}}</ref>
इकाई-संबंध मॉडल में, युनिफाइड को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है, जिससे कि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।<ref>{{Cite book |last=Elmasri |first=Ramez |url=https://www.worldcat.org/oclc/913842106 |title=डेटाबेस सिस्टम की बुनियादी बातें|date=2016 |others=Sham Navathe |isbn=978-0-13-397077-7 |edition=Seventh |location=Hoboken, NJ |pages=133 |oclc=913842106}}</ref>
== विघटित समुच्चय कार्य ==
== विघटित समुच्चय कार्य ==
समग्र फ़ंक्शन बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। वितरित कंप्यूटिंग में, ऐसी गणनाओं को छोटे टुकड़ों में विभाजित करना वांछनीय है, और कार्य को, आमतौर पर [[समानांतर कंप्यूटिंग]], विभाजन और जीत एल्गोरिथ्म के माध्यम से वितरित करना है।
'''ऐग्रीगेट फ़ंक्शन''' बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। इसके आधार पर वितरित कंप्यूटिंग में ऐसी गणनाओं को छोटे भागों में विभाजित करना वांछनीय हो जाता है, और किसी फंक्शन को सामान्यतः [[समानांतर कंप्यूटिंग|पैरलेल कंप्यूटिंग]], विभाजन और विक्ट्री एल्गोरिथ्म के माध्यम से वितरित करना है।


कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में शामिल <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code>. अन्य मामलों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में शामिल <code>AVERAGE</code> (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और <code>RANGE</code> (अधिकतम और न्यूनतम पर नज़र रखना, अंत में घटाना)। अन्य मामलों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, हालांकि कुछ मामलों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में शामिल <code>DISTINCT COUNT</code> (गणना-विशिष्ट समस्या), <code>MEDIAN</code>, और <code>MODE</code>.
कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में उपस्थित <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code> का उपयोग किया जाता हैं। इसकी अन्य स्थितियों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में उपस्थित <code>AVERAGE</code> (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और <code>RANGE</code> अधिकतम और न्यूनतम पर ध्यान रखना, अंत में घटाना उपस्थित होता हैं। इस प्रकार इसकी अन्य स्थितियों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, चूंकि कुछ स्थितियों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में उपस्थित <code>DISTINCT COUNT</code> (गणना-विशिष्ट समस्या), <code>MEDIAN</code>, और <code>MODE</code> को सम्मिलित किया जाता हैं।


ऐसे फ़ंक्शंस को विघटित एकत्रीकरण फ़ंक्शंस कहा जाता है{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} या विघटित समुच्चय कार्य। सबसे सरल को स्व-विघटित एकत्रीकरण कार्यों के रूप में संदर्भित किया जा सकता है, जिन्हें उन कार्यों के रूप में परिभाषित किया गया है {{mvar|''f''}} जैसे कि मर्ज ऑपरेटर है {{tmath|\diamond}} ऐसा है कि
ऐसे फ़ंक्शंस को विघटित युनिफाइट फंक्शंस या विघटित समुच्चय कार्य कहा जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} इसका सबसे सरल स्व-विघटित युनिफाइट फंक्शंस के रूप में संदर्भित किया जा सकता है, जिन्हें उन फंक्शंस {{mvar|''f''}} के रूप में परिभाषित किया गया है, जैसे कि मर्ज ऑपरेटर {{tmath|\diamond}} है, जो इस प्रकार हैं कि-
:<math>f(X \uplus Y) = f(X) \diamond f(Y)</math>
:<math>f(X \uplus Y) = f(X) \diamond f(Y)</math>
कहाँ {{tmath|\uplus}} मल्टीसेट्स का संघ है ([[मोनोइड समरूपता]] देखें)।
जहाँ {{tmath|\uplus}} मल्टीसेट्स का युनियन है, जिसे [[मोनोइड समरूपता]] के रूप में देख सकते हैं।


उदाहरण के लिए, <code>SUM</code>:
उदाहरण के लिए, <code>SUM</code>:
:<math>\operatorname{SUM}({x}) = x</math>, सिंगलटन के लिए;
:<math>\operatorname{SUM}({x}) = x</math>, सिंगलटन के लिए;
:<math>\operatorname{SUM}(X \uplus Y) = \operatorname{SUM}(X) + \operatorname{SUM}(Y)</math>, अर्थात विलय {{tmath|\diamond}} बस जोड़ है.
:<math>\operatorname{SUM}(X \uplus Y) = \operatorname{SUM}(X) + \operatorname{SUM}(Y)</math>, अर्थात विलय {{tmath|\diamond}} बस संयोजन है.
<code>COUNT</code>:
<code>COUNT</code>:
:<math>\operatorname{COUNT}({x}) = 1</math>,
:<math>\operatorname{COUNT}({x}) = 1</math>,
Line 68: Line 69:
:<math>\operatorname{MIN}(X \uplus Y) = \min\bigl(\operatorname{MIN}(X), \operatorname{MIN}(Y)\bigr)</math>.
:<math>\operatorname{MIN}(X \uplus Y) = \min\bigl(\operatorname{MIN}(X), \operatorname{MIN}(Y)\bigr)</math>.


ध्यान दें कि स्व-विघटित एकत्रीकरण कार्यों को अलग-अलग लागू करके जोड़ा जा सकता है (औपचारिक रूप से, उत्पाद लेना), इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है <code>SUM</code> और <code>COUNT</code> ही समय में, दो नंबरों को ट्रैक करके।
यहाँ पर ध्यान दें कि स्व-विघटित युनिफाइट फंक्शंस को अलग-अलग लागू करके साथ ही जोड़ा भी जा सकता है, औपचारिक रूप से, उत्पाद लेने के उद्देश्य से इसका उपयोग करते हैं। इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है, जिसके आधार पर <code>SUM</code> और <code>COUNT</code> ही समय में दो नंबरों को ट्रैक करके इसका पता लगाया जाता हैं।
 
अधिक सामान्यतः, कोई विघटित युनिफाइड फ़ंक्शन {{mvar|''f''}} को परिभाषित कर सकता है, इसके आधार पर अंतिम फ़ंक्शन की संरचना {{mvar|''g''}} के रूप में व्यक्त किया जा सकता है, और स्व-विघटित युनिफाइड फ़ंक्शन {{mvar|''h''}} के लिए <math>f = g \circ h, f(X) = g(h(X))</math> के रूप में परिभाषित किया जाता हैं। उदाहरण के लिए, <code>AVERAGE</code>=<code>SUM</code>/<code>COUNT</code> और <code>RANGE</code>=<code>MAX</code>−<code>MIN</code> इसका मुख्य उदाहरण हैं।
 
[[MapReduce|मैप रिड्यूस]] फ्रेमवर्क में, इन चरणों को प्रारंभिक कमी के रूप में व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान को संयोजित करने के लिए दो युनिफाइड बाइनरी को संयोजित करके और अंतिम कमी के सहायक मान पर अंतिम फ़ंक्शन के रूप में जाना जाता है।{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, pp. 2–4}} इस कारण विघटित होने वाले युनिफाइड को शफ़ल चरण से पहले ले जाना प्रारंभिक कमी के विशेष भाग के रूप में जाना जाता है,{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, p. 1}}
 
ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के अतिरिक्त [[OLAP घन]] में पूर्व-गणना किए गए परिणामों पर युनिफाइड प्रश्नों की गणना करने की अनुमति देते हैं।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, इसका समर्थन करना सरल है, इसके आधार पर <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code> OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना कठिन हो जाता है, इस प्रकार <code>MEDIAN</code> के लिए इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।
 
== अन्य विघटित समुच्चय फंक्शन ==
समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: इसके मानों का कुल (Σx<sub>i</sub> = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)<sub>i</sub><sup>2</sup>=SUM(x<sup>2</sup>)) के समान होती हैं।<ref>Ing. Óscar Bonilla, MBA</ref>
<code>AVG</code>:<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) * \operatorname{COUNT}(X) + \operatorname{AVG}(Y) * \operatorname{COUNT}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>या<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{SUM}(X) + \operatorname{SUM}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>या, केवल यदि COUNT(X)=COUNT(Y)<math display="block">\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) + \operatorname{AVG}(Y)\bigr) / 2</math><br><code>SUM(x<sup>2</sup>)</code>:


अधिक सामान्यतः, कोई विघटित एकत्रीकरण फ़ंक्शन को परिभाषित कर सकता है {{mvar|''f''}} के रूप में जिसे अंतिम फ़ंक्शन की संरचना के रूप में व्यक्त किया जा सकता है {{mvar|''g''}} और स्व-विघटित एकत्रीकरण फ़ंक्शन {{mvar|''h''}}, <math>f = g \circ h, f(X) = g(h(X))</math>. उदाहरण के लिए, <code>AVERAGE</code>=<code>SUM</code>/<code>COUNT</code> और <code>RANGE</code>=<code>MAX</code>−<code>MIN</code>.


[[MapReduce]] फ्रेमवर्क में, इन चरणों को InitialReduce (व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान), कम्बाइन (दो एकत्रीकरण पर बाइनरी मर्ज), और फाइनलReduce (सहायक मान पर अंतिम फ़ंक्शन) के रूप में जाना जाता है।{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, pp. 2–4}} और विघटित एकत्रीकरण को शफ़ल चरण से पहले ले जाना इनिशियलरिड्यूस चरण के रूप में जाना जाता है,{{sfn|Yu|Gunda|Isard|2009|loc=2. Distributed Aggregation, p. 1}}
समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है<math display="block">\operatorname{SUM}(X^2 \uplus Y^2) = \operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)</math><br><code>STDDEV</code>:


ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के बजाय [[OLAP घन]] में पूर्व-गणना किए गए परिणामों पर एकत्रीकरण प्रश्नों की गणना करने की अनुमति देते हैं।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, इसका समर्थन करना आसान है <code>COUNT</code>, <code>MAX</code>, <code>MIN</code>, और <code>SUM</code> OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना मुश्किल है <code>MEDIAN</code>, क्योंकि इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।


== अन्य विघटित समुच्चय कार्य ==
सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास उक्त समीकरण इस प्रकार है-<ref>[[Standard deviation#Identities and mathematical properties]]</ref><math display="block">\operatorname{STDDEV}(X) = s(x) = \sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^2} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - (\overline{x})^2}
समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: मानों का कुल (Σx<sub>i</sub> = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)<sub>i</sub><sup>2</sup>=SUM(x<sup>प्रत्येक समूह के 2</sup>))<ref>Ing. Óscar Bonilla, MBA</ref><br>
<br>
<code>AVG</code>:
<math display=block>\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) * \operatorname{COUNT}(X) + \operatorname{AVG}(Y) * \operatorname{COUNT}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>
या<br>
<math display=block>\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{SUM}(X) + \operatorname{SUM}(Y)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y)\bigr)</math>
या, केवल यदि COUNT(X)=COUNT(Y)<br>
<math display=block>\operatorname{AVG}(X \uplus Y) = \bigl(\operatorname{AVG}(X) + \operatorname{AVG}(Y)\bigr) / 2</math>
<br>
<code>SUM(x<sup>2</sup>)</code>:
समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है
<math display=block>\operatorname{SUM}(X^2 \uplus Y^2) = \operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)</math>
<br>
<code>STDDEV</code>:<br>
सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास है<ref>[[Standard deviation#Identities and mathematical properties]]</ref>
<math display=block>\operatorname{STDDEV}(X) = s(x) = \sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^2} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - (\overline{x})^2}
= \sqrt{\operatorname{SUM}(x^2)  / \operatorname{COUNT}(x) - \operatorname{AVG}(x) ^2}
= \sqrt{\operatorname{SUM}(x^2)  / \operatorname{COUNT}(x) - \operatorname{AVG}(x) ^2}
</math>
</math>इसका अर्ताथ यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।<math display="block">\operatorname{STDDEV}(X \uplus Y) = \sqrt{\operatorname{SUM}(X^2 \uplus Y^2)  / \operatorname{COUNT}(X \uplus Y) - \operatorname{AVG}(X \uplus Y) ^2}</math><math display="block">\operatorname{STDDEV}(X \uplus Y) = \sqrt{\bigl(\operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y) \bigr) - \bigl((\operatorname{SUM}(X) + \operatorname{SUM}(Y)) / (\operatorname{COUNT}(X) + \operatorname{COUNT}(Y))\bigr)^2}</math>
इसका मतलब यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।
 
<math display=block>\operatorname{STDDEV}(X \uplus Y) = \sqrt{\operatorname{SUM}(X^2 \uplus Y^2)  / \operatorname{COUNT}(X \uplus Y) - \operatorname{AVG}(X \uplus Y) ^2}</math>
<math display=block>\operatorname{STDDEV}(X \uplus Y) = \sqrt{\bigl(\operatorname{SUM}(X^2)+\operatorname{SUM}(Y^2)\bigr) / \bigl(\operatorname{COUNT}(X) + \operatorname{COUNT}(Y) \bigr) - \bigl((\operatorname{SUM}(X) + \operatorname{SUM}(Y)) / (\operatorname{COUNT}(X) + \operatorname{COUNT}(Y))\bigr)^2}</math>
==यह भी देखें==
==यह भी देखें==
*क्रॉस-सारणीकरण उर्फ ​​आकस्मिकता तालिका
*क्रॉस टैबुलेशन या ​​कांटिजेंसी टेबल
*[[डेटा ड्रिलिंग]]
*[[डेटा ड्रिलिंग]]
*[[डेटा खनन]]
*[[डेटा खनन|डेटा माइनिंग]]
*[[डाटा प्रासेसिंग]]
*[[डाटा प्रासेसिंग]]
*निकालें, रूपांतरित करें, लोड करें
*एक्सट्रैक्ट, ट्रांसफाॅर्म, लोड
*फ़ोल्ड (उच्च-क्रम फ़ंक्शन)
*फ़ोल्ड (उच्च-क्रम फ़ंक्शन)
*ग्रुप बाय (एसक्यूएल), एसक्यूएल क्लॉज
*ग्रुप बाय (एसक्यूएल), एसक्यूएल क्लॉज
*ओलाप क्यूब
*ओलाप क्यूब
*ऑनलाइन विश्लेषणात्मक प्रक्रिया
*ऑनलाइन विश्लेषणात्मक प्रक्रिया
*[[पिवट तालिका]]
*[[पिवट तालिका|पिवट टेबल]]
*संबंधपरक बीजगणित
*रिलेशलन एल्जेब्रा
*अविभाज्य वस्तुओं पर उपयोगिता कार्य#उपयोगिता कार्यों का [[समुच्चय]]
*अविभाज्य वस्तुओं पर उपयोगिता कार्य, उपयोगिता कार्यों का [[समुच्चय]]
*[[विश्लेषण के लिए एक्सएमएल]]
*[[विश्लेषण के लिए एक्सएमएल]]
*एग्रीगेटआईक्यू
*एग्रीगेटआईक्यू
*मानचित्र छोटा करना
*मानचित्र में कमी


==संदर्भ==
==संदर्भ==
Line 153: Line 144:
* [https://msdn.microsoft.com/en-IN/library/ms173454.aspx Aggregate Functions (Transact-SQL)]
* [https://msdn.microsoft.com/en-IN/library/ms173454.aspx Aggregate Functions (Transact-SQL)]


{{DEFAULTSORT:Aggregate Function}}[[Category: सबरूटीन्स]]
{{DEFAULTSORT:Aggregate Function}}
 
 


[[Category: Machine Translated Page]]
[[Category:Created On 25/07/2023|Aggregate Function]]
[[Category:Created On 25/07/2023]]
[[Category:Lua-based templates|Aggregate Function]]
[[Category:Machine Translated Page|Aggregate Function]]
[[Category:Pages with script errors|Aggregate Function]]
[[Category:Short description with empty Wikidata description|Aggregate Function]]
[[Category:Templates Vigyan Ready|Aggregate Function]]
[[Category:Templates that add a tracking category|Aggregate Function]]
[[Category:Templates that generate short descriptions|Aggregate Function]]
[[Category:Templates using TemplateData|Aggregate Function]]
[[Category:सबरूटीन्स|Aggregate Function]]

Latest revision as of 11:50, 10 August 2023

डेटाबेस प्रबंधन में, ऐग्रीगेट फ़ंक्शन या युनिफाइड फ़ंक्शन ऐसे सबरूटीन है, जिसमें एकल सारांशित आँकडों को बनाने के लिए कई पंक्तियों में उपस्थित मानों को एक साथ संसाधित किया जाता है।

(चित्र 1) इकाई संबंध आरेख युनिफाइड का प्रतिनिधित्व।

सामान्य ऐग्रीगेट फ़ंक्शन्स में निम्न बिंदु उपस्थित रहते हैं:

अन्य में उपस्थित हैं:

  • नाॅनमीन (अर्ताथ NaN मानों को नगण्य मानना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
  • मानक विचलन

औपचारिक रूप से, ऐग्रीगेट फ़ंक्शन इनपुट के रूप में सेट (कंप्यूटर विज्ञान), मल्टीसेट (डेटा का प्रकार) (बैग), या कुछ इनपुट डोमेन से सूची (कंप्यूटिंग) लेता है। जिसके आधार पर I और आउटपुट डोमेन के तत्व को O आउटपुट करता है।[1] इस प्रकार इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि SUM, या भिन्न हो सकता है, जैसे कि के लिए COUNT इसका प्रमुख उदाहरण हैं।

ऐग्रीगेट फ़ंक्शन सामान्यतः कई प्रोग्रामिंग लैंग्वेज, स्प्रेडशीट्स और रिलेशनल बीजगणित में उपस्थित होते हैं। इस प्रकार listagg e> फ़ंक्शन, जैसे SQL:2016 मानक में परिभाषित है[2]

एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है।

इकाई-संबंध मॉडल में, युनिफाइड को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है, जिससे कि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।[3]

विघटित समुच्चय कार्य

ऐग्रीगेट फ़ंक्शन बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। इसके आधार पर वितरित कंप्यूटिंग में ऐसी गणनाओं को छोटे भागों में विभाजित करना वांछनीय हो जाता है, और किसी फंक्शन को सामान्यतः पैरलेल कंप्यूटिंग, विभाजन और विक्ट्री एल्गोरिथ्म के माध्यम से वितरित करना है।

कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में उपस्थित COUNT, MAX, MIN, और SUM का उपयोग किया जाता हैं। इसकी अन्य स्थितियों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में उपस्थित AVERAGE (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और RANGE अधिकतम और न्यूनतम पर ध्यान रखना, अंत में घटाना उपस्थित होता हैं। इस प्रकार इसकी अन्य स्थितियों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, चूंकि कुछ स्थितियों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में उपस्थित DISTINCT COUNT (गणना-विशिष्ट समस्या), MEDIAN, और MODE को सम्मिलित किया जाता हैं।

ऐसे फ़ंक्शंस को विघटित युनिफाइट फंक्शंस या विघटित समुच्चय कार्य कहा जाता है।[4] इसका सबसे सरल स्व-विघटित युनिफाइट फंक्शंस के रूप में संदर्भित किया जा सकता है, जिन्हें उन फंक्शंस f के रूप में परिभाषित किया गया है, जैसे कि मर्ज ऑपरेटर है, जो इस प्रकार हैं कि-

जहाँ मल्टीसेट्स का युनियन है, जिसे मोनोइड समरूपता के रूप में देख सकते हैं।

उदाहरण के लिए, SUM:

, सिंगलटन के लिए;
, अर्थात विलय बस संयोजन है.

COUNT:

,
.

MAX:

,
.

MIN:

,[2]
.

यहाँ पर ध्यान दें कि स्व-विघटित युनिफाइट फंक्शंस को अलग-अलग लागू करके साथ ही जोड़ा भी जा सकता है, औपचारिक रूप से, उत्पाद लेने के उद्देश्य से इसका उपयोग करते हैं। इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है, जिसके आधार पर SUM और COUNT ही समय में दो नंबरों को ट्रैक करके इसका पता लगाया जाता हैं।

अधिक सामान्यतः, कोई विघटित युनिफाइड फ़ंक्शन f को परिभाषित कर सकता है, इसके आधार पर अंतिम फ़ंक्शन की संरचना g के रूप में व्यक्त किया जा सकता है, और स्व-विघटित युनिफाइड फ़ंक्शन h के लिए के रूप में परिभाषित किया जाता हैं। उदाहरण के लिए, AVERAGE=SUM/COUNT और RANGE=MAXMIN इसका मुख्य उदाहरण हैं।

मैप रिड्यूस फ्रेमवर्क में, इन चरणों को प्रारंभिक कमी के रूप में व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान को संयोजित करने के लिए दो युनिफाइड बाइनरी को संयोजित करके और अंतिम कमी के सहायक मान पर अंतिम फ़ंक्शन के रूप में जाना जाता है।[5] इस कारण विघटित होने वाले युनिफाइड को शफ़ल चरण से पहले ले जाना प्रारंभिक कमी के विशेष भाग के रूप में जाना जाता है,[6]

ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के अतिरिक्त OLAP घन में पूर्व-गणना किए गए परिणामों पर युनिफाइड प्रश्नों की गणना करने की अनुमति देते हैं।[7] उदाहरण के लिए, इसका समर्थन करना सरल है, इसके आधार पर COUNT, MAX, MIN, और SUM OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना कठिन हो जाता है, इस प्रकार MEDIAN के लिए इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।

अन्य विघटित समुच्चय फंक्शन

समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: इसके मानों का कुल (Σxi = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)i2=SUM(x2)) के समान होती हैं।[8] AVG:

या
या, केवल यदि COUNT(X)=COUNT(Y)

SUM(x2):


समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है


STDDEV:


सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास उक्त समीकरण इस प्रकार है-[9]

इसका अर्ताथ यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।

यह भी देखें

संदर्भ

उद्धरण

  1. Jesus, Baquero & Almeida 2011, 2 Problem Definition, pp. 3.
  2. 2.0 2.1 Winand, Markus (2017-05-15). "Big News in Databases: New SQL Standard, Cloud Wars, and ACIDRain (Spring 2017)". DZone. Retrieved 2017-06-10. In December 2016, ISO released a new version of the SQL standard. It introduces new features such as row pattern matching, listagg, date and time formatting, and JSON support.
  3. Elmasri, Ramez (2016). डेटाबेस सिस्टम की बुनियादी बातें. Sham Navathe (Seventh ed.). Hoboken, NJ. p. 133. ISBN 978-0-13-397077-7. OCLC 913842106.{{cite book}}: CS1 maint: location missing publisher (link)
  4. Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
  5. Yu, Gunda & Isard 2009, 2. Distributed Aggregation, pp. 2–4.
  6. Yu, Gunda & Isard 2009, 2. Distributed Aggregation, p. 1.
  7. Zhang 2017, p. 1.
  8. Ing. Óscar Bonilla, MBA
  9. Standard deviation#Identities and mathematical properties


ग्रन्थसूची


अग्रिम पठन


बाहरी संबंध