समग्र कार्य: Difference between revisions

Revision as of 13:21, 9 August 2023

डेटाबेस प्रबंधन में, ऐग्रीगेट फ़ंक्शन या युनिफाइड फ़ंक्शन ऐसे सबरूटीन है, जिसमें एकल सारांशित आँकडों को बनाने के लिए कई पंक्तियों में उपस्थित मानों को एक साथ संसाधित किया जाता है।

(चित्र 1) इकाई संबंध आरेख युनिफाइड का प्रतिनिधित्व।

सामान्य ऐग्रीगेट फ़ंक्शन्स में निम्न बिंदु उपस्थित रहते हैं:

औसत (अर्ताथ, अंकगणितीय माध्य)
गिनती
अधिकतम
माध्यिका
न्यूनतम
मोड (सांख्यिकी)
रेंज (सांख्यिकी)
संक्षेप

अन्य में उपस्थित हैं:

नाॅनमीन (अर्ताथ NaN मानों को नगण्य मानना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
मानक विचलन

औपचारिक रूप से, ऐग्रीगेट फ़ंक्शन इनपुट के रूप में सेट (कंप्यूटर विज्ञान), मल्टीसेट (डेटा का प्रकार) (बैग), या कुछ इनपुट डोमेन से सूची (कंप्यूटिंग) लेता है। जिसके आधार पर $I$ और आउटपुट डोमेन के तत्व को $O$ आउटपुट करता है।^[1] इस प्रकार इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि SUM, या भिन्न हो सकता है, जैसे कि के लिए COUNT इसका प्रमुख उदाहरण हैं।

ऐग्रीगेट फ़ंक्शन सामान्यतः कई प्रोग्रामिंग लैंग्वेज, स्प्रेडशीट्स और रिलेशनल बीजगणित में उपस्थित होते हैं। इस प्रकार listagg e> फ़ंक्शन, जैसे SQL:2016 मानक में परिभाषित है^[2]

एकाधिक पंक्तियों से डेटा को एकल संयोजित स्ट्रिंग में एकत्रित करता है।

इकाई-संबंध मॉडल में, युनिफाइड को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर आयत के साथ दर्शाया गया है, जिससे कि यह दर्शाया जा सके कि इसे समग्र इकाई के रूप में माना जा रहा है।^[3]

विघटित समुच्चय कार्य

ऐग्रीगेट फ़ंक्शन बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से ही बार में सभी इनपुट मानों की आवश्यकता होती है। इसके आधार पर वितरित कंप्यूटिंग में ऐसी गणनाओं को छोटे भागों में विभाजित करना वांछनीय हो जाता है, और किसी फंक्शन को सामान्यतः पैरलेल कंप्यूटिंग, विभाजन और विक्ट्री एल्गोरिथ्म के माध्यम से वितरित करना है।

कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में उपस्थित COUNT, MAX, MIN, और SUM का उपयोग किया जाता हैं। इसकी अन्य स्थितियों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में उपस्थित AVERAGE (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और RANGE अधिकतम और न्यूनतम पर ध्यान रखना, अंत में घटाना उपस्थित होता हैं। इस प्रकार इसकी अन्य स्थितियों में पूरे सेट का बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, चूंकि कुछ स्थितियों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में उपस्थित DISTINCT COUNT (गणना-विशिष्ट समस्या), MEDIAN, और MODE को सम्मिलित किया जाता हैं।

ऐसे फ़ंक्शंस को विघटित युनिफाइट फंक्शंस या विघटित समुच्चय कार्य कहा जाता है।^[4] इसका सबसे सरल स्व-विघटित युनिफाइट फंक्शंस के रूप में संदर्भित किया जा सकता है, जिन्हें उन फंक्शंस $f$ के रूप में परिभाषित किया गया है, जैसे कि मर्ज ऑपरेटर $\diamond$ है, जो इस प्रकार हैं कि-

f(X\uplus Y)=f(X)\diamond f(Y)

जहाँ $\uplus$ मल्टीसेट्स का युनियन है, जिसे मोनोइड समरूपता के रूप में देख सकते हैं।

उदाहरण के लिए, SUM:

\operatorname {SUM} ({x})=x

, सिंगलटन के लिए;

\operatorname {SUM} (X\uplus Y)=\operatorname {SUM} (X)+\operatorname {SUM} (Y)

, अर्थात विलय

\diamond

बस संयोजन है.

COUNT:

\operatorname {COUNT} ({x})=1

,

\operatorname {COUNT} (X\uplus Y)=\operatorname {COUNT} (X)+\operatorname {COUNT} (Y)

.

MAX:

\operatorname {MAX} ({x})=x

,

\operatorname {MAX} (X\uplus Y)=\max {\bigl (}\operatorname {MAX} (X),\operatorname {MAX} (Y){\bigr )}

.

MIN:

{\textstyle \operatorname {MIN} ({x})=x}

,^[2]

\operatorname {MIN} (X\uplus Y)=\min {\bigl (}\operatorname {MIN} (X),\operatorname {MIN} (Y){\bigr )}

.

यहाँ पर ध्यान दें कि स्व-विघटित युनिफाइट फंक्शंस को अलग-अलग लागू करके साथ ही जोड़ा भी जा सकता है, औपचारिक रूप से, उत्पाद लेने के उद्देश्य से इसका उपयोग करते हैं। इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है, जिसके आधार पर SUM और COUNT ही समय में दो नंबरों को ट्रैक करके इसका पता लगाया जाता हैं।

अधिक सामान्यतः, कोई विघटित युनिफाइड फ़ंक्शन $f$ को परिभाषित कर सकता है, इसके आधार पर अंतिम फ़ंक्शन की संरचना $g$ के रूप में व्यक्त किया जा सकता है, और स्व-विघटित युनिफाइड फ़ंक्शन $h$ के लिए $f=g\circ h,f(X)=g(h(X))$ के रूप में परिभाषित किया जाता हैं। उदाहरण के लिए, AVERAGE=SUM/COUNT और RANGE=MAX−MIN इसका मुख्य उदाहरण हैं।

मैप रिड्यूस फ्रेमवर्क में, इन चरणों को प्रारंभिक कमी के रूप में व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान को संयोजित करने के लिए दो युनिफाइड बाइनरी को संयोजित करके और अंतिम कमी के सहायक मान पर अंतिम फ़ंक्शन के रूप में जाना जाता है।^[5] इस कारण विघटित होने वाले युनिफाइड को शफ़ल चरण से पहले ले जाना प्रारंभिक कमी के विशेष भाग के रूप में जाना जाता है,^[6]

ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के अतिरिक्त OLAP घन में पूर्व-गणना किए गए परिणामों पर युनिफाइड प्रश्नों की गणना करने की अनुमति देते हैं।^[7] उदाहरण के लिए, इसका समर्थन करना सरल है, इसके आधार पर COUNT, MAX, MIN, और SUM OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना कठिन हो जाता है, इस प्रकार MEDIAN के लिए इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।

अन्य विघटित समुच्चय फंक्शन

समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: इसके मानों का कुल (Σx_i = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)_i²=SUM(x²)) के समान होती हैं।^[8] AVG:

\operatorname {AVG} (X\uplus Y)={\bigl (}\operatorname {AVG} (X)*\operatorname {COUNT} (X)+\operatorname {AVG} (Y)*\operatorname {COUNT} (Y){\bigr )}/{\bigl (}\operatorname {COUNT} (X)+\operatorname {COUNT} (Y){\bigr )}

या

\operatorname {AVG} (X\uplus Y)={\bigl (}\operatorname {SUM} (X)+\operatorname {SUM} (Y){\bigr )}/{\bigl (}\operatorname {COUNT} (X)+\operatorname {COUNT} (Y){\bigr )}

या, केवल यदि COUNT(X)=COUNT(Y)

\operatorname {AVG} (X\uplus Y)={\bigl (}\operatorname {AVG} (X)+\operatorname {AVG} (Y){\bigr )}/2

SUM(x²):

समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है

\operatorname {SUM} (X^{2}\uplus Y^{2})=\operatorname {SUM} (X^{2})+\operatorname {SUM} (Y^{2})

STDDEV:

सभी बिंदुओं पर समान संभावनाओं वाली सीमित जनसंख्या के लिए, हमारे पास उक्त समीकरण इस प्रकार है-^[9]

\operatorname {STDDEV} (X)=s(x)={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}={\sqrt {{\frac {1}{N}}\left(\sum _{i=1}^{N}x_{i}^{2}\right)-({\overline {x}})^{2}}}={\sqrt {\operatorname {SUM} (x^{2})/\operatorname {COUNT} (x)-\operatorname {AVG} (x)^{2}}}

इसका अर्ताथ यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।

\operatorname {STDDEV} (X\uplus Y)={\sqrt {\operatorname {SUM} (X^{2}\uplus Y^{2})/\operatorname {COUNT} (X\uplus Y)-\operatorname {AVG} (X\uplus Y)^{2}}}

\operatorname {STDDEV} (X\uplus Y)={\sqrt {{\bigl (}\operatorname {SUM} (X^{2})+\operatorname {SUM} (Y^{2}){\bigr )}/{\bigl (}\operatorname {COUNT} (X)+\operatorname {COUNT} (Y){\bigr )}-{\bigl (}(\operatorname {SUM} (X)+\operatorname {SUM} (Y))/(\operatorname {COUNT} (X)+\operatorname {COUNT} (Y)){\bigr )}^{2}}}

यह भी देखें

क्रॉस टैबुलेशन या कांटिजेंसी टेबल
डेटा ड्रिलिंग
डेटा माइनिंग
डाटा प्रासेसिंग
एक्सट्रैक्ट, ट्रांसफाॅर्म, लोड
फ़ोल्ड (उच्च-क्रम फ़ंक्शन)
ग्रुप बाय (एसक्यूएल), एसक्यूएल क्लॉज
ओलाप क्यूब
ऑनलाइन विश्लेषणात्मक प्रक्रिया
पिवट टेबल
रिलेशलन एल्जेब्रा
अविभाज्य वस्तुओं पर उपयोगिता कार्य, उपयोगिता कार्यों का समुच्चय
विश्लेषण के लिए एक्सएमएल
एग्रीगेटआईक्यू
मानचित्र में कमी

संदर्भ

उद्धरण

↑ Jesus, Baquero & Almeida 2011, 2 Problem Definition, pp. 3.
↑ ^2.0 ^2.1 Winand, Markus (2017-05-15). "Big News in Databases: New SQL Standard, Cloud Wars, and ACIDRain (Spring 2017)". DZone. Retrieved 2017-06-10. In December 2016, ISO released a new version of the SQL standard. It introduces new features such as row pattern matching, listagg, date and time formatting, and JSON support.
↑ Elmasri, Ramez (2016). डेटाबेस सिस्टम की बुनियादी बातें. Sham Navathe (Seventh ed.). Hoboken, NJ. p. 133. ISBN 978-0-13-397077-7. OCLC 913842106.{{cite book}}: CS1 maint: location missing publisher (link)
↑ Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
↑ Yu, Gunda & Isard 2009, 2. Distributed Aggregation, pp. 2–4.
↑ Yu, Gunda & Isard 2009, 2. Distributed Aggregation, p. 1.
↑ Zhang 2017, p. 1.
↑ Ing. Óscar Bonilla, MBA
↑ Standard deviation#Identities and mathematical properties

ग्रन्थसूची

Yu, Yuan; Gunda, Pradeep Kumar; Isard, Michael (2009). Distributed aggregation for data-parallel computing: interfaces and implementations. ACM SIGOPS 22nd symposium on Operating systems principles. ACM. pp. 247–260. doi:10.1145/1629575.1629600.
Jesus, Paulo; Baquero, Carlos; Almeida, Paulo Sérgio (2011). "A Survey of Distributed Data Aggregation Algorithms". arXiv:1110.0725 [cs.DC].
Zhang, Chao (2017). Symmetric and Asymmetric Aggregate Function in Massively Parallel Computing (Technical report).

अग्रिम पठन

Grabisch, Michel; Marichal, Jean-Luc; Mesiar, Radko; Pap, Endre (2009). Aggregation functions. Encyclopedia of Mathematics and its Applications. Vol. 127. Cambridge: Cambridge University Press. ISBN 978-0-521-51926-7. Zbl 1196.00002.
Oracle Aggregate Functions: MAX, MIN, COUNT, SUM, AVG Examples

बाहरी संबंध

Aggregate Functions (Transact-SQL)

[FOOTNOTEJesusBaqueroAlmeida20112_Problem_Definition,_pp._3-1] Jesus, Baquero & Almeida 2011, 2 Problem Definition, pp. 3.

[:0-2] 2.0 ^2.1 Winand, Markus (2017-05-15). "Big News in Databases: New SQL Standard, Cloud Wars, and ACIDRain (Spring 2017)". DZone. Retrieved 2017-06-10. In December 2016, ISO released a new version of the SQL standard. It introduces new features such as row pattern matching, listagg, date and time formatting, and JSON support.

[3] Elmasri, Ramez (2016). डेटाबेस सिस्टम की बुनियादी बातें. Sham Navathe (Seventh ed.). Hoboken, NJ. p. 133. ISBN 978-0-13-397077-7. OCLC 913842106.{{cite book}}: CS1 maint: location missing publisher (link)

[FOOTNOTEJesusBaqueroAlmeida20112.1_Decomposable_functions,_pp._3–4-4] Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.

[FOOTNOTEYuGundaIsard20092._Distributed_Aggregation,_pp._2–4-5] Yu, Gunda & Isard 2009, 2. Distributed Aggregation, pp. 2–4.

[FOOTNOTEYuGundaIsard20092._Distributed_Aggregation,_p._1-6] Yu, Gunda & Isard 2009, 2. Distributed Aggregation, p. 1.

[FOOTNOTEZhang20171-7] Zhang 2017, p. 1.

[8] Ing. Óscar Bonilla, MBA

[9] Standard deviation#Identities and mathematical properties

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

@@ Line 150: / Line 150: @@
 [[Category: Machine Translated Page]]
 [[Category:Created On 25/07/2023]]
+[[Category:Vigyan Ready]]

Anonymous

Search

समग्र कार्य: Difference between revisions

Namespaces

More

Page actions

Revision as of 13:21, 9 August 2023

Contents

विघटित समुच्चय कार्य

अन्य विघटित समुच्चय फंक्शन

यह भी देखें

संदर्भ

उद्धरण

ग्रन्थसूची

अग्रिम पठन

बाहरी संबंध

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

समग्र कार्य: Difference between revisions

Revision as of 13:21, 9 August 2023

विघटित समुच्चय कार्य

अन्य विघटित समुच्चय फंक्शन

यह भी देखें

संदर्भ

उद्धरण

ग्रन्थसूची

अग्रिम पठन

बाहरी संबंध

Navigation

Wiki tools

Page tools

Other projects

Categories