समग्र कार्य

From Vigyanwiki
Revision as of 15:58, 25 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Type of function in database management}} डेटाबेस प्रबंधन में, एक समग्र फ़ंक्शन या...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

डेटाबेस प्रबंधन में, एक समग्र फ़ंक्शन या एकत्रीकरण फ़ंक्शन एक सबरूटीन है जहां एकल सारांश आँकड़े बनाने के लिए कई पंक्तियों के मानों को एक साथ संसाधित किया जाता है।

(चित्र 1) इकाई संबंध आरेख एकत्रीकरण का प्रतिनिधित्व।

सामान्य समग्र कार्यों में शामिल हैं:

अन्य में शामिल हैं:

  • नानमीन (मतलब NaN मानों को अनदेखा करना, जिसे शून्य या शून्य के रूप में भी जाना जाता है)
  • मानक विचलन

औपचारिक रूप से, एक समग्र फ़ंक्शन इनपुट के रूप में एक सेट (कंप्यूटर विज्ञान), एक मल्टीसेट (अमूर्त डेटा प्रकार) (बैग), या कुछ इनपुट डोमेन से एक सूची (कंप्यूटिंग) लेता है। I और आउटपुट डोमेन के एक तत्व को आउटपुट करता है O.[1] इनपुट और आउटपुट डोमेन समान हो सकते हैं, जैसे कि SUM, या भिन्न हो सकता है, जैसे कि के लिए COUNT.

समग्र कार्य आम तौर पर कई प्रोग्रामिंग भाषाओं, स्प्रेडशीट्स और रिलेशनल बीजगणित में होते हैं। listagg e> फ़ंक्शन, जैसा कि SQL:2016 मानक में परिभाषित है[2] एकाधिक पंक्तियों से डेटा को एक एकल संयोजित स्ट्रिंग में एकत्रित करता है।

इकाई-संबंध मॉडल में, एकत्रीकरण को चित्र 1 में दिखाए अनुसार संबंध और उसकी संस्थाओं के चारों ओर एक आयत के साथ दर्शाया गया है ताकि यह दर्शाया जा सके कि इसे एक समग्र इकाई के रूप में माना जा रहा है।[3]


विघटित समुच्चय कार्य

समग्र फ़ंक्शन एक बॉटलनेक (सॉफ़्टवेयर) प्रस्तुत करते हैं, क्योंकि उन्हें संभावित रूप से एक ही बार में सभी इनपुट मानों की आवश्यकता होती है। वितरित कंप्यूटिंग में, ऐसी गणनाओं को छोटे टुकड़ों में विभाजित करना वांछनीय है, और कार्य को, आमतौर पर समानांतर कंप्यूटिंग, एक विभाजन और जीत एल्गोरिथ्म के माध्यम से वितरित करना है।

कुछ समुच्चय कार्यों की गणना उपसमुच्चय के लिए समुच्चय की गणना करके और फिर इन समुच्चयों को एकत्रित करके की जा सकती है; उदाहरणों में शामिल COUNT, MAX, MIN, और SUM. अन्य मामलों में समुच्चय की गणना उपसमुच्चय के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में कुल संख्या की गणना करके की जा सकती है; उदाहरणों में शामिल AVERAGE (योग और गिनती पर नज़र रखना, अंत में विभाजित करना) और RANGE (अधिकतम और न्यूनतम पर नज़र रखना, अंत में घटाना)। अन्य मामलों में पूरे सेट का एक बार में विश्लेषण किए बिना कुल की गणना नहीं की जा सकती है, हालांकि कुछ मामलों में अनुमान वितरित किए जा सकते हैं; उदाहरणों में शामिल DISTINCT COUNT (गणना-विशिष्ट समस्या), MEDIAN, और MODE.

ऐसे फ़ंक्शंस को विघटित एकत्रीकरण फ़ंक्शंस कहा जाता है[4] या विघटित समुच्चय कार्य। सबसे सरल को स्व-विघटित एकत्रीकरण कार्यों के रूप में संदर्भित किया जा सकता है, जिन्हें उन कार्यों के रूप में परिभाषित किया गया है f जैसे कि एक मर्ज ऑपरेटर है ऐसा है कि

कहाँ मल्टीसेट्स का संघ है (मोनोइड समरूपता देखें)।

उदाहरण के लिए, SUM:

, एक सिंगलटन के लिए;
, अर्थात विलय बस जोड़ है.

COUNT:

,
.

MAX:

,
.

MIN:

,[2]
.

ध्यान दें कि स्व-विघटित एकत्रीकरण कार्यों को अलग-अलग लागू करके जोड़ा जा सकता है (औपचारिक रूप से, उत्पाद लेना), इसलिए उदाहरण के लिए कोई दोनों की गणना कर सकता है SUM और COUNT एक ही समय में, दो नंबरों को ट्रैक करके।

अधिक सामान्यतः, कोई एक विघटित एकत्रीकरण फ़ंक्शन को परिभाषित कर सकता है f एक के रूप में जिसे अंतिम फ़ंक्शन की संरचना के रूप में व्यक्त किया जा सकता है g और एक स्व-विघटित एकत्रीकरण फ़ंक्शन h, . उदाहरण के लिए, AVERAGE=SUM/COUNT और RANGE=MAXMIN.

MapReduce फ्रेमवर्क में, इन चरणों को InitialReduce (व्यक्तिगत रिकॉर्ड/सिंगलटन सेट पर मान), कम्बाइन (दो एकत्रीकरण पर बाइनरी मर्ज), और फाइनलReduce (सहायक मान पर अंतिम फ़ंक्शन) के रूप में जाना जाता है।[5] और विघटित एकत्रीकरण को शफ़ल चरण से पहले ले जाना इनिशियलरिड्यूस चरण के रूप में जाना जाता है,[6]

ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) में डीकंपोजेबल एग्रीगेशन फ़ंक्शन महत्वपूर्ण हैं, क्योंकि वे आधार डेटा के बजाय OLAP घन में पूर्व-गणना किए गए परिणामों पर एकत्रीकरण प्रश्नों की गणना करने की अनुमति देते हैं।[7] उदाहरण के लिए, इसका समर्थन करना आसान है COUNT, MAX, MIN, और SUM OLAP में, चूँकि इन्हें OLAP क्यूब के प्रत्येक सेल के लिए गणना की जा सकती है और फिर सारांशित (रोल अप) किया जा सकता है, लेकिन इसका समर्थन करना मुश्किल है MEDIAN, क्योंकि इसकी गणना प्रत्येक दृश्य के लिए अलग से की जानी चाहिए।

अन्य विघटित समुच्चय कार्य

समग्र डेटा से औसत और मानक विचलन की गणना करने के लिए, प्रत्येक समूह के लिए उपलब्ध होना आवश्यक है: मानों का कुल (Σxi = SUM(x)), मानों की संख्या (N=COUNT(x)) और मानों के वर्गों का योग (Σx)i2=SUM(xप्रत्येक समूह के 2))[8]

AVG:

या
या, केवल यदि COUNT(X)=COUNT(Y)

SUM(x2): समूहों के मानक विचलन की गणना करने के लिए मानों के वर्गों का योग महत्वपूर्ण है

STDDEV:
सभी बिंदुओं पर समान संभावनाओं वाली एक सीमित जनसंख्या के लिए, हमारे पास है[9][circular reference]
इसका मतलब यह है कि मानक विचलन मानों के वर्गों के औसत और औसत मान के वर्ग के बीच अंतर के वर्गमूल के बराबर है।


यह भी देखें

संदर्भ

उद्धरण

  1. Jesus, Baquero & Almeida 2011, 2 Problem Definition, pp. 3.
  2. 2.0 2.1 Winand, Markus (2017-05-15). "Big News in Databases: New SQL Standard, Cloud Wars, and ACIDRain (Spring 2017)". DZone. Retrieved 2017-06-10. In December 2016, ISO released a new version of the SQL standard. It introduces new features such as row pattern matching, listagg, date and time formatting, and JSON support.
  3. Elmasri, Ramez (2016). डेटाबेस सिस्टम की बुनियादी बातें. Sham Navathe (Seventh ed.). Hoboken, NJ. p. 133. ISBN 978-0-13-397077-7. OCLC 913842106.{{cite book}}: CS1 maint: location missing publisher (link)
  4. Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
  5. Yu, Gunda & Isard 2009, 2. Distributed Aggregation, pp. 2–4.
  6. Yu, Gunda & Isard 2009, 2. Distributed Aggregation, p. 1.
  7. Zhang 2017, p. 1.
  8. Ing. Óscar Bonilla, MBA
  9. Standard deviation#Identities and mathematical properties


ग्रन्थसूची


अग्रिम पठन


बाहरी संबंध