ऑनलाइन विश्लेषणात्मक प्रक्रिया: Difference between revisions
No edit summary |
|||
Line 37: | Line 37: | ||
}}</ref> | }}</ref> | ||
ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन | ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन मूलभूत विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग।<ref name="OBrien">O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.</ref> समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी प्रौद्योगिकी है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )। | ||
ओएलएपी के लिए विन्यस्त किए गए [[डेटाबेस|आंकड़ाकोष]] एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।<ref>{{cite web | ओएलएपी के लिए विन्यस्त किए गए [[डेटाबेस|आंकड़ाकोष]] एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।<ref>{{cite web | ||
Line 47: | Line 47: | ||
}}</ref> वे [[नेविगेशनल डेटाबेस|नेविगेशनल आंकड़ाकोष]], [[पदानुक्रमित डेटाबेस|पदानुक्रमित आंकड़ाकोष]] और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं। | }}</ref> वे [[नेविगेशनल डेटाबेस|नेविगेशनल आंकड़ाकोष]], [[पदानुक्रमित डेटाबेस|पदानुक्रमित आंकड़ाकोष]] और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं। | ||
ओएलएपी आमतौर पर [[OLTP|ओएलटीपी]] (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार | ओएलएपी आमतौर पर [[OLTP|ओएलटीपी]] (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार आसूचना या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है। | ||
== ओएलएपी प्रणाली का अवलोकन == | == ओएलएपी प्रणाली का अवलोकन == | ||
किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या [[अतिविम]] भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें [[आयाम (डेटा वेयरहाउस)|आयामों (डेटा वेयरहाउस)]] द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में | किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या [[अतिविम]] भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें [[आयाम (डेटा वेयरहाउस)|आयामों (डेटा वेयरहाउस)]] द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में गड़बड़ी करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में [[पिवट तालिका|पिवट टेबल्स]], जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत। | ||
घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में [[स्टार स्कीमा]] या [[स्नोफ्लेक स्कीमा]] या | घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में [[स्टार स्कीमा]] या [[स्नोफ्लेक स्कीमा]] या टेबल के [[तथ्य नक्षत्र]] से बनाया जाता है। उपाय [[तथ्य तालिका|तथ्य टेबल]] में अभिलेख से माप प्राप्त किए जाते हैं और [[आयाम तालिका|आयाम टेबल]] से आयाम प्राप्त किए जाते हैं। | ||
प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है। | प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है। | ||
Line 59: | Line 59: | ||
उदाहरण के लिए: | उदाहरण के लिए: | ||
बिक्री तथ्य | बिक्री तथ्य टेबल | ||
+-------------+----------+ | +-------------+----------+ | ||
| बिक्री_राशि | समय_आईडी | | | बिक्री_राशि | समय_आईडी | | ||
Line 70: | Line 70: | ||
=== बहुआयामी आंकड़ाकोष === | === बहुआयामी आंकड़ाकोष === | ||
बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।<ref name="OBrien"/>{{rp|१७७}} संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।<ref name="OBrien"/>{{rp|१७८}} यहां तक कि जब डेटा में | बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।<ref name="OBrien"/>{{rp|१७७}} संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।<ref name="OBrien"/>{{rp|१७८}} यहां तक कि जब डेटा में गड़बड़ी किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।<ref name="OBrien"/> विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की उनकी क्षमता है। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।<ref>Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)</ref> | ||
=== एकत्रीकरण === | === एकत्रीकरण === | ||
यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।<ref>{{cite web | यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।<ref>{{cite web | ||
Line 89: | Line 89: | ||
|citeseerx=10.1.1.211.7178 | |citeseerx=10.1.1.211.7178 | ||
|s2cid=8125630 | |s2cid=8125630 | ||
}}</ref> ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। [[कुल समारोह]] (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य | }}</ref> ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। [[कुल समारोह]] (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य टेबल से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है। | ||
सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।<ref>{{cite journal | सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।<ref>{{cite journal | ||
Line 113: | Line 113: | ||
}}</ref> | }}</ref> | ||
क्योंकि | क्योंकि आमतौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, प्रायः केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अद्यतन करने का समय, या दोनों द्वारा बाधित किया जा सकता है। दृश्य चयन का उद्देश्य आमतौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, यद्यपि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें [[लालची एल्गोरिदम]], यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और ए* खोज एल्गोरिदम सम्मिलित हैं। | ||
कुछ एकत्रीकरण कार्यों की गणना पूरे ओएलएपी घन के लिए प्रत्येक सेल के लिए मूल्यों की पूर्व-गणना करके की जा सकती है, और फिर इन समुच्चय को एकत्र करके कोशिकाओं के रोल-अप के लिए एकत्रीकरण की गणना करके, उन्हें कुशलता से गणना करने के लिए बहुआयामी समस्या के लिए एक विभाजन और जीत एल्गोरिथ्म लागू किया जा सकता है।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} अन्य मामलों में कुल फ़ंक्शन की गणना कोशिकाओं के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में <code>औसत</code> (ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और <code>रेंज</code> (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, | <s>कुछ</s> एकत्रीकरण कार्यों की गणना पूरे ओएलएपी घन के लिए प्रत्येक सेल के लिए मूल्यों की पूर्व-गणना करके की जा सकती है, और फिर इन समुच्चय को एकत्र करके कोशिकाओं के रोल-अप के लिए एकत्रीकरण की गणना करके, उन्हें कुशलता से गणना करने के लिए बहुआयामी समस्या के लिए एक विभाजन और जीत एल्गोरिथ्म लागू किया जा सकता है।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} अन्य मामलों में कुल फ़ंक्शन की गणना कोशिकाओं के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में <code>औसत</code> (ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और <code>रेंज</code> (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, यद्यपि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में विशिष्ट गणना, माध्य और मोड सम्मिलित हैं ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना कठिन है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है। | ||
[[Category:All articles with dead external links]] | [[Category:All articles with dead external links]] | ||
Line 152: | Line 152: | ||
=== संबंधपरक ओएलएपी (आरओएलएपी) === | === संबंधपरक ओएलएपी (आरओएलएपी) === | ||
आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम | आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम टेबल को संबंधपरक टेबल के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई तालिकाएँ बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में गड़बड़ी करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया एसक्यूएल कथन में "डब्ल्यएचईआरई" खंड जोड़ने के समान है। आरओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए मानक संबंधात्मक आंकड़ाकोष और इसकी टेबल में प्रश्न करते हैं। आरओएलएपी उपकरण में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। आरओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल करने की क्षमता भी रखता है। | ||
जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। हालाँकि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है। | जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। हालाँकि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है। | ||
Line 172: | Line 172: | ||
--> | --> | ||
* उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन [[MOLAP|एमओएलएपी]] उपकरण की तुलना में धीमा है। हालाँकि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें। | * उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन [[MOLAP|एमओएलएपी]] उपकरण की तुलना में धीमा है। हालाँकि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें। | ||
* कुल | * कुल टेबल की लोडिंग कस्टम ETL कोड द्वारा प्रबंधित किया जाना चाहिए। आरओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है कि समर्थन करने के लिए अतिरिक्त विकास समय और अधिक कोड। | ||
* जब समग्र तालिकाएँ बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत | * जब समग्र तालिकाएँ बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत टेबल को प्रश्न करना चाहिए। अतिरिक्त समग्र तालिकाएँ जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, हालाँकि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र तालिकाएँ बनाना अभी भी व्यावहारिक नहीं है। | ||
* आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। हालाँकि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं। | * आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। हालाँकि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं। | ||
* चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं। | * चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं। | ||
Line 180: | Line 180: | ||
ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। [http://www.olapreport.com/survey.htm ओएलएपी सर्वेक्षण], जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं। | ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। [http://www.olapreport.com/survey.htm ओएलएपी सर्वेक्षण], जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं। | ||
यद्यपि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए। | |||
* सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा। | * सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा। | ||
* मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है। | * मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है। | ||
==== लचीलेपन का नकारात्मक पक्ष ==== | ==== लचीलेपन का नकारात्मक पक्ष ==== | ||
कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे मौजूदा संबंधपरक आंकड़ाकोष | कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे मौजूदा संबंधपरक आंकड़ाकोष टेबल का पुन: उपयोग करने का आशय रखती हैं - ये टेबल को प्रायः ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। आरओएलएपी उपकरण का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत ओएलएपी उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे। | ||
===हाइब्रिड ओलाप (होलाप)=== | ===हाइब्रिड ओलाप (होलाप)=== | ||
Line 212: | Line 212: | ||
=== तुलना === | === तुलना === | ||
प्रत्येक प्रकार के कुछ लाभ हैं, | प्रत्येक प्रकार के कुछ लाभ हैं, यद्यपि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है। | ||
* कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा। | * कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा। | ||
* एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।<ref name="ieee_cite"/>* आरओएलएपी आमतौर पर अधिक मापनीय है।<ref name="ieee_cite"/> | * एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।<ref name="ieee_cite"/>* आरओएलएपी आमतौर पर अधिक मापनीय है।<ref name="ieee_cite"/>यद्यपि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना मुश्किल है, इसलिए इसे प्रायः छोड़ दिया जाता है। आरओएलएपी प्रश्न प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है। | ||
* चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं। | * चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं। | ||
* एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आम तौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की पेशकश कर सकता है। | * एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आम तौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की पेशकश कर सकता है। | ||
=== अन्य प्रकार === | === अन्य प्रकार === | ||
निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, | निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, यद्यपि वे ऊपर के रूप में व्यापक नहीं हैं: | ||
* डब्ल्यूओएलएपी - वेब आधारित ओएलएपी | * डब्ल्यूओएलएपी - वेब आधारित ओएलएपी | ||
Line 235: | Line 235: | ||
=== इतिहास === | === इतिहास === | ||
ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे 1970 में जारी किया गया था (और १९९५ में [[Oracle Corporation|ओरेकल निगम]] द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।<ref>{{cite web|title=The origins of today's OLAP products |url=http://olapreport.com/origins.htm |publisher=OLAP Report |date=2007-08-23 |author=Nigel Pendse |access-date=November 27, 2007 |url-status=dead |archive-url=https://web.archive.org/web/20071221044811/http://www.olapreport.com/origins.htm |archive-date=December 21, 2007 }}</ref> | ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे 1970 में जारी किया गया था (और १९९५ में [[Oracle Corporation|ओरेकल निगम]] द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।<ref>{{cite web|title=The origins of today's OLAP products |url=http://olapreport.com/origins.htm |publisher=OLAP Report |date=2007-08-23 |author=Nigel Pendse |access-date=November 27, 2007 |url-status=dead |archive-url=https://web.archive.org/web/20071221044811/http://www.olapreport.com/origins.htm |archive-date=December 21, 2007 }}</ref> यद्यपि, यह शब्द १९९३ तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर<ref name=Codd1993/> एक छोटे से परामर्श कार्य के परिणामस्वरूप हुआ, जिसे कॉड ने पूर्व आर्बर सॉफ्टवेयर (बाद में [[हाइपरियन सॉल्यूशंस]], और २००७ में ओरेकल द्वारा अधिग्रहित) एक प्रकार के विपणन तख्तापलट के रूप में लिया था। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद एस्बेस जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून एस्बेस के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने १९९० के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। १९९८ में, माइक्रोसॉफ्ट ने अपना पहला ओएलएपी सर्वर जारी किया{{snd}} माइक्रोसॉफ्ट विश्लेषण सेवाएँ, जिसने ओएलएपी प्रौद्योगिकी को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया। | ||
=== उत्पाद तुलना === | === उत्पाद तुलना === |
Revision as of 14:02, 10 March 2023
ऑनलाइन विश्लेषणात्मक प्रसंस्करण, या ओएलएपी (/ˈoʊlæp/), कम्प्यूटिंग में बहु-आयामी विश्लेषणात्मक (एमडीए) प्रश्नों का तेजी से उत्तर देने का एक दृष्टिकोण है।[1] ओएलएपी व्यावसायिक बुद्धिमत्ता की व्यापक श्रेणी का हिस्सा है, जिसमें संबंध का आंकड़ाकोष, रिपोर्ट लेखन और डेटा खनन भी सम्मिलित है।[2] ओएलएपी के विशिष्ट अनुप्रयोगों में बिक्री, विपणन, व्यापार प्रतिवेदन, व्यवसाय प्रक्रिया प्रबंधन (बीपीएम) के लिए व्यवसाय प्रतिवेदन सम्मिलित है।[3] बजट और पूर्वानुमान, वित्तीय प्रतिवेदन और इसी तरह के क्षेत्र,कृषि जैसे नए अनुप्रयोगों के साथ।[4]
ओएलएपी शब्द पारंपरिक आंकड़ाकोष शब्द ऑनलाइन लेनदेन प्रसंस्करण (ओएलपी) के लघु संशोधन के रूप में बनाया गया था।[5]
ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन मूलभूत विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग।[6] समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी प्रौद्योगिकी है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )।
ओएलएपी के लिए विन्यस्त किए गए आंकड़ाकोष एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।[7] वे नेविगेशनल आंकड़ाकोष, पदानुक्रमित आंकड़ाकोष और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं।
ओएलएपी आमतौर पर ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार आसूचना या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है।
ओएलएपी प्रणाली का अवलोकन
किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या अतिविम भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें आयामों (डेटा वेयरहाउस) द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में गड़बड़ी करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में पिवट टेबल्स, जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत।
घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में स्टार स्कीमा या स्नोफ्लेक स्कीमा या टेबल के तथ्य नक्षत्र से बनाया जाता है। उपाय तथ्य टेबल में अभिलेख से माप प्राप्त किए जाते हैं और आयाम टेबल से आयाम प्राप्त किए जाते हैं।
प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है।
एक सरल उदाहरण एक घन होगा जिसमें माप के रूप में स्टोर की बिक्री और आयाम के रूप में दिनांक/समय सम्मिलित है। प्रत्येक बिक्री में एक दिनांक/समय लेबल होता है जो उस बिक्री के बारे में अधिक वर्णन बताता है।
उदाहरण के लिए:
बिक्री तथ्य टेबल +-------------+----------+ | बिक्री_राशि | समय_आईडी | +-------------+----------+ समय आयाम | २००८.१०| १२३४ |----+ +---------+----+ +-------------+----------+ | | समय_आईडी | टाइमस्टैम्प | | +---------+----+ +---->| १२३४ | २००८०९०२ १२ः३५ः४३ | +---------+----+
बहुआयामी आंकड़ाकोष
बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।[6]: १७७ संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।[6]: १७८ यहां तक कि जब डेटा में गड़बड़ी किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।[6] विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की उनकी क्षमता है। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।[8]
एकत्रीकरण
यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।[9][10] ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। कुल समारोह (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य टेबल से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है।
सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।[11]
क्योंकि आमतौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, प्रायः केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अद्यतन करने का समय, या दोनों द्वारा बाधित किया जा सकता है। दृश्य चयन का उद्देश्य आमतौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, यद्यपि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें लालची एल्गोरिदम, यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और ए* खोज एल्गोरिदम सम्मिलित हैं।
कुछ एकत्रीकरण कार्यों की गणना पूरे ओएलएपी घन के लिए प्रत्येक सेल के लिए मूल्यों की पूर्व-गणना करके की जा सकती है, और फिर इन समुच्चय को एकत्र करके कोशिकाओं के रोल-अप के लिए एकत्रीकरण की गणना करके, उन्हें कुशलता से गणना करने के लिए बहुआयामी समस्या के लिए एक विभाजन और जीत एल्गोरिथ्म लागू किया जा सकता है।[12] उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।[13] अन्य मामलों में कुल फ़ंक्शन की गणना कोशिकाओं के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में औसत
(ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और रेंज
(अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, यद्यपि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में विशिष्ट गणना, माध्य और मोड सम्मिलित हैं ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना कठिन है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है।
प्रकार
ओएलएपी प्रणाली को पारंपरिक रूप से निम्नलिखित टैक्सोनॉमी का उपयोग करके वर्गीकृत किया गया है।[14]
बहुआयामी ओएलएपी (एमओएलएपी)
एमओएलएपी (बहु-आयामी ऑनलाइन विश्लेषणात्मक प्रसंस्करण) ओएलएपी का क्लासिक रूप है और इसे कभी-कभी केवल ओएलएपी के रूप में संदर्भित किया जाता है। एमओएलएपी इस डेटा को एक संबंधपरक आंकड़ाकोष के बजाय एक अनुकूलित बहु-आयामी सरणी संग्रहण में संग्रहीत करता है।
कुछ एमओएलएपी उपकरणों को व्युत्पन्न डेटा की पूर्व-गणना और भंडारण की आवश्यकता होती है, जैसे समेकन - ऑपरेशन जिसे प्रसंस्करण के रूप में जाना जाता है। ऐसे एमओएलएपी उपकरण आम तौर पर डेटा घन के रूप में संदर्भित पूर्व-परिकलित डेटा सेट का उपयोग करते हैं। डेटा घन में प्रश्नों की दी गई श्रेणी के सभी संभावित उत्तर होते हैं। नतीजतन, उनके पास प्रश्नों के लिए बहुत तेज़ प्रतिक्रिया होती है। दूसरी ओर, पूर्व-गणना की डिग्री के आधार पर अद्यतन करने में लंबा समय लग सकता है। पूर्व-गणना से डेटा विस्फोट के रूप में भी जाना जाता है।
अन्य एमओएलएपी उपकरण, विशेष रूप से वे जो कार्यात्मक आंकड़ाकोष मॉडल को लागू करते हैं, व्युत्पन्न डेटा की पूर्व-गणना नहीं करते हैं, लेकिन उन लोगों के अलावा मांग पर सभी गणना करते हैं जो पहले अनुरोध किए गए थे और कैश में संग्रहीत किए गए थे।
एमओएलएपी के लाभ
- अनुकूलित भंडारण, बहुआयामी अनुक्रमण और कैशिंग के कारण तेज़ प्रश्न प्रदर्शन।
- संपीड़न प्रौद्योगिकीों के कारण संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा की तुलना में डेटा का छोटा ऑन-डिस्क आकार।
- डेटा के उच्च स्तर के समुच्चय की स्वचालित गणना।
- यह कम आयाम वाले डेटा सेट के लिए बहुत कॉम्पैक्ट है।
- सरणी मॉडल प्राकृतिक अनुक्रमण प्रदान करते हैं।
- एकत्रित डेटा की पूर्व-संरचना के माध्यम से प्राप्त प्रभावी डेटा निष्कर्षण।
एमओएलएपी के नुकसान
- कुछ एमओएलएपी प्रणाली में प्रोसेसिंग चरण (डेटा लोड) काफी लंबा हो सकता है, विशेष रूप से बड़े डेटा वॉल्यूम पर। आमतौर पर केवल वृद्धिशील प्रसंस्करण करके इसका उपचार किया जाता है, यानी पूरे डेटा सेट को पुन: संसाधित करने के बजाय केवल उस डेटा को संसाधित करना जो बदल गया है (आमतौर पर नया डेटा)।
- कुछ एमओएलएपी कार्यप्रणालियाँ डेटा अतिरेक का परिचय देती हैं।
उत्पाद
एमओएलएपी का उपयोग करने वाले वाणिज्यिक उत्पादों के उदाहरण कॉग्नोस पावरप्ले, ओरेकल ओएलएपी, सूक्ष्म रणनीति, माइक्रोसॉफ्ट विश्लेषण सेवाएँ, ईएसएसबेस, एप्लिक्स, जेडॉक्स और आईसीक्यूब हैं।
संबंधपरक ओएलएपी (आरओएलएपी)
आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम टेबल को संबंधपरक टेबल के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई तालिकाएँ बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में गड़बड़ी करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया एसक्यूएल कथन में "डब्ल्यएचईआरई" खंड जोड़ने के समान है। आरओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए मानक संबंधात्मक आंकड़ाकोष और इसकी टेबल में प्रश्न करते हैं। आरओएलएपी उपकरण में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। आरओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल करने की क्षमता भी रखता है।
जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। हालाँकि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है।
आरओएलएपी के फायदे
- आरओएलएपी को बड़े डेटा वॉल्यूम को संभालने में अधिक मापनीय माना जाता है, विशेष रूप से बहुत अधिक गणनांक वाले आयाम वाले मॉडल प्रमुखता (यानी, लाखों सदस्य) के साथ।
- विभिन्न प्रकार के डेटा लोडिंग उपकरण उपलब्ध होने के साथ, और विशेष डेटा मॉडल में अर्क, परिणत, लोड (ईटीएल) कोड को ठीक करने की क्षमता के साथ, लोड समय आम तौर पर स्वचालित एमओएलएपी लोड की तुलना में बहुत कम होता है .
- डेटा को एक मानक संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है और इसे किसी भी एसक्यूएल प्रतिवेदन उपकरण द्वारा एक्सेस किया जा सकता है (उपकरण को ओएलएपी उपकरण आवश्यकता नहीं है)।
- आरओएलएपी उपकरण गैर-अस्पष्ट तथ्यों (जैसे, पाठ्य विवरण) को संभालने में बेहतर हैं। इन तत्वों को प्रश्न करते समय एमओएलएपी उपकरण धीमे प्रदर्शन से पीड़ित होते हैं।
- बहु-आयामी मॉडल से डेटा भंडारण को डिकूप्लिंग (इलेक्ट्रॉनिक्स) करके, डेटा को सफलतापूर्वक मॉडल करना संभव है जो अन्यथा सख्त आयामी मॉडल में फिट नहीं होगा।
- आरओएलएपी दृष्टिकोण आंकड़ाकोष प्राधिकरण नियंत्रणों जैसे कि पंक्ति-स्तरीय सुरक्षा का लाभ उठा सकता है, जिससे प्रश्न परिणाम लागू किए गए पूर्व निर्धारित मानदंडों के आधार पर फ़िल्टर किए जाते हैं, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता या उपयोगकर्ताओं के समूह ( एसक्यूएल डब्ल्यूएचईआरई खंड) के लिए।
आरओएलएपी के नुकसान
- उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन एमओएलएपी उपकरण की तुलना में धीमा है। हालाँकि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें।
- कुल टेबल की लोडिंग कस्टम ETL कोड द्वारा प्रबंधित किया जाना चाहिए। आरओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है कि समर्थन करने के लिए अतिरिक्त विकास समय और अधिक कोड।
- जब समग्र तालिकाएँ बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत टेबल को प्रश्न करना चाहिए। अतिरिक्त समग्र तालिकाएँ जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, हालाँकि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र तालिकाएँ बनाना अभी भी व्यावहारिक नहीं है।
- आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। हालाँकि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं।
- चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं।
आरओएलएपी का प्रदर्शन
ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। ओएलएपी सर्वेक्षण, जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं।
यद्यपि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए।
- सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा।
- मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है।
लचीलेपन का नकारात्मक पक्ष
कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे मौजूदा संबंधपरक आंकड़ाकोष टेबल का पुन: उपयोग करने का आशय रखती हैं - ये टेबल को प्रायः ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। आरओएलएपी उपकरण का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत ओएलएपी उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे।
हाइब्रिड ओलाप (होलाप)
अतिरिक्त ईटीएल लागत लागत और धीमी प्रश्न प्रदर्शन के बीच अवांछनीय व्यापार-बंद ने सुनिश्चित किया है कि अधिकांश वाणिज्यिक ओएलएपी उपकरण अब "हाइब्रिड ओएलएपी" (एचओएलएपी) दृष्टिकोण का उपयोग करते हैं, जो मॉडल डिज़ाइनर को यह तय करने की अनुमति देता है कि डेटा का कौन सा भाग एमओएलएपी में संग्रहीत किया जाएगा और आरओएलएपी में कौन सा हिस्सा।
"हाइब्रिड ओएलएपी" का गठन करने के लिए पूरे उद्योग में कोई स्पष्ट समझौता नहीं है, सिवाय इसके कि एक आंकड़ाकोष संबंधपरक और विशेष भंडारण के बीच डेटा को विभाजित करेगा।[15] उदाहरण के लिए, कुछ विक्रेताओं के लिए, एक एचओएलएपी आंकड़ाकोष बड़ी मात्रा में विस्तृत डेटा रखने के लिए संबंधात्मक टेबल का उपयोग करेगा, और अधिक-एकत्रित या कम-विस्तृत डेटा की छोटी मात्रा के कम से कम कुछ पहलुओं के लिए विशेष भंडारण का उपयोग करेगा। एचओएलएपी दोनों दृष्टिकोणों की क्षमताओं को जोड़कर एमओएलएपी और आरओएलएपी की कमियों को संबोधित करता है। एचओएलएपी उपकरण पूर्व-परिकलित क्यूब्स और संबंधपरक डेटा स्रोतों दोनों का उपयोग कर सकते हैं।
कार्यक्षेत्र विभाजन
इस मोड में एचओएलएपी एकत्रीकरण को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए संग्रहीत करता है, और घन प्रसंस्करण के समय को अनुकूलित करने के लिए आरओएलएपी में विस्तृत डेटा।
क्षैतिज विभाजन
इस मोड में एचओएलएपी डेटा के कुछ हिस्से को संग्रहीत करता है, आमतौर पर नवीनतम डेटा (अर्थात समय आयाम द्वारा विभाजित) को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए, और पुराने डेटा को आरओएलएपी में संग्रहीत करता है। इसके अलावा, हम कुछ डाइसों को एमओएलएपी में और अन्य को आरओएलएपी में स्टोर कर सकते हैं, इस तथ्य का लाभ उठाते हुए कि एक बड़े घनाभ में घने और विरल उपक्षेत्र होंगे।[16]
उत्पाद
एचओएलएपी संग्रहण प्रदान करने वाला पहला उत्पाद होलोस था, लेकिन यह प्रौद्योगिकी अन्य वाणिज्यिक उत्पादों जैसे माइक्रोसॉफ्ट विश्लेषण सेवाओं, देववाणी ओएलएपी, सूक्ष्म रणनीति और एसएपी एजी बीआई एक्सेलेरेटर में भी उपलब्ध हो गई। हाइब्रिड ओएलएपी दृष्टिकोण आरओएलएपी और एमओएलएपी प्रौद्योगिकी को जोड़ती है, जो आरओएलएपी की अधिक मापनीयता और एमओएलएपी की तेज़ गणना से लाभान्वित होती है। उदाहरण के लिए, एक एचओएलएपी सर्वर बड़ी मात्रा में विस्तृत डेटा को संबंधात्मक आंकड़ाकोष में संग्रहीत कर सकता है, जबकि एकत्रीकरण को एक अलग एमओएलएपी स्टोर में रखा जाता है। माइक्रोसॉफ्ट एसक्यूएल सर्वर ७.० ओएलएपी सेवाएँ हाइब्रिड ओएलएपी सर्वर का समर्थन करती हैं
तुलना
प्रत्येक प्रकार के कुछ लाभ हैं, यद्यपि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है।
- कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा।
- एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।[15]* आरओएलएपी आमतौर पर अधिक मापनीय है।[15]यद्यपि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना मुश्किल है, इसलिए इसे प्रायः छोड़ दिया जाता है। आरओएलएपी प्रश्न प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है।
- चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं।
- एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आम तौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की पेशकश कर सकता है।
अन्य प्रकार
निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, यद्यपि वे ऊपर के रूप में व्यापक नहीं हैं:
- डब्ल्यूओएलएपी - वेब आधारित ओएलएपी
- डीओएलएपी - डेस्कटॉप कंप्यूटर ओएलएपी
- आरटीओएलएपी - रीयल-टाइम ओएलएपी
- जीओएलएपी - ग्राफ़ ओएलएपी[17][18]
- कैसिओएलएपी - संदर्भ-जागरूक सिमेंटिक ओएलएपी,[19] जैव चिकित्सा अनुप्रयोगों के लिए विकसित।[20] कैसिओएलएपी प्लेटफ़ॉर्म में डेटा पूर्वप्रक्रमण (जैसे, डाउनलोड करना, निष्कर्षण और टेक्स्ट दस्तावेज़ों को पार्स करना), इलास्टिक्स खोज के साथ अनुक्रमण और खोज करना, टेक्स्ट-घन नामक एक कार्यात्मक दस्तावेज़ संरचना बनाना सम्मिलित है,[21][22][23][24][25] और मुख्य कैसिओएलएपी एल्गोरिथ्म का उपयोग करके उपयोगकर्ता-परिभाषित वाक्यांश-श्रेणी संबंधों को परिमाणित करना।
एपीआई और प्रश्न भाषाएं
संबंधपरक आंकड़ाकोष के विपरीत, जिसमें मानक प्रश्न भाषा के रूप में एसक्यूएल था, और ओडीबीसी, जेडीबीसी और ओएलईडीबी जैसे व्यापक अप्लिकेशन प्रोग्रामिंग अंतरफलक थे, ओएलएपी दुनिया में लंबे समय तक ऐसा कोई एकीकरण नहीं था। माइक्रोसॉफ्ट से ओएलएपी विनिर्देशन के लिए पहला वास्तविक मानक एपीआई ओएलई डीबी था जो १९९७ में सामने आया और बहुआयामी अभिव्यक्ति प्रश्न भाषा पेश की। कई ओएलएपी वेंडर – सर्वर और क्लाइंट दोनों – ने इसे अपनाया। २००१ में माइक्रोसॉफ्ट और हाइपरियन सॉल्यूशंस कॉर्पोरेशन ने विश्लेषण विनिर्देश के लिए एक्सएमएल की घोषणा की, जिसे अधिकांश ओएलएपी विक्रेताओं द्वारा समर्थन दिया गया था। चूँकि इसने एमडीएक्स को प्रश्न भाषा के रूप में भी उपयोग किया, एमडीएक्स वास्तविक मानक बन गया।[26]
सितंबर-2011 से माइक्रोसॉफ्ट .एनएफटी से माइक्रोसॉफ्ट विश्लेषण सेवाओं ओएलएपी क्यूब्स को प्रश्न करने के लिए एलआईएनक्यू का उपयोग किया जा सकता है।[27]
उत्पाद
इतिहास
ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे 1970 में जारी किया गया था (और १९९५ में ओरेकल निगम द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।[28] यद्यपि, यह शब्द १९९३ तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर[1] एक छोटे से परामर्श कार्य के परिणामस्वरूप हुआ, जिसे कॉड ने पूर्व आर्बर सॉफ्टवेयर (बाद में हाइपरियन सॉल्यूशंस, और २००७ में ओरेकल द्वारा अधिग्रहित) एक प्रकार के विपणन तख्तापलट के रूप में लिया था। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद एस्बेस जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून एस्बेस के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने १९९० के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। १९९८ में, माइक्रोसॉफ्ट ने अपना पहला ओएलएपी सर्वर जारी किया – माइक्रोसॉफ्ट विश्लेषण सेवाएँ, जिसने ओएलएपी प्रौद्योगिकी को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया।
उत्पाद तुलना
ओएलएपी ग्राहक
ओएलएपी क्लाइंट में एक्सेल, वेब एप्लिकेशन, एसक्यूएल, डैशबोर्ड उपकरण आदि जैसे कई स्प्रेडशीट प्रोग्राम सम्मिलित हैं। कई ग्राहक इंटरएक्टिव डेटा अन्वेषण का समर्थन करते हैं जहां उपयोगकर्ता रुचि के आयामों और उपायों का चयन करते हैं। कुछ आयामों का उपयोग फिल्टर के रूप में किया जाता है (डेटा को स्लाइस करने और डाइस करने के लिए) जबकि अन्य को धुरी टेबल या धुरी चार्ट के अक्ष के रूप में चुना जाता है। उपयोगकर्ता प्रदर्शित दृश्य में एकत्रीकरण स्तर (ड्रिलिंग-डाउन या रोलिंग-अप के लिए) भी भिन्न हो सकते हैं। ग्राहक विभिन्न प्रकार के ग्राफिकल विजेट्स जैसे स्लाइडर्स, भौगोलिक मानचित्र, हीट मैप्स और बहुत कुछ प्रदान कर सकते हैं जिन्हें डैशबोर्ड के रूप में समूहीकृत और समन्वित किया जा सकता है। ओएलएपी सर्वर टेबल की तुलना के विज़ुअलाइज़ेशन कॉलम में ग्राहकों की एक विस्तृत सूची दिखाई देती है।
बाजार संरचना
नीचे २००६ में शीर्ष ओएलएपी विक्रेताओं की सूची दी गई है, जिसमें आंकड़े लाखों अमेरिकी डॉलर में हैं।[29]
विक्रेता | भूमंडलीय
कर |
समेकित कंपनी |
---|---|---|
माइक्रोसॉफ्ट निगम | १,८०६ | माइक्रोसॉफ्ट |
हाइपरियन समाधान निगम | १,०७७ | ओरेकल |
कोगन | ७३५ | आईबीएम |
व्यापार ऑब्जेक्ट | ४१६ | एसएपी |
सूक्ष्म रणनीति | ४१६ | सूक्ष्म रणनीति |
एसएपी एजी | ३३० | एसएपी |
कार्तीय (एसएपी ) | २१० | एसएपी |
एप्प्लिक्ष | २०५ | आईबीएम |
इन्फोर | १९९ | इन्फोर |
ओरेकल निगम | १५९ | ओरेकल |
अन्य | १५२ | अन्य |
एकूण | ५,७०० |
ओपन-सोर्स
- अपाचे पिनोट का उपयोग लिंक्डइन, सिस्को, उबेर, स्लैक, स्ट्राइप, डोरडैश, टारगेट, वॉलमार्ट, अमेज़ॅन और माइक्रोसॉफ्ट में कम विलंबता के साथ स्केलेबल रियल टाइम एनालिटिक्स देने के लिए किया जाता है।[30] यह ऑफ़लाइन डेटा स्रोतों (जैसे हडूप और फ्लैट फ़ाइलें) के साथ-साथ ऑनलाइन स्रोतों (जैसे काफ्का) से डेटा ग्रहण कर सकता है। पिनोट को क्षैतिज रूप से स्केल करने के लिए डिज़ाइन किया गया है।
- मोंड्रियन ओलाप सर्वर एक खुला स्रोत सॉफ्टवेयर है। ओपन-सोर्स ओएलएपी सर्वर जावा (प्रोग्रामिंग भाषा) में लिखा गया है। यह बहुआयामी अभिव्यक्ति प्रश्न भाषा, विश्लेषण के लिए एक्सएमएल और ओएलएपी4j इंटरफ़ेस विनिर्देशों का समर्थन करता है।
- अपाचे ड्र्यूड ओएलएपी प्रश्नों के लिए एक लोकप्रिय ओपन-सोर्स वितरित डेटा स्टोर है जिसका उपयोग विभिन्न संगठनों द्वारा बड़े पैमाने पर उत्पादन में किया जाता है।
- अपाचे किलिन मूल रूप से ईबे द्वारा विकसित ओएलएपी प्रश्नों के लिए एक वितरित डेटा स्टोर है।
- क्यूब्स (ओएलएपी सर्वर) एक और हल्का ओपन-सोर्स सॉफ्टवेयर है। अंतर्निहित रोलैप के साथ पायथन (प्रोग्रामिंग भाषा) में ओएलएपी कार्यक्षमता का ओपन-सोर्स उपकरणकिट कार्यान्वयन।
- क्लिकहाउस तेजी से प्रसंस्करण और प्रतिक्रिया समय पर ध्यान केंद्रित करने वाला एक बिल्कुल नया कॉलम उन्मुख डीबीएमएस है।
- डकडब[31] एक इन-प्रोसेस एसक्यूएल ओएलएपी है[32] आंकड़ाकोष प्रबंधन प्रणाली।
यह भी देखें
- ओलाप सर्वरों की तुलना
- कार्यात्मक आंकड़ाकोष मॉडल
ग्रन्थसूची
- डैनियल लेमिरे (दिसम्बर २००७). "डेटा वेयरहाउसिंग और ओएलएपी-ए अनुसंधान-उन्मुख ग्रन्थसूची".
{{cite web}}
: Check date values in:|date=
(help)
- एरिक थॉमसेन। (१९९७). ओएलएपी समाधान: बहुआयामी सूचना प्रणाली का निर्माण, दूसरा संस्करण. जॉन विली एंड संस. ISBN ९७८-०४७१-१४९३१-६.
{{cite book}}
: Check|isbn=
value: invalid character (help); Check date values in:|year=
(help)
- लिंग लियू और तामेर एम ओज़सू (एड) (२००९). "Encyclopedia of Database Systems, ४१०० पी. ६० इलस. ISBN ९७८-०३८७-४९६१६-० Parameter error in {{ISBN}}: invalid character.
संदर्भ
उद्धरण
- ↑ 1.0 1.1 Codd E.F.; Codd S.B. & Salley C.T. (1993). "Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate" (PDF). Codd & Date, Inc. Retrieved 2008-03-05.[permanent dead link]
- ↑ Deepak Pareek (2007). Business Intelligence for Telecommunications. CRC Press. pp. 294 pp. ISBN 978-0-8493-8792-0. Retrieved 2008-03-18.
- ↑ Apostolos Benisis (2010). Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making. VDM Verlag Dr. Müller e.K. pp. 204 pp. ISBN 978-3-639-22216-6.
- ↑ Abdullah, Ahsan (November 2009). "Analysis of mealybug incidence on the cotton crop using ADSS-OLAP (Online Analytical Processing) tool". Computers and Electronics in Agriculture. 69 (1): 59–72. doi:10.1016/j.compag.2009.07.003.
- ↑ "OLAP Council White Paper" (PDF). OLAP Council. 1997. Retrieved 2008-03-18.
- ↑ 6.0 6.1 6.2 6.3 O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.
- ↑ Hari Mailvaganam (2007). "Introduction to OLAP – Slice, Dice and Drill!". Data Warehousing Review. Retrieved 2008-03-18.
- ↑ Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)
- ↑ MicroStrategy, Incorporated (1995). "The Case for Relational OLAP" (PDF). Retrieved 2008-03-20.
- ↑ Surajit Chaudhuri & Umeshwar Dayal (1997). "An overview of data warehousing and OLAP technology". SIGMOD Rec. 26 (1): 65. CiteSeerX 10.1.1.211.7178. doi:10.1145/248603.248616. S2CID 8125630.
- ↑ Gray, Jim; Chaudhuri, Surajit; Layman, Andrew; Reichart, Don; Venkatrao, Murali; Pellow, Frank; Pirahesh, Hamid (1997). "Data Cube: {A} Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals". J. Data Mining and Knowledge Discovery. 1 (1): 29–53. arXiv:cs/0701155. doi:10.1023/A:1009726021843. S2CID 12502175. Retrieved 2008-03-20.
- ↑ Zhang 2017, p. 1.
- ↑ Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
- ↑ Nigel Pendse (2006-06-27). "OLAP architectures". OLAP Report. Archived from the original on January 24, 2008. Retrieved 2008-03-17.
- ↑ 15.0 15.1 15.2 Bach Pedersen, Torben; S. Jensen, Christian (December 2001). "बहुआयामी डेटाबेस प्रौद्योगिकी". Distributed Systems Online. 34 (12): 40–46. doi:10.1109/2.970558. ISSN 0018-9162.
- ↑ Kaser, Owen; Lemire, Daniel (2006). "Attribute value reordering for efficient hybrid OLAP". Information Sciences. 176 (16): 2304–2336. arXiv:cs/0702143. doi:10.1016/j.ins.2005.09.005.
- ↑ "This Week in Graph and Entity Analytics". Datanami (in English). 2016-12-07. Retrieved 2018-03-08.
- ↑ "Cambridge Semantics Announces AnzoGraph Support for Amazon Neptune and Graph Databases". Database Trends and Applications (in English). 2018-02-15. Retrieved 2018-03-08.
- ↑ Tao, Fangbo; Zhuang, Honglei; Yu, Chi Wang; Wang, Qi; Cassidy, Taylor; Kaplan, Lance; Voss, Clare; Han, Jiawei (2016). "Multi-Dimensional, Phrase-Based Summarization in Text Cubes" (PDF).
- ↑ Liem, David A.; Murali, Sanjana; Sigdel, Dibakar; Shi, Yu; Wang, Xuan; Shen, Jiaming; Choi, Howard; Caufield, John H.; Wang, Wei; Ping, Peipei; Han, Jiawei (2018-10-01). "Phrase mining of textual data to analyze extracellular matrix protein patterns across cardiovascular disease". American Journal of Physiology. Heart and Circulatory Physiology. 315 (4): H910–H924. doi:10.1152/ajpheart.00175.2018. ISSN 1522-1539. PMC 6230912. PMID 29775406.
- ↑ Lee, S.; Kim, N.; Kim, J. (2014). A Multi-dimensional Analysis and Data Cube for Unstructured Text and Social Media. pp. 761–764. doi:10.1109/BDCloud.2014.117. ISBN 978-1-4799-6719-3. S2CID 229585.
{{cite book}}
:|journal=
ignored (help) - ↑ Ding, B.; Lin, X.C.; Han, J.; Zhai, C.; Srivastava, A.; Oza, N.C. (December 2011). "Efficient Keyword-Based Search for Top-K Cells in Text Cube". IEEE Transactions on Knowledge and Data Engineering. 23 (12): 1795–1810. doi:10.1109/TKDE.2011.34. S2CID 13960227.
- ↑ Ding, B.; Zhao, B.; Lin, C.X.; Han, J.; Zhai, C. (2010). TopCells: Keyword-based search of top-k aggregated documents in text cube. pp. 381–384. CiteSeerX 10.1.1.215.7504. doi:10.1109/ICDE.2010.5447838. ISBN 978-1-4244-5445-7. S2CID 14649087.
{{cite book}}
:|journal=
ignored (help) - ↑ Lin, C.X.; Ding, B.; Han, K.; Zhu, F.; Zhao, B. (2008). "Text Cube: Computing IR Measures for Multidimensional Text Database Analysis". IEEE Data Mining: 905–910. doi:10.1109/icdm.2008.135. ISBN 978-0-7695-3502-9. S2CID 1522480.
- ↑ Liu, X.; Tang, K.; Hancock, J.; Han, J.; Song, M.; Xu, R.; Pokorny, B. (2013-03-21). "Social Computing, Behavioral-Cultural Modeling and Prediction. SBP 2013. Lecture Notes in Computer Science". In Greenberg, A.M.; Kennedy, W.G.; Bos, N.D. (eds.). A Text Cube Approach to Human, Social and Cultural Behavior in the Twitter Stream (7812 ed.). Berlin, Heidelberg: Springer. pp. 321–330. ISBN 978-3-642-37209-4.
- ↑ Nigel Pendse (2007-08-23). "Commentary: OLAP API wars". OLAP Report. Archived from the original on May 28, 2008. Retrieved 2008-03-18.
- ↑ "SSAS Entity Framework Provider for LINQ to SSAS OLAP".
- ↑ Nigel Pendse (2007-08-23). "The origins of today's OLAP products". OLAP Report. Archived from the original on December 21, 2007. Retrieved November 27, 2007.
- ↑ Nigel Pendse (2006). "OLAP Market". OLAP Report. Retrieved 2008-03-17.
- ↑ Yegulalp, Serdar (2015-06-11). "LinkedIn fills another SQL-on-Hadoop niche". InfoWorld. Retrieved 2016-11-19.
- ↑ "An in-process SQL OLAP database management system". DuckDB (in English). Retrieved 2022-12-10.
- ↑ Anand, Chillar (2022-11-17). "Common Crawl On Laptop - Extracting Subset Of Data". Avil Page (in English). Retrieved 2022-12-10.
स्रोत
- Jesus, Paulo; Baquero, Carlos; Paulo Sérgio Almeida (2011). "वितरित डेटा एकत्रीकरण एल्गोरिदम का एक सर्वेक्षण". arXiv:1110.0725 [cs.DC].
- Zhang, Chao (2017). बड़े पैमाने पर समानांतर कंप्यूटिंग में सममित और असममित समग्र कार्य (Technical report).