ऑनलाइन विश्लेषणात्मक प्रक्रिया: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(6 intermediate revisions by 4 users not shown)
Line 37: Line 37:
}}</ref>
}}</ref>


ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन बुनियादी विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग।<ref name="OBrien">O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.</ref> समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी प्रौद्योगिकी है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )।
ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन मूलभूत विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग।<ref name="OBrien">O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.</ref> समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी प्रौद्योगिकी है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )।


ओएलएपी के लिए विन्यस्त किए गए [[डेटाबेस|आंकड़ाकोष]] एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।<ref>{{cite web
ओएलएपी के लिए विन्यस्त किए गए [[डेटाबेस|आंकड़ाकोष]] एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।<ref>{{cite web
Line 47: Line 47:
}}</ref> वे [[नेविगेशनल डेटाबेस|नेविगेशनल आंकड़ाकोष]], [[पदानुक्रमित डेटाबेस|पदानुक्रमित आंकड़ाकोष]] और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं।
}}</ref> वे [[नेविगेशनल डेटाबेस|नेविगेशनल आंकड़ाकोष]], [[पदानुक्रमित डेटाबेस|पदानुक्रमित आंकड़ाकोष]] और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं।


ओएलएपी आमतौर पर [[OLTP|ओएलटीपी]] (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार खुफिया या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है।
ओएलएपी आमतौर पर [[OLTP|ओएलटीपी]] (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार आसूचना या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है।


== ओएलएपी प्रणाली का अवलोकन ==
== ओएलएपी प्रणाली का अवलोकन ==
किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या [[अतिविम]] भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें [[आयाम (डेटा वेयरहाउस)|आयामों (डेटा वेयरहाउस)]] द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में हेरफेर करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में [[पिवट तालिका|पिवट तालिकाएँ]], जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत।
किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या [[अतिविम]] भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें [[आयाम (डेटा वेयरहाउस)|आयामों (डेटा वेयरहाउस)]] द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में गड़बड़ी करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में [[पिवट तालिका|पिवट टेबल्स]], जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत।


घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में [[स्टार स्कीमा]] या [[स्नोफ्लेक स्कीमा]] या तालिकाओं के [[तथ्य नक्षत्र]] से बनाया जाता है। उपाय [[तथ्य तालिका]] में अभिलेख से माप प्राप्त किए जाते हैं और [[आयाम तालिका]] से आयाम प्राप्त किए जाते हैं।
घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में [[स्टार स्कीमा]] या [[स्नोफ्लेक स्कीमा]] या टेबल के [[तथ्य नक्षत्र]] से बनाया जाता है। उपाय [[तथ्य तालिका|तथ्य टेबल]] में अभिलेख से माप प्राप्त किए जाते हैं और [[आयाम तालिका|आयाम टेबल]] से आयाम प्राप्त किए जाते हैं।


प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है।
प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है।
Line 59: Line 59:


उदाहरण के लिए:
उदाहरण के लिए:
   बिक्री तथ्य तालिका
   बिक्री तथ्य टेबल
  +-------------+----------+
  +-------------+----------+
  | बिक्री_राशि | समय_आईडी |
  | बिक्री_राशि | समय_आईडी |
Line 70: Line 70:


=== बहुआयामी आंकड़ाकोष ===
=== बहुआयामी आंकड़ाकोष ===
बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।<ref name="OBrien"/>{{rp|१७७}} संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।<ref name="OBrien"/>{{rp|१७८}} यहां तक ​​​​कि जब डेटा में हेरफेर किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।<ref name="OBrien"/> विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की उनकी क्षमता है। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।<ref>Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)</ref>
बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।<ref name="OBrien"/>{{rp|१७७}} संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।<ref name="OBrien"/>{{rp|१७८}} यहां तक ​​​​कि जब डेटा में गड़बड़ी किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।<ref name="OBrien"/> विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की उनकी क्षमता है। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।<ref>Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)</ref>
=== एकत्रीकरण ===
=== एकत्रीकरण ===
यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।<ref>{{cite web
यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।<ref>{{cite web
Line 89: Line 89:
   |citeseerx=10.1.1.211.7178
   |citeseerx=10.1.1.211.7178
   |s2cid=8125630
   |s2cid=8125630
  }}</ref> ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। [[कुल समारोह]] (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य तालिका से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है।
  }}</ref> ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। [[कुल समारोह]] (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य टेबल से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है।


सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।<ref>{{cite journal
सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।<ref>{{cite journal
Line 113: Line 113:
  }}</ref>
  }}</ref>


क्योंकि आम तौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, प्रायः केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अद्यतन करने का समय, या दोनों द्वारा बाधित किया जा सकता है। दृश्य चयन का उद्देश्य आम तौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, हालांकि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें [[लालची एल्गोरिदम]], यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और ए* खोज एल्गोरिदम सम्मिलित हैं।
क्योंकि आमतौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, प्रायः केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अद्यतन करने का समय, या दोनों द्वारा बाधित किया जा सकता है। दृश्य चयन का उद्देश्य आमतौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, यद्यपि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें [[लालची एल्गोरिदम]], यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और ए* खोज एल्गोरिदम सम्मिलित हैं।
 
प्रत्येक सेल के लिए प्रीकंप्यूटिंग मानों द्वारा पूरे ओएलएपी घन के लिए कुछ एकत्रीकरण कार्यों की गणना की जा सकती है, और फिर इन समुच्चय को एकत्र करके सेल्स के रोल-अप के लिए एकत्रीकरण की गणना की जा सकती है, बहुआयामी समस्या के लिए एक विभाजन और विजय एल्गोरिदम लागू करके उन्हें कुशलतापूर्वक गणना करने के लिए।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} अन्य मामलों में कुल फ़ंक्शन की गणना सेल्स के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में<code>औसत</code> (ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और <code>रेंज</code> (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, यद्यपि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में विशिष्ट गणना, माध्य और मोड सम्मिलित हैं ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना कठिन है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है।
 
 
 
 
 
 
 
 
 


कुछ एकत्रीकरण कार्यों की गणना पूरे ओएलएपी घन के लिए प्रत्येक सेल के लिए मूल्यों की पूर्व-गणना करके की जा सकती है, और फिर इन समुच्चय को एकत्र करके कोशिकाओं के रोल-अप के लिए एकत्रीकरण की गणना करके, उन्हें कुशलता से गणना करने के लिए बहुआयामी समस्या के लिए एक विभाजन और जीत एल्गोरिथ्म लागू किया जा सकता है।{{sfn|Zhang|2017|p=1}} उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।{{sfn|Jesus|Baquero|Almeida|2011|loc=2.1 Decomposable functions, pp. 3–4}} अन्य मामलों में कुल फ़ंक्शन की गणना कोशिकाओं के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों में <code>औसत</code> (ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और <code>रेंज</code> (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, हालांकि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में विशिष्ट गणना, माध्य और मोड सम्मिलित हैं ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना कठिन है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है।


== प्रकार ==
== प्रकार ==
ओएलएपी प्रणाली को पारंपरिक रूप से निम्नलिखित टैक्सोनॉमी का उपयोग करके वर्गीकृत किया गया है।<ref name=Pendse2006>{{cite web|url=http://www.olapreport.com/Architectures.htm |title=OLAP architectures |publisher=OLAP Report |author=Nigel Pendse |date=2006-06-27 |access-date=2008-03-17 |url-status=dead |archive-url=https://web.archive.org/web/20080124155954/http://www.olapreport.com/Architectures.htm |archive-date=January 24, 2008 }}</ref>
ओएलएपी प्रणाली को पारंपरिक रूप से निम्नलिखित टैक्सोनॉमी का उपयोग करके वर्गीकृत किया गया है।<ref name=Pendse2006>{{cite web|url=http://www.olapreport.com/Architectures.htm |title=OLAP architectures |publisher=OLAP Report |author=Nigel Pendse |date=2006-06-27 |access-date=2008-03-17 |url-status=dead |archive-url=https://web.archive.org/web/20080124155954/http://www.olapreport.com/Architectures.htm |archive-date=January 24, 2008 }}</ref>
=== बहुआयामी ओएलएपी (एमओएलएपी) ===
=== बहुआयामी ओएलएपी (एमओएलएपी) ===
एमओएलएपी (बहु-आयामी ऑनलाइन विश्लेषणात्मक प्रसंस्करण) ओएलएपी का क्लासिक रूप है और इसे कभी-कभी केवल ओएलएपी के रूप में संदर्भित किया जाता है। एमओएलएपी इस डेटा को एक संबंधपरक आंकड़ाकोष के बजाय एक अनुकूलित बहु-आयामी सरणी संग्रहण में संग्रहीत करता है।
एमओएलएपी (बहु-आयामी ऑनलाइन विश्लेषणात्मक प्रसंस्करण) ओएलएपी का शास्त्रीय रूप है और इसे कभी-कभी केवल ओएलएपी के रूप में संदर्भित किया जाता है। एमओएलएपी इस डेटा को एक संबंधपरक आंकड़ाकोष के बजाय एक अनुकूलित बहु-आयामी सरणी संग्रहण में संग्रहीत करता है।


कुछ एमओएलएपी उपकरणों को व्युत्पन्न डेटा की पूर्व-गणना और भंडारण की आवश्यकता होती है, जैसे समेकन - ऑपरेशन जिसे प्रसंस्करण के रूप में जाना जाता है। ऐसे एमओएलएपी उपकरण आम तौर पर [[डेटा क्यूब|डेटा घन]] के रूप में संदर्भित पूर्व-परिकलित डेटा सेट का उपयोग करते हैं। डेटा घन में प्रश्नों की दी गई श्रेणी के सभी संभावित उत्तर होते हैं। नतीजतन, उनके पास प्रश्नों के लिए बहुत तेज़ प्रतिक्रिया होती है। दूसरी ओर, पूर्व-गणना की डिग्री के आधार पर अद्यतन करने में लंबा समय लग सकता है। पूर्व-गणना से डेटा विस्फोट के रूप में भी जाना जाता है।
कुछ एमओएलएपी उपकरणों को व्युत्पन्न डेटा की पूर्व-गणना और भंडारण की आवश्यकता होती है, जैसे समेकन - ऑपरेशन जिसे प्रसंस्करण के रूप में जाना जाता है। ऐसे एमओएलएपी उपकरण आमतौर पर [[डेटा क्यूब|डेटा घन]] के रूप में संदर्भित पूर्व-परिकलित डेटा सेट का उपयोग करते हैं। डेटा घन में प्रश्नों की दी गई श्रेणी के सभी संभावित उत्तर होते हैं। नतीजतन, उनके पास प्रश्नों के लिए बहुत तेज़ प्रतिक्रिया होती है। दूसरी ओर, पूर्व-गणना की डिग्री के आधार पर अद्यतन करने में लंबा समय लग सकता है। पूर्व-गणना से डेटा विस्फोट के रूप में भी जाना जाता है।


अन्य एमओएलएपी उपकरण, विशेष रूप से वे जो [[कार्यात्मक डेटाबेस मॉडल|कार्यात्मक आंकड़ाकोष मॉडल]] को लागू करते हैं, व्युत्पन्न डेटा की पूर्व-गणना नहीं करते हैं, लेकिन उन लोगों के अलावा मांग पर सभी गणना करते हैं जो पहले अनुरोध किए गए थे और कैश में संग्रहीत किए गए थे।
अन्य एमओएलएपी उपकरण, विशेष रूप से वे जो [[कार्यात्मक डेटाबेस मॉडल|कार्यात्मक आंकड़ाकोष मॉडल]] को लागू करते हैं, व्युत्पन्न डेटा की पूर्व-गणना नहीं करते हैं, लेकिन उन लोगों के अतिरिक्त मांग पर सभी गणना करते हैं जो पहले अनुरोध किए गए थे और कैश में संग्रहीत किए गए थे।


'''एमओएलएपी के लाभ'''
'''एमओएलएपी के लाभ'''
Line 130: Line 140:
* संपीड़न प्रौद्योगिकीों के कारण संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा की तुलना में डेटा का छोटा ऑन-डिस्क आकार।
* संपीड़न प्रौद्योगिकीों के कारण संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा की तुलना में डेटा का छोटा ऑन-डिस्क आकार।
* डेटा के उच्च स्तर के समुच्चय की स्वचालित गणना।
* डेटा के उच्च स्तर के समुच्चय की स्वचालित गणना।
* यह कम आयाम वाले डेटा सेट के लिए बहुत कॉम्पैक्ट है।
* यह कम आयाम वाले डेटा सेट के लिए बहुत संकुचित है।
* सरणी मॉडल प्राकृतिक अनुक्रमण प्रदान करते हैं।
* सरणी मॉडल प्राकृतिक अनुक्रमण प्रदान करते हैं।
* एकत्रित डेटा की पूर्व-संरचना के माध्यम से प्राप्त प्रभावी डेटा निष्कर्षण।
* एकत्रित डेटा की पूर्व-संरचना के माध्यम से प्राप्त प्रभावी डेटा निष्कर्षण।
Line 142: Line 152:


=== संबंधपरक ओएलएपी (आरओएलएपी) ===
=== संबंधपरक ओएलएपी (आरओएलएपी) ===
आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम तालिकाओं को संबंधपरक तालिकाओं के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई तालिकाएँ बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में हेरफेर करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया एसक्यूएल कथन में "डब्ल्यएचईआरई" खंड जोड़ने के समान है। आरओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए मानक संबंधात्मक आंकड़ाकोष और इसकी तालिकाओं में प्रश्न करते हैं। आरओएलएपी उपकरण में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। आरओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल करने की क्षमता भी रखता है।
आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम टेबल्स को संबंधपरक टेबल्स के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई टेबल्स बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में गड़बड़ी करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया एसक्यूएल कथन में "डब्ल्यएचईआरई" खंड जोड़ने के समान है। आरओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए मानक संबंधात्मक आंकड़ाकोष और इसकी टेबल्स में प्रश्न करते हैं। आरओएलएपी उपकरण में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। आरओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल डाउन करने की क्षमता भी रखता है।


जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। हालाँकि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है।
जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। तथापि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है।


==== आरओएलएपी के फायदे ====
==== आरओएलएपी के फायदे ====
Line 153: Line 163:
* विभिन्न प्रकार के डेटा लोडिंग उपकरण उपलब्ध होने के साथ, और विशेष डेटा मॉडल में अर्क, परिणत, लोड (ईटीएल) कोड को ठीक करने की क्षमता के साथ, लोड समय आम तौर पर स्वचालित एमओएलएपी लोड की तुलना में बहुत कम होता है .
* विभिन्न प्रकार के डेटा लोडिंग उपकरण उपलब्ध होने के साथ, और विशेष डेटा मॉडल में अर्क, परिणत, लोड (ईटीएल) कोड को ठीक करने की क्षमता के साथ, लोड समय आम तौर पर स्वचालित एमओएलएपी लोड की तुलना में बहुत कम होता है .
* डेटा को एक मानक संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है और इसे किसी भी [[SQL|एसक्यूएल]] प्रतिवेदन उपकरण द्वारा एक्सेस किया जा सकता है (उपकरण को ओएलएपी उपकरण आवश्यकता नहीं है)।
* डेटा को एक मानक संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है और इसे किसी भी [[SQL|एसक्यूएल]] प्रतिवेदन उपकरण द्वारा एक्सेस किया जा सकता है (उपकरण को ओएलएपी उपकरण आवश्यकता नहीं है)।
* आरओएलएपी उपकरण गैर-अस्पष्ट तथ्यों (जैसे, पाठ्य विवरण) को संभालने में बेहतर हैं। इन तत्वों को प्रश्न करते समय एमओएलएपी उपकरण धीमे प्रदर्शन से पीड़ित होते हैं।
* आरओएलएपी उपकरण गैर-अस्पष्ट तथ्यों (जैसे, पाठ्य विवरण) को संभालने में सुधार हैं। इन तत्वों को प्रश्न करते समय एमओएलएपी उपकरण धीमे प्रदर्शन से पीड़ित होते हैं।
* बहु-आयामी मॉडल से डेटा भंडारण को [[डिकूप्लिंग (इलेक्ट्रॉनिक्स)]] करके, डेटा को सफलतापूर्वक मॉडल करना संभव है जो अन्यथा सख्त आयामी मॉडल में फिट नहीं होगा।
* बहु-आयामी मॉडल से डेटा भंडारण को [[डिकूप्लिंग (इलेक्ट्रॉनिक्स)]] करके, डेटा को सफलतापूर्वक मॉडल करना संभव है जो अन्यथा सख्त आयामी मॉडल में फिट नहीं होगा।
* आरओएलएपी दृष्टिकोण आंकड़ाकोष प्राधिकरण नियंत्रणों जैसे कि पंक्ति-स्तरीय सुरक्षा का लाभ उठा सकता है, जिससे प्रश्न परिणाम लागू किए गए पूर्व निर्धारित मानदंडों के आधार पर फ़िल्टर किए जाते हैं, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता या उपयोगकर्ताओं के समूह ( एसक्यूएल डब्ल्यूएचईआरई खंड) के लिए।
* आरओएलएपी दृष्टिकोण आंकड़ाकोष प्राधिकरण नियंत्रणों जैसे कि पंक्ति-स्तरीय सुरक्षा का लाभ उठा सकता है, जिससे प्रश्न परिणाम लागू किए गए पूर्व निर्धारित मानदंडों के आधार पर फ़िल्टर किए जाते हैं, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता या उपयोगकर्ताओं के समूह ( एसक्यूएल डब्ल्यूएचईआरई खंड) के लिए।
Line 161: Line 171:
Please review the discussion page before making changes to the advantages or disadvantages. Thank you.
Please review the discussion page before making changes to the advantages or disadvantages. Thank you.
-->
-->
* उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन [[MOLAP|एमओएलएपी]] उपकरण की तुलना में धीमा है। हालाँकि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें।
* उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन [[MOLAP|एमओएलएपी]] उपकरण की तुलना में धीमा है। तथापि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें।
* कुल तालिकाओं की लोडिंग कस्टम ETL कोड द्वारा प्रबंधित किया जाना चाहिए। आरओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है कि समर्थन करने के लिए अतिरिक्त विकास समय और अधिक कोड।
* कुल टेबल की लोडिंग कस्टम ईटीएल कोड द्वारा प्रबंधित किया जाना चाहिए। आरओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है कि समर्थन करने के लिए अतिरिक्त विकास समय और अधिक कोड।
* जब समग्र तालिकाएँ बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत तालिकाओं को प्रश्न करना चाहिए। अतिरिक्त समग्र तालिकाएँ जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, हालाँकि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र तालिकाएँ बनाना अभी भी व्यावहारिक नहीं है।
* जब समग्र टेबल्स बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत टेबल को प्रश्न करना चाहिए। अतिरिक्त समग्र टेबल्स जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, तथापि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र टेबल्स बनाना अभी भी व्यावहारिक नहीं है।
* आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। हालाँकि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं।
* आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। तथापि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं।
* चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं।
* चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं।


Line 170: Line 180:
ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। [http://www.olapreport.com/survey.htm ओएलएपी सर्वेक्षण], जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं।
ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। [http://www.olapreport.com/survey.htm ओएलएपी सर्वेक्षण], जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं।


हालांकि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए।
यद्यपि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए।
* सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा।
* सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा।
* मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है।
* मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है।


==== लचीलेपन का नकारात्मक पक्ष ====
==== लचीलेपन का नकारात्मक पक्ष ====
कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे मौजूदा संबंधपरक आंकड़ाकोष तालिकाओं का पुन: उपयोग करने का आशय रखती हैं - ये तालिकाओं को प्रायः ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। आरओएलएपी उपकरण का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत ओएलएपी उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे।
कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे वर्तमान संबंधपरक आंकड़ाकोष टेबल का पुन: उपयोग करने का आशय रखती हैं - ये टेबल को प्रायः ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। आरओएलएपी उपकरण का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत ओएलएपी उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे।


===हाइब्रिड ओलाप (होलाप)===
===हाइब्रिड ओलाप (होलाप)===
Line 197: Line 207:


==== क्षैतिज विभाजन ====
==== क्षैतिज विभाजन ====
इस मोड में एचओएलएपी डेटा के कुछ हिस्से को संग्रहीत करता है, आमतौर पर नवीनतम डेटा (अर्थात समय आयाम द्वारा विभाजित) को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए, और पुराने डेटा को आरओएलएपी में संग्रहीत करता है। इसके अलावा, हम कुछ डाइसों को एमओएलएपी में और अन्य को आरओएलएपी में स्टोर कर सकते हैं, इस तथ्य का लाभ उठाते हुए कि एक बड़े घनाभ में घने और विरल उपक्षेत्र होंगे।<ref>{{cite journal|arxiv=cs/0702143|doi=10.1016/j.ins.2005.09.005 |title=Attribute value reordering for efficient hybrid OLAP |year=2006 |last1=Kaser |first1=Owen |last2=Lemire |first2=Daniel |journal=Information Sciences |volume=176 |issue=16 |pages=2304–2336 }}</ref>
इस मोड में एचओएलएपी डेटा के कुछ हिस्से को संग्रहीत करता है, आमतौर पर नवीनतम डेटा (अर्थात समय आयाम द्वारा विभाजित) को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए, और पुराने डेटा को आरओएलएपी में संग्रहीत करता है। इसके अतिरिक्त, हम कुछ डाइसों को एमओएलएपी में और अन्य को आरओएलएपी में स्टोर कर सकते हैं, इस तथ्य का लाभ उठाते हुए कि एक बड़े घनाभ में घने और विरल उपक्षेत्र होंगे।<ref>{{cite journal|arxiv=cs/0702143|doi=10.1016/j.ins.2005.09.005 |title=Attribute value reordering for efficient hybrid OLAP |year=2006 |last1=Kaser |first1=Owen |last2=Lemire |first2=Daniel |journal=Information Sciences |volume=176 |issue=16 |pages=2304–2336 }}</ref>
==== उत्पाद ====
==== उत्पाद ====
एचओएलएपी संग्रहण प्रदान करने वाला पहला उत्पाद [[Holos|होलोस]] था, लेकिन यह प्रौद्योगिकी अन्य वाणिज्यिक उत्पादों जैसे माइक्रोसॉफ्ट विश्लेषण सेवाओं, देववाणी ओएलएपी, सूक्ष्म रणनीति और [[SAP AG|एसएपी एजी]] बीआई एक्सेलेरेटर में भी उपलब्ध हो गई। हाइब्रिड ओएलएपी दृष्टिकोण आरओएलएपी और एमओएलएपी प्रौद्योगिकी को जोड़ती है, जो आरओएलएपी की अधिक मापनीयता और एमओएलएपी की तेज़ गणना से लाभान्वित होती है। उदाहरण के लिए, एक एचओएलएपी सर्वर बड़ी मात्रा में विस्तृत डेटा को संबंधात्मक आंकड़ाकोष में संग्रहीत कर सकता है, जबकि एकत्रीकरण को एक अलग एमओएलएपी स्टोर में रखा जाता है। माइक्रोसॉफ्ट एसक्यूएल सर्वर ७.० ओएलएपी सेवाएँ हाइब्रिड ओएलएपी सर्वर का समर्थन करती हैं
एचओएलएपी संग्रहण प्रदान करने वाला पहला उत्पाद [[Holos|होलोस]] था, लेकिन यह प्रौद्योगिकी अन्य वाणिज्यिक उत्पादों जैसे माइक्रोसॉफ्ट विश्लेषण सेवाओं, देववाणी ओएलएपी, सूक्ष्म रणनीति और [[SAP AG|एसएपी एजी]] बीआई एक्सेलेरेटर में भी उपलब्ध हो गई। हाइब्रिड ओएलएपी दृष्टिकोण आरओएलएपी और एमओएलएपी प्रौद्योगिकी को जोड़ती है, जो आरओएलएपी की अधिक मापनीयता और एमओएलएपी की तेज़ गणना से लाभान्वित होती है। उदाहरण के लिए, एक एचओएलएपी सर्वर बड़ी मात्रा में विस्तृत डेटा को संबंधात्मक आंकड़ाकोष में संग्रहीत कर सकता है, जबकि एकत्रीकरण को एक अलग एमओएलएपी स्टोर में रखा जाता है। माइक्रोसॉफ्ट एसक्यूएल सर्वर ७.० ओएलएपी सेवाएँ हाइब्रिड ओएलएपी सर्वर का समर्थन करती हैं


=== तुलना ===
=== तुलना ===
प्रत्येक प्रकार के कुछ लाभ हैं, हालांकि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है।
प्रत्येक प्रकार के कुछ लाभ हैं, यद्यपि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है।


* कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा।
* कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा।
* एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।<ref name="ieee_cite"/>* आरओएलएपी आमतौर पर अधिक मापनीय है।<ref name="ieee_cite"/>हालांकि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना मुश्किल है, इसलिए इसे प्रायः छोड़ दिया जाता है। आरओएलएपी प्रश्न प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है।
* एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।<ref name="ieee_cite"/> आरओएलएपी आमतौर पर अधिक मापनीय है।<ref name="ieee_cite"/>यद्यपि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना कठिन है, इसलिए इसे प्रायः छोड़ दिया जाता है। आरओएलएपी प्रश्न प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है।
* चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं।
* चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं।
* एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आम तौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की पेशकश कर सकता है।
* एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आमतौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की प्रस्ताव कर सकता है।


=== अन्य प्रकार ===
=== अन्य प्रकार ===
निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, हालांकि वे ऊपर के रूप में व्यापक नहीं हैं:
निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, यद्यपि वे ऊपर के रूप में व्यापक नहीं हैं:


* डब्ल्यूओएलएपी - वेब आधारित ओएलएपी
* डब्ल्यूओएलएपी - वेब आधारित ओएलएपी
Line 221: Line 231:
[[संबंधपरक डेटाबेस|संबंधपरक आंकड़ाकोष]] के विपरीत, जिसमें मानक प्रश्न भाषा के रूप में एसक्यूएल था, और [[ODBC|ओडीबीसी]], [[JDBC|जे]][[ODBC|डीबीसी]] और [[OLEDB|ओएलईडीबी]] जैसे व्यापक [[अप्लिकेशन प्रोग्रामिंग अंतरफलक]] थे, ओएलएपी दुनिया में लंबे समय तक ऐसा कोई एकीकरण नहीं था। [[Microsoft|माइक्रोसॉफ्ट]] से ओएलएपी विनिर्देशन के लिए पहला वास्तविक मानक एपीआई ओएलई डीबी था जो १९९७ में सामने आया और बहुआयामी अभिव्यक्ति प्रश्न भाषा पेश की। कई ओएलएपी वेंडर – सर्वर और क्लाइंट दोनों – ने इसे अपनाया। २००१ में माइक्रोसॉफ्ट और [[Hyperion Solutions Corporation|हाइपरियन सॉल्यूशंस कॉर्पोरेशन]] ने विश्लेषण विनिर्देश के लिए एक्सएमएल की घोषणा की, जिसे अधिकांश ओएलएपी विक्रेताओं द्वारा समर्थन दिया गया था। चूँकि इसने एमडीएक्स को प्रश्न भाषा के रूप में भी उपयोग किया, एमडीएक्स वास्तविक मानक बन गया।<ref>{{cite web|url=http://www.olapreport.com/Comment_APIs.htm |title=Commentary: OLAP API wars |publisher=OLAP Report |author=Nigel Pendse |date=2007-08-23 |access-date=2008-03-18 |url-status=dead |archive-url=https://web.archive.org/web/20080528220113/http://www.olapreport.com/Comment_APIs.htm |archive-date=May 28, 2008 }}</ref>
[[संबंधपरक डेटाबेस|संबंधपरक आंकड़ाकोष]] के विपरीत, जिसमें मानक प्रश्न भाषा के रूप में एसक्यूएल था, और [[ODBC|ओडीबीसी]], [[JDBC|जे]][[ODBC|डीबीसी]] और [[OLEDB|ओएलईडीबी]] जैसे व्यापक [[अप्लिकेशन प्रोग्रामिंग अंतरफलक]] थे, ओएलएपी दुनिया में लंबे समय तक ऐसा कोई एकीकरण नहीं था। [[Microsoft|माइक्रोसॉफ्ट]] से ओएलएपी विनिर्देशन के लिए पहला वास्तविक मानक एपीआई ओएलई डीबी था जो १९९७ में सामने आया और बहुआयामी अभिव्यक्ति प्रश्न भाषा पेश की। कई ओएलएपी वेंडर – सर्वर और क्लाइंट दोनों – ने इसे अपनाया। २००१ में माइक्रोसॉफ्ट और [[Hyperion Solutions Corporation|हाइपरियन सॉल्यूशंस कॉर्पोरेशन]] ने विश्लेषण विनिर्देश के लिए एक्सएमएल की घोषणा की, जिसे अधिकांश ओएलएपी विक्रेताओं द्वारा समर्थन दिया गया था। चूँकि इसने एमडीएक्स को प्रश्न भाषा के रूप में भी उपयोग किया, एमडीएक्स वास्तविक मानक बन गया।<ref>{{cite web|url=http://www.olapreport.com/Comment_APIs.htm |title=Commentary: OLAP API wars |publisher=OLAP Report |author=Nigel Pendse |date=2007-08-23 |access-date=2008-03-18 |url-status=dead |archive-url=https://web.archive.org/web/20080528220113/http://www.olapreport.com/Comment_APIs.htm |archive-date=May 28, 2008 }}</ref>


सितंबर-2011 से माइक्रोसॉफ्ट .एनएफटी से माइक्रोसॉफ्ट विश्लेषण सेवाओं ओएलएपी क्यूब्स को प्रश्न करने के लिए [[LINQ|एलआईएनक्यू]] का उपयोग किया जा सकता है।<ref>{{cite web|url=http://www.agiledesignllc.com/Products|title=SSAS Entity Framework Provider for LINQ to SSAS OLAP}}</ref>
सितंबर-२०११ से माइक्रोसॉफ्ट .एनएफटी से माइक्रोसॉफ्ट विश्लेषण सेवाओं ओएलएपी क्यूब्स को प्रश्न करने के लिए [[LINQ|एलआईएनक्यू]] का उपयोग किया जा सकता है।<ref>{{cite web|url=http://www.agiledesignllc.com/Products|title=SSAS Entity Framework Provider for LINQ to SSAS OLAP}}</ref>
== उत्पाद ==
== उत्पाद ==


=== इतिहास ===
=== इतिहास ===
ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे 1970 में जारी किया गया था (और १९९५ में [[Oracle Corporation|ओरेकल निगम]] द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।<ref>{{cite web|title=The origins of today's OLAP products |url=http://olapreport.com/origins.htm |publisher=OLAP Report |date=2007-08-23 |author=Nigel Pendse |access-date=November 27, 2007 |url-status=dead |archive-url=https://web.archive.org/web/20071221044811/http://www.olapreport.com/origins.htm |archive-date=December 21, 2007 }}</ref> हालांकि, यह शब्द १९९३ तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर<ref name=Codd1993/> एक छोटे से परामर्श कार्य के परिणामस्वरूप हुआ, जिसे कॉड ने पूर्व आर्बर सॉफ्टवेयर (बाद में [[हाइपरियन सॉल्यूशंस]], और २००७ में ओरेकल द्वारा अधिग्रहित) एक प्रकार के विपणन तख्तापलट के रूप में लिया था। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद एस्बेस जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून एस्बेस के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने १९९० के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। १९९८ में, माइक्रोसॉफ्ट ने अपना पहला ओएलएपी सर्वर जारी किया{{snd}} माइक्रोसॉफ्ट विश्लेषण सेवाएँ, जिसने ओएलएपी प्रौद्योगिकी को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया।
ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे १९७० में जारी किया गया था (और १९९५ में [[Oracle Corporation|ओरेकल निगम]] द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।<ref>{{cite web|title=The origins of today's OLAP products |url=http://olapreport.com/origins.htm |publisher=OLAP Report |date=2007-08-23 |author=Nigel Pendse |access-date=November 27, 2007 |url-status=dead |archive-url=https://web.archive.org/web/20071221044811/http://www.olapreport.com/origins.htm |archive-date=December 21, 2007 }}</ref> यद्यपि, यह शब्द १९९३ तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर<ref name=Codd1993/> एक छोटे से परामर्श कार्य के परिणामस्वरूप हुआ, जिसे कॉड ने पूर्व आर्बर सॉफ्टवेयर (बाद में [[हाइपरियन सॉल्यूशंस]], और २००७ में ओरेकल द्वारा अधिग्रहित) एक प्रकार के विपणन तख्तापलट के रूप में लिया था। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद एस्बेस जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून एस्बेस के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने १९९० के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। १९९८ में, माइक्रोसॉफ्ट ने अपना पहला ओएलएपी सर्वर जारी किया{{snd}} माइक्रोसॉफ्ट विश्लेषण सेवाएँ, जिसने ओएलएपी प्रौद्योगिकी को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया।


=== उत्पाद तुलना ===
=== उत्पाद तुलना ===
Line 332: Line 342:
{{refend}}
{{refend}}


{{-}}{{Authority control}}
{{-}}
 
{{DEFAULTSORT:Online Analytical Processing}}{{Authority control}}
{{DEFAULTSORT:Online Analytical Processing}}
श्रेणी:ऑनलाइन विश्लेषणात्मक प्रक्रिया
श्रेणी:डेटा प्रबंधन
 


[[Category: Machine Translated Page]]
[[Category:All articles with dead external links|Online Analytical Processing]]
[[Category:Created On 16/02/2023]]
[[Category:Articles with dead external links from April 2020|Online Analytical Processing]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Online Analytical Processing]]
[[Category:Articles with invalid date parameter in template|Online Analytical Processing]]
[[Category:Articles with permanently dead external links|Online Analytical Processing]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors|Online Analytical Processing]]
[[Category:Created On 16/02/2023|Online Analytical Processing]]
[[Category:Harv and Sfn no-target errors|Online Analytical Processing]]
[[Category:Lua-based templates|Online Analytical Processing]]
[[Category:Machine Translated Page|Online Analytical Processing]]
[[Category:Pages with script errors|Online Analytical Processing]]
[[Category:Short description with empty Wikidata description|Online Analytical Processing]]
[[Category:Templates Vigyan Ready|Online Analytical Processing]]
[[Category:Templates that add a tracking category|Online Analytical Processing]]
[[Category:Templates that generate short descriptions|Online Analytical Processing]]
[[Category:Templates using TemplateData|Online Analytical Processing]]

Latest revision as of 16:42, 9 April 2023

ऑनलाइन विश्लेषणात्मक प्रसंस्करण, या ओएलएपी (/ˈlæp/), कम्प्यूटिंग में बहु-आयामी विश्लेषणात्मक (एमडीए) प्रश्नों का तेजी से उत्तर देने का एक दृष्टिकोण है।[1] ओएलएपी व्यावसायिक बुद्धिमत्ता की व्यापक श्रेणी का हिस्सा है, जिसमें संबंध का आंकड़ाकोष, रिपोर्ट लेखन और डेटा खनन भी सम्मिलित है।[2] ओएलएपी के विशिष्ट अनुप्रयोगों में बिक्री, विपणन, व्यापार प्रतिवेदन, व्यवसाय प्रक्रिया प्रबंधन (बीपीएम) के लिए व्यवसाय प्रतिवेदन सम्मिलित है।[3] बजट और पूर्वानुमान, वित्तीय प्रतिवेदन और इसी तरह के क्षेत्र,कृषि जैसे नए अनुप्रयोगों के साथ।[4]

ओएलएपी शब्द पारंपरिक आंकड़ाकोष शब्द ऑनलाइन लेनदेन प्रसंस्करण (ओएलपी) के लघु संशोधन के रूप में बनाया गया था।[5]

ओएलएपी उपकरण उपयोगकर्ताओं को कई दृष्टिकोणों से बहुआयामी डेटा का सहभागी रूप से विश्लेषण करने में सक्षम बनाता है। ओएलएपी में तीन मूलभूत विश्लेषणात्मक संचालन होते हैं: समेकन (रोल-अप), ड्रिल-डाउन और स्लाइसिंग और डाइसिंग।[6] समेकन में डेटा का एकत्रीकरण सम्मिलित है जिसे एक या अधिक आयामों में संचित और गणना की जा सकती है। उदाहरण के लिए, बिक्री के रुझानों का अनुमान लगाने के लिए सभी बिक्री कार्यालयों को बिक्री विभाग या बिक्री प्रभाग में रोल अप किया जाता है। इसके विपरीत, ड्रिल-डाउन एक ऐसी प्रौद्योगिकी है जो उपयोगकर्ताओं को विवरण के माध्यम से मार्गनिर्देशन करने की अनुमति देती है। उदाहरण के लिए, उपयोगकर्ता व्यक्तिगत उत्पादों द्वारा बिक्री देख सकते हैं जो किसी क्षेत्र की बिक्री बनाते हैं। स्लाइसिंग और डाइसिंग एक ऐसी सुविधा है जिससे उपयोगकर्ता ओएलएपी क्यूब के डेटा के एक विशिष्ट सेट निकाल सकते हैं (स्लाइसिंग) कर सकते हैं और विभिन्न दृष्टिकोणों से स्लाइस देख सकते हैं (डाइकिंग)। इन दृष्टिकोणों को कभी-कभी आयाम कहा जाता है (जैसे विक्रेता द्वारा एक ही बिक्री को देखना, या तिथि के अनुसार, या ग्राहक द्वारा, या उत्पाद द्वारा, या क्षेत्र द्वारा, आदि द्वारा )।

ओएलएपी के लिए विन्यस्त किए गए आंकड़ाकोष एक बहुआयामी डेटा मॉडल का उपयोग करते हैं, जिससे तेजी से निष्पादन समय के साथ जटिल विश्लेषणात्मक और तदर्थ प्रश्नों की अनुमति मिलती है।[7] वे नेविगेशनल आंकड़ाकोष, पदानुक्रमित आंकड़ाकोष और संबंधात्मक आंकड़ाकोष के पहलुओं को उधार लेते हैं।

ओएलएपी आमतौर पर ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) के विपरीत माना जाता है, जो आमतौर पर व्यापार आसूचना या प्रतिवेदन के उद्देश्य के बजाय लेनदेन को संसाधित करने के लिए, बड़ी मात्रा में बहुत कम जटिल प्रश्नों की विशेषता है।। जबकि ओएलएपी प्रणालियों ज्यादातर पढ़ने के लिए अनुकूलित होते हैं, ओएलटीपी को सभी प्रकार के प्रश्नों (पढ़ना, सम्मिलित करना, नवीनीकरण करना और मिटाना) को संसाधित करना होता है।

ओएलएपी प्रणाली का अवलोकन

किसी भी ओएलएपी प्रणाली के मूल में एक ओएलएपी घन होता है (जिसे 'बहुआयामी घन' या अतिविम भी कहा जाता है)। इसमें संख्यात्मक तथ्य होते हैं जिन्हें माप कहा जाता है जिन्हें आयामों (डेटा वेयरहाउस) द्वारा वर्गीकृत किया जाता है। उपायों को अतिविम के चौराहों पर रखा गया है, जो एक सदिश स्थान के रूप में आयामों द्वारा फैला हुआ है। ओएलएपी घन में गड़बड़ी करने के लिए सामान्य अंतरापृष्ठ एक सांचा अंतरापृष्ठ है, जैसे स्प्रेडशीट प्रोग्राम में पिवट टेबल्स, जो आयामों के साथ प्रक्षेपण संचालन करती हैं, जैसे कि एकत्रीकरण या औसत।

घन अधिआंकड़ा आमतौर पर एक संबंधात्मक आंकड़ाकोष में स्टार स्कीमा या स्नोफ्लेक स्कीमा या टेबल के तथ्य नक्षत्र से बनाया जाता है। उपाय तथ्य टेबल में अभिलेख से माप प्राप्त किए जाते हैं और आयाम टेबल से आयाम प्राप्त किए जाते हैं।

प्रत्येक उपाय के बारे में सोचा जा सकता है कि इसमें लेबल का एक सेट है, या इसके साथ जुड़े अधिआंकड़ा हैं। एक आयाम वह है जो इन लेबलों का वर्णन करता है; यह उपाय के बारे में जानकारी प्रदान करता है।

एक सरल उदाहरण एक घन होगा जिसमें माप के रूप में स्टोर की बिक्री और आयाम के रूप में दिनांक/समय सम्मिलित है। प्रत्येक बिक्री में एक दिनांक/समय लेबल होता है जो उस बिक्री के बारे में अधिक वर्णन बताता है।

उदाहरण के लिए:

 बिक्री तथ्य टेबल
+-------------+----------+
| बिक्री_राशि | समय_आईडी |
+-------------+----------+ समय आयाम
| २००८.१०| १२३४ |----+ +---------+----+
+-------------+----------+ | | समय_आईडी | टाइमस्टैम्प |
 | +---------+----+
 +---->| १२३४ | २००८०९०२ १२ः३५ः४३ |
 +---------+----+

बहुआयामी आंकड़ाकोष

बहुआयामी संरचना को "संबंधात्मक मॉडल की भिन्नता के रूप में परिभाषित किया जाता है जो डेटा को व्यवस्थित करने और डेटा के बीच संबंधों को व्यक्त करने के लिए बहुआयामी संरचनाओं का उपयोग करता है"।[6]: १७७  संरचना को क्यूब्स में तोड़ा गया है और क्यूब्स प्रत्येक घन की सीमाओं के भीतर डेटा को स्टोर और एक्सेस करने में सक्षम हैं। "एक बहुआयामी संरचना के भीतर प्रत्येक सेल में इसके प्रत्येक आयाम के साथ तत्वों से संबंधित एकत्रित डेटा होता है" ।[6]: १७८  यहां तक ​​​​कि जब डेटा में गड़बड़ी किया जाता है, तब भी इसका उपयोग करना आसान रहता है और एक कॉम्पैक्ट आंकड़ाकोष प्रारूप का गठन जारी रहता है। डेटा अभी भी परस्पर जुड़ा हुआ है। बहुआयामी संरचना विश्लेषणात्मक आंकड़ाकोष के लिए काफी लोकप्रिय है जो ऑनलाइन विश्लेषणात्मक प्रसंस्करण (ओएलएपी) अनुप्रयोगों का उपयोग करने वाले विश्लेषणात्मक आंकड़ाकोष के लिए बहुआयामी संरचना काफी लोकप्रिय है।[6] विश्लेषणात्मक आंकड़ाकोष इन आंकड़ाकोष का उपयोग जटिल व्यावसायिक प्रश्नों के उत्तर तेजी से देने की उनकी क्षमता है। डेटा को विभिन्न कोणों से देखा जा सकता है, जो अन्य मॉडलों के विपरीत समस्या का व्यापक परिप्रेक्ष्य देता है।[8]

एकत्रीकरण

यह दावा किया गया है कि जटिल प्रश्नों के लिए ओएलएपी क्यूब्स ओएलटीपी संबंधात्मक डेटा पर एक ही प्रश्न के लिए आवश्यक समय के लगभग ०.१% में उत्तर दे सकते हैं।[9][10] ओएलएपी में सबसे महत्वपूर्ण तंत्र जो इस तरह के प्रदर्शन को प्राप्त करने की अनुमति देता है, वह एकत्रीकरण का उपयोग है। कुल समारोह (या एकत्रीकरण फ़ंक्शन) का उपयोग करके, विशिष्ट आयामों पर ग्रैन्युलैरिटी को बदलकर और इन आयामों के साथ डेटा एकत्र करके तथ्य टेबल से एकत्रीकरण बनाया जाता है। संभावित एकत्रीकरण की संख्या आयाम ग्रैन्युलैरिटी के प्रत्येक संभावित संयोजन द्वारा निर्धारित की जाती है।

सभी संभावित एकत्रीकरण और आधार डेटा के संयोजन में प्रत्येक प्रश्न के उत्तर होते हैं जिनका उत्तर डेटा से दिया जा सकता है।[11]

क्योंकि आमतौर पर कई एकत्रीकरण होते हैं जिनकी गणना की जा सकती है, प्रायः केवल एक पूर्व निर्धारित संख्या की ही पूरी तरह से गणना की जाती है; शेष मांग पर हल किए जाते हैं। किस एकत्रीकरण (विचारों) की गणना करने का निर्णय लेने की समस्या को दृश्य चयन समस्या के रूप में जाना जाता है। दृश्य चयन को एकत्रीकरण के चयनित सेट के कुल आकार, आधार डेटा में परिवर्तन से उन्हें अद्यतन करने का समय, या दोनों द्वारा बाधित किया जा सकता है। दृश्य चयन का उद्देश्य आमतौर पर ओएलएपी प्रश्नों का उत्तर देने के लिए औसत समय को कम करना है, यद्यपि कुछ अध्ययन अद्यतन समय को भी कम करते हैं। दृश्य चयन एनपी-पूर्ण है। समस्या के कई दृष्टिकोणों का पता लगाया गया है, जिसमें लालची एल्गोरिदम, यादृच्छिक खोज, आनुवंशिक एल्गोरिदम और ए* खोज एल्गोरिदम सम्मिलित हैं।

प्रत्येक सेल के लिए प्रीकंप्यूटिंग मानों द्वारा पूरे ओएलएपी घन के लिए कुछ एकत्रीकरण कार्यों की गणना की जा सकती है, और फिर इन समुच्चय को एकत्र करके सेल्स के रोल-अप के लिए एकत्रीकरण की गणना की जा सकती है, बहुआयामी समस्या के लिए एक विभाजन और विजय एल्गोरिदम लागू करके उन्हें कुशलतापूर्वक गणना करने के लिए।[12] उदाहरण के लिए, रोल-अप का कुल योग प्रत्येक सेल में सब-सम का योग है। ऐसे कार्य जिन्हें इस तरह से विघटित किया जा सकता है, उन्हें विघटनीय एकत्रीकरण कार्य कहा जाता है, और इसमें काउंट, मैक्स, एमआईएन और एसयूएम सम्मिलित हैं, जिन्हें प्रत्येक सेल के लिए गणना की जा सकती है और फिर सीधे एकत्रित किया जा सकता है; इन्हें स्व-विघटनीय एकत्रीकरण कार्यों के रूप में जाना जाता है।[13] अन्य मामलों में कुल फ़ंक्शन की गणना सेल्स के लिए सहायक संख्याओं की गणना करके, इन सहायक संख्याओं को एकत्र करके और अंत में अंत में समग्र संख्या की गणना करके की जा सकती है; उदाहरणों मेंऔसत (ट्रैकिंग योग और गिनती, अंत में विभाजित करना) और रेंज (अधिकतम और न्यूनतम ट्रैकिंग, अंत में घटाना) सम्मिलित हैं। अन्य मामलों में एक बार पूरे सेट का में विश्लेषण किए बिना समग्र कार्य की गणना नहीं की जा सकती है, यद्यपि कुछ मामलों में सन्निकटन की गणना की जा सकती है; उदाहरणों में विशिष्ट गणना, माध्य और मोड सम्मिलित हैं ; उदाहरण के लिए, किसी समुच्चय की माध्यिका उपसमुच्चयों की माध्यिकाओं की माध्यिका नहीं है। इन बाद वाले को ओएलएपी में कुशलता से लागू करना कठिन है, क्योंकि उन्हें आधार डेटा पर कुल फ़ंक्शन की गणना करने की आवश्यकता होती है, या तो उन्हें ऑनलाइन (धीमा) कंप्यूटिंग या संभावित रोलआउट (बड़ी जगह) के लिए प्रीकंप्यूटिंग करना पड़ता है।






प्रकार

ओएलएपी प्रणाली को पारंपरिक रूप से निम्नलिखित टैक्सोनॉमी का उपयोग करके वर्गीकृत किया गया है।[14]

बहुआयामी ओएलएपी (एमओएलएपी)

एमओएलएपी (बहु-आयामी ऑनलाइन विश्लेषणात्मक प्रसंस्करण) ओएलएपी का शास्त्रीय रूप है और इसे कभी-कभी केवल ओएलएपी के रूप में संदर्भित किया जाता है। एमओएलएपी इस डेटा को एक संबंधपरक आंकड़ाकोष के बजाय एक अनुकूलित बहु-आयामी सरणी संग्रहण में संग्रहीत करता है।

कुछ एमओएलएपी उपकरणों को व्युत्पन्न डेटा की पूर्व-गणना और भंडारण की आवश्यकता होती है, जैसे समेकन - ऑपरेशन जिसे प्रसंस्करण के रूप में जाना जाता है। ऐसे एमओएलएपी उपकरण आमतौर पर डेटा घन के रूप में संदर्भित पूर्व-परिकलित डेटा सेट का उपयोग करते हैं। डेटा घन में प्रश्नों की दी गई श्रेणी के सभी संभावित उत्तर होते हैं। नतीजतन, उनके पास प्रश्नों के लिए बहुत तेज़ प्रतिक्रिया होती है। दूसरी ओर, पूर्व-गणना की डिग्री के आधार पर अद्यतन करने में लंबा समय लग सकता है। पूर्व-गणना से डेटा विस्फोट के रूप में भी जाना जाता है।

अन्य एमओएलएपी उपकरण, विशेष रूप से वे जो कार्यात्मक आंकड़ाकोष मॉडल को लागू करते हैं, व्युत्पन्न डेटा की पूर्व-गणना नहीं करते हैं, लेकिन उन लोगों के अतिरिक्त मांग पर सभी गणना करते हैं जो पहले अनुरोध किए गए थे और कैश में संग्रहीत किए गए थे।

एमओएलएपी के लाभ

  • अनुकूलित भंडारण, बहुआयामी अनुक्रमण और कैशिंग के कारण तेज़ प्रश्न प्रदर्शन।
  • संपीड़न प्रौद्योगिकीों के कारण संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा की तुलना में डेटा का छोटा ऑन-डिस्क आकार।
  • डेटा के उच्च स्तर के समुच्चय की स्वचालित गणना।
  • यह कम आयाम वाले डेटा सेट के लिए बहुत संकुचित है।
  • सरणी मॉडल प्राकृतिक अनुक्रमण प्रदान करते हैं।
  • एकत्रित डेटा की पूर्व-संरचना के माध्यम से प्राप्त प्रभावी डेटा निष्कर्षण।

एमओएलएपी के नुकसान

  • कुछ एमओएलएपी प्रणाली में प्रोसेसिंग चरण (डेटा लोड) काफी लंबा हो सकता है, विशेष रूप से बड़े डेटा वॉल्यूम पर। आमतौर पर केवल वृद्धिशील प्रसंस्करण करके इसका उपचार किया जाता है, यानी पूरे डेटा सेट को पुन: संसाधित करने के बजाय केवल उस डेटा को संसाधित करना जो बदल गया है (आमतौर पर नया डेटा)।
  • कुछ एमओएलएपी कार्यप्रणालियाँ डेटा अतिरेक का परिचय देती हैं।

उत्पाद

एमओएलएपी का उपयोग करने वाले वाणिज्यिक उत्पादों के उदाहरण कॉग्नोस पावरप्ले, ओरेकल ओएलएपी, सूक्ष्म रणनीति, माइक्रोसॉफ्ट विश्लेषण सेवाएँ, ईएसएसबेस, एप्लिक्स, जेडॉक्स और आईसीक्यूब हैं।

संबंधपरक ओएलएपी (आरओएलएपी)

आरओएलएपी सीधे संबंधपरक आंकड़ाकोष के साथ काम करता है और इसके लिए पूर्व-गणना की आवश्यकता नहीं होती है। आधार डेटा और आयाम टेबल्स को संबंधपरक टेबल्स के रूप में संग्रहीत किया जाता है और एकत्रित जानकारी रखने के लिए नई टेबल्स बनाई जाती हैं। यह एक विशेष स्कीमा डिजाइन पर निर्भर करता है। यह कार्यप्रणाली पारंपरिक ओएलएपी की स्लाइसिंग और डाइसिंग कार्यक्षमता का आभास देने के लिए संबंधात्मक आंकड़ाकोष में संग्रहीत डेटा में गड़बड़ी करने पर निर्भर करती है। संक्षेप में, स्लाइसिंग और डाइसिंग की प्रत्येक क्रिया एसक्यूएल कथन में "डब्ल्यएचईआरई" खंड जोड़ने के समान है। आरओएलएपी उपकरण पूर्व-परिकलित डेटा क्यूब्स का उपयोग नहीं करते हैं, बल्कि प्रश्न का उत्तर देने के लिए आवश्यक डेटा को वापस लाने के लिए मानक संबंधात्मक आंकड़ाकोष और इसकी टेबल्स में प्रश्न करते हैं। आरओएलएपी उपकरण में कोई भी प्रश्न पूछने की क्षमता होती है क्योंकि कार्यप्रणाली घन की सामग्री तक सीमित नहीं है। आरओएलएपी में आंकड़ाकोष में विवरण के निम्नतम स्तर तक ड्रिल डाउन करने की क्षमता भी रखता है।

जबकि आरओएलएपी एक संबंधात्मक आंकड़ाकोष स्रोत का उपयोग करता है, आम तौर पर आंकड़ाकोष को सावधानीपूर्वक आरओएलएपी उपयोग के लिए डिज़ाइन किया जाना चाहिए। एक आंकड़ाकोष जो ओएलटीपी के लिए डिज़ाइन किया गया था, वह आरओएलएपी आंकड़ाकोष के रूप में अच्छी तरह से काम नहीं करेगा। इसलिए, आरओएलएपी में अभी भी डेटा की एक अतिरिक्त प्रति बनाना सम्मिलित है। तथापि, चूंकि यह एक आंकड़ाकोष है, इसलिए आंकड़ाकोष को भरने के लिए विभिन्न प्रौद्योगिकीों का उपयोग किया जा सकता है।

आरओएलएपी के फायदे

  • आरओएलएपी को बड़े डेटा वॉल्यूम को संभालने में अधिक मापनीय माना जाता है, विशेष रूप से बहुत अधिक गणनांक वाले आयाम वाले मॉडल प्रमुखता (यानी, लाखों सदस्य) के साथ।
  • विभिन्न प्रकार के डेटा लोडिंग उपकरण उपलब्ध होने के साथ, और विशेष डेटा मॉडल में अर्क, परिणत, लोड (ईटीएल) कोड को ठीक करने की क्षमता के साथ, लोड समय आम तौर पर स्वचालित एमओएलएपी लोड की तुलना में बहुत कम होता है .
  • डेटा को एक मानक संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है और इसे किसी भी एसक्यूएल प्रतिवेदन उपकरण द्वारा एक्सेस किया जा सकता है (उपकरण को ओएलएपी उपकरण आवश्यकता नहीं है)।
  • आरओएलएपी उपकरण गैर-अस्पष्ट तथ्यों (जैसे, पाठ्य विवरण) को संभालने में सुधार हैं। इन तत्वों को प्रश्न करते समय एमओएलएपी उपकरण धीमे प्रदर्शन से पीड़ित होते हैं।
  • बहु-आयामी मॉडल से डेटा भंडारण को डिकूप्लिंग (इलेक्ट्रॉनिक्स) करके, डेटा को सफलतापूर्वक मॉडल करना संभव है जो अन्यथा सख्त आयामी मॉडल में फिट नहीं होगा।
  • आरओएलएपी दृष्टिकोण आंकड़ाकोष प्राधिकरण नियंत्रणों जैसे कि पंक्ति-स्तरीय सुरक्षा का लाभ उठा सकता है, जिससे प्रश्न परिणाम लागू किए गए पूर्व निर्धारित मानदंडों के आधार पर फ़िल्टर किए जाते हैं, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता या उपयोगकर्ताओं के समूह ( एसक्यूएल डब्ल्यूएचईआरई खंड) के लिए।

आरओएलएपी के नुकसान

  • उद्योग में इस बात पर सहमति है कि आरओएलएपी उपकरण का प्रदर्शन एमओएलएपी उपकरण की तुलना में धीमा है। तथापि, आरओएलएपी प्रदर्शन के बारे में नीचे चर्चा देखें।
  • कुल टेबल की लोडिंग कस्टम ईटीएल कोड द्वारा प्रबंधित किया जाना चाहिए। आरओएलएपी उपकरण इस कार्य में सहायता नहीं करते हैं। इसका अर्थ है कि समर्थन करने के लिए अतिरिक्त विकास समय और अधिक कोड।
  • जब समग्र टेबल्स बनाने का चरण छोड़ दिया जाता है, तो प्रश्न प्रदर्शन तब प्रभावित होता है क्योंकि बड़ी विस्तृत टेबल को प्रश्न करना चाहिए। अतिरिक्त समग्र टेबल्स जोड़कर इसका आंशिक रूप से उपचार किया जा सकता है, तथापि आयामों/विशेषताओं के सभी संयोजनों के लिए समग्र टेबल्स बनाना अभी भी व्यावहारिक नहीं है।
  • आरओएलएपी प्रश्न और कैशिंग के लिए सामान्य उद्देश्य आंकड़ाकोष पर निर्भर करता है, और इसलिए एमओएलएपी उपकरण द्वारा नियोजित कई विशेष प्रौद्योगिकीें उपलब्ध नहीं हैं (जैसे विशेष श्रेणीबद्ध अनुक्रमण)। तथापि, आधुनिक आरओएलएपी उपकरण एसक्यूएल भाषा में नवीनतम सुधारों का लाभ उठाते हैं जैसे क्यूब और रोलअप संचालक, डीबी२ घन व्यूज़, साथ ही अन्य एसक्यूएल ओएलएपी एक्सटेंशन। ये एसक्यूएल सुधार एमओएलएपी उपकरण के लाभों को कम कर सकते हैं।
  • चूँकि आरओएलएपी उपकरण सभी संगणनाओं के लिए एसक्यूएल पर भरोसा करते हैं, वे उपयुक्त नहीं होते हैं जब मॉडल गणना पर भारी होता है जो एसक्यूएल में अच्छी तरह से अनुवाद नहीं करता है। ऐसे मॉडलों के उदाहरणों में बजट, आवंटन, वित्तीय प्रतिवेदन और अन्य परिदृश्य सम्मिलित हैं।

आरओएलएपी का प्रदर्शन

ओएलएपी उद्योग में आरओएलएपी को आमतौर पर बड़े डेटा वॉल्यूम के लिए स्केल करने में सक्षम माना जाता है, लेकिन एमओएलएपी के विपरीत धीमी प्रश्न प्रदर्शन से पीड़ित है। ओएलएपी सर्वेक्षण, जो सभी प्रमुख ओएलएपी उत्पादों का सबसे बड़ा स्वतंत्र सर्वेक्षण है, जो ६ वर्षों (२००१ से २००६) के लिए आयोजित किया जा रहा है, ने लगातार पाया है कि आरओएलएपी का उपयोग करने वाली कंपनियां प्रदर्शन की तुलना में धीमी रिपोर्ट करती हैं जो डेटा की मात्रा को ध्यान में रखते हुए भी एमओएलएपी का उपयोग कर रहे हैं।

यद्यपि, जैसा कि किसी भी सर्वेक्षण के साथ होता है, ऐसे कई सूक्ष्म मुद्दे हैं जिन्हें परिणामों की व्याख्या करते समय ध्यान में रखा जाना चाहिए।

  • सर्वेक्षण से पता चलता है कि आरओएलएपी उपकरण के पास प्रत्येक कंपनी के भीतर एमओएलएपी उपकरण की तुलना में ७ गुना अधिक उपयोगकर्ता हैं। अधिक उपयोगकर्ताओं वाले प्रणाली को चरम उपयोग के समय अधिक प्रदर्शन समस्याओं का सामना करना पड़ेगा।
  • मॉडल की जटिलता के बारे में भी एक सवाल है, जिसे आयामों की संख्या और गणनाओं की समृद्धि दोनों में मापा जाता है। विश्लेषण किए जा रहे डेटा में इन विविधताओं को नियंत्रित करने के लिए सर्वेक्षण एक अच्छा तरीका प्रदान नहीं करता है।

लचीलेपन का नकारात्मक पक्ष

कुछ कंपनियां आरओएलएपी का चयन करती हैं क्योंकि वे वर्तमान संबंधपरक आंकड़ाकोष टेबल का पुन: उपयोग करने का आशय रखती हैं - ये टेबल को प्रायः ओएलएपी उपयोग के लिए इष्टतम रूप से डिज़ाइन नहीं किया जाएगा। आरओएलएपी उपकरण का बेहतर लचीलापन इसे काम करने के लिए इष्टतम डिज़ाइन से कम अनुमति देता है, लेकिन प्रदर्शन प्रभावित होता है। इसके विपरीत ओएलएपी उपकरण डेटा को एक इष्टतम ओएलएपी डिज़ाइन में पुनः लोड करने के लिए बाध्य करेंगे।

हाइब्रिड ओलाप (होलाप)

अतिरिक्त ईटीएल लागत लागत और धीमी प्रश्न प्रदर्शन के बीच अवांछनीय व्यापार-बंद ने सुनिश्चित किया है कि अधिकांश वाणिज्यिक ओएलएपी उपकरण अब "हाइब्रिड ओएलएपी" (एचओएलएपी) दृष्टिकोण का उपयोग करते हैं, जो मॉडल डिज़ाइनर को यह तय करने की अनुमति देता है कि डेटा का कौन सा भाग एमओएलएपी में संग्रहीत किया जाएगा और आरओएलएपी में कौन सा हिस्सा।

"हाइब्रिड ओएलएपी" का गठन करने के लिए पूरे उद्योग में कोई स्पष्ट समझौता नहीं है, सिवाय इसके कि एक आंकड़ाकोष संबंधपरक और विशेष भंडारण के बीच डेटा को विभाजित करेगा।[15] उदाहरण के लिए, कुछ विक्रेताओं के लिए, एक एचओएलएपी आंकड़ाकोष बड़ी मात्रा में विस्तृत डेटा रखने के लिए संबंधात्मक टेबल का उपयोग करेगा, और अधिक-एकत्रित या कम-विस्तृत डेटा की छोटी मात्रा के कम से कम कुछ पहलुओं के लिए विशेष भंडारण का उपयोग करेगा। एचओएलएपी दोनों दृष्टिकोणों की क्षमताओं को जोड़कर एमओएलएपी और आरओएलएपी की कमियों को संबोधित करता है। एचओएलएपी उपकरण पूर्व-परिकलित क्यूब्स और संबंधपरक डेटा स्रोतों दोनों का उपयोग कर सकते हैं।

कार्यक्षेत्र विभाजन

इस मोड में एचओएलएपी एकत्रीकरण को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए संग्रहीत करता है, और घन प्रसंस्करण के समय को अनुकूलित करने के लिए आरओएलएपी में विस्तृत डेटा।

क्षैतिज विभाजन

इस मोड में एचओएलएपी डेटा के कुछ हिस्से को संग्रहीत करता है, आमतौर पर नवीनतम डेटा (अर्थात समय आयाम द्वारा विभाजित) को एमओएलएपी में तेजी से प्रश्न प्रदर्शन के लिए, और पुराने डेटा को आरओएलएपी में संग्रहीत करता है। इसके अतिरिक्त, हम कुछ डाइसों को एमओएलएपी में और अन्य को आरओएलएपी में स्टोर कर सकते हैं, इस तथ्य का लाभ उठाते हुए कि एक बड़े घनाभ में घने और विरल उपक्षेत्र होंगे।[16]

उत्पाद

एचओएलएपी संग्रहण प्रदान करने वाला पहला उत्पाद होलोस था, लेकिन यह प्रौद्योगिकी अन्य वाणिज्यिक उत्पादों जैसे माइक्रोसॉफ्ट विश्लेषण सेवाओं, देववाणी ओएलएपी, सूक्ष्म रणनीति और एसएपी एजी बीआई एक्सेलेरेटर में भी उपलब्ध हो गई। हाइब्रिड ओएलएपी दृष्टिकोण आरओएलएपी और एमओएलएपी प्रौद्योगिकी को जोड़ती है, जो आरओएलएपी की अधिक मापनीयता और एमओएलएपी की तेज़ गणना से लाभान्वित होती है। उदाहरण के लिए, एक एचओएलएपी सर्वर बड़ी मात्रा में विस्तृत डेटा को संबंधात्मक आंकड़ाकोष में संग्रहीत कर सकता है, जबकि एकत्रीकरण को एक अलग एमओएलएपी स्टोर में रखा जाता है। माइक्रोसॉफ्ट एसक्यूएल सर्वर ७.० ओएलएपी सेवाएँ हाइब्रिड ओएलएपी सर्वर का समर्थन करती हैं

तुलना

प्रत्येक प्रकार के कुछ लाभ हैं, यद्यपि प्रदाताओं के बीच लाभों की बारीकियों के बारे में असहमति है।

  • कुछ एमओएलएपी कार्यान्वयन आंकड़ाकोष विस्फोट के लिए प्रवण होते हैं, एक ऐसी घटना जिसके कारण एमओएलएपी आंकड़ाकोष द्वारा बड़ी मात्रा में भंडारण स्थान का उपयोग किया जाता है जब कुछ सामान्य स्थितियाँ पूरी होती हैं: उच्च संख्या में आयाम, पूर्व-परिकलित परिणाम और विरल बहुआयामी डेटा।
  • एमओएलएपी आमतौर पर विशिष्ट अनुक्रमण और भंडारण अनुकूलन के कारण बेहतर प्रदर्शन प्रदान करता है। एमओएलएपी को आरओएलएपी की तुलना में कम संग्रहण स्थान की आवश्यकता होती है क्योंकि विशिष्ट संग्रहण में आमतौर पर डेटा संपीड़न प्रौद्योगिकीें सम्मिलित होती हैं।[15] आरओएलएपी आमतौर पर अधिक मापनीय है।[15]यद्यपि, बड़ी मात्रा में पूर्व-प्रसंस्करण कुशलता से लागू करना कठिन है, इसलिए इसे प्रायः छोड़ दिया जाता है। आरओएलएपी प्रश्न प्रदर्शन इसलिए जबरदस्त रूप से प्रभावित हो सकता है।
  • चूँकि आरओएलएपी गणना करने के लिए आंकड़ाकोष पर अधिक निर्भर करता है, इसलिए इसके द्वारा उपयोग किए जा सकने वाले विशेष कार्यों में इसकी अधिक सीमाएँ हैं।
  • एचओएलएपी आरओएलएपी और एमओएलएपी के सर्वोत्तम मिश्रण का प्रयास करता है। यह आमतौर पर तेजी से पूर्व प्रक्रमक कर सकता है, अच्छी तरह से स्केल कर सकता है और अच्छे फंक्शन समर्थन की प्रस्ताव कर सकता है।

अन्य प्रकार

निम्नलिखित परिवर्णी शब्द भी कभी-कभी उपयोग किए जाते हैं, यद्यपि वे ऊपर के रूप में व्यापक नहीं हैं:

  • डब्ल्यूओएलएपी - वेब आधारित ओएलएपी
  • डीओएलएपी - डेस्कटॉप कंप्यूटर ओएलएपी
  • आरटीओएलएपी - रीयल-टाइम ओएलएपी
  • जीओएलएपी - ग्राफ़ ओएलएपी[17][18]
  • कैसिओएलएपी - संदर्भ-जागरूक सिमेंटिक ओएलएपी,[19] जैव चिकित्सा अनुप्रयोगों के लिए विकसित।[20] कैसिओएलएपी प्लेटफ़ॉर्म में डेटा पूर्वप्रक्रमण (जैसे, डाउनलोड करना, निष्कर्षण और टेक्स्ट दस्तावेज़ों को पार्स करना), इलास्टिक्स खोज के साथ अनुक्रमण और खोज करना, टेक्स्ट-घन नामक एक कार्यात्मक दस्तावेज़ संरचना बनाना सम्मिलित है,[21][22][23][24][25] और मुख्य कैसिओएलएपी एल्गोरिथ्म का उपयोग करके उपयोगकर्ता-परिभाषित वाक्यांश-श्रेणी संबंधों को परिमाणित करना।

एपीआई और प्रश्न भाषाएं

संबंधपरक आंकड़ाकोष के विपरीत, जिसमें मानक प्रश्न भाषा के रूप में एसक्यूएल था, और ओडीबीसी, जेडीबीसी और ओएलईडीबी जैसे व्यापक अप्लिकेशन प्रोग्रामिंग अंतरफलक थे, ओएलएपी दुनिया में लंबे समय तक ऐसा कोई एकीकरण नहीं था। माइक्रोसॉफ्ट से ओएलएपी विनिर्देशन के लिए पहला वास्तविक मानक एपीआई ओएलई डीबी था जो १९९७ में सामने आया और बहुआयामी अभिव्यक्ति प्रश्न भाषा पेश की। कई ओएलएपी वेंडर – सर्वर और क्लाइंट दोनों – ने इसे अपनाया। २००१ में माइक्रोसॉफ्ट और हाइपरियन सॉल्यूशंस कॉर्पोरेशन ने विश्लेषण विनिर्देश के लिए एक्सएमएल की घोषणा की, जिसे अधिकांश ओएलएपी विक्रेताओं द्वारा समर्थन दिया गया था। चूँकि इसने एमडीएक्स को प्रश्न भाषा के रूप में भी उपयोग किया, एमडीएक्स वास्तविक मानक बन गया।[26]

सितंबर-२०११ से माइक्रोसॉफ्ट .एनएफटी से माइक्रोसॉफ्ट विश्लेषण सेवाओं ओएलएपी क्यूब्स को प्रश्न करने के लिए एलआईएनक्यू का उपयोग किया जा सकता है।[27]

उत्पाद

इतिहास

ओएलएपी प्रश्नों का प्रदर्शन करने वाला पहला उत्पाद एक्सप्रेस था, जिसे १९७० में जारी किया गया था (और १९९५ में ओरेकल निगम द्वारा सूचना संसाधनों से अधिग्रहित किया गया था)।[28] यद्यपि, यह शब्द १९९३ तक प्रकट नहीं हुआ था जब इसे एडगर एफ. कॉड द्वारा गढ़ा गया था, जिसे संबंधपरक आंकड़ाकोष के पिता के रूप में वर्णित किया गया है। कॉड का पेपर[1] एक छोटे से परामर्श कार्य के परिणामस्वरूप हुआ, जिसे कॉड ने पूर्व आर्बर सॉफ्टवेयर (बाद में हाइपरियन सॉल्यूशंस, और २००७ में ओरेकल द्वारा अधिग्रहित) एक प्रकार के विपणन तख्तापलट के रूप में लिया था। कंपनी ने एक साल पहले अपना ओएलएपी उत्पाद एस्बेस जारी किया था। नतीजतन, कॉड के ऑनलाइन विश्लेषणात्मक प्रसंस्करण के बारह कानून एस्बेस के संदर्भ में स्पष्ट थे। इसके बाद कुछ विवाद हुआ और जब कंप्यूटरवर्ल्ड को पता चला कि कॉड को आर्बर द्वारा भुगतान किया गया था, तो उसने लेख को वापस ले लिया। ओएलएपी बाजार ने १९९० के दशक के अंत में दर्जनों वाणिज्यिक उत्पादों के बाजार में आने के साथ मजबूत वृद्धि का अनुभव किया। १९९८ में, माइक्रोसॉफ्ट ने अपना पहला ओएलएपी सर्वर जारी किया – माइक्रोसॉफ्ट विश्लेषण सेवाएँ, जिसने ओएलएपी प्रौद्योगिकी को व्यापक रूप से अपनाया और इसे मुख्यधारा में लाया।

उत्पाद तुलना

ओएलएपी ग्राहक

ओएलएपी क्लाइंट में एक्सेल, वेब एप्लिकेशन, एसक्यूएल, डैशबोर्ड उपकरण आदि जैसे कई स्प्रेडशीट प्रोग्राम सम्मिलित हैं। कई ग्राहक इंटरएक्टिव डेटा अन्वेषण का समर्थन करते हैं जहां उपयोगकर्ता रुचि के आयामों और उपायों का चयन करते हैं। कुछ आयामों का उपयोग फिल्टर के रूप में किया जाता है (डेटा को स्लाइस करने और डाइस करने के लिए) जबकि अन्य को धुरी टेबल या धुरी चार्ट के अक्ष के रूप में चुना जाता है। उपयोगकर्ता प्रदर्शित दृश्य में एकत्रीकरण स्तर (ड्रिलिंग-डाउन या रोलिंग-अप के लिए) भी भिन्न हो सकते हैं। ग्राहक विभिन्न प्रकार के ग्राफिकल विजेट्स जैसे स्लाइडर्स, भौगोलिक मानचित्र, हीट मैप्स और बहुत कुछ प्रदान कर सकते हैं जिन्हें डैशबोर्ड के रूप में समूहीकृत और समन्वित किया जा सकता है। ओएलएपी सर्वर टेबल की तुलना के विज़ुअलाइज़ेशन कॉलम में ग्राहकों की एक विस्तृत सूची दिखाई देती है।

बाजार संरचना

नीचे २००६ में शीर्ष ओएलएपी विक्रेताओं की सूची दी गई है, जिसमें आंकड़े लाखों अमेरिकी डॉलर में हैं।[29]

विक्रेता भूमंडलीय

कर

समेकित कंपनी
माइक्रोसॉफ्ट निगम १,८०६ माइक्रोसॉफ्ट
हाइपरियन समाधान निगम १,०७७ ओरेकल
कोगन ७३५ आईबीएम
व्यापार ऑब्जेक्ट ४१६ एसएपी
सूक्ष्म रणनीति ४१६ सूक्ष्म रणनीति
एसएपी एजी ३३० एसएपी
कार्तीय (एसएपी ) २१० एसएपी
प्प्लिक्ष २०५ आईबीएम
इन्फोर १९९ इन्फोर
ओरेकल निगम १५९ ओरेकल
अन्य १५२ अन्य
एकूण ५,७००


ओपन-सोर्स

  • अपाचे पिनोट का उपयोग लिंक्डइन, सिस्को, उबेर, स्लैक, स्ट्राइप, डोरडैश, टारगेट, वॉलमार्ट, अमेज़ॅन और माइक्रोसॉफ्ट में कम विलंबता के साथ स्केलेबल रियल टाइम एनालिटिक्स देने के लिए किया जाता है।[30] यह ऑफ़लाइन डेटा स्रोतों (जैसे हडूप और फ्लैट फ़ाइलें) के साथ-साथ ऑनलाइन स्रोतों (जैसे काफ्का) से डेटा ग्रहण कर सकता है। पिनोट को क्षैतिज रूप से स्केल करने के लिए डिज़ाइन किया गया है।
  • मोंड्रियन ओलाप सर्वर एक खुला स्रोत सॉफ्टवेयर है। ओपन-सोर्स ओएलएपी सर्वर जावा (प्रोग्रामिंग भाषा) में लिखा गया है। यह बहुआयामी अभिव्यक्ति प्रश्न भाषा, विश्लेषण के लिए एक्सएमएल और ओएलएपी4j इंटरफ़ेस विनिर्देशों का समर्थन करता है।
  • अपाचे ड्र्यूड ओएलएपी प्रश्नों के लिए एक लोकप्रिय ओपन-सोर्स वितरित डेटा स्टोर है जिसका उपयोग विभिन्न संगठनों द्वारा बड़े पैमाने पर उत्पादन में किया जाता है।
  • अपाचे किलिन मूल रूप से ईबे द्वारा विकसित ओएलएपी प्रश्नों के लिए एक वितरित डेटा स्टोर है।
  • क्यूब्स (ओएलएपी सर्वर) एक और हल्का ओपन-सोर्स सॉफ्टवेयर है। अंतर्निहित रोलैप के साथ पायथन (प्रोग्रामिंग भाषा) में ओएलएपी कार्यक्षमता का ओपन-सोर्स उपकरणकिट कार्यान्वयन।
  • क्लिकहाउस तेजी से प्रसंस्करण और प्रतिक्रिया समय पर ध्यान केंद्रित करने वाला एक बिल्कुल नया कॉलम उन्मुख डीबीएमएस है।
  • डकडब[31] एक इन-प्रोसेस एसक्यूएल ​​ओएलएपी है[32] आंकड़ाकोष प्रबंधन प्रणाली।

यह भी देखें

  • ओलाप सर्वरों की तुलना
  • कार्यात्मक आंकड़ाकोष मॉडल

ग्रन्थसूची

  • डैनियल लेमिरे (दिसम्बर २००७). "डेटा वेयरहाउसिंग और ओएलएपी-ए अनुसंधान-उन्मुख ग्रन्थसूची". {{cite web}}: Check date values in: |date= (help)
  • एरिक थॉमसेन। (१९९७). ओएलएपी समाधान: बहुआयामी सूचना प्रणाली का निर्माण, दूसरा संस्करण. जॉन विली एंड संस. ISBN ९७८-०४७१-१४९३१-६. {{cite book}}: Check |isbn= value: invalid character (help); Check date values in: |year= (help)


संदर्भ

उद्धरण

  1. 1.0 1.1 Codd E.F.; Codd S.B. & Salley C.T. (1993). "Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate" (PDF). Codd & Date, Inc. Retrieved 2008-03-05.[permanent dead link]
  2. Deepak Pareek (2007). Business Intelligence for Telecommunications. CRC Press. pp. 294 pp. ISBN 978-0-8493-8792-0. Retrieved 2008-03-18.
  3. Apostolos Benisis (2010). Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making. VDM Verlag Dr. Müller e.K. pp. 204 pp. ISBN 978-3-639-22216-6.
  4. Abdullah, Ahsan (November 2009). "Analysis of mealybug incidence on the cotton crop using ADSS-OLAP (Online Analytical Processing) tool". Computers and Electronics in Agriculture. 69 (1): 59–72. doi:10.1016/j.compag.2009.07.003.
  5. "OLAP Council White Paper" (PDF). OLAP Council. 1997. Retrieved 2008-03-18.
  6. 6.0 6.1 6.2 6.3 O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.
  7. Hari Mailvaganam (2007). "Introduction to OLAP – Slice, Dice and Drill!". Data Warehousing Review. Retrieved 2008-03-18.
  8. Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)
  9. MicroStrategy, Incorporated (1995). "The Case for Relational OLAP" (PDF). Retrieved 2008-03-20.
  10. Surajit Chaudhuri & Umeshwar Dayal (1997). "An overview of data warehousing and OLAP technology". SIGMOD Rec. 26 (1): 65. CiteSeerX 10.1.1.211.7178. doi:10.1145/248603.248616. S2CID 8125630.
  11. Gray, Jim; Chaudhuri, Surajit; Layman, Andrew; Reichart, Don; Venkatrao, Murali; Pellow, Frank; Pirahesh, Hamid (1997). "Data Cube: {A} Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals". J. Data Mining and Knowledge Discovery. 1 (1): 29–53. arXiv:cs/0701155. doi:10.1023/A:1009726021843. S2CID 12502175. Retrieved 2008-03-20.
  12. Zhang 2017, p. 1.
  13. Jesus, Baquero & Almeida 2011, 2.1 Decomposable functions, pp. 3–4.
  14. Nigel Pendse (2006-06-27). "OLAP architectures". OLAP Report. Archived from the original on January 24, 2008. Retrieved 2008-03-17.
  15. 15.0 15.1 15.2 Bach Pedersen, Torben; S. Jensen, Christian (December 2001). "बहुआयामी डेटाबेस प्रौद्योगिकी". Distributed Systems Online. 34 (12): 40–46. doi:10.1109/2.970558. ISSN 0018-9162.
  16. Kaser, Owen; Lemire, Daniel (2006). "Attribute value reordering for efficient hybrid OLAP". Information Sciences. 176 (16): 2304–2336. arXiv:cs/0702143. doi:10.1016/j.ins.2005.09.005.
  17. "This Week in Graph and Entity Analytics". Datanami (in English). 2016-12-07. Retrieved 2018-03-08.
  18. "Cambridge Semantics Announces AnzoGraph Support for Amazon Neptune and Graph Databases". Database Trends and Applications (in English). 2018-02-15. Retrieved 2018-03-08.
  19. Tao, Fangbo; Zhuang, Honglei; Yu, Chi Wang; Wang, Qi; Cassidy, Taylor; Kaplan, Lance; Voss, Clare; Han, Jiawei (2016). "Multi-Dimensional, Phrase-Based Summarization in Text Cubes" (PDF).
  20. Liem, David A.; Murali, Sanjana; Sigdel, Dibakar; Shi, Yu; Wang, Xuan; Shen, Jiaming; Choi, Howard; Caufield, John H.; Wang, Wei; Ping, Peipei; Han, Jiawei (2018-10-01). "Phrase mining of textual data to analyze extracellular matrix protein patterns across cardiovascular disease". American Journal of Physiology. Heart and Circulatory Physiology. 315 (4): H910–H924. doi:10.1152/ajpheart.00175.2018. ISSN 1522-1539. PMC 6230912. PMID 29775406.
  21. Lee, S.; Kim, N.; Kim, J. (2014). A Multi-dimensional Analysis and Data Cube for Unstructured Text and Social Media. pp. 761–764. doi:10.1109/BDCloud.2014.117. ISBN 978-1-4799-6719-3. S2CID 229585. {{cite book}}: |journal= ignored (help)
  22. Ding, B.; Lin, X.C.; Han, J.; Zhai, C.; Srivastava, A.; Oza, N.C. (December 2011). "Efficient Keyword-Based Search for Top-K Cells in Text Cube". IEEE Transactions on Knowledge and Data Engineering. 23 (12): 1795–1810. doi:10.1109/TKDE.2011.34. S2CID 13960227.
  23. Ding, B.; Zhao, B.; Lin, C.X.; Han, J.; Zhai, C. (2010). TopCells: Keyword-based search of top-k aggregated documents in text cube. pp. 381–384. CiteSeerX 10.1.1.215.7504. doi:10.1109/ICDE.2010.5447838. ISBN 978-1-4244-5445-7. S2CID 14649087. {{cite book}}: |journal= ignored (help)
  24. Lin, C.X.; Ding, B.; Han, K.; Zhu, F.; Zhao, B. (2008). "Text Cube: Computing IR Measures for Multidimensional Text Database Analysis". IEEE Data Mining: 905–910. doi:10.1109/icdm.2008.135. ISBN 978-0-7695-3502-9. S2CID 1522480.
  25. Liu, X.; Tang, K.; Hancock, J.; Han, J.; Song, M.; Xu, R.; Pokorny, B. (2013-03-21). "Social Computing, Behavioral-Cultural Modeling and Prediction. SBP 2013. Lecture Notes in Computer Science". In Greenberg, A.M.; Kennedy, W.G.; Bos, N.D. (eds.). A Text Cube Approach to Human, Social and Cultural Behavior in the Twitter Stream (7812 ed.). Berlin, Heidelberg: Springer. pp. 321–330. ISBN 978-3-642-37209-4.
  26. Nigel Pendse (2007-08-23). "Commentary: OLAP API wars". OLAP Report. Archived from the original on May 28, 2008. Retrieved 2008-03-18.
  27. "SSAS Entity Framework Provider for LINQ to SSAS OLAP".
  28. Nigel Pendse (2007-08-23). "The origins of today's OLAP products". OLAP Report. Archived from the original on December 21, 2007. Retrieved November 27, 2007.
  29. Nigel Pendse (2006). "OLAP Market". OLAP Report. Retrieved 2008-03-17.
  30. Yegulalp, Serdar (2015-06-11). "LinkedIn fills another SQL-on-Hadoop niche". InfoWorld. Retrieved 2016-11-19.
  31. "An in-process SQL OLAP database management system". DuckDB (in English). Retrieved 2022-12-10.
  32. Anand, Chillar (2022-11-17). "Common Crawl On Laptop - Extracting Subset Of Data". Avil Page (in English). Retrieved 2022-12-10.


स्रोत