स्टार स्कीमा
कम्प्यूटिंग में, स्टार स्कीमा डेटा मार्ट तार्किक स्कीमा की सबसे सरल शैली है और डेटा वेयरहाउस और डायमेंशनल डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।[1] स्टार स्कीमा में या से अधिक तथ्य तालिका होते हैं जो किसी भी संख्या में आयाम (डेटा वेयरहाउस) को संदर्भित करते हैं। स्टार स्कीमा स्नोफ्लेक स्कीमा का महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।[2]
स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | भौतिक मॉडल से मिलता है[3] इसके केंद्र में तथ्य तालिका के साथ स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।
मॉडल
स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।
स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।[4] केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।
फैक्ट टेबल
फैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं। फैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।[4]फैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। फैक्ट टेबल को तीन प्रकारों में से के रूप में परिभाषित किया गया है:
- लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
- स्नैपशॉट तथ्य तालिकाएँ निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
- संकलित स्नैपशॉट तालिकाएँ निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)
प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर सरोगेट कुंजी सौंपी जाती है। यह कुंजी साधारण प्राथमिक कुंजी है।
आयाम टेबल
तथ्य तालिकाओं की तुलना में आयाम तालिकाओं में आमतौर पर अपेक्षाकृत कम संख्या में रिकॉर्ड होते हैं, लेकिन तथ्य डेटा का वर्णन करने के लिए प्रत्येक रिकॉर्ड में बहुत बड़ी संख्या में विशेषताएँ हो सकती हैं। आयाम कई प्रकार की विशेषताओं को परिभाषित कर सकते हैं, लेकिन आयाम तालिकाओं द्वारा परिभाषित कुछ सबसे सामान्य विशेषताओं में शामिल हैं:
- टाइम डायमेंशन टेबल टाइम ग्रैन्युलैरिटी के निम्नतम स्तर पर समय का वर्णन करते हैं जिसके लिए स्टार स्कीमा में इवेंट रिकॉर्ड किए जाते हैं
- भूगोल आयाम तालिकाएँ देश, राज्य या शहर जैसे स्थान डेटा का वर्णन करती हैं
- उत्पाद आयाम तालिकाएँ उत्पादों का वर्णन करती हैं
- कर्मचारी आयाम तालिकाएँ कर्मचारियों का वर्णन करती हैं, जैसे बिक्री करने वाले लोग
- रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं
आयाम तालिकाओं को आम तौर पर सरोगेट कुंजी दी जाती है, आमतौर पर एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।
लाभ
स्टार स्कीमा डेटाबेस सामान्यीकरण हैं, जिसका अर्थ है कि लेनदेन संबंधपरक डेटाबेस पर लागू सामान्यीकरण के सामान्य नियम स्टार-स्कीमा डिज़ाइन और कार्यान्वयन के दौरान आराम कर रहे हैं। स्टार-स्कीमा विसामान्यीकरण के लाभ हैं:
- सरल प्रश्न - स्टार-स्कीमा जॉइन-लॉजिक आमतौर पर अत्यधिक सामान्यीकृत लेनदेन स्कीमा से डेटा पुनर्प्राप्त करने के लिए आवश्यक जॉइन लॉजिक से सरल होता है।
- सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
- क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
- तेज़ एकत्रीकरण - स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
- फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का ROLAP मोड प्रदान करती हैं जो मालिकाना घन संरचना के निर्माण के बिना स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।
नुकसान
स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है।[citation needed] सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं।[citation needed] स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को स्टार स्कीमा में सरलीकृत किया जाता है।
और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है[citation needed]. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।
उदाहरण
बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है।
Fact_Sales
फैक्ट टेबल है और तीन डायमेंशन टेबल हैं Dim_Date
, Dim_Store
और Dim_Product
.
प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है Id
कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। Fact_Sales
तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (Date_Id
, Store_Id
, Product_Id
). गैर-प्राथमिक कुंजी Units_Sold
इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि Year
की Dim_Date
आयाम)।
उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए: <वाक्यविन्यास प्रकाश लैंग = एसक्यूएल> चुनना पी. ब्रांड, एस देश एएस देश, SUM(F.Units_Sold)
फैक्ट_सेल्स एफ से INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) इनर जॉइन Dim_Product P ON (F.Product_Id = P.Id)
जहां डी.ईयर = 1997 और पी.प्रोडक्ट_केटेगरी = 'टीवी'
द्वारा समूह बनाएं पी. ब्रांड, एस देश </वाक्यविन्यास हाइलाइट>
यह भी देखें
- डेटा वेयरहाउस
- ऑनलाइन विश्लेषणात्मक प्रक्रिया
- रिवर्स स्टार स्कीमा
- स्नोफ्लेक स्कीमा
- तथ्य नक्षत्र
- गतिविधि स्कीमा
संदर्भ
- ↑ Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.
- ↑ DWH Schemas, 2009, archived from the original on 16 July 2010
- ↑ ", p. 708
- ↑ 4.0 4.1 Ralph Kimball and Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition), p. 393