स्टार स्कीमा: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Data warehousing schema}} | {{Short description|Data warehousing schema}} | ||
[[File:Star-schema.png|thumb|right|]] | [[File:Star-schema.png|thumb|right|]] | ||
[[File:Star Schema.png|thumb|right|]][[कम्प्यूटिंग]] में, स्टार स्कीमा [[डेटा मार्ट]] [[तार्किक स्कीमा]] की सबसे सरल शैली है और डेटा वेयरहाउस और | [[File:Star Schema.png|thumb|right|]][[कम्प्यूटिंग]] में, स्टार स्कीमा [[डेटा मार्ट]] [[तार्किक स्कीमा]] की सबसे सरल शैली है और डेटा वेयरहाउस और आयाम डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।<ref>Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.</ref> स्टार स्कीमा में या से अधिक [[तथ्य तालिका]] होते हैं जो किसी भी संख्या में [[आयाम (डेटा वेयरहाउस)]] को संदर्भित करते हैं। स्टार स्कीमा [[स्नोफ्लेक स्कीमा]] का महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।<ref>{{citation |url=http://www.dwhworld.com/dwh-schemas/ |title=DWH Schemas |year=2009 |archive-date=16 July 2010 |archive-url=https://web.archive.org/web/20100716233800/http://www.dwhworld.com/dwh-schemas/}}</ref> | ||
स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल के स्टार के आकार से मिलता-जुलता है<ref name = "Date-IntroToDBMS">", p. 708</ref> इसके केंद्र में तथ्य तालिका के साथ स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं। | ||
== मॉडल == | == मॉडल == | ||
Line 9: | Line 9: | ||
स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।<ref name="Kimball-DWHToolkit">Ralph Kimball and Margy Ross, ''The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)'', p. 393</ref> केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है। | स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।<ref name="Kimball-DWHToolkit">Ralph Kimball and Margy Ross, ''The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)'', p. 393</ref> केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है। | ||
=== | === तथ्यफैक्ट टेबल === | ||
तथ्यफैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं। | |||
तथ्यफैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।<ref name="Kimball-DWHToolkit"/>तथ्यफैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। तथ्यफैक्ट टेबल को तीन प्रकारों में से के रूप में परिभाषित किया गया है: | |||
* लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ) | * लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ) | ||
Line 50: | Line 50: | ||
[[File:Приклад схеми зірки.png|300px|thumb|right|उदाहरण क्वेरी द्वारा प्रयुक्त स्टार स्कीमा।]]बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है। | [[File:Приклад схеми зірки.png|300px|thumb|right|उदाहरण क्वेरी द्वारा प्रयुक्त स्टार स्कीमा।]]बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है। | ||
<code>Fact_Sales</code> | <code>Fact_Sales</code> तथ्यफैक्ट टेबल है और तीन डायमेंशन टेबल हैं <code>Dim_Date</code>, <code>Dim_Store</code> और <code>Dim_Product</code>. | ||
प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है <code>Id</code> कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। <code>Fact_Sales</code> तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (<code>Date_Id</code>, <code>Store_Id</code>, <code>Product_Id</code>). गैर-प्राथमिक कुंजी <code>Units_Sold</code> इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि <code>Year</code> की <code>Dim_Date</code> आयाम)। | प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है <code>Id</code> कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। <code>Fact_Sales</code> तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (<code>Date_Id</code>, <code>Store_Id</code>, <code>Product_Id</code>). गैर-प्राथमिक कुंजी <code>Units_Sold</code> इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि <code>Year</code> की <code>Dim_Date</code> आयाम)। | ||
Line 61: | Line 61: | ||
SUM(F.Units_Sold) | SUM(F.Units_Sold) | ||
तथ्यफैक्ट_सेल्स एफ से | |||
INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) | INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) | ||
INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) | INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) |
Revision as of 18:36, 21 February 2023
कम्प्यूटिंग में, स्टार स्कीमा डेटा मार्ट तार्किक स्कीमा की सबसे सरल शैली है और डेटा वेयरहाउस और आयाम डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।[1] स्टार स्कीमा में या से अधिक तथ्य तालिका होते हैं जो किसी भी संख्या में आयाम (डेटा वेयरहाउस) को संदर्भित करते हैं। स्टार स्कीमा स्नोफ्लेक स्कीमा का महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।[2]
स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल के स्टार के आकार से मिलता-जुलता है[3] इसके केंद्र में तथ्य तालिका के साथ स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।
मॉडल
स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।
स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।[4] केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।
तथ्यफैक्ट टेबल
तथ्यफैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं। तथ्यफैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।[4]तथ्यफैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। तथ्यफैक्ट टेबल को तीन प्रकारों में से के रूप में परिभाषित किया गया है:
- लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
- स्नैपशॉट तथ्य तालिकाएँ निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
- संकलित स्नैपशॉट तालिकाएँ निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)
प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर सरोगेट कुंजी सौंपी जाती है। यह कुंजी साधारण प्राथमिक कुंजी है।
आयाम टेबल
तथ्य तालिकाओं की तुलना में आयाम तालिकाओं में आमतौर पर अपेक्षाकृत कम संख्या में रिकॉर्ड होते हैं, लेकिन तथ्य डेटा का वर्णन करने के लिए प्रत्येक रिकॉर्ड में बहुत बड़ी संख्या में विशेषताएँ हो सकती हैं। आयाम कई प्रकार की विशेषताओं को परिभाषित कर सकते हैं, लेकिन आयाम तालिकाओं द्वारा परिभाषित कुछ सबसे सामान्य विशेषताओं में शामिल हैं:
- टाइम डायमेंशन टेबल टाइम ग्रैन्युलैरिटी के निम्नतम स्तर पर समय का वर्णन करते हैं जिसके लिए स्टार स्कीमा में इवेंट रिकॉर्ड किए जाते हैं
- भूगोल आयाम तालिकाएँ देश, राज्य या शहर जैसे स्थान डेटा का वर्णन करती हैं
- उत्पाद आयाम तालिकाएँ उत्पादों का वर्णन करती हैं
- कर्मचारी आयाम तालिकाएँ कर्मचारियों का वर्णन करती हैं, जैसे बिक्री करने वाले लोग
- रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं
आयाम तालिकाओं को आम तौर पर सरोगेट कुंजी दी जाती है, आमतौर पर एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।
लाभ
स्टार स्कीमा डेटाबेस सामान्यीकरण हैं, जिसका अर्थ है कि लेनदेन संबंधपरक डेटाबेस पर लागू सामान्यीकरण के सामान्य नियम स्टार-स्कीमा डिज़ाइन और कार्यान्वयन के दौरान आराम कर रहे हैं। स्टार-स्कीमा विसामान्यीकरण के लाभ हैं:
- सरल प्रश्न - स्टार-स्कीमा जॉइन-लॉजिक आमतौर पर अत्यधिक सामान्यीकृत लेनदेन स्कीमा से डेटा पुनर्प्राप्त करने के लिए आवश्यक जॉइन लॉजिक से सरल होता है।
- सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
- क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
- तेज़ एकत्रीकरण - स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
- फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का ROLAP मोड प्रदान करती हैं जो मालिकाना घन संरचना के निर्माण के बिना स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।
नुकसान
स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है।[citation needed] सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं।[citation needed] स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को स्टार स्कीमा में सरलीकृत किया जाता है।
और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है[citation needed]. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।
उदाहरण
बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है।
Fact_Sales
तथ्यफैक्ट टेबल है और तीन डायमेंशन टेबल हैं Dim_Date
, Dim_Store
और Dim_Product
.
प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है Id
कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। Fact_Sales
तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (Date_Id
, Store_Id
, Product_Id
). गैर-प्राथमिक कुंजी Units_Sold
इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि Year
की Dim_Date
आयाम)।
उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए: <वाक्यविन्यास प्रकाश लैंग = एसक्यूएल> चुनना पी. ब्रांड, एस देश एएस देश, SUM(F.Units_Sold)
तथ्यफैक्ट_सेल्स एफ से INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) इनर जॉइन Dim_Product P ON (F.Product_Id = P.Id)
जहां डी.ईयर = 1997 और पी.प्रोडक्ट_केटेगरी = 'टीवी'
द्वारा समूह बनाएं पी. ब्रांड, एस देश </वाक्यविन्यास हाइलाइट>
यह भी देखें
- डेटा वेयरहाउस
- ऑनलाइन विश्लेषणात्मक प्रक्रिया
- रिवर्स स्टार स्कीमा
- स्नोफ्लेक स्कीमा
- तथ्य नक्षत्र
- गतिविधि स्कीमा
संदर्भ
- ↑ Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.
- ↑ DWH Schemas, 2009, archived from the original on 16 July 2010
- ↑ ", p. 708
- ↑ 4.0 4.1 Ralph Kimball and Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition), p. 393