स्टार स्कीमा: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Data warehousing schema}} thumb|right| thumb|right|कम्प्यूटिंग में, स...")
 
No edit summary
Line 1: Line 1:
{{Short description|Data warehousing schema}}
{{Short description|Data warehousing schema}}
[[File:Star-schema.png|thumb|right|]]
[[File:Star-schema.png|thumb|right|]]
[[File:Star Schema.png|thumb|right|]][[कम्प्यूटिंग]] में, स्टार स्कीमा [[डेटा मार्ट]] [[तार्किक स्कीमा]] की सबसे सरल शैली है और डेटा वेयरहाउस और डायमेंशनल डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।<ref>Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.</ref> स्टार स्कीमा में एक या एक से अधिक [[तथ्य तालिका]] होते हैं जो किसी भी संख्या में [[आयाम (डेटा वेयरहाउस)]] को संदर्भित करते हैं। स्टार स्कीमा [[स्नोफ्लेक स्कीमा]] का एक महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।<ref>{{citation |url=http://www.dwhworld.com/dwh-schemas/ |title=DWH Schemas |year=2009 |archive-date=16 July 2010 |archive-url=https://web.archive.org/web/20100716233800/http://www.dwhworld.com/dwh-schemas/}}</ref>
[[File:Star Schema.png|thumb|right|]][[कम्प्यूटिंग]] में, स्टार स्कीमा [[डेटा मार्ट]] [[तार्किक स्कीमा]] की सबसे सरल शैली है और डेटा वेयरहाउस और डायमेंशनल डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।<ref>Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.</ref> स्टार स्कीमा में या से अधिक [[तथ्य तालिका]] होते हैं जो किसी भी संख्या में [[आयाम (डेटा वेयरहाउस)]] को संदर्भित करते हैं। स्टार स्कीमा [[स्नोफ्लेक स्कीमा]] का महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।<ref>{{citation |url=http://www.dwhworld.com/dwh-schemas/ |title=DWH Schemas |year=2009 |archive-date=16 July 2010 |archive-url=https://web.archive.org/web/20100716233800/http://www.dwhworld.com/dwh-schemas/}}</ref>
स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | भौतिक मॉडल से मिलता है<ref name = "Date-IntroToDBMS">", p. 708</ref> इसके केंद्र में एक तथ्य तालिका के साथ एक स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।
स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | भौतिक मॉडल से मिलता है<ref name = "Date-IntroToDBMS">", p. 708</ref> इसके केंद्र में तथ्य तालिका के साथ स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।


== मॉडल ==
== मॉडल ==
स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।
स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।


एक स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।<ref name="Kimball-DWHToolkit">Ralph Kimball and Margy Ross, ''The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)'', p. 393</ref> केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।
स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।<ref name="Kimball-DWHToolkit">Ralph Kimball and Margy Ross, ''The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)'', p. 393</ref> केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।


=== फैक्ट टेबल ===
=== फैक्ट टेबल ===
फैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं।
फैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं।
फैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।<ref name="Kimball-DWHToolkit"/>फैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। फैक्ट टेबल को तीन प्रकारों में से एक के रूप में परिभाषित किया गया है:
फैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।<ref name="Kimball-DWHToolkit"/>फैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। फैक्ट टेबल को तीन प्रकारों में से के रूप में परिभाषित किया गया है:


* लेन-देन तथ्य तालिकाएँ एक विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
* लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
* स्नैपशॉट तथ्य तालिकाएँ एक निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
* स्नैपशॉट तथ्य तालिकाएँ निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
* संकलित स्नैपशॉट तालिकाएँ एक निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)
* संकलित स्नैपशॉट तालिकाएँ निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)


प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर एक [[सरोगेट कुंजी]] सौंपी जाती है।
प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर [[सरोगेट कुंजी]] सौंपी जाती है।
यह कुंजी एक साधारण प्राथमिक कुंजी है।
यह कुंजी साधारण प्राथमिक कुंजी है।


=== आयाम टेबल ===
=== आयाम टेबल ===
Line 30: Line 30:
* रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं
* रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं


आयाम तालिकाओं को आम तौर पर एक सरोगेट कुंजी दी जाती है, आमतौर पर एक एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।
आयाम तालिकाओं को आम तौर पर सरोगेट कुंजी दी जाती है, आमतौर पर एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।


== लाभ ==
== लाभ ==
Line 38: Line 38:
* सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
* सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
* क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
* क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
* तेज़ एकत्रीकरण - एक स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
* तेज़ एकत्रीकरण - स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
* फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का एक [[ROLAP]] मोड प्रदान करती हैं जो एक मालिकाना घन संरचना के निर्माण के बिना एक स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।
* फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का [[ROLAP]] मोड प्रदान करती हैं जो मालिकाना घन संरचना के निर्माण के बिना स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।


== नुकसान ==
== नुकसान ==


स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है।{{citation needed|reason=What is meant by "flexible"?|date=July 2015}} सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के एक विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं।{{citation needed|reason=How is a dimensional model "purpose-built"|date=July 2015}} स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को एक स्टार स्कीमा में सरलीकृत किया जाता है।
स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है।{{citation needed|reason=What is meant by "flexible"?|date=July 2015}} सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं।{{citation needed|reason=How is a dimensional model "purpose-built"|date=July 2015}} स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को स्टार स्कीमा में सरलीकृत किया जाता है।


एक और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है{{citation needed|reason=Relational datamodels usually are normalized (though bad examples will exist in practise) and foreign key constraints enforce the data integrity|date=June 2020}}. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।
और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है{{citation needed|reason=Relational datamodels usually are normalized (though bad examples will exist in practise) and foreign key constraints enforce the data integrity|date=June 2020}}. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।


== उदाहरण ==
== उदाहरण ==
[[File:Приклад схеми зірки.png|300px|thumb|right|उदाहरण क्वेरी द्वारा प्रयुक्त स्टार स्कीमा।]]बिक्री के एक डेटाबेस पर विचार करें, शायद एक स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का एक स्टार स्कीमा संस्करण है।
[[File:Приклад схеми зірки.png|300px|thumb|right|उदाहरण क्वेरी द्वारा प्रयुक्त स्टार स्कीमा।]]बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है।


<code>Fact_Sales</code> फैक्ट टेबल है और तीन डायमेंशन टेबल हैं <code>Dim_Date</code>, <code>Dim_Store</code> और <code>Dim_Product</code>.
<code>Fact_Sales</code> फैक्ट टेबल है और तीन डायमेंशन टेबल हैं <code>Dim_Date</code>, <code>Dim_Store</code> और <code>Dim_Product</code>.


प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है <code>Id</code> कॉलम, किसी एक कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। <code>Fact_Sales</code> तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (<code>Date_Id</code>, <code>Store_Id</code>, <code>Product_Id</code>). गैर-प्राथमिक कुंजी <code>Units_Sold</code> इस उदाहरण में तथ्य तालिका का कॉलम एक माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि <code>Year</code> की <code>Dim_Date</code> आयाम)।
प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है <code>Id</code> कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। <code>Fact_Sales</code> तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (<code>Date_Id</code>, <code>Store_Id</code>, <code>Product_Id</code>). गैर-प्राथमिक कुंजी <code>Units_Sold</code> इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि <code>Year</code> की <code>Dim_Date</code> आयाम)।


उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए:
उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए:

Revision as of 18:27, 21 February 2023

Star-schema.png
Star Schema.png

कम्प्यूटिंग में, स्टार स्कीमा डेटा मार्ट तार्किक स्कीमा की सबसे सरल शैली है और डेटा वेयरहाउस और डायमेंशनल डेटा मार्ट विकसित करने के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला दृष्टिकोण है।[1] स्टार स्कीमा में या से अधिक तथ्य तालिका होते हैं जो किसी भी संख्या में आयाम (डेटा वेयरहाउस) को संदर्भित करते हैं। स्टार स्कीमा स्नोफ्लेक स्कीमा का महत्वपूर्ण विशेष मामला है, और सरल प्रश्नों को संभालने के लिए अधिक प्रभावी है।[2]

स्टार स्कीमा को इसका नाम भौतिक डेटा मॉडल | भौतिक मॉडल से मिलता है[3] इसके केंद्र में तथ्य तालिका के साथ स्टार बहुभुज के समानता और इसके आसपास के आयाम तालिकाएं स्टार के बिंदुओं का प्रतिनिधित्व करती हैं।

मॉडल

स्टार स्कीमा व्यवसाय प्रक्रिया डेटा को तथ्यों में अलग करती है, जिसमें किसी व्यवसाय के बारे में मापने योग्य, मात्रात्मक डेटा और आयाम होते हैं जो तथ्य डेटा से संबंधित वर्णनात्मक गुण होते हैं। तथ्य डेटा के उदाहरणों में बिक्री मूल्य, बिक्री मात्रा और समय, दूरी, गति और वजन माप शामिल हैं। संबंधित आयाम विशेषता उदाहरणों में उत्पाद मॉडल, उत्पाद रंग, उत्पाद आकार, भौगोलिक स्थान और विक्रेता के नाम शामिल हैं।

स्टार स्कीमा जिसमें कई आयाम होते हैं, उसे कभी-कभी कनखजूरा स्कीमा कहा जाता है।[4] केवल कुछ विशेषताओं के आयाम होने के कारण, जबकि बनाए रखना आसान है, कई तालिका में शामिल होने के साथ क्वेरी में परिणाम होता है और स्टार स्कीमा का उपयोग करना कम आसान बनाता है।

फैक्ट टेबल

फैक्ट टेबल किसी विशिष्ट घटना के लिए माप या मीट्रिक रिकॉर्ड करते हैं। फैक्ट टेबल में आम तौर पर संख्यात्मक मान होते हैं, और आयामी डेटा के लिए विदेशी कुंजियाँ होती हैं जहाँ वर्णनात्मक जानकारी रखी जाती है।[4]फैक्ट टेबल को निम्न स्तर के समान विवरण के लिए डिज़ाइन किया गया है (जिसे ग्रैन्युलैरिटी या ग्रेन कहा जाता है), जिसका अर्थ है कि तथ्य बहुत ही परमाणु स्तर पर घटनाओं को रिकॉर्ड कर सकते हैं। इसके परिणामस्वरूप समय के साथ तथ्य तालिका में बड़ी संख्या में रिकॉर्ड जमा हो सकते हैं। फैक्ट टेबल को तीन प्रकारों में से के रूप में परिभाषित किया गया है:

  • लेन-देन तथ्य तालिकाएँ विशिष्ट घटना के बारे में तथ्य रिकॉर्ड करती हैं (जैसे, बिक्री घटनाएँ)
  • स्नैपशॉट तथ्य तालिकाएँ निश्चित समय पर तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, महीने के अंत में खाता विवरण)
  • संकलित स्नैपशॉट तालिकाएँ निश्चित समय पर कुल तथ्यों को रिकॉर्ड करती हैं (उदाहरण के लिए, किसी उत्पाद के लिए कुल माह-दर-तारीख बिक्री)

प्रत्येक पंक्ति को विशिष्ट रूप से पहचाना जा सकता है यह सुनिश्चित करने के लिए तथ्य तालिकाओं को आम तौर पर सरोगेट कुंजी सौंपी जाती है। यह कुंजी साधारण प्राथमिक कुंजी है।

आयाम टेबल

तथ्य तालिकाओं की तुलना में आयाम तालिकाओं में आमतौर पर अपेक्षाकृत कम संख्या में रिकॉर्ड होते हैं, लेकिन तथ्य डेटा का वर्णन करने के लिए प्रत्येक रिकॉर्ड में बहुत बड़ी संख्या में विशेषताएँ हो सकती हैं। आयाम कई प्रकार की विशेषताओं को परिभाषित कर सकते हैं, लेकिन आयाम तालिकाओं द्वारा परिभाषित कुछ सबसे सामान्य विशेषताओं में शामिल हैं:

  • टाइम डायमेंशन टेबल टाइम ग्रैन्युलैरिटी के निम्नतम स्तर पर समय का वर्णन करते हैं जिसके लिए स्टार स्कीमा में इवेंट रिकॉर्ड किए जाते हैं
  • भूगोल आयाम तालिकाएँ देश, राज्य या शहर जैसे स्थान डेटा का वर्णन करती हैं
  • उत्पाद आयाम तालिकाएँ उत्पादों का वर्णन करती हैं
  • कर्मचारी आयाम तालिकाएँ कर्मचारियों का वर्णन करती हैं, जैसे बिक्री करने वाले लोग
  • रेंज डायमेंशन टेबल रिपोर्टिंग को आसान बनाने के लिए समय की रेंज, डॉलर वैल्यू या अन्य मापने योग्य मात्रा का वर्णन करते हैं

आयाम तालिकाओं को आम तौर पर सरोगेट कुंजी दी जाती है, आमतौर पर एकल-स्तंभ पूर्णांक डेटा प्रकार, प्राकृतिक कुंजी बनाने वाले आयाम विशेषताओं के संयोजन के लिए मैप किया जाता है।

लाभ

स्टार स्कीमा डेटाबेस सामान्यीकरण हैं, जिसका अर्थ है कि लेनदेन संबंधपरक डेटाबेस पर लागू सामान्यीकरण के सामान्य नियम स्टार-स्कीमा डिज़ाइन और कार्यान्वयन के दौरान आराम कर रहे हैं। स्टार-स्कीमा विसामान्यीकरण के लाभ हैं:

  • सरल प्रश्न - स्टार-स्कीमा जॉइन-लॉजिक आमतौर पर अत्यधिक सामान्यीकृत लेनदेन स्कीमा से डेटा पुनर्प्राप्त करने के लिए आवश्यक जॉइन लॉजिक से सरल होता है।
  • सरलीकृत व्यापार रिपोर्टिंग तर्क - अत्यधिक सामान्यीकृत स्कीमाओं की तुलना में, स्टार स्कीमा सामान्य व्यापार रिपोर्टिंग तर्क को सरल बनाता है, जैसे अवधि-दर-अवधि और रिपोर्टिंग के रूप में।
  • क्वेरी प्रदर्शन लाभ - अत्यधिक डेटाबेस सामान्यीकरण स्कीमा की तुलना में स्टार स्कीमा रीड-ओनली रिपोर्टिंग अनुप्रयोगों के लिए प्रदर्शन संवर्द्धन प्रदान कर सकते हैं।
  • तेज़ एकत्रीकरण - स्टार स्कीमा के विरुद्ध सरल प्रश्नों के परिणामस्वरूप एकत्रीकरण संचालन के लिए बेहतर प्रदर्शन हो सकता है।
  • फीडिंग क्यूब्स - मालिकाना OLAP क्यूब्स को कुशलतापूर्वक बनाने के लिए सभी ऑनलाइन विश्लेषणात्मक प्रसंस्करण प्रणालियों द्वारा स्टार स्कीमा का उपयोग किया जाता है; वास्तव में, अधिकांश प्रमुख OLAP प्रणालियाँ ऑपरेशन का ROLAP मोड प्रदान करती हैं जो मालिकाना घन संरचना के निर्माण के बिना स्टार स्कीमा को सीधे स्रोत के रूप में उपयोग कर सकती हैं।

नुकसान

स्टार स्कीमा का मुख्य नुकसान यह है कि यह विश्लेषणात्मक आवश्यकताओं के मामले में सामान्यीकृत डेटा मॉडल के रूप में लचीला नहीं है।[citation needed] सामान्यीकृत मॉडल किसी भी प्रकार की विश्लेषणात्मक क्वेरी को तब तक निष्पादित करने की अनुमति देते हैं, जब तक यह मॉडल में परिभाषित व्यावसायिक तर्क का पालन करती है। स्टार स्कीमा डेटा के विशेष दृश्य के लिए अधिक उद्देश्य से निर्मित होते हैं, इस प्रकार वास्तव में अधिक जटिल विश्लेषण की अनुमति नहीं देते हैं।[citation needed] स्टार स्कीमा व्यावसायिक संस्थाओं के बीच मैनी-टू-मैनी संबंधों का आसानी से समर्थन नहीं करते हैं। आम तौर पर सरल आयामी मॉडल के अनुरूप होने के लिए इन संबंधों को स्टार स्कीमा में सरलीकृत किया जाता है।

और नुकसान यह है कि इसकी असामान्य स्थिति के कारण डेटा अखंडता अच्छी तरह से लागू नहीं होती है[citation needed]. एकबारगी आवेषण और अद्यतन के परिणामस्वरूप डेटा विसंगतियाँ हो सकती हैं, जिनसे बचने के लिए डेटाबेस सामान्यीकरण स्कीमा डिज़ाइन किए गए हैं। सामान्यतया, डेटाबेस सामान्यीकरण द्वारा वहन की जाने वाली सुरक्षा की कमी की भरपाई करने के लिए, स्टार स्कीमा को बैच प्रोसेसिंग के माध्यम से या रीयल-टाइम ट्रिकल फीड के पास अत्यधिक नियंत्रित तरीके से लोड किया जाता है।

उदाहरण

उदाहरण क्वेरी द्वारा प्रयुक्त स्टार स्कीमा।

बिक्री के डेटाबेस पर विचार करें, शायद स्टोर श्रृंखला से, जिसे दिनांक, स्टोर और उत्पाद द्वारा वर्गीकृत किया गया है। दाईं ओर स्कीमा की छवि स्नोफ्लेक स्कीमा लेख में प्रदान किए गए नमूना स्कीमा का स्टार स्कीमा संस्करण है।

Fact_Sales फैक्ट टेबल है और तीन डायमेंशन टेबल हैं Dim_Date, Dim_Store और Dim_Product.

प्रत्येक आयाम तालिका में इसकी प्राथमिक कुंजी होती है Id कॉलम, किसी कॉलम से संबंधित (उदाहरण स्कीमा में पंक्तियों के रूप में देखा गया)। Fact_Sales तालिका की तीन-स्तंभ (यौगिक) प्राथमिक कुंजी (Date_Id, Store_Id, Product_Id). गैर-प्राथमिक कुंजी Units_Sold इस उदाहरण में तथ्य तालिका का कॉलम माप या मीट्रिक का प्रतिनिधित्व करता है जिसका उपयोग गणना और विश्लेषण में किया जा सकता है। आयाम तालिका के गैर-प्राथमिक कुंजी स्तंभ आयामों की अतिरिक्त विशेषताओं का प्रतिनिधित्व करते हैं (जैसे कि Year की Dim_Date आयाम)।

उदाहरण के लिए, निम्न क्वेरी उत्तर देती है कि 1997 में प्रत्येक ब्रांड और देश के लिए कितने टीवी सेट बेचे गए: <वाक्यविन्यास प्रकाश लैंग = एसक्यूएल> चुनना पी. ब्रांड, एस देश एएस देश, SUM(F.Units_Sold)

फैक्ट_सेल्स एफ से INNER JOIN Dim_Date D ON (F.Date_Id = D.Id) INNER JOIN Dim_Store S ON (F.Store_Id = S.Id) इनर जॉइन Dim_Product P ON (F.Product_Id = P.Id)

जहां डी.ईयर = 1997 और पी.प्रोडक्ट_केटेगरी = 'टीवी'

द्वारा समूह बनाएं पी. ब्रांड, एस देश </वाक्यविन्यास हाइलाइट>

यह भी देखें

संदर्भ

  1. Dedić, N. and Stanier C., 2016., "An Evaluation of the Challenges of Multilingualism in Data Warehouse Development" in 18th International Conference on Enterprise Information Systems - ICEIS 2016, p. 196.
  2. DWH Schemas, 2009, archived from the original on 16 July 2010
  3. ", p. 708
  4. 4.0 4.1 Ralph Kimball and Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition), p. 393


बाहरी संबंध