डेटा सम्मिश्रण: Difference between revisions
No edit summary |
No edit summary |
||
(5 intermediate revisions by 4 users not shown) | |||
Line 1: | Line 1: | ||
'''डेटा सम्मिश्रण''' ऐसी प्रक्रिया होती है जिसके अनुसार अनेक स्रोतों से [[बड़ा डेटा]] | '''डेटा सम्मिश्रण''' ऐसी प्रक्रिया होती है जिसके अनुसार अनेक स्रोतों से [[बड़ा डेटा]]<ref>[https://blog.ventanaresearch.com/2014/05/30/alteryx-analytics-brings-power-of-predictive-and-big-data-to-market Alteryx Analytics Brings Power of Predictive and Big Data to Market]</ref> एकल [[डेटा वेयरहाउस]] या [[डेटा सेट|डेटा समूह]] में विलय कर दिया जाता है।<ref>[http://www.datawatch.com/what-is-data-blending/ Data blending is the process of combining data from multiple sources into a functioning data set]</ref> यह न केवल विभिन्न फ़ाइल स्वरूपों या डेटा के भिन्न-भिन्न स्रोतों के विलय से संबंधित होता है, किंतु डेटा की विभिन्न किस्मों से भी संबंधित होता है।<ref>[http://pages.alteryx.com/rs/alteryx/images/ALT_WPDefGuideDataBlending-WithGraphics38.pdf The Definitive Guide to Data Blending]</ref> इस प्रकार डेटा सम्मिश्रण व्यवसाय विश्लेषकों को डेटा के विस्तार से निपटने की अनुमति देता है जिसकी उन्हें अच्छी गुणवत्ता वाली व्यावसायिक बुद्धिमत्ता के आधार पर महत्वपूर्ण व्यावसायिक निर्णय लेने के लिए आवश्यकता होती है।<ref name=":0">{{Cite web|url=https://www.trifacta.com/data-blending/|title=डेटा सम्मिश्रण|date=August 24, 2017|website=Trifacta.com}}</ref> | ||
[[डेटा विज्ञान]] द्वारा किसी भी व्यावहारिक हस्तक्षेप के लिए स्रोतों को | [[डेटा विज्ञान]] द्वारा किसी भी व्यावहारिक हस्तक्षेप के लिए स्रोतों को अधिक तेज़ी से मर्ज करने के लिए [[डेटा विश्लेषण]] की आवश्यकताओं के कारण डेटा मिश्रण को [[डेटा एकीकरण]] से भिन्न बताया गया है।<ref name=":1">[http://www.softwareadvice.com/resources/what-is-data-blending-tool/ What Is Data Blending, and Which Tools Make It Easier?]</ref> | ||
डेटा स्रोतों को संयोजित करने के लिए विश्लेषकों की बढ़ती मांग का प्रतिनिधित्व करते हुए | डेटा स्रोतों को संयोजित करने के लिए विश्लेषकों की बढ़ती मांग का प्रतिनिधित्व करते हुए अनेक सॉफ्टवेयर कंपनियों ने बड़ी वृद्धि देखी है और लाखों डॉलर जुटाए हैं,<ref>{{Cite web|title=Incorta raises $30M Series C for ETL-free data processing solution|url=https://social.techcrunch.com/2019/08/15/incorta-raises-30m-series-c-for-etl-free-data-processing-solution/|access-date=2021-02-27|website=TechCrunch|language=en-US}}</ref> अतः बाज़ार में कुछ प्रारंभिक प्रवेशकों के साथ वर्तमान सार्वजनिक कंपनियाँ होती है।<ref>{{Cite web|title=एल्टरेक्स ने आरंभिक सार्वजनिक पेशकश के मूल्य निर्धारण की घोषणा की|url=https://www.alteryx.com/press-releases/2017-03-23-alteryx-announces-pricing-initial-public-offering|access-date=2021-02-27|website=Alteryx|language=en}}</ref> उदाहरणों में [[अमेज़न वेब सेवाएँ]], एल्टरेक्स, [[माइक्रोसॉफ्ट]] [[पावर क्वेरी]] सम्मिलित होते हैं।<ref>{{Cite web|last=Corporation|first=Microsoft|title=माइक्रोसॉफ्ट पावर क्वेरी|url=https://powerquery.microsoft.com/en-us/|access-date=2021-02-27|website=powerquery.microsoft.com|language=en}}</ref> जो अनेक भिन्न-भिन्न डेटा स्रोतों से डेटा को संयोजित करने में सक्षम बनाता है, उदाहरण के लिए, टेक्स्ट फ़ाइलें, डेटाबेस, एक्सएमएल, जेएसओएन, संरचित और अर्ध-संरचित डेटा के अनेक अन्य रूप होते है।<ref>{{Cite web|title=डेटा स्रोत|url=https://docs.incorta.com/4.4/data-sources/|access-date=2021-02-27|website=docs.incorta.com|language=en}}</ref><ref>{{Cite web|last=davidiseminger|title=पावर क्वेरी का उपयोग करके एकाधिक स्रोतों से डेटा को आकार दें और संयोजित करें|url=https://docs.microsoft.com/en-us/power-query/power-query-tutorial-shape-combine|access-date=2021-02-27|website=docs.microsoft.com|language=en-us}}</ref><ref>{{Cite web|title=समर्थित डेटा स्रोत - अमेज़न क्विकसाइट|url=https://docs.aws.amazon.com/quicksight/latest/user/supported-data-sources.html|access-date=2021-02-27|website=docs.aws.amazon.com}}</ref><ref>{{Cite web|title=Data Sources {{!}} Alteryx Help|url=https://help.alteryx.com/current/designer/data-sources|access-date=2021-02-27|website=help.alteryx.com}}</ref> | ||
डेटा ब्लेंडिंग अनेक मायनों में एक्सट्रेक्ट, ट्रांसफॉर्म, लोड के समान है। ईटीएल और डेटा ब्लेंडिंग दोनों विभिन्न स्रोतों से डेटा लेते हैं और उन्हें संयोजित करते हैं। चूँकि, | सामान्यतः डेटा ब्लेंडिंग अनेक मायनों में एक्सट्रेक्ट, ट्रांसफॉर्म, लोड के समान होता है। इस प्रकार ईटीएल और डेटा ब्लेंडिंग दोनों विभिन्न स्रोतों से डेटा लेते हैं और उन्हें संयोजित करते हैं। चूँकि, ईटीएल का उपयोग डेटा को लक्ष्य डेटाबेस में मर्ज और संरचना करने के लिए किया जाता है,<ref>{{Cite web|title=ईटीएल कैसे काम करता है|url=https://databricks.com/de/glossary/extract-transform-load|access-date=2021-02-27|website=Databricks|language=de-DE}}</ref> अतः अधिकांशतः डेटा वेयरहाउस. डेटा सम्मिश्रण थोड़ा भिन्न होता है जिससे कि यह विशिष्ट समय पर किसी विशिष्ट उपयोग की स्थिति के लिए डेटा को जोड़ने के बारे में होता है।<ref>{{Cite web|date=2016-08-25|title=What Is Data Blending, and Which Tools Make It Easier?|url=https://www.softwareadvice.com/resources/what-is-data-blending-tool/|access-date=2021-02-27|website=Software Advice|language=en-US}}</ref> कुछ सॉफ़्टवेयर के साथ, डेटा को डेटाबेस में नहीं लिखा जाता है, जो ईटीएल से अधिक भिन्न होता है। उदाहरण के लिए, [[Google|गूगल]] डेटा स्टूडियो के साथ<ref>{{Cite web|title=Google डेटा स्टूडियो अवलोकन|url=https://datastudio.google.com/overview|access-date=2021-02-27|website=datastudio.google.com}}</ref> और [[झांकी सॉफ्टवेयर]], डेटा मिश्रण सूची परत पर होता है। इस प्रकार यह कहीं लिखा नहीं है, केवल प्रदर्शित किया गया है। | ||
== झांकी में डेटा सम्मिश्रण == | == झांकी में डेटा सम्मिश्रण == | ||
टेबल्यू सॉफ़्टवेयर में, डेटा सम्मिश्रण [[डेटा विज़ुअलाइज़ेशन]] में एकाधिक डेटा स्रोतों से डेटा को संयोजित करने की विधि | टेबल्यू सॉफ़्टवेयर में, डेटा सम्मिश्रण [[डेटा विज़ुअलाइज़ेशन]] में एकाधिक डेटा स्रोतों से डेटा को संयोजित करने की विधि होती है।<ref>{{Cite web|title=अपना डेटा मिश्रित करें|url=https://help.tableau.com/current/pro/desktop/en-us/multiple_connections.htm|access-date=2021-02-27|website=help.tableau.com|language=en-us}}</ref> इस प्रकार डेटा स्रोतों को भिन्न प्रकार से संग्रहीत किया जाता है और केवल सूची परत पर [[डैशबोर्ड (व्यवसाय)]] में साथ प्रदर्शित किया जाता है। अतः यह टेबल्यू डेटा मिश्रण को डेटा सम्मिश्रण की अन्य परिभाषाओं से भिन्न करने वाली प्रमुख अवधारणाओं में होता है। | ||
अन्य प्रमुख विभेदक डेटा जॉइन की ग्रैन्युलैरिटी है। सामान्यतः, डेटा को एकल डेटा समूह में मिश्रित करते समय, यह [[ शामिल हों (एसक्यूएल) |सम्मिलित | अन्य प्रमुख विभेदक डेटा जॉइन की ग्रैन्युलैरिटी है। सामान्यतः, डेटा को एकल डेटा समूह में मिश्रित करते समय, यह [[ शामिल हों (एसक्यूएल) |सम्मिलित (एसक्यूएल)]] होने का उपयोग करता है, जो सामान्यतः जहां संभव होता है, वहां आईडी क्षेत्र का उपयोग करके सबसे अधिक दानेदार स्तर पर जुड़ जाता है।<ref>{{Cite web|title=एसक्यूएल जॉइन्स की व्याख्या|url=http://www.sql-join.com/|access-date=2021-02-27|website=एसक्यूएल जॉइन्स की व्याख्या|language=en-US}}</ref> इस प्रकार टेबल्यू में डेटा मिश्रण कम से कम सूक्ष्म स्तर पर होता है।<ref>{{Cite web|last=TAR Solutions|date=2021-01-20|title=झांकी में डेटा सम्मिश्रण|url=https://tarsolutions.co.uk/blog/data-blending-in-tableau/|url-status=live|access-date=2021-02-27|website=TAR Solutions|language=en-US}}</ref> | ||
== | == गूगल डेटा स्टूडियो में डेटा सम्मिश्रण == | ||
गूगल डेटा स्टूडियो में, डेटा स्रोतों को डेटा स्रोत के रिकॉर्ड को 4 अन्य डेटा स्रोतों के रिकॉर्ड के साथ जोड़कर संयोजित किया जाता है। | |||
टेबलू के समान, डेटा मिश्रण केवल सूची परत पर होता है। मिश्रित डेटा को कभी भी भिन्न संयुक्त डेटा स्रोत के रूप में संग्रहीत नहीं किया जाता है।<ref>{{Cite web|title=डेटा सम्मिश्रण के बारे में - डेटा स्टूडियो सहायता|url=https://support.google.com/datastudio/answer/9061420|access-date=2021-02-27|website=support.google.com}}</ref> | |||
टेबलू के समान, डेटा मिश्रण केवल सूची परत पर होता है। इस प्रकार मिश्रित डेटा को कभी भी भिन्न संयुक्त डेटा स्रोत के रूप में संग्रहीत नहीं किया जाता है।<ref>{{Cite web|title=डेटा सम्मिश्रण के बारे में - डेटा स्टूडियो सहायता|url=https://support.google.com/datastudio/answer/9061420|access-date=2021-02-27|website=support.google.com}}</ref> | |||
== डेटा सम्मिश्रण की चुनौतियाँ == | == डेटा सम्मिश्रण की चुनौतियाँ == | ||
सबसे | सबसे सामान्य कस्टम मेटाडेटा प्रश्न यह होता है कि यह डेटासमूह मेरे अन्य डेटासमूह के साथ कैसे मिश्रित हो सकता है (जुड़ सकता है या जुड़ सकता है)?<ref>{{Cite book|title=डेटा गड़बड़ी के सिद्धांत|last1=Heer|first1=Jeffrey|last2=Hellerstein|first2=Joseph|last3=Kandel|first3=Sean|last4=Rattenbury|first4=Tye|publisher=O'Reilly Media|date=July 2017|url=http://shop.oreilly.com/product/0636920045113.do}}</ref> सन्न 2015 फॉरेस्टर कंसल्टिंग अध्ययन में पाया गया कि 52 प्रतिशत कंपनियां 50 या अधिक डेटा स्रोतों का मिश्रण कर रही हैं और 12 प्रतिशत 1,000 से अधिक स्रोतों का मिश्रण कर रही हैं।<ref>{{Cite web|url=http://www.pentaho.com/data-mashups-for-analytics|title=एनालिटिक्स के लिए डेटा मैशअप|website=Pentaho}}</ref> | ||
== यह भी देखें == | == यह भी देखें == | ||
* [[डेटा तैयारी]] | * [[डेटा तैयारी]] | ||
Line 28: | Line 29: | ||
==संदर्भ== | ==संदर्भ== | ||
<references/> | <references/> | ||
[[Category: | [[Category:CS1 Deutsch-language sources (de)]] | ||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:CS1 maint]] | |||
[[Category:Created On 06/07/2023]] | [[Category:Created On 06/07/2023]] | ||
[[Category:Machine Translated Page]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:डेटा प्रबंधन]] | |||
[[Category:डेटा भण्डारण| डेटा भण्डारण]] |
Latest revision as of 21:51, 15 July 2023
डेटा सम्मिश्रण ऐसी प्रक्रिया होती है जिसके अनुसार अनेक स्रोतों से बड़ा डेटा[1] एकल डेटा वेयरहाउस या डेटा समूह में विलय कर दिया जाता है।[2] यह न केवल विभिन्न फ़ाइल स्वरूपों या डेटा के भिन्न-भिन्न स्रोतों के विलय से संबंधित होता है, किंतु डेटा की विभिन्न किस्मों से भी संबंधित होता है।[3] इस प्रकार डेटा सम्मिश्रण व्यवसाय विश्लेषकों को डेटा के विस्तार से निपटने की अनुमति देता है जिसकी उन्हें अच्छी गुणवत्ता वाली व्यावसायिक बुद्धिमत्ता के आधार पर महत्वपूर्ण व्यावसायिक निर्णय लेने के लिए आवश्यकता होती है।[4]
डेटा विज्ञान द्वारा किसी भी व्यावहारिक हस्तक्षेप के लिए स्रोतों को अधिक तेज़ी से मर्ज करने के लिए डेटा विश्लेषण की आवश्यकताओं के कारण डेटा मिश्रण को डेटा एकीकरण से भिन्न बताया गया है।[5]
डेटा स्रोतों को संयोजित करने के लिए विश्लेषकों की बढ़ती मांग का प्रतिनिधित्व करते हुए अनेक सॉफ्टवेयर कंपनियों ने बड़ी वृद्धि देखी है और लाखों डॉलर जुटाए हैं,[6] अतः बाज़ार में कुछ प्रारंभिक प्रवेशकों के साथ वर्तमान सार्वजनिक कंपनियाँ होती है।[7] उदाहरणों में अमेज़न वेब सेवाएँ, एल्टरेक्स, माइक्रोसॉफ्ट पावर क्वेरी सम्मिलित होते हैं।[8] जो अनेक भिन्न-भिन्न डेटा स्रोतों से डेटा को संयोजित करने में सक्षम बनाता है, उदाहरण के लिए, टेक्स्ट फ़ाइलें, डेटाबेस, एक्सएमएल, जेएसओएन, संरचित और अर्ध-संरचित डेटा के अनेक अन्य रूप होते है।[9][10][11][12]
सामान्यतः डेटा ब्लेंडिंग अनेक मायनों में एक्सट्रेक्ट, ट्रांसफॉर्म, लोड के समान होता है। इस प्रकार ईटीएल और डेटा ब्लेंडिंग दोनों विभिन्न स्रोतों से डेटा लेते हैं और उन्हें संयोजित करते हैं। चूँकि, ईटीएल का उपयोग डेटा को लक्ष्य डेटाबेस में मर्ज और संरचना करने के लिए किया जाता है,[13] अतः अधिकांशतः डेटा वेयरहाउस. डेटा सम्मिश्रण थोड़ा भिन्न होता है जिससे कि यह विशिष्ट समय पर किसी विशिष्ट उपयोग की स्थिति के लिए डेटा को जोड़ने के बारे में होता है।[14] कुछ सॉफ़्टवेयर के साथ, डेटा को डेटाबेस में नहीं लिखा जाता है, जो ईटीएल से अधिक भिन्न होता है। उदाहरण के लिए, गूगल डेटा स्टूडियो के साथ[15] और झांकी सॉफ्टवेयर, डेटा मिश्रण सूची परत पर होता है। इस प्रकार यह कहीं लिखा नहीं है, केवल प्रदर्शित किया गया है।
झांकी में डेटा सम्मिश्रण
टेबल्यू सॉफ़्टवेयर में, डेटा सम्मिश्रण डेटा विज़ुअलाइज़ेशन में एकाधिक डेटा स्रोतों से डेटा को संयोजित करने की विधि होती है।[16] इस प्रकार डेटा स्रोतों को भिन्न प्रकार से संग्रहीत किया जाता है और केवल सूची परत पर डैशबोर्ड (व्यवसाय) में साथ प्रदर्शित किया जाता है। अतः यह टेबल्यू डेटा मिश्रण को डेटा सम्मिश्रण की अन्य परिभाषाओं से भिन्न करने वाली प्रमुख अवधारणाओं में होता है।
अन्य प्रमुख विभेदक डेटा जॉइन की ग्रैन्युलैरिटी है। सामान्यतः, डेटा को एकल डेटा समूह में मिश्रित करते समय, यह सम्मिलित (एसक्यूएल) होने का उपयोग करता है, जो सामान्यतः जहां संभव होता है, वहां आईडी क्षेत्र का उपयोग करके सबसे अधिक दानेदार स्तर पर जुड़ जाता है।[17] इस प्रकार टेबल्यू में डेटा मिश्रण कम से कम सूक्ष्म स्तर पर होता है।[18]
गूगल डेटा स्टूडियो में डेटा सम्मिश्रण
गूगल डेटा स्टूडियो में, डेटा स्रोतों को डेटा स्रोत के रिकॉर्ड को 4 अन्य डेटा स्रोतों के रिकॉर्ड के साथ जोड़कर संयोजित किया जाता है।
टेबलू के समान, डेटा मिश्रण केवल सूची परत पर होता है। इस प्रकार मिश्रित डेटा को कभी भी भिन्न संयुक्त डेटा स्रोत के रूप में संग्रहीत नहीं किया जाता है।[19]
डेटा सम्मिश्रण की चुनौतियाँ
सबसे सामान्य कस्टम मेटाडेटा प्रश्न यह होता है कि यह डेटासमूह मेरे अन्य डेटासमूह के साथ कैसे मिश्रित हो सकता है (जुड़ सकता है या जुड़ सकता है)?[20] सन्न 2015 फॉरेस्टर कंसल्टिंग अध्ययन में पाया गया कि 52 प्रतिशत कंपनियां 50 या अधिक डेटा स्रोतों का मिश्रण कर रही हैं और 12 प्रतिशत 1,000 से अधिक स्रोतों का मिश्रण कर रही हैं।[21]
यह भी देखें
- डेटा तैयारी
- डाटा संलयन
- डेटा की अस्तव्यस्तता
- डेटा सफाई
- डेटा संपादन
- डेटा स्क्रैपिंग
- डेटा क्यूरेशन
- डेटा प्री-प्रोसेसिंग
संदर्भ
- ↑ Alteryx Analytics Brings Power of Predictive and Big Data to Market
- ↑ Data blending is the process of combining data from multiple sources into a functioning data set
- ↑ The Definitive Guide to Data Blending
- ↑ "डेटा सम्मिश्रण". Trifacta.com. August 24, 2017.
- ↑ What Is Data Blending, and Which Tools Make It Easier?
- ↑ "Incorta raises $30M Series C for ETL-free data processing solution". TechCrunch (in English). Retrieved 2021-02-27.
- ↑ "एल्टरेक्स ने आरंभिक सार्वजनिक पेशकश के मूल्य निर्धारण की घोषणा की". Alteryx (in English). Retrieved 2021-02-27.
- ↑ Corporation, Microsoft. "माइक्रोसॉफ्ट पावर क्वेरी". powerquery.microsoft.com (in English). Retrieved 2021-02-27.
- ↑ "डेटा स्रोत". docs.incorta.com (in English). Retrieved 2021-02-27.
- ↑ davidiseminger. "पावर क्वेरी का उपयोग करके एकाधिक स्रोतों से डेटा को आकार दें और संयोजित करें". docs.microsoft.com (in English). Retrieved 2021-02-27.
- ↑ "समर्थित डेटा स्रोत - अमेज़न क्विकसाइट". docs.aws.amazon.com. Retrieved 2021-02-27.
- ↑ "Data Sources | Alteryx Help". help.alteryx.com. Retrieved 2021-02-27.
- ↑ "ईटीएल कैसे काम करता है". Databricks (in Deutsch). Retrieved 2021-02-27.
- ↑ "What Is Data Blending, and Which Tools Make It Easier?". Software Advice (in English). 2016-08-25. Retrieved 2021-02-27.
- ↑ "Google डेटा स्टूडियो अवलोकन". datastudio.google.com. Retrieved 2021-02-27.
- ↑ "अपना डेटा मिश्रित करें". help.tableau.com (in English). Retrieved 2021-02-27.
- ↑ "एसक्यूएल जॉइन्स की व्याख्या". एसक्यूएल जॉइन्स की व्याख्या (in English). Retrieved 2021-02-27.
- ↑ TAR Solutions (2021-01-20). "झांकी में डेटा सम्मिश्रण". TAR Solutions (in English). Retrieved 2021-02-27.
{{cite web}}
: CS1 maint: url-status (link) - ↑ "डेटा सम्मिश्रण के बारे में - डेटा स्टूडियो सहायता". support.google.com. Retrieved 2021-02-27.
- ↑ Heer, Jeffrey; Hellerstein, Joseph; Kandel, Sean; Rattenbury, Tye (July 2017). डेटा गड़बड़ी के सिद्धांत. O'Reilly Media.
- ↑ "एनालिटिक्स के लिए डेटा मैशअप". Pentaho.