डेटा मैपिंग: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Data transformation}}
{{Data transformation}}
[[ कम्प्यूटिंग |कम्प्यूटिंग]] और [[डेटा प्रबंधन]] में, डेटा मैपिंग दो भिन्न-भिन्न [[डेटा मॉडल]] के मध्य [[डेटा तत्व|डेटा एलिमेंट]] मैप (गणित) बनाने की प्रक्रिया है। '''डेटा मैपिंग''' का उपयोग विभिन्न प्रकार के [[डेटा एकीकरण]] कार्यों के लिए पहले चरण के रूप में किया जाता है, जिसमें सम्मिलित हैं:<ref name="ShahbazData15">{{cite book |url=https://books.google.com/books?id=pRChCgAAQBAJ |title=डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग|author=Shahbaz, Q. |publisher=Elsevier |pages=180 |year=2015 |isbn=9780128053355 |access-date=29 May 2018}}</ref>
[[ कम्प्यूटिंग |कम्प्यूटिंग]] और [[डेटा प्रबंधन]] में, '''डेटा मैपिंग''' दो भिन्न-भिन्न [[डेटा मॉडल]] के मध्य [[डेटा तत्व|डेटा एलिमेंट]] मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के [[डेटा एकीकरण]] कार्यों के लिए पहले चरण के रूप में किया जाता है, जिसमें सम्मिलित हैं:<ref name="ShahbazData15">{{cite book |url=https://books.google.com/books?id=pRChCgAAQBAJ |title=डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग|author=Shahbaz, Q. |publisher=Elsevier |pages=180 |year=2015 |isbn=9780128053355 |access-date=29 May 2018}}</ref>
* डेटा स्रोत और गंतव्य के मध्य [[डेटा परिवर्तन]] या [[डेटा मध्यस्थता|डेटा मध्यस्थता।]]
* डेटा स्रोत और गंतव्य के मध्य [[डेटा परिवर्तन]] या [[डेटा मध्यस्थता]] करना।
* डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा संबंधों की पहचान।
* डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा संबंधों की पहचान करना।
* डेटा मास्किंग या [[de-पहचान|डी-पहचान]] परियोजना के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लुप्त संवेदनशील डेटा जैसे सामाजिक सुरक्षा नंबर के अंतिम चार अंक का शोध।
* डेटा मास्किंग या [[de-पहचान|डी-पहचान]] परियोजना के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लुप्त संवेदनशील डेटा जैसे सामाजिक सुरक्षा नंबर के अंतिम चार अंक का शोध करना।
* एक ही डेटाबेस में एकाधिक डेटाबेस का [[डेटा समेकन]] या उन्मूलन के लिए डेटा के अनावश्यक कॉलम की पहचान करना।
* एक ही डेटाबेस में एकाधिक डेटाबेस का [[डेटा समेकन]] या उन्मूलन के लिए डेटा के अनावश्यक कॉलम की पहचान करना।


उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ व्ययीकरण और इनवॉइस प्रसारित करना और प्राप्त करना चाहती है, वह व्यय ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकती है।
उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ व्ययीकरण और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह व्यय ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।


==मानक==
==मानक==
Line 29: Line 29:


== यह भी देखें ==
== यह भी देखें ==
* डेटा ीकरण
* डेटा एकीकरण
* [[डेटा की गड़बड़ी]]
* [[डेटा की गड़बड़ी|डेटा व्रान्गलिंग]]  
*[[पहचान परिवर्तन]]
*[[पहचान परिवर्तन]]
*आईएसओ/आईईसी 11179 - आईएसओ/आईईसी [[ मेटा डेटा ]] रजिस्ट्री मानक
*आईएसओ/आईईसी 11179 - आईएसओ/आईईसी [[ मेटा डेटा |मेटाडेटा]] रजिस्ट्री मानक
*मेटाडेटा
*मेटाडेटा
*मेटाडेटा प्रकाशन
*मेटाडेटा प्रकाशन
*[[स्कीमा मिलान]]
*[[स्कीमा मिलान|स्कीमा संघ]]
*शब्दार्थ विविधता
*शब्दार्थ विविधता
*सिमेंटिक मैपर
*सिमेंटिक मैपर
Line 41: Line 41:
*[[अर्थ विज्ञान]] वेब
*[[अर्थ विज्ञान]] वेब
*शब्दार्थ
*शब्दार्थ
*्सएसएलटी - ्सएमएल परिवर्तन भाषा
*एक्सएसएलटी -एक्सएमएल परिवर्तन भाषा


==संदर्भ==
==संदर्भ==

Revision as of 19:52, 18 July 2023

कम्प्यूटिंग और डेटा प्रबंधन में, डेटा मैपिंग दो भिन्न-भिन्न डेटा मॉडल के मध्य डेटा एलिमेंट मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के डेटा एकीकरण कार्यों के लिए पहले चरण के रूप में किया जाता है, जिसमें सम्मिलित हैं:[1]

  • डेटा स्रोत और गंतव्य के मध्य डेटा परिवर्तन या डेटा मध्यस्थता करना।
  • डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा संबंधों की पहचान करना।
  • डेटा मास्किंग या डी-पहचान परियोजना के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लुप्त संवेदनशील डेटा जैसे सामाजिक सुरक्षा नंबर के अंतिम चार अंक का शोध करना।
  • एक ही डेटाबेस में एकाधिक डेटाबेस का डेटा समेकन या उन्मूलन के लिए डेटा के अनावश्यक कॉलम की पहचान करना।

उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ व्ययीकरण और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह व्यय ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।

मानक

एक्स12 मानक सामान्य इलेक्ट्रॉनिक आंकड़े इंटरचेंज (EDI) मानक हैं जो किसी कंपनी लॉ) नियम) को उद्योग को ध्यान दिए बिना किसी अन्य कंपनी के साथ डेटा का आदान-प्रदान करने की अनुमति देने के लिए डिज़ाइन किए गए हैं। मानकों को मान्यता प्राप्त मानक समिति एक्स12 (एएससी एक्स12) द्वारा बनाए रखा जाता है, अमेरिकी राष्ट्रीय मानक संस्थान (ANSI) को ईडीआई के लिए मानक निर्धारित करने के लिए मान्यता प्राप्त है। एक्स12 मानकों को प्रायः एएनएसआई एएससी एक्स12 मानक कहा जाता है।

W3C ने R2RML को रिसोर्स_डिस्क्रिप्शन_फ़्रेमवर्क (RDF) के संदर्भ में व्यक्त डेटा के लिए रिलेशनल डेटाबेस में डेटा मैप करने के लिए मानक के रूप में प्रस्तुत किया।

भविष्य में, रिसोर्स डिस्क्रिप्शन फ्रेमवर्क (आरडीएफ), वेब ओन्टोलॉजी भाषा (ओडब्लूएल) और मानकीकृत मेटाडेटा रजिस्ट्री जैसे सेमांटिक वेब भाषाओं पर आधारित उपकरण डेटा मैपिंग को और अधिक स्वचालित प्रक्रिया बना देंगे। यदि प्रत्येक एप्लिकेशन मेटाडेटा प्रकाशन करता है तो यह प्रक्रिया तीव्र हो जाएगी। पूर्ण स्वचालित डेटा मैपिंग अधिक ही कठिन समस्या है (अर्थात् अनुवाद देखें)।

हाथ से कोडित, ग्राफिकल मैनुअल

डेटा मैपिंग प्रक्रियात्मक कोड का उपयोग करके, एक्सएसएलटी ट्रांसफॉर्म बनाकर या ग्राफिकल मैपिंग उपकरण का उपयोग करके विभिन्न विधियों से किया जा सकता है जो स्वचालित रूप से निष्पादन योग्य रूपांतरण प्रोग्राम उत्पन्न करते हैं। ये ग्राफ़िकल उपकरण हैं जो उपयोगकर्ता को डेटा के सेट के क्षेत्र से दूसरे सेट के क्षेत्र तक रेखाएँ खींचने की अनुमति देते हैं। कुछ ग्राफिकल डेटा मैपिंग उपकरण उपयोगकर्ताओं को किसी स्रोत और गंतव्य को ऑटो-कनेक्ट करने की अनुमति देते हैं। यह सुविधा स्रोत और गंतव्य डेटा एलिमेंट नाम के समान होने पर निर्भर है। परिवर्तन प्रोग्राम स्वचालित रूप से एसक्यूएल, एक्सएसएलटी, जावा (प्रोग्रामिंग भाषा), या सी++ में बनाए जाते हैं। इस प्रकार के ग्राफ़िकल उपकरण अधिकांश ईटीएल, (एक्सट्रैक्ट, ट्रांसफॉर्म और लोड) उपकरण में डेटा मूवमेंट का समर्थन करने के लिए डेटा मैप अंकित करने के प्राथमिक साधन के रूप में पाए जाते हैं। उदाहरणों में सैप बीओडीएस और इंफॉर्मेटिका पॉवरसेंटर

सम्मिलित हैं।

डेटा-संचालित मैपिंग

यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य जटिल मैपिंग को स्वचालित रूप से शोध करने के लिए अनुमान और आंकड़ों का उपयोग करके दो डेटा स्रोतों में वास्तविक डेटा मानों का साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य परिवर्तनों का शोध, सबस्ट्रिंग, संयोजन, अंकगणित, केस स्टेटमेंट के साथ-साथ अन्य प्रकार के परिवर्तन तर्क का शोध के लिए किया जाता है। यह दृष्टिकोण उन डेटा अपवादों को भी ज्ञात करता है जो शोध किये गए परिवर्तन तर्क का पालन नहीं करते हैं।

सिमेंटिक मैपिंग

सिमेंटिक मैपर डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस अपवाद के साथ कि डेटा एलिमेंट पर्यायवाची शब्दों को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि स्रोत प्रणाली प्रथम नाम को सूचीबद्ध करता है किन्तु गंतव्य पर्सनगिवेननाम को सूचीबद्ध करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में समानार्थक शब्द के रूप में सूचीबद्ध हैं। सिमेंटिक मैपिंग केवल डेटा के स्तंभों के मध्य त्रुटिहीन संयुग्मन परीक्षण करने में सक्षम है और स्तंभों के मध्य किसी भी परिवर्तन तर्क या अपवाद का परीक्षण नहीं करेगा।

डेटा मैपिंग डेटा के प्रत्येक भाग के जीवन चक्र का ट्रैक है क्योंकि इसे एनालिटिक्स प्रणाली द्वारा अंतर्ग्रहण, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और त्रुटियों को उनके स्रोतों तक ट्रेस करना सरल बनाता है। यह चरण-वार डिबगिंग या लुप्त हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रवाह के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस प्रणाली ने पहले से ही समान सत्यापन और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा उद्गम कहा जाता है।[2]

यह भी देखें

संदर्भ

  1. Shahbaz, Q. (2015). डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग. Elsevier. p. 180. ISBN 9780128053355. Retrieved 29 May 2018.
  2. De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn