डेटा मैपिंग

कम्प्यूटिंग और डेटा मैनेजमेंट में, डेटा मैपिंग दो भिन्न-भिन्न डेटा मॉडल के मध्य डेटा एलिमेंट मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के डेटा इंटीग्रेशन कार्यों के लिए पहले स्टेप के रूप में किया जाता है, जिसमें सम्मिलित हैं:^[1]

डेटा सोर्स और डेस्टिनेशन के मध्य डेटा ट्रांसफॉर्मेशन या डेटा मेडिएशन करना।
डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा संबंधों का आइडेंटिफिकेशन करना।
डेटा मास्किंग या डी-आइडेंटिफिकेशन प्रोजेक्ट के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लॉस्ट संवेदनशील डेटा जैसे सोशल सिक्योरिटी नंबर के अंतिम चार अंक का शोध करना।
एक ही डेटाबेस में एकाधिक डेटाबेस का डेटा कंसोलिडेशन या एलिमिनेशन के लिए डेटा के अनावश्यक कॉलम का आइडेंटिफिकेशन करना।

उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ परचेस और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह परचेस ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।

मानक

एक्स12 मानक सामान्य इलेक्ट्रॉनिक डेटा इंटरचेंज (EDI) मानक हैं जो किसी कंपनी लॉ) नियम) के इंडस्ट्री को ध्यान दिए बिना किसी अन्य कंपनी के साथ डेटा का आदान-प्रदान करने की अनुमति देने के लिए डिज़ाइन किए गए हैं। मानकों को मान्यता प्राप्त मानक समिति एक्स12 (एएससी एक्स12) द्वारा बनाए रखा जाता है, अमेरिकी राष्ट्रीय मानक संस्थान (ANSI) को ईडीआई के लिए मानक निर्धारित करने के लिए मान्यता प्राप्त है। एक्स12 मानकों को प्रायः एएनएसआई एएससी एक्स12 मानक कहा जाता है।

W3C ने R2RML को रिसोर्स_डिस्क्रिप्शन_फ़्रेमवर्क (RDF) के संदर्भ में व्यक्त डेटा के लिए रिलेशनल डेटाबेस में डेटा मैप करने के लिए मानक के रूप में प्रस्तुत किया।

भविष्य में, रिसोर्स डिस्क्रिप्शन फ्रेमवर्क (आरडीएफ), वेब ओन्टोलॉजी लैंग्वेज (ओडब्लूएल) और मानकीकृत मेटाडेटा रजिस्ट्री जैसे सेमांटिक वेब लैंग्वेज पर आधारित उपकरण डेटा मैपिंग को और अधिक आटोमेटिक प्रक्रिया बना देंगे। यदि प्रत्येक एप्लिकेशन मेटाडेटा प्रकाशन करता है तो यह प्रक्रिया तीव्र हो जाएगी। पूर्ण ऑटोमेटेड डेटा मैपिंग अधिक ही कठिन समस्या है।

हैंडेड कोडित, ग्राफिकल मैनुअल

डेटा मैपिंग प्रक्रियात्मक कोड का उपयोग करके, एक्सएसएलटी ट्रांसफॉर्म बनाकर या ग्राफिकल मैपिंग उपकरण का उपयोग करके विभिन्न विधियों से किया जा सकता है जो ऑटोमेटिकली एक्सेक्यूटबले ट्रांसफॉर्मेशन प्रोग्राम उत्पन्न करते हैं। ये ग्राफ़िकल उपकरण हैं जो उपयोगकर्ता को डेटा के सेट के फील्ड से दूसरे सेट के फील्ड तक लाइन्स ड्रा करने की अनुमति देते हैं। कुछ ग्राफिकल डेटा मैपिंग टूल उपयोगकर्ताओं को किसी सोर्स और डेस्टिनेशन को ऑटो-कनेक्ट करने की अनुमति देते हैं। यह सुविधा सोर्स और डेस्टिनेशन डेटा एलिमेंट नाम के समान होने पर निर्भर है। ट्रांसफॉर्मेशन प्रोग्राम ऑटोमेटिकली एसक्यूएल, एक्सएसएलटी, जावा (प्रोग्रामिंग लैंग्वेज), या सी++ में बनाए जाते हैं। इस प्रकार के ग्राफ़िकल टूल अधिकांश ईटीएल, (एक्सट्रैक्ट, ट्रांसफॉर्म और लोड) टूल में डेटा मूवमेंट का समर्थन करने के लिए डेटा मैप अंकित करने के प्राथमिक साधन के रूप में पाए जाते हैं। उदाहरणों में सैप बीओडीएस और इंफॉर्मेटिका पॉवरसेंटर

सम्मिलित हैं।

डेटा-ड्रिवेन मैपिंग

यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य मैपिंग को ऑटोमेटिकली शोध करने के लिए अनुमान और डेटा का उपयोग करके दो डेटा सोर्सों में वास्तविक डेटा मानों का साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य ट्रांसफॉर्मेशनों का शोध, सबस्ट्रिंग, कोंसटेनशंस, अर्थमेटिक, केस स्टेटमेंट के साथ-साथ अन्य प्रकार के ट्रांसफॉर्मेशन लॉजिक का शोध के लिए किया जाता है। यह दृष्टिकोण उन डेटा एक्सेप्शन्स को भी ज्ञात करता है जो शोध किये गए ट्रांसफॉर्मेशन लॉजिक का पालन नहीं करते हैं।

सिमेंटिक मैपिंग

सिमेंटिक मैपर डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस एक्सेप्शन्स के साथ कि डेटा एलिमेंट सीनोनिम्स को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि सोर्स सिस्टम फर्स्ट नेम को मैपिंग करता है किन्तु डेस्टिनेशन पर्सनगिवेननेम को मैपिंग करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में मैपिंग के रूप में मैपिंग होते हैं। सिमेंटिक मैपिंग केवल डेटा के कॉलम के मध्य एरर संयुग्मन परीक्षण करने में सक्षम है और कॉलम के मध्य किसी भी ट्रांसफॉर्मेशन लॉजिक या एक्सेप्शन्स का परीक्षण नहीं करेगा।

डेटा मैपिंग डेटा के प्रत्येक भाग के लाइफ साइकिल का ट्रैक है क्योंकि इसे एनालिटिक्स सिस्टम द्वारा इंगेस्टेड, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और एरर को उनके सोर्सों तक ट्रेस करना सरल बनाता है। यह स्टेप-वाइज डिबगिंग या लॉस्ट हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रोवेनैंस के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस सिस्टम ने पहले से ही समान एड्रेस और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा प्रोवेनैंस कहा जाता है।^[2]

यह भी देखें

डेटा इंटीग्रेशन
डेटा व्रान्गलिंग
आइडेंटिफिकेशन ट्रांसफॉर्मेशन
आईएसओ/आईईसी 11179- आईएसओ/आईईसी मेटाडेटा रजिस्ट्री मानक
मेटाडेटा
मेटाडेटा प्रकाशन
स्कीमा संघ
शब्दार्थ विविधता
सिमेंटिक मैपर
शब्दार्थ अनुवाद
अर्थ विज्ञान वेब
शब्दार्थ
एक्सएसएलटी- एक्सएमएल ट्रांसफॉर्मेशन लैंग्वेज

संदर्भ

↑ Shahbaz, Q. (2015). डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग. Elsevier. p. 180. ISBN 9780128053355. Retrieved 29 May 2018.
↑ De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn

[ShahbazData15-1] Shahbaz, Q. (2015). डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग. Elsevier. p. 180. ISBN 9780128053355. Retrieved 29 May 2018.

[2] De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn

[1]

[2]

Anonymous

Search

डेटा मैपिंग

Namespaces

More

Page actions

Contents

मानक

हैंडेड कोडित, ग्राफिकल मैनुअल

डेटा-ड्रिवेन मैपिंग

सिमेंटिक मैपिंग

यह भी देखें

संदर्भ

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

डेटा मैपिंग

मानक

हैंडेड कोडित, ग्राफिकल मैनुअल

डेटा-ड्रिवेन मैपिंग

सिमेंटिक मैपिंग

यह भी देखें

संदर्भ

Navigation

Wiki tools

Page tools

Other projects

Categories