डेटा मैपिंग: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(4 intermediate revisions by 3 users not shown)
Line 2: Line 2:
[[ कम्प्यूटिंग |कम्प्यूटिंग]] और [[डेटा प्रबंधन|डेटा मैनेजमेंट]] में, '''डेटा मैपिंग''' दो भिन्न-भिन्न [[डेटा मॉडल]] के मध्य [[डेटा तत्व|डेटा एलिमेंट]] मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के [[डेटा एकीकरण|डेटा इंटीग्रेशन]] कार्यों के लिए पहले स्टेप के रूप में किया जाता है, जिसमें सम्मिलित हैं:<ref name="ShahbazData15">{{cite book |url=https://books.google.com/books?id=pRChCgAAQBAJ |title=डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग|author=Shahbaz, Q. |publisher=Elsevier |pages=180 |year=2015 |isbn=9780128053355 |access-date=29 May 2018}}</ref>
[[ कम्प्यूटिंग |कम्प्यूटिंग]] और [[डेटा प्रबंधन|डेटा मैनेजमेंट]] में, '''डेटा मैपिंग''' दो भिन्न-भिन्न [[डेटा मॉडल]] के मध्य [[डेटा तत्व|डेटा एलिमेंट]] मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के [[डेटा एकीकरण|डेटा इंटीग्रेशन]] कार्यों के लिए पहले स्टेप के रूप में किया जाता है, जिसमें सम्मिलित हैं:<ref name="ShahbazData15">{{cite book |url=https://books.google.com/books?id=pRChCgAAQBAJ |title=डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग|author=Shahbaz, Q. |publisher=Elsevier |pages=180 |year=2015 |isbn=9780128053355 |access-date=29 May 2018}}</ref>
* डेटा सोर्स और डेस्टिनेशन के मध्य [[डेटा परिवर्तन|डेटा ट्रांसफॉर्मेशन]] या [[डेटा मध्यस्थता|डेटा मेडिएशन]] करना।
* डेटा सोर्स और डेस्टिनेशन के मध्य [[डेटा परिवर्तन|डेटा ट्रांसफॉर्मेशन]] या [[डेटा मध्यस्थता|डेटा मेडिएशन]] करना।
* डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा संबंधों का आइडेंटिफिकेशन करना।
* डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा रिलेशन का आइडेंटिफिकेशन करना।
* डेटा मास्किंग या [[de-पहचान|डी-आइडेंटिफिकेशन]] प्रोजेक्ट के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लॉस्ट संवेदनशील डेटा जैसे सोशल सिक्योरिटी नंबर के अंतिम चार अंक का शोध करना।
* डेटा मास्किंग या [[de-पहचान|डी-आइडेंटिफिकेशन]] प्रोजेक्ट के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लॉस्ट संवेदनशील डेटा जैसे सोशल सिक्योरिटी नंबर के अंतिम चार अंक का शोध करना।
* एक ही डेटाबेस में एकाधिक डेटाबेस का [[डेटा समेकन|डेटा कंसोलिडेशन]] या एलिमिनेशन के लिए डेटा के अनावश्यक कॉलम का आइडेंटिफिकेशन करना।
* एक ही डेटाबेस में सिंगल डेटाबेस का [[डेटा समेकन|डेटा कंसोलिडेशन]] या एलिमिनेशन के लिए डेटा के अनावश्यक कॉलम का आइडेंटिफिकेशन करना।


उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ परचेस और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह परचेस ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।
उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ परचेस और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह परचेस ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।
Line 21: Line 21:


==डेटा-ड्रिवेन मैपिंग==
==डेटा-ड्रिवेन मैपिंग==
यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य मैपिंग को ऑटोमेटिकली शोध करने के लिए अनुमान और डेटा का उपयोग करके दो डेटा सोर्सों में वास्तविक डेटा मानों का साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य ट्रांसफॉर्मेशनों का शोध, सबस्ट्रिंग, कोंसटेनशंस, [[अंकगणित|अर्थमेटिक]], केस स्टेटमेंट के साथ-साथ अन्य प्रकार के ट्रांसफॉर्मेशन लॉजिक का शोध के लिए किया जाता है। यह दृष्टिकोण उन डेटा एक्सेप्शन्स को भी ज्ञात करता है जो शोध किये गए ट्रांसफॉर्मेशन लॉजिक का पालन नहीं करते हैं।
यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य मैपिंग को ऑटोमेटिकली शोध करने के लिए अनुमान और डेटा का उपयोग करके दो डेटा सोर्सों में वास्तविक डेटा मानों के साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य ट्रांसफॉर्मेशनों का शोध, सबस्ट्रिंग, कोंसटेनशंस, [[अंकगणित|अर्थमेटिक]], केस स्टेटमेंट के साथ-साथ अन्य प्रकार के ट्रांसफॉर्मेशन लॉजिक का शोध करने के लिए किया जाता है। यह दृष्टिकोण उन डेटा एक्सेप्शन्स को भी ज्ञात करता है जो शोध किये गए ट्रांसफॉर्मेशन लॉजिक का पालन नहीं करते हैं।


==सिमेंटिक मैपिंग==
==सिमेंटिक मैपिंग==
[[सिमेंटिक मैपर]] डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस एक्सेप्शन्स के साथ कि डेटा एलिमेंट सीनोनिम्स को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि सोर्स सिस्टम फर्स्ट नेम को मैपिंग करता है किन्तु डेस्टिनेशन पर्सनगिवेननेम को मैपिंग करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में मैपिंग के रूप में मैपिंग होते हैं। सिमेंटिक मैपिंग केवल डेटा के कॉलम के मध्य एरर संयुग्मन परीक्षण करने में सक्षम है और कॉलम के मध्य किसी भी ट्रांसफॉर्मेशन लॉजिक या एक्सेप्शन्स का परीक्षण नहीं करेगा।
[[सिमेंटिक मैपर]] डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस एक्सेप्शन्स के साथ कि डेटा एलिमेंट सीनोनिम्स को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि सोर्स सिस्टम फर्स्ट नेम को मैपिंग करता है किन्तु डेस्टिनेशन पर्सनगिवेननेम को मैपिंग करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में मैपिंग के रूप में मैपिंग होते हैं। सिमेंटिक मैपिंग केवल डेटा के कॉलम के मध्य एरर संयुग्मन का परीक्षण करने में सक्षम है और कॉलम के मध्य किसी भी ट्रांसफॉर्मेशन लॉजिक या एक्सेप्शन्स का परीक्षण नहीं करेगा।


डेटा मैपिंग डेटा के प्रत्येक भाग के लाइफ साइकिल का ट्रैक है क्योंकि इसे एनालिटिक्स सिस्टम द्वारा इंगेस्टेड, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और एरर को उनके सोर्सों तक ट्रेस करना सरल बनाता है। यह स्टेप-वाइज डिबगिंग या लॉस्ट हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रोवेनैंस के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस सिस्टम ने पहले से ही समान एड्रेस और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा प्रोवेनैंस कहा जाता है।<ref>De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn</ref>
डेटा मैपिंग डेटा के प्रत्येक भाग के लाइफ साइकिल का ट्रैक है क्योंकि इसे एनालिटिक्स सिस्टम द्वारा इंगेस्टेड, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और एरर को उनके सोर्सों तक ट्रेस करना सरल बनाता है। यह स्टेप-वाइज डिबगिंग या लॉस्ट हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रोवेनैंस के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस सिस्टम ने पहले से ही समान एड्रेस और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा प्रोवेनैंस कहा जाता है।<ref>De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn</ref>
Line 46: Line 46:
{{reflist}}
{{reflist}}


{{DEFAULTSORT:Data Mapping}}[[Category: डेटा मैपिंग| डेटा मैपिंग]]
{{DEFAULTSORT:Data Mapping}}


 
[[Category:Created On 10/07/2023|Data Mapping]]
 
[[Category:Machine Translated Page|Data Mapping]]
[[Category: Machine Translated Page]]
[[Category:Pages with script errors|Data Mapping]]
[[Category:Created On 10/07/2023]]
[[Category:Templates Vigyan Ready|Data Mapping]]
[[Category:डेटा मैपिंग| डेटा मैपिंग]]

Latest revision as of 12:15, 31 July 2023

कम्प्यूटिंग और डेटा मैनेजमेंट में, डेटा मैपिंग दो भिन्न-भिन्न डेटा मॉडल के मध्य डेटा एलिमेंट मैप (गणित) बनाने की प्रक्रिया है। डेटा मैपिंग का उपयोग विभिन्न प्रकार के डेटा इंटीग्रेशन कार्यों के लिए पहले स्टेप के रूप में किया जाता है, जिसमें सम्मिलित हैं:[1]

  • डेटा सोर्स और डेस्टिनेशन के मध्य डेटा ट्रांसफॉर्मेशन या डेटा मेडिएशन करना।
  • डेटा मैपिंग विश्लेषण के भाग के रूप में डेटा रिलेशन का आइडेंटिफिकेशन करना।
  • डेटा मास्किंग या डी-आइडेंटिफिकेशन प्रोजेक्ट के भाग के रूप में किसी अन्य उपयोगकर्ता आईडी में लॉस्ट संवेदनशील डेटा जैसे सोशल सिक्योरिटी नंबर के अंतिम चार अंक का शोध करना।
  • एक ही डेटाबेस में सिंगल डेटाबेस का डेटा कंसोलिडेशन या एलिमिनेशन के लिए डेटा के अनावश्यक कॉलम का आइडेंटिफिकेशन करना।

उदाहरण के लिए, कंपनी जो अन्य कंपनियों के साथ परचेस और इनवॉइस प्रसारित करना और प्राप्त करना चाहता है, वह परचेस ऑर्डर और इनवॉइस जैसी वस्तुओं के लिए कंपनी के डेटा से मानकीकृत एएनएसआई एएससी एक्स12 संदेशों के लिए डेटा मैप बनाने के लिए डेटा मैपिंग का उपयोग कर सकता है।

मानक

एक्स12 मानक सामान्य इलेक्ट्रॉनिक डेटा इंटरचेंज (EDI) मानक हैं जो किसी कंपनी लॉ) नियम) के इंडस्ट्री को ध्यान दिए बिना किसी अन्य कंपनी के साथ डेटा का आदान-प्रदान करने की अनुमति देने के लिए डिज़ाइन किए गए हैं। मानकों को मान्यता प्राप्त मानक समिति एक्स12 (एएससी एक्स12) द्वारा बनाए रखा जाता है, अमेरिकी राष्ट्रीय मानक संस्थान (ANSI) को ईडीआई के लिए मानक निर्धारित करने के लिए मान्यता प्राप्त है। एक्स12 मानकों को प्रायः एएनएसआई एएससी एक्स12 मानक कहा जाता है।

W3C ने R2RML को रिसोर्स_डिस्क्रिप्शन_फ़्रेमवर्क (RDF) के संदर्भ में व्यक्त डेटा के लिए रिलेशनल डेटाबेस में डेटा मैप करने के लिए मानक के रूप में प्रस्तुत किया।

भविष्य में, रिसोर्स डिस्क्रिप्शन फ्रेमवर्क (आरडीएफ), वेब ओन्टोलॉजी लैंग्वेज (ओडब्लूएल) और मानकीकृत मेटाडेटा रजिस्ट्री जैसे सेमांटिक वेब लैंग्वेज पर आधारित उपकरण डेटा मैपिंग को और अधिक आटोमेटिक प्रक्रिया बना देंगे। यदि प्रत्येक एप्लिकेशन मेटाडेटा प्रकाशन करता है तो यह प्रक्रिया तीव्र हो जाएगी। पूर्ण ऑटोमेटेड डेटा मैपिंग अधिक ही कठिन समस्या है।

हैंडेड कोडित, ग्राफिकल मैनुअल

डेटा मैपिंग प्रक्रियात्मक कोड का उपयोग करके, एक्सएसएलटी ट्रांसफॉर्म बनाकर या ग्राफिकल मैपिंग उपकरण का उपयोग करके विभिन्न विधियों से किया जा सकता है जो ऑटोमेटिकली एक्सेक्यूटबले ट्रांसफॉर्मेशन प्रोग्राम उत्पन्न करते हैं। ये ग्राफ़िकल उपकरण हैं जो उपयोगकर्ता को डेटा के सेट के फील्ड से दूसरे सेट के फील्ड तक लाइन्स ड्रा करने की अनुमति देते हैं। कुछ ग्राफिकल डेटा मैपिंग टूल उपयोगकर्ताओं को किसी सोर्स और डेस्टिनेशन को ऑटो-कनेक्ट करने की अनुमति देते हैं। यह सुविधा सोर्स और डेस्टिनेशन डेटा एलिमेंट नाम के समान होने पर निर्भर है। ट्रांसफॉर्मेशन प्रोग्राम ऑटोमेटिकली एसक्यूएल, एक्सएसएलटी, जावा (प्रोग्रामिंग लैंग्वेज), या सी++ में बनाए जाते हैं। इस प्रकार के ग्राफ़िकल टूल अधिकांश ईटीएल, (एक्सट्रैक्ट, ट्रांसफॉर्म और लोड) टूल में डेटा मूवमेंट का समर्थन करने के लिए डेटा मैप अंकित करने के प्राथमिक साधन के रूप में पाए जाते हैं। उदाहरणों में सैप बीओडीएस और इंफॉर्मेटिका पॉवरसेंटर

सम्मिलित हैं।

डेटा-ड्रिवेन मैपिंग

यह डेटा मैपिंग में नवीनतम दृष्टिकोण है और इसमें दो डेटा सेटों के मध्य मैपिंग को ऑटोमेटिकली शोध करने के लिए अनुमान और डेटा का उपयोग करके दो डेटा सोर्सों में वास्तविक डेटा मानों के साथ मूल्यांकन करना सम्मिलित है। इस दृष्टिकोण का उपयोग दो डेटा सेटों के मध्य ट्रांसफॉर्मेशनों का शोध, सबस्ट्रिंग, कोंसटेनशंस, अर्थमेटिक, केस स्टेटमेंट के साथ-साथ अन्य प्रकार के ट्रांसफॉर्मेशन लॉजिक का शोध करने के लिए किया जाता है। यह दृष्टिकोण उन डेटा एक्सेप्शन्स को भी ज्ञात करता है जो शोध किये गए ट्रांसफॉर्मेशन लॉजिक का पालन नहीं करते हैं।

सिमेंटिक मैपिंग

सिमेंटिक मैपर डेटा मैपर्स के ऑटो-कनेक्ट सुविधा के समान है, इस एक्सेप्शन्स के साथ कि डेटा एलिमेंट सीनोनिम्स को देखने के लिए मेटाडेटा रजिस्ट्री से परामर्श लिया जा सकता है। उदाहरण के लिए, यदि सोर्स सिस्टम फर्स्ट नेम को मैपिंग करता है किन्तु डेस्टिनेशन पर्सनगिवेननेम को मैपिंग करता है, तो मैपिंग तब भी की जाएगी यदि ये डेटा एलिमेंट मेटाडेटा रजिस्ट्री में मैपिंग के रूप में मैपिंग होते हैं। सिमेंटिक मैपिंग केवल डेटा के कॉलम के मध्य एरर संयुग्मन का परीक्षण करने में सक्षम है और कॉलम के मध्य किसी भी ट्रांसफॉर्मेशन लॉजिक या एक्सेप्शन्स का परीक्षण नहीं करेगा।

डेटा मैपिंग डेटा के प्रत्येक भाग के लाइफ साइकिल का ट्रैक है क्योंकि इसे एनालिटिक्स सिस्टम द्वारा इंगेस्टेड, संसाधित और आउटपुट किया जाता है। यह एनालिटिक्स पाइपलाइन में दृश्यता प्रदान करता है और एरर को उनके सोर्सों तक ट्रेस करना सरल बनाता है। यह स्टेप-वाइज डिबगिंग या लॉस्ट हुए आउटपुट को पुन: उत्पन्न करने के लिए डेटा प्रोवेनैंस के विशिष्ट भागों या इनपुट को फिर से चलाने में भी सक्षम बनाता है। वास्तव में, डेटाबेस सिस्टम ने पहले से ही समान एड्रेस और डिबगिंग उद्देश का समाधान करने के लिए ऐसी जानकारी का उपयोग किया है, जिसे डेटा प्रोवेनैंस कहा जाता है।[2]

यह भी देखें

संदर्भ

  1. Shahbaz, Q. (2015). डेटा वेयरहाउस डिज़ाइन के लिए डेटा मैपिंग. Elsevier. p. 180. ISBN 9780128053355. Retrieved 29 May 2018.
  2. De, Soumyarupa. (2012). Newt : an architecture for lineage based replay and debugging in DISC systems. UC San Diego: b7355202. Retrieved from: https://escholarship.org/uc/item/3170p7zn