आँकड़ा विनिमय: Difference between revisions
No edit summary |
No edit summary |
||
Line 2: | Line 2: | ||
डेटा एक्सचेंज एक 'स्रोत' [[डेटाबेस स्कीमा]] के अनुसार संरचित डेटा लेने और इसे 'लक्ष्य' स्कीमा में बदलने की प्रक्रिया है, जिससे कि लक्ष्य डेटा स्रोत डेटा का त्रुटिहीन प्रतिनिधित्व हो।<ref>A. Doan, A. Halevy, and Z. Ives. "[https://books.google.com/books?id=s2YCKGrO10YC Principles of data integration]", Morgan Kaufmann,s 2012 pp. 276</ref> डेटा एक्सचेंज डेटा को विभिन्न कंप्यूटर प्रोग्रामों के बीच साझा करने की अनुमति देता है। | डेटा एक्सचेंज एक 'स्रोत' [[डेटाबेस स्कीमा]] के अनुसार संरचित डेटा लेने और इसे 'लक्ष्य' स्कीमा में बदलने की प्रक्रिया है, जिससे कि लक्ष्य डेटा स्रोत डेटा का त्रुटिहीन प्रतिनिधित्व हो।<ref>A. Doan, A. Halevy, and Z. Ives. "[https://books.google.com/books?id=s2YCKGrO10YC Principles of data integration]", Morgan Kaufmann,s 2012 pp. 276</ref> डेटा एक्सचेंज डेटा को विभिन्न कंप्यूटर प्रोग्रामों के बीच साझा करने की अनुमति देता है। | ||
यह [[डेटा एकीकरण]] की संबंधित अवधारणा के समान है सिवाय इसके कि डेटा एक्सचेंज में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित नुकसान के साथ) है। सभी बाधाओं को देखते हुए | यह [[डेटा एकीकरण]] की संबंधित अवधारणा के समान है, सिवाय इसके कि डेटा एक्सचेंज में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित नुकसान के साथ) किया जाता है। सभी बाधाओं को देखते हुए किसी [[उदाहरण (कंप्यूटर विज्ञान)]] को बदलने का कोई विधि नहीं हो सकता है। इसके विपरीत, उदाहरण को बदलने के कई तरीके हो सकते हैं (संभवतः असीम रूप से कई), जिस स्थिति में समाधान के "सर्वोत्तम" विकल्प की पहचान की जानी चाहिए और उसे उचित ठहराया जाना चाहिए। | ||
== सिंगल-डोमेन डेटा एक्सचेंज == | == सिंगल-डोमेन डेटा एक्सचेंज == | ||
कुछ डोमेन में, कुछ दर्जन | कुछ डोमेन में, कुछ दर्जन अलग-अलग स्रोत और लक्ष्य स्कीमा (मालिकाना डेटा स्वरूप) उपस्तिथ हो सकते हैं। एक "एक्सचेंज" या "इंटरचेंज प्रारूप" अधिकांशतः एक ही डोमेन के लिए विकसित किया जाता है और फिर आवश्यक रूटीन (मैपिंग) को (अप्रत्यक्ष रूप से) प्रत्येक स्रोत स्कीमा को एक मध्यवर्ती चरण के रूप में इंटरचेंज प्रारूप का उपयोग करके प्रत्येक और हर लक्ष्य स्कीमा में बदलने / अनुवाद करने के लिए लिखा जाता है।<ref name="ArenasFound14">{{cite book |url=https://books.google.com/books?id=z9TSAgAAQBAJ&pg=PA1 |title=डेटा एक्सचेंज की नींव|author=Arenas, M. |author2=Barceló, P. |author3=Libkin, L. |author4=Murlak, F. |publisher=Cambridge University Press |pages=1–11 |year=2014 |isbn=9781107016163 |access-date=25 May 2018}}</ref> इसके लिए सैकड़ों अलग-अलग रूटीन लिखने और डिबग करने की तुलना में बहुत कम काम की आवश्यकता होती है, जो प्रत्येक स्रोत स्कीमा को सीधे प्रत्येक लक्ष्य स्कीमा में अनुवाद करने के लिए आवश्यक होगा। | ||
इन परिवर्तनकारी इंटरचेंज प्रारूपों के उदाहरणों में सम्मिलित हैं: | इन परिवर्तनकारी इंटरचेंज प्रारूपों के उदाहरणों में सम्मिलित हैं: |
Revision as of 13:32, 23 June 2023
डेटा एक्सचेंज एक 'स्रोत' डेटाबेस स्कीमा के अनुसार संरचित डेटा लेने और इसे 'लक्ष्य' स्कीमा में बदलने की प्रक्रिया है, जिससे कि लक्ष्य डेटा स्रोत डेटा का त्रुटिहीन प्रतिनिधित्व हो।[1] डेटा एक्सचेंज डेटा को विभिन्न कंप्यूटर प्रोग्रामों के बीच साझा करने की अनुमति देता है।
यह डेटा एकीकरण की संबंधित अवधारणा के समान है, सिवाय इसके कि डेटा एक्सचेंज में डेटा वास्तव में पुनर्गठित (सामग्री के संभावित नुकसान के साथ) किया जाता है। सभी बाधाओं को देखते हुए किसी उदाहरण (कंप्यूटर विज्ञान) को बदलने का कोई विधि नहीं हो सकता है। इसके विपरीत, उदाहरण को बदलने के कई तरीके हो सकते हैं (संभवतः असीम रूप से कई), जिस स्थिति में समाधान के "सर्वोत्तम" विकल्प की पहचान की जानी चाहिए और उसे उचित ठहराया जाना चाहिए।
सिंगल-डोमेन डेटा एक्सचेंज
कुछ डोमेन में, कुछ दर्जन अलग-अलग स्रोत और लक्ष्य स्कीमा (मालिकाना डेटा स्वरूप) उपस्तिथ हो सकते हैं। एक "एक्सचेंज" या "इंटरचेंज प्रारूप" अधिकांशतः एक ही डोमेन के लिए विकसित किया जाता है और फिर आवश्यक रूटीन (मैपिंग) को (अप्रत्यक्ष रूप से) प्रत्येक स्रोत स्कीमा को एक मध्यवर्ती चरण के रूप में इंटरचेंज प्रारूप का उपयोग करके प्रत्येक और हर लक्ष्य स्कीमा में बदलने / अनुवाद करने के लिए लिखा जाता है।[2] इसके लिए सैकड़ों अलग-अलग रूटीन लिखने और डिबग करने की तुलना में बहुत कम काम की आवश्यकता होती है, जो प्रत्येक स्रोत स्कीमा को सीधे प्रत्येक लक्ष्य स्कीमा में अनुवाद करने के लिए आवश्यक होगा।
इन परिवर्तनकारी इंटरचेंज प्रारूपों के उदाहरणों में सम्मिलित हैं:
- भू-स्थानिक डेटा के लिए मानक इंटरचेंज प्रारूप;[3]
- स्प्रेडशीट डेटा के लिए डेटा इंटरचेंज प्रारूप;[4]
- स्प्रैडशीट्स, चार्ट्स, प्रस्तुतियों और वर्ड प्रोसेसिंग दस्तावेज़ों के लिए खुला दस्तावेज़ स्वरूप;[5]
- जीपीएस डेटा का वर्णन करने के लिए जीपीएस एक्सचेंज प्रारूप या कीहोल मार्कअप भाषा;[6][7] और
- एकीकृत सर्किट लेआउट के लिए जीडीएसआईआई।[8]
डेटा विनिमय भाषाएँ
डेटा इंटरचेंज (या एक्सचेंज) भाषा/प्रारूप एक ऐसी भाषा है जो डोमेन-स्वतंत्र है और किसी भी प्रकार के अनुशासन से डेटा के लिए उपयोग की जा सकती है।[9] वे मेटाडेटा के एन्कोडिंग का समर्थन करने के लिए मार्कअप और डिस्प्ले-ओरिएंटेड होने से विकसित हुए हैं जो सूचना के संरचनात्मक गुणों का वर्णन करता है।[10]
अभ्यास से पता चला है कि कुछ प्रकार की औपचारिक भाषाएं इस कार्य के लिए दूसरों की तुलना में उत्तम अनुकूल हैं, क्योंकि उनके विनिर्देश विशेष सॉफ़्टवेयर कार्यान्वयन आवश्यकताओं के अतिरिक्त एक औपचारिक प्रक्रिया द्वारा संचालित होते हैं। उदाहरण के लिए, एक्सएमएल एक मार्कअप भाषा है जिसे बोलियों (डोमेन-विशिष्ट उपभाषाओं की परिभाषा) के निर्माण को सक्षम करने के लिए डिज़ाइन किया गया था।[11] चूँकि, इसमें डोमेन-विशिष्ट शब्दकोश या तथ्य प्रकार सम्मिलित नहीं हैं। एक विश्वसनीय डेटा एक्सचेंज के लिए फायदेमंद मानक शब्दकोशों-टैक्सोनॉमी और टूल लाइब्रेरी जैसे पार्सर, स्कीमा सत्यापनकर्ता और परिवर्तन उपकरण की उपलब्धता है।
डेटा विनिमय के लिए प्रयुक्त लोकप्रिय भाषाएँ
निम्नलिखित कई डोमेन में डेटा विनिमय के लिए उपयोग की जाने वाली लोकप्रिय सामान्य भाषाओं की आंशिक सूची है।
नाम/संक्षिप्त रूप | स्कीमा | लचीला | अर्थपूर्ण सत्यापन | शब्दकोष | सूचना मॉडल | पर्यायवाची और समानार्थी | बोली लगाना | वेब मानक | Transformations | Lightweight | Human readable | Compatibility |
---|---|---|---|---|---|---|---|---|---|---|---|---|
आरडीएफ | Yes[1] | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Partial | सिमेंटिक वेब का सबसेट |
एक्सएमएल | Yes[2] | Yes | No | No | No | No | Yes | Yes | Yes | No | Yes | एसजीएमएल, एचटीएमएल का सबसेट |
एटम | Yes | Unknown | Unknown | Unknown | No | Unknown | Yes | Yes | Yes | No | No | एक्सएमएल बोली |
जे एस ओ एन | No | Unknown | Unknown | Unknown | No | Unknown | No | Yes | No | Yes | Yes | वाईएएमएल का सबसेट |
वाईएएमएल | No[3] | Unknown | Unknown | Unknown | No | Unknown | No | No | No[3] | Yes | Yes[4] | जेएस ओएन का सबसेट |
विद्रोह | Yes[7] | Yes | No | Yes | No | Yes | Yes | No | Yes[7] | Yes | Yes[5] | |
गेलिश | Yes | Yes | Yes | Yes[8] | No | Yes | Yes | आईएसओ | No | Yes | Partial[6] | एसक्यूएल, आरडीएफ/एक्सएमएल, OWL |
नामपद्धति
- स्कीमा - क्या भाषा की परिभाषा कंप्यूटर व्याख्यात्मक रूप में उपलब्ध है
- लचीला - क्या भाषा स्कीमा को संशोधित किए बिना शब्दार्थ अभिव्यक्ति क्षमताओं के विस्तार को सक्षम करती है
- सिमेंटिक सत्यापन - क्या भाषा की परिभाषा भाषा में अभिव्यक्तियों की शुद्धता के सिमेंटिक सत्यापन को सक्षम बनाती है
- डिक्शनरी-टैक्सोनॉमी - क्या भाषा में एक डिक्शनरी और इनहेरिटेंस के साथ अवधारणाओं का एक टैक्सोनॉमी (उपप्रकार-सुपरटाइप पदानुक्रम) सम्मिलित है
- पर्यायवाची और समनाम - क्या भाषा में भावों में पर्यायवाची और समानार्थी शब्द सम्मिलित हैं और उनका समर्थन करती है
- डायलेक्टिंग - क्या भाषा की परिभाषा कई प्राकृतिक भाषाओं या बोलियों में उपलब्ध है
- वेब या आईएसओ मानक - संगठन जो मानक के रूप में भाषा का समर्थन करता है
- परिवर्तन - क्या भाषा में अन्य मानकों का अनुवाद सम्मिलित है
- लाइटवेट - फुल वर्जन के अतिरिक्त लाइटवेट वर्जन भी उपलब्ध है या नहीं
- मानव-पठनीय - क्या भाषा में भाव मानव-पठनीय हैं (बिना प्रशिक्षण के मानव द्वारा पठनीय)[12]
- संगतता - भाषा का उपयोग करते समय किन अन्य उपकरणों का उपयोग करना संभव या आवश्यक है
टिप्पणियाँ:
- ^ RDF स्कीमा-लचीली भाषा है।
- ^ एक्सएमएल की स्कीमा में बहुत सीमित व्याकरण और शब्दावली है।
- ^ एक्सटेंशन के रूप में उपलब्ध है।
- ^ डिफ़ॉल्ट स्वरूप में, कॉम्पैक्ट सिंटैक्स नहीं।
- ^ वाक्य-विन्यास अधिक सरल है (भाषा को मानव-पठनीय होने के लिए डिज़ाइन किया गया था); बोलियों को डोमेन ज्ञान की आवश्यकता हो सकती है।
- ^ मानकीकृत तथ्य प्रकारों को मानकीकृत अंग्रेजी वाक्यांशों द्वारा दर्शाया जाता है, जिसकी व्याख्या और उपयोग के लिए कुछ प्रशिक्षण की आवश्यकता होती है।
- ^ रिबोल पार्स का उपयोग बोलियों को निर्दिष्ट करने, मान्य करने और रूपांतरित करने के लिए किया जाता है।
- ^ अंग्रेजी संस्करण में एक गेलिश इंग्लिश डिक्शनरी-टैक्सोनॉमी सम्मिलित है जिसमें मानकीकृत तथ्य प्रकार (= संबंधों के प्रकार) भी सम्मिलित हैं।
डेटा एक्सचेंज के लिए एक्सएमएल
वर्ल्ड वाइड वेब पर डेटा एक्सचेंज के लिए एक्सएमएल की लोकप्रियता के कई कारण हैं। सबसे पहले, यह पहले से उपस्तिथ मानक मानक सामान्यीकृत मार्कअप लैंग्वेज (एसजीएमएल) और हाइपरटेक्स्ट मार्कअप लैंग्वेज (एचटीएमएल) से निकटता से संबंधित है, और इन दो भाषाओं का समर्थन करने के लिए लिखे गए पार्सर को आसानी से एक्सएमएल का समर्थन करने के लिए भी बढ़ाया जा सकता है। उदाहरण के लिए, एक्सएचटीएमएल को एक ऐसे प्रारूप के रूप में परिभाषित किया गया है जो औपचारिक एक्सएमएल है, किन्तु अधिकांश (यदि सभी नहीं) एचटीएमएल पार्सर्स द्वारा सही ढंग से समझा जाता है।[11]
डेटा एक्सचेंज के लिए वाईएएमएल
वाईएएमएल एक ऐसी भाषा है जिसे मानव-पठनीय (और किसी भी मानक पाठ संपादक के साथ संपादित करना आसान होना) के लिए डिज़ाइन किया गया था। इसकी धारणा अधिकांशतः पुनर्संरचित पाठ या विकी सिंटैक्स के समान होती है, जो मानव और कंप्यूटर दोनों द्वारा पठनीय होने का भी प्रयास करती है। वाईएएमएल1.2 में एक आशुलिपि धारणा भी सम्मिलित है जो जेएसओएन के साथ संगत है, और इस तरह कोई भी जेएसओएन दस्तावेज़ भी मान्य वाईएएमएल है; चूंकि यह दूसरा विधि नहीं रखता है।[13]
डेटा एक्सचेंज के लिए आरईबीओएल
आरईबीओएल एक ऐसी भाषा है जिसे मानव-पठनीय और किसी भी मानक पाठ संपादक का उपयोग करके संपादित करने में आसान बनाया गया है। इसे प्राप्त करने के लिए यह न्यूनतम विराम चिह्न और डेटाटाइप्स के एक समृद्ध सेट के साथ एक सरल फ्री-फॉर्म सिंटैक्स का उपयोग करता है। आरईबीओएल डेटाटाइप जैसे यूआरएल, ईमेल, दिनांक और समय मान, टुपल्स, स्ट्रिंग्स, टैग आदि सामान्य मानकों का सम्मान करते हैं। आरईबीओएल को किसी भी अतिरिक्त मेटा-लैंग्वेज की आवश्यकता नहीं होने के लिए डिज़ाइन किया गया है, जिसे मेटासर्कुलर फैशन में डिज़ाइन किया जा रहा है। भाषा की मेटासर्कुलरिटी यही कारण है कि, उदाहरण के लिए, आरईबीओएल बोलियों की परिभाषाओं और परिवर्तनों के लिए उपयोग की जाने वाली पार्स बोली (विशेष रूप से नहीं) भी आरईबीओएल की एक बोली है।[14] आरईबीओएल का उपयोग जेएसओएन के प्रेरणा स्रोत के रूप में किया गया था।[15]
डेटा विनिमय के लिए गेलिश
गेलिश अंग्रेजी प्राकृतिक अंग्रेजी का एक औपचारिक उपसमुच्चय है, जिसमें एक सरल व्याकरण और एक बड़ा विस्तारणीय अंग्रेजी शब्दकोश सम्मिलित है। पदानुक्रम (एक वर्गीकरण), जो ज्ञान और आवश्यकताओं की विरासत का समर्थन करता है। डिक्शनरी-टैक्सोनॉमी में मानकीकृत तथ्य प्रकार भी सम्मिलित हैं (जिन्हें संबंध प्रकार भी कहा जाता है)। शर्तों और संबंध प्रकारों का एक साथ तथ्यों, ज्ञान, आवश्यकताओं और अन्य सूचनाओं की अभिव्यक्ति बनाने और व्याख्या करने के लिए उपयोग किया जा सकता है। गेलिश का उपयोग एसक्यूएल, आरडीएफ/एक्सएमएल, वेब ओन्टोलॉजी भाषा और विभिन्न अन्य मेटा-भाषाओं के संयोजन में किया जा सकता है। गेलिश मानक आईएसओ10303-221 (एपी221) और आईएसओ15926 का संयोजन है।[16]
यह भी देखें
- परमाणु (फ़ाइल स्वरूप)
- डेटा स्थानांतरण
- लाइटवेट मार्कअप भाषा
- आरएसएस
- अल्पविराम से अलग किए गए मान (सीएसवी)
संदर्भ
- ↑ A. Doan, A. Halevy, and Z. Ives. "Principles of data integration", Morgan Kaufmann,s 2012 pp. 276
- ↑ Arenas, M.; Barceló, P.; Libkin, L.; Murlak, F. (2014). डेटा एक्सचेंज की नींव. Cambridge University Press. pp. 1–11. ISBN 9781107016163. Retrieved 25 May 2018.
- ↑ Clancy, J.J. (2012). "Chapter 1: Directions for Engineering Data Exchange for Computer Aided Design and Manufacturing". In Wang, P.C.C. (ed.). Advances in CAD/CAM: Case Studies. Springer Science & Business Media. pp. 1–36. ISBN 9781461328193. Retrieved 25 May 2018.
- ↑ Kalish, C.E.; Mayer, M.F. (November 1981). "DIF: A format for data exchange between application programs". BYTE Magazine: 174.
- ↑ "ओडीएफ के बारे में". OpenDoc Society. Retrieved 25 May 2018.
- ↑ Zhu, X. (2016). GIS for Environmental Applications: A practical approach. Routledge. ISBN 9781134094509. Retrieved 25 May 2018.
- ↑ "केएमएल संदर्भ". Google Inc. 21 January 2016. Retrieved 25 May 2018.
- ↑ Martins, R.M.F.; Lourenço, N.C.C.; Horta, N.C.G. (2012). लेजेन II के साथ एनालॉग आईसी लेआउट बनाना. Springer Science & Business Media. p. 34. ISBN 9783642331466. Retrieved 25 May 2018.
- ↑ Billingsley, F.C. (1988). "सामान्य डेटा इंटरचेंज भाषा". ISPRS Archives. 27 (B3): 80–91. Retrieved 25 May 2018.
The transformation routines will constitute a language and syntax which must be discipline and machine independent.
- ↑ Nurseitov, N.; Paulson, M.; Reynolds, R.; Izurieta, C. (2009). "Comparison of JSON and XML Data Interchange Formats: A Case Study". Scenario: 157–162.
- ↑ 11.0 11.1 Lewis, J.; Moscovitz, M. (2009). उन्नत सीएसएस. APress. pp. 5–6. ISBN 9781430219323. Retrieved 25 May 2018.
- ↑ मानव "पठनीय मानव". Oxford Dictionaries. Oxford University Press. Archived from मानव the original on May 30, 2018. Retrieved 29 May 2018.
{{cite web}}
: Check|archive-url=
value (help); Check|url=
value (help) - ↑ Bendersky, E. (22 November 2008). "JSON YAML है, लेकिन YAML JSON नहीं है". Eli Bendersky's website. Retrieved 29 May 2018.
- ↑ Sassenrath, C. (2000). "REBOL स्क्रिप्टिंग लैंग्वेज". Dr. Dobb's Journal. 25 (314): 64–8. Retrieved 29 May 2018.
- ↑ Sassenrath, C. (13 December 2012). "JSON और REBOL पर". REBOL.com. Retrieved 29 May 2018.
- ↑ van Renssen, A.; Vermaas, P.E.; Zwart, S.D. (2007). "ए टैक्सोनॉमी ऑफ फंक्शंस इन गेलिश इंग्लिश". Proceedings from the International Conference on Engineering Design 2007: DS42_P_230. Retrieved 29 May 2018.