मशीन-पठनीय माध्यम और डेटा: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Medium capable of storing data in a format readable by a machine}} Image:EAN-13-ISBN-13.svg|thumb|ISBN को [[ यूरोपीय अनुच्छ...")
 
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{short description|Medium capable of storing data in a format readable by a machine}}
{{short description|Medium capable of storing data in a format readable by a machine}}
[[Image:EAN-13-ISBN-13.svg|thumb|ISBN को [[ यूरोपीय अनुच्छेद संख्या ]] के रूप में दर्शाया गया है| EAN-13 बार कोड मशीन-पठनीय बार और मानव-पठनीय अंक दोनों दिखा रहा है]][[संचार]] और [[ कम्प्यूटिंग ]] में एक मशीन-पठनीय माध्यम, या कंप्यूटर-पठनीय माध्यम, एक [[रिकॉर्डिंग माध्यम]] है जो [[डेटा (कंप्यूटिंग)]] को एक डिजिटल कंप्यूटर या मैकेनिकल डिवाइस (मानव पठनीय के बजाय) द्वारा आसानी से पढ़ने योग्य प्रारूप में संग्रहीत करने में सक्षम है।
[[Image:EAN-13-ISBN-13.svg|thumb| ईएएन-13 मशीन-पठनीय बारकोड और मानव-पठनीय अंक दोनों दिखा रहा है। ]][[संचार]] और [[ कम्प्यूटिंग |कम्प्यूटिंग]] में '''मशीन-पठनीय माध्यम''' या '''कंप्यूटर-पठनीय माध्यम''' एक डिजिटल कंप्यूटर या यांत्रिक उपकरण (मानव पठनीय के अतिरिक्त) द्वारा आसानी से पठनीय प्रारूप में [[डेटा (कंप्यूटिंग)|डेटा]] संग्रहीत करने का सक्षम माध्यम है इस परिणाम को मशीन-पठनीय डेटा या कंप्यूटर-पठनीय डेटा कहा जाता है।
परिणाम को मशीन-पठनीय डेटा या कंप्यूटर-पठनीय डेटा कहा जाता है।
== डेटा ==
मशीन-पठनीय डेटा बनाने का प्रयास 1960 के दशक की प्रारम्भ में हुआ। उसी समय जब मशीन-पठनीय और प्राकृतिक-भाषा प्रसंस्करण में मौलिक विकास (जैसे वीज़ेनबाम की एलिज़ा) प्रारम्भ हो रहे थे तब लोग मशीन-पठनीय कार्यक्षमता की सफलता की संभावना कर रहे थे और मशीन-पठनीय दस्तावेज़ बनाने का प्रयास कर रहे थे।<ref>{{Cite web|url=http://opendatahandbook.org/glossary/en/terms/machine-readable/|title=मशीन पठनीय|website=opendatahandbook.org|access-date=2019-07-22}}</ref> ऐसा ही एक उदाहरण संगीतकार नैन्सी बी. रीच का 1966 में संगीतकार विलियम [[जे सिडेमैन]] के कृतियों की मशीन-पठनीय सूची बनाना था।


== डेटा ==
संयुक्त राज्य अमेरिका में 14 जनवरी 2019 का सरकारी डेटा अधिनियम मशीन-पठनीय डेटा को "एक ऐसे प्रारूप में डेटा के रूप में परिभाषित करता है जिसे मानव हस्तक्षेप के अतिरिक्त कंप्यूटर द्वारा आसानी से संसाधित किया जा सकता है जबकि यह सुनिश्चित करता है कि किसी शब्दार्थ अर्थ न समाप्त हो" अधिनियम अमेरिकी संघीय संस्थाओं को इस प्रकार से सार्वजनिक डेटा प्रकाशित करने का निर्देश देता है।<ref>{{Cite web|url=http://stratml.us/references/HR4174.htm#Agency_Responsibilities|title=HR4174|website=stratml.us}}</ref> यह सुनिश्चित करते हुए कि "संस्था की कोई भी सार्वजनिक डेटा संपत्ति मशीन-पठनीय है।"<ref>{{Cite web|url=http://stratml.us/references/HR4174.htm#machine-readabilty|title=HR4174|website=stratml.us}}</ref>
मशीन-पठनीय डेटा [[संरचित डेटा]] होना चाहिए।<ref>{{Cite web|url=http://opendatahandbook.org/glossary/en/terms/machine-readable/|title=मशीन पठनीय|website=opendatahandbook.org|access-date=2019-07-22}}</ref>
मशीन-पठनीय डेटा बनाने का प्रयास 1960 के दशक की शुरुआत में हुआ। उसी समय जब मशीन-पठन और प्राकृतिक-भाषा प्रसंस्करण में मौलिक विकास जारी हो रहे थे (जैसे जोसेफ वीज़ेनबाम | वीज़ेनबाम का [[एलिजा]]), लोग मशीन-पठनीय कार्यक्षमता की सफलता की आशा कर रहे थे और मशीन-पठनीय दस्तावेज़ बनाने का प्रयास कर रहे थे। ऐसा ही एक उदाहरण था संगीतकार नैन्सी बी. रीच का 1966 में संगीतकार [[जे सिडेमैन]] की कृतियों का मशीन-पठनीय कैटलॉग बनाना।


संयुक्त राज्य अमेरिका में, 14 जनवरी 2019 का ओपेन गवर्नमेंट डेटा एक्ट मशीन-पठनीय डेटा को एक ऐसे प्रारूप में डेटा के रूप में परिभाषित करता है जिसे मानव हस्तक्षेप के बिना कंप्यूटर द्वारा आसानी से संसाधित किया जा सकता है, जबकि यह सुनिश्चित करता है कि कोई शब्दार्थ अर्थ खो न जाए। कानून अमेरिकी संघीय एजेंसियों को इस तरह से सार्वजनिक डेटा प्रकाशित करने का निर्देश देता है,<ref>{{Cite web|url=http://stratml.us/references/HR4174.htm#Agency_Responsibilities|title=HR4174|website=stratml.us}}</ref> यह सुनिश्चित करना कि एजेंसी की कोई भी सार्वजनिक डेटा संपत्ति मशीन-पठनीय है।<ref>{{Cite web|url=http://stratml.us/references/HR4174.htm#machine-readabilty|title=HR4174|website=stratml.us}}</ref>
मशीन-पठनीय डेटा को दो समूहों में वर्गीकृत किया जा सकता है: मानव-पठनीय डेटा जिसे चिह्नित किया गया है ताकि इसे मशीनों द्वारा भी पढ़ा जा सके (जैसे माइक्रोफ़ॉर्मेट, आरडीएफए, [[एचटीएमएल]]) और मुख्य रूप से मशीनों द्वारा प्रसंस्करण के लिए डेटा फ़ाइल प्रारूप (सीएसवी, आरडीएफ, [[XML|एक्सएमएल]], [[JSON|जेएसओएन]]) ये प्रारूप केवल मशीन द्वारा पढ़े जा सकते हैं यदि उनमें निहित डेटा औपचारिक रूप से संरचित है तो संरचित स्प्रेडशीट से सीएसवी फ़ाइल परिवर्तित करना परिभाषा को पूर्ण नहीं करता है।
मशीन-पठनीय डेटा को दो समूहों में वर्गीकृत किया जा सकता है: मानव-पठनीय डेटा जो मार्कअप भाषा है ताकि इसे मशीनों द्वारा भी पढ़ा जा सके (जैसे [[microformat]], [[आरडीएफ]]ए, [[एचटीएमएल]]), और डेटा फ़ाइल प्रारूप मुख्य रूप से मशीनों द्वारा प्रसंस्करण के लिए अभिप्रेत है (कॉमा- अलग किए गए मान, संसाधन विवरण फ़्रेमवर्क, [[XML]], [[JSON]]). ये प्रारूप केवल मशीन द्वारा पढ़े जा सकते हैं यदि उनमें निहित डेटा औपचारिक रूप से संरचित है; खराब संरचित स्प्रेडशीट से CSV फ़ाइल निर्यात करना परिभाषा को पूरा नहीं करता है।


मशीन पठनीय डिजिटल रूप से सुलभ का पर्याय नहीं है। एक डिजिटल रूप से सुलभ दस्तावेज़ ऑनलाइन हो सकता है, जिससे कंप्यूटर के माध्यम से मनुष्यों का उपयोग करना आसान हो जाता है, लेकिन मशीन-पठनीय नहीं होने पर इसकी सामग्री को कंप्यूटर प्रोग्रामिंग लॉजिक के माध्यम से निकालना, बदलना और संसाधित करना बहुत कठिन होता है।<ref>{{cite web|url=https://www.data.gov/developers/blog/primer-machine-readability-online-documents-and-data|title=ऑनलाइन दस्तावेज़ों और डेटा के लिए मशीन पठनीयता पर एक प्राइमर|date=2012-09-24|work=Data.gov|access-date=2015-02-27}}
मशीन-पठनीय डिजिटल रूप से सुलभ का पर्याय नहीं है एक डिजिटल रूप से सुलभ दस्तावेज़ ऑनलाइन हो सकते है जिससे कंप्यूटर के माध्यम से मनुष्यों का उपयोग करना आसान हो जाता है लेकिन मशीन-पठनीय नहीं होने पर इसके डेटा को कंप्यूटर प्रोग्रामिंग एल्गोरिथम के माध्यम से निकालना, परिवर्तित करना और संसाधित करना बहुत कठिन होता है।<ref>{{cite web|url=https://www.data.gov/developers/blog/primer-machine-readability-online-documents-and-data|title=ऑनलाइन दस्तावेज़ों और डेटा के लिए मशीन पठनीयता पर एक प्राइमर|date=2012-09-24|work=Data.gov|access-date=2015-02-27}}
</ref>
</ref>
[[एक्सटेंसिबल मार्कअप लैंग्वेज]] (XML) को मानव- और मशीन-पठनीय दोनों के लिए डिज़ाइन किया गया है, और एक्सटेंसिबल स्टाइलशीट लैंग्वेज ट्रांसफ़ॉर्मेशन (XSLT) का उपयोग मानव पठनीयता के लिए डेटा की प्रस्तुति को बेहतर बनाने के लिए किया जाता है। उदाहरण के लिए, XSLT का उपयोग XML को [[ संवहन दस्तावेज़ स्वरूप ]] (PDF) में स्वचालित रूप से प्रस्तुत करने के लिए किया जा सकता है। मशीन-पठनीय डेटा को मानव-पठनीयता के लिए स्वचालित रूप से रूपांतरित किया जा सकता है, लेकिन आम तौर पर बोलना, उल्टा सच नहीं है।
सरकारी प्रदर्शन और परिणाम अधिनियम (जीपीआरए) आधुनिकीकरण अधिनियम के कार्यान्वयन के प्रयोजनों के लिए, प्रबंधन और बजट कार्यालय (ओएमबी) मशीन पठनीय प्रारूप को निम्नानुसार परिभाषित करता है: मानक कंप्यूटर भाषा में प्रारूप (अंग्रेजी पाठ नहीं) जिसे स्वचालित रूप से पढ़ा जा सकता है एक वेब ब्राउज़र या कंप्यूटर सिस्टम। (जैसे; एक्सएमएल)। पारंपरिक वर्ड प्रोसेसिंग दस्तावेज़ और पोर्टेबल दस्तावेज़ स्वरूप ([[पीडीएफ]]) फ़ाइलें मनुष्यों द्वारा आसानी से पढ़ी जाती हैं लेकिन आमतौर पर मशीनों के लिए व्याख्या करना कठिन होता है। अन्य प्रारूप जैसे एक्स्टेंसिबल मार्कअप लैंग्वेज (XML), (JSON), या हेडर कॉलम वाली स्प्रेडशीट जिन्हें अल्पविराम से अलग किए गए मान (CSV) के रूप में निर्यात किया जा सकता है, मशीन पठनीय प्रारूप हैं। जैसा कि HTML एक संरचनात्मक मार्कअप भाषा है, दस्तावेज़ के कुछ हिस्सों को सावधानी से लेबल करना, कंप्यूटर सामग्री, रूपरेखा, साहित्य खोज ग्रंथ सूची, आदि की तालिकाओं को इकट्ठा करने के लिए दस्तावेज़ घटकों को इकट्ठा करने में सक्षम हैं। पारंपरिक वर्ड प्रोसेसिंग दस्तावेज़ों और अन्य स्वरूपों को मशीन पठनीय बनाना संभव है। लेकिन दस्तावेजों में उन्नत संरचनात्मक तत्व शामिल होने चाहिए।<ref>[https://www.whitehouse.gov/wp-content/uploads/2018/06/a11.pdf OMB Circular A-11, Part 6] {{webarchive|url=https://web.archive.org/web/20200422172616/https://www.whitehouse.gov/wp-content/uploads/2018/06/a11.pdf |date=2020-04-22 }}, Preparation, Submission, and Execution of the Budget</ref>


[[एक्सटेंसिबल मार्कअप लैंग्वेज|एक्सटेंसिबल मार्कअप भाषा]] (एक्सएमएल) को मानव और मशीन-पठनीय दोनों के लिए डिज़ाइन किया गया है और एक्सटेंसिबल स्टाइलशीट भाषा रूपान्तरण (एक्सएसएलटी) का उपयोग मानव पठनीयता के लिए डेटा की प्रस्तुति को अपेक्षाकृत अच्छा बनाने के लिए किया जाता है उदाहरण के लिए, एक्सएसएलटी का उपयोग एक्सएमएल को [[ संवहन दस्तावेज़ स्वरूप |पोर्टेबल दस्तावेज़ स्वरूप]] (पीडीएफ) में स्वचालित रूप से प्रस्तुत करने के लिए किया जा सकता है मशीन-पठनीय डेटा को मानव-पठनीयता के लिए स्वचालित रूप से रूपांतरित किया जा सकता है लेकिन सामान्यतः यह सच नहीं होता है।


सरकारी प्रदर्शन और परिणाम अधिनियम (जीपीआरए) आधुनिकीकरण अधिनियम के कार्यान्वयन के प्रयोजनों के लिए प्रबंधन और बजट कार्यालय (ओएमबी) "मशीन पठनीय प्रारूप" को निम्नानुसार परिभाषित करता है: "मानक कंप्यूटर भाषा में प्रारूप (अंग्रेजी टेक्स्ट मे नहीं) एक वेब ब्राउज़र या कंप्यूटर सिस्टम द्वारा स्वचालित (जैसे- एक्सएमएल) रूप से पढ़ें जाते है पारंपरिक वर्ड-प्रोसेसिंग दस्तावेज़ और पोर्टेबल दस्तावेज़ प्रारूप ([[पीडीएफ]]) फ़ाइलें मनुष्यों द्वारा आसानी से पढ़ी जाती हैं लेकिन सामान्यतः मशीनों की व्याख्या करना कठिन होता है अन्य प्रारूप जैसे एक्स्टेंसिबल मार्कअप भाषा (पीडीएफ) एक्सएमएल, जेएसओएन या हेडर कॉलम वाली स्प्रेडशीट जिन्हें अल्पविराम से अलग किए गए मान (सीएसवी) के रूप को परिवर्तित किया जा सकता है मशीन पठनीय प्रारूप हैं। चूंकि एचटीएमएल एक संरचनात्मक मार्कअप भाषा है जिसके दस्तावेज़ के कुछ भागों को सावधानीपूर्वक वर्गीकृत करना, कंप्यूटर दस्तावेज़ घटकों को एकत्र करने में सक्षम हैं और डेटा को साहित्य खोज ग्रंथ सूची आदि की तालिकाओं को संग्रहीत करने के लिए पारंपरिक शब्द संसाधन दस्तावेजों और अन्य प्रारूपों को मशीन पठनीय बनाना संभव होता है लेकिन दस्तावेजों में उन्नत संरचनात्मक डेटा सम्मिलित होना आवश्यक होता है।<ref>[https://www.whitehouse.gov/wp-content/uploads/2018/06/a11.pdf OMB Circular A-11, Part 6] {{webarchive|url=https://web.archive.org/web/20200422172616/https://www.whitehouse.gov/wp-content/uploads/2018/06/a11.pdf |date=2020-04-22 }}, Preparation, Submission, and Execution of the Budget</ref>
==मीडिया==
==मीडिया==
मशीन-पठनीय मीडिया के उदाहरणों में चुंबकीय मीडिया जैसे [[ डिस्क भंडारण ]], कार्ड, [[चुंबकीय टेप]] और [[चुंबकीय ड्रम]], [[छिद्रित कार्ड]] और पेपर टेप, [[ऑप्टिकल डिस्क]], [[बारकोड]] और [[चुंबकीय स्याही वर्ण पहचान]] शामिल हैं।
मशीन-पठनीय मीडिया के उदाहरणों में चुंबकीय मीडिया जैसे [[ डिस्क भंडारण |डिस्क भंडारण]], कार्ड, [[चुंबकीय टेप]] और [[चुंबकीय ड्रम]], [[छिद्रित कार्ड|पंच कार्ड]] और पेपर टेप, [[ऑप्टिकल डिस्क|प्रकाशीय]] [[ऑप्टिकल डिस्क|डिस्क]], [[बारकोड]] और [[चुंबकीय स्याही वर्ण पहचान|चुंबकीय स्याही संप्रतीक पहचान (एमआईसीआर)]] सम्मिलित हैं।


सामान्य मशीन-पठनीय तकनीकों में चुंबकीय रिकॉर्डिंग, प्रसंस्करण [[तरंग]]ों और बारकोड शामिल हैं। [[ऑप्टिकल कैरेक्टर मान्यता]] (OCR) का उपयोग मशीनों को मनुष्यों के लिए उपलब्ध जानकारी को पढ़ने में सक्षम बनाने के लिए किया जा सकता है। किसी भी प्रकार की ऊर्जा द्वारा पुनर्प्राप्त की जाने वाली कोई भी जानकारी मशीन-पठनीय हो सकती है।
सामान्य मशीन-पठनीय तकनीकों में चुंबकीय रिकॉर्डिंग, प्रसंस्करण तरंग और बारकोड सम्मिलित हैं [[ऑप्टिकल कैरेक्टर मान्यता|प्रकाशीय]] [[ऑप्टिकल कैरेक्टर मान्यता|संप्रतीक पहचान]] (ओसीआर) का उपयोग मशीनों को मनुष्यों के लिए उपलब्ध जानकारी को पढ़ने में सक्षम बनाने के लिए किया जा सकता है किसी भी प्रकार की ऊर्जा द्वारा पुनर्प्राप्त की जाने वाली कोई भी जानकारी मशीन-पठनीय हो सकती है।


उदाहरणों में शामिल:
उदाहरणों में निम्नलिखित सम्मिलित है:


* ध्वनिकी
* ध्वनि विज्ञान
*[[रासायनिक]]
*[[रासायनिक]]
** [[प्रकाश रसायन]]
** [[प्रकाश रसायन]]
*विद्युत
*विद्युत
** [[सेमीकंडक्टर]] वाष्पशील मेमोरी [[रैंडम एक्सेस मेमोरी]] में उपयोग किया जाता है
** [[सेमीकंडक्टर|अर्धचालक]] को [[रैंडम एक्सेस मेमोरी]] में उपयोग किया जाता है।
** [[एनवीआरएएम]] में उपयोग किया जाने वाला [[फ्लोटिंग-गेट ट्रांजिस्टर]] | गैर-वाष्पशील [[मेमोरी कार्ड]]
** [[फ्लोटिंग-गेट ट्रांजिस्टर]] का उपयोग [[रैंडम एक्सेस मेमोरी|रैंडम एक्सेस]] [[मेमोरी कार्ड]] में किया जाता है।
** [[ट्रांसमिशन (दूरसंचार)]]
** [[ट्रांसमिशन (दूरसंचार)]]
* [[चुंबकीय भंडारण]]
* [[चुंबकीय भंडारण]]
* [[शास्त्रीय यांत्रिकी]]
* [[शास्त्रीय यांत्रिकी|यांत्रिकी]]
** टिन्स और स्विंस
** टिन्स और स्विंस
*** छिद्रित कार्ड
*** पंच कार्ड
*** [[कागज का टेप]]
*** [[कागज का टेप|पेपर टेप]]
**** [[संगीत रोल]]
**** [[संगीत रोल]]
*** संगीत बॉक्स सिलेंडर या डिस्क
*** संगीत बॉक्स सिलेंडर या डिस्क
** ग्रूव्स ([[ ऑडियो भंडारण ]] भी देखें)
** ग्रूव ([[ ऑडियो भंडारण |ऑडियो भंडारण]] भी देखें)
*** [[फोनोग्राफ सिलेंडर]]
*** [[फोनोग्राफ सिलेंडर]]
*** [[ग्रामोफोन रिकॉर्ड]]
*** [[ग्रामोफोन रिकॉर्ड]]
*** [[ तानाशाही ]] (प्लास्टिक बेल्ट पर नाली)
*** [[ तानाशाही |डिक्टाबेल्ट]] (प्लास्टिक ग्रूव बेल्ट)
*** समाई [[विद्युतीय]] डिस्क
*** [[विद्युतीय]] डिस्क
* [[प्रकाशिकी]]
* [[प्रकाशिकी]]
**[[ऑप्टिकल भंडारण]]
**[[ऑप्टिकल भंडारण|प्रकाशीय भंडारण]]
*[[thermodynamic]]
*[[thermodynamic|ऊष्मागतिकी]]


== अनुप्रयोग ==
== अनुप्रयोग ==
Line 62: Line 59:


== यह भी देखें ==
== यह भी देखें ==
* [[कागज डेटा भंडारण]]
* [[कागज डेटा भंडारण|डेटा भंडारण]]
* [[सममित चरण रिकॉर्डिंग]]
* [[सममित चरण रिकॉर्डिंग|सममितीय फेज़ रिकॉर्डिंग]]
* [[मुक्त डेटा]]
* [[मुक्त डेटा]]
* जुड़ा हुआ डेटा
* संबद्ध डेटा
* [[मानव-पठनीय माध्यम और डेटा]]
* [[मानव-पठनीय माध्यम और डेटा]]
* [[सेमांटिक वेब]]
* [[सेमांटिक वेब|शब्दार्थ तरंग विज्ञान]]
* मशीन-पठनीय पोस्टल मार्किंग (बहुविकल्पी) | मशीन-पठनीय पोस्टल मार्किंग
* मशीन-पठनीय डाक संख्या
{{wiktionary|machine-readable}}
{{wiktionary|machine-readable}}


Line 75: Line 72:
{{FS1037C}}
{{FS1037C}}


{{DEFAULTSORT:Machine-Readable Medium}}[[Category: कंप्यूटिंग शब्दावली]] [[Category: भंडारण मीडिया]] [[Category: ऑप्टिकल कैरेक्टर मान्यता]]
{{DEFAULTSORT:Machine-Readable Medium}}  




{{compu-storage-stub}}
{{compu-storage-stub}}


 
[[Category:All stub articles|Machine-Readable Medium]]
 
[[Category:Articles with broken excerpts|Machine-Readable Medium]]
[[Category: Machine Translated Page]]
[[Category:Computer storage stubs|Machine-Readable Medium]]
[[Category:Created On 25/04/2023]]
[[Category:Created On 25/04/2023|Machine-Readable Medium]]
[[Category:Lua-based templates|Machine-Readable Medium]]
[[Category:Machine Translated Page|Machine-Readable Medium]]
[[Category:Pages with script errors|Machine-Readable Medium]]
[[Category:Templates Vigyan Ready|Machine-Readable Medium]]
[[Category:Templates that add a tracking category|Machine-Readable Medium]]
[[Category:Templates that generate short descriptions|Machine-Readable Medium]]
[[Category:Templates using TemplateData|Machine-Readable Medium]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia articles incorporating text from the Federal Standard 1037C|मशीन-पठनीय माध्यम और डेटा]]
[[Category:Wikipedia fully protected templates|Excerpt]]
[[Category:Wikipedia page-section templates|Machine-Readable Medium]]
[[Category:ऑप्टिकल कैरेक्टर मान्यता|Machine-Readable Medium]]
[[Category:कंप्यूटिंग शब्दावली|Machine-Readable Medium]]
[[Category:भंडारण मीडिया|Machine-Readable Medium]]

Latest revision as of 11:43, 3 May 2023

ईएएन-13 मशीन-पठनीय बारकोड और मानव-पठनीय अंक दोनों दिखा रहा है।

संचार और कम्प्यूटिंग में मशीन-पठनीय माध्यम या कंप्यूटर-पठनीय माध्यम एक डिजिटल कंप्यूटर या यांत्रिक उपकरण (मानव पठनीय के अतिरिक्त) द्वारा आसानी से पठनीय प्रारूप में डेटा संग्रहीत करने का सक्षम माध्यम है इस परिणाम को मशीन-पठनीय डेटा या कंप्यूटर-पठनीय डेटा कहा जाता है।

डेटा

मशीन-पठनीय डेटा बनाने का प्रयास 1960 के दशक की प्रारम्भ में हुआ। उसी समय जब मशीन-पठनीय और प्राकृतिक-भाषा प्रसंस्करण में मौलिक विकास (जैसे वीज़ेनबाम की एलिज़ा) प्रारम्भ हो रहे थे तब लोग मशीन-पठनीय कार्यक्षमता की सफलता की संभावना कर रहे थे और मशीन-पठनीय दस्तावेज़ बनाने का प्रयास कर रहे थे।[1] ऐसा ही एक उदाहरण संगीतकार नैन्सी बी. रीच का 1966 में संगीतकार विलियम जे सिडेमैन के कृतियों की मशीन-पठनीय सूची बनाना था।

संयुक्त राज्य अमेरिका में 14 जनवरी 2019 का सरकारी डेटा अधिनियम मशीन-पठनीय डेटा को "एक ऐसे प्रारूप में डेटा के रूप में परिभाषित करता है जिसे मानव हस्तक्षेप के अतिरिक्त कंप्यूटर द्वारा आसानी से संसाधित किया जा सकता है जबकि यह सुनिश्चित करता है कि किसी शब्दार्थ अर्थ न समाप्त हो" अधिनियम अमेरिकी संघीय संस्थाओं को इस प्रकार से सार्वजनिक डेटा प्रकाशित करने का निर्देश देता है।[2] यह सुनिश्चित करते हुए कि "संस्था की कोई भी सार्वजनिक डेटा संपत्ति मशीन-पठनीय है।"[3]

मशीन-पठनीय डेटा को दो समूहों में वर्गीकृत किया जा सकता है: मानव-पठनीय डेटा जिसे चिह्नित किया गया है ताकि इसे मशीनों द्वारा भी पढ़ा जा सके (जैसे माइक्रोफ़ॉर्मेट, आरडीएफए, एचटीएमएल) और मुख्य रूप से मशीनों द्वारा प्रसंस्करण के लिए डेटा फ़ाइल प्रारूप (सीएसवी, आरडीएफ, एक्सएमएल, जेएसओएन) ये प्रारूप केवल मशीन द्वारा पढ़े जा सकते हैं यदि उनमें निहित डेटा औपचारिक रूप से संरचित है तो संरचित स्प्रेडशीट से सीएसवी फ़ाइल परिवर्तित करना परिभाषा को पूर्ण नहीं करता है।

मशीन-पठनीय डिजिटल रूप से सुलभ का पर्याय नहीं है एक डिजिटल रूप से सुलभ दस्तावेज़ ऑनलाइन हो सकते है जिससे कंप्यूटर के माध्यम से मनुष्यों का उपयोग करना आसान हो जाता है लेकिन मशीन-पठनीय नहीं होने पर इसके डेटा को कंप्यूटर प्रोग्रामिंग एल्गोरिथम के माध्यम से निकालना, परिवर्तित करना और संसाधित करना बहुत कठिन होता है।[4]

एक्सटेंसिबल मार्कअप भाषा (एक्सएमएल) को मानव और मशीन-पठनीय दोनों के लिए डिज़ाइन किया गया है और एक्सटेंसिबल स्टाइलशीट भाषा रूपान्तरण (एक्सएसएलटी) का उपयोग मानव पठनीयता के लिए डेटा की प्रस्तुति को अपेक्षाकृत अच्छा बनाने के लिए किया जाता है उदाहरण के लिए, एक्सएसएलटी का उपयोग एक्सएमएल को पोर्टेबल दस्तावेज़ स्वरूप (पीडीएफ) में स्वचालित रूप से प्रस्तुत करने के लिए किया जा सकता है मशीन-पठनीय डेटा को मानव-पठनीयता के लिए स्वचालित रूप से रूपांतरित किया जा सकता है लेकिन सामान्यतः यह सच नहीं होता है।

सरकारी प्रदर्शन और परिणाम अधिनियम (जीपीआरए) आधुनिकीकरण अधिनियम के कार्यान्वयन के प्रयोजनों के लिए प्रबंधन और बजट कार्यालय (ओएमबी) "मशीन पठनीय प्रारूप" को निम्नानुसार परिभाषित करता है: "मानक कंप्यूटर भाषा में प्रारूप (अंग्रेजी टेक्स्ट मे नहीं) एक वेब ब्राउज़र या कंप्यूटर सिस्टम द्वारा स्वचालित (जैसे- एक्सएमएल) रूप से पढ़ें जाते है पारंपरिक वर्ड-प्रोसेसिंग दस्तावेज़ और पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) फ़ाइलें मनुष्यों द्वारा आसानी से पढ़ी जाती हैं लेकिन सामान्यतः मशीनों की व्याख्या करना कठिन होता है अन्य प्रारूप जैसे एक्स्टेंसिबल मार्कअप भाषा (पीडीएफ) एक्सएमएल, जेएसओएन या हेडर कॉलम वाली स्प्रेडशीट जिन्हें अल्पविराम से अलग किए गए मान (सीएसवी) के रूप को परिवर्तित किया जा सकता है मशीन पठनीय प्रारूप हैं। चूंकि एचटीएमएल एक संरचनात्मक मार्कअप भाषा है जिसके दस्तावेज़ के कुछ भागों को सावधानीपूर्वक वर्गीकृत करना, कंप्यूटर दस्तावेज़ घटकों को एकत्र करने में सक्षम हैं और डेटा को साहित्य खोज ग्रंथ सूची आदि की तालिकाओं को संग्रहीत करने के लिए पारंपरिक शब्द संसाधन दस्तावेजों और अन्य प्रारूपों को मशीन पठनीय बनाना संभव होता है लेकिन दस्तावेजों में उन्नत संरचनात्मक डेटा सम्मिलित होना आवश्यक होता है।[5]

मीडिया

मशीन-पठनीय मीडिया के उदाहरणों में चुंबकीय मीडिया जैसे डिस्क भंडारण, कार्ड, चुंबकीय टेप और चुंबकीय ड्रम, पंच कार्ड और पेपर टेप, प्रकाशीय डिस्क, बारकोड और चुंबकीय स्याही संप्रतीक पहचान (एमआईसीआर) सम्मिलित हैं।

सामान्य मशीन-पठनीय तकनीकों में चुंबकीय रिकॉर्डिंग, प्रसंस्करण तरंग और बारकोड सम्मिलित हैं प्रकाशीय संप्रतीक पहचान (ओसीआर) का उपयोग मशीनों को मनुष्यों के लिए उपलब्ध जानकारी को पढ़ने में सक्षम बनाने के लिए किया जा सकता है किसी भी प्रकार की ऊर्जा द्वारा पुनर्प्राप्त की जाने वाली कोई भी जानकारी मशीन-पठनीय हो सकती है।

उदाहरणों में निम्नलिखित सम्मिलित है:

अनुप्रयोग

दस्तावेज़

Page 'Machine-readable document' not found

कैटलॉग

Page 'Machine-readable cataloging' not found

शब्दकोश

Page 'Machine-readable dictionary' not found

पासपोर्ट

Page 'Machine-readable passport' not found

यह भी देखें

संदर्भ

  1. "मशीन पठनीय". opendatahandbook.org. Retrieved 2019-07-22.
  2. "HR4174". stratml.us.
  3. "HR4174". stratml.us.
  4. "ऑनलाइन दस्तावेज़ों और डेटा के लिए मशीन पठनीयता पर एक प्राइमर". Data.gov. 2012-09-24. Retrieved 2015-02-27.
  5. OMB Circular A-11, Part 6 Archived 2020-04-22 at the Wayback Machine, Preparation, Submission, and Execution of the Budget

Public Domain This article incorporates public domain material from Federal Standard 1037C. General Services Administration. Archived from the original on 2022-01-22.