मशीन-पठनीय माध्यम और डेटा

From Vigyanwiki
ईएएन-13 मशीन-पठनीय बारकोड और मानव-पठनीय अंक दोनों दिखा रहा है।

संचार और कम्प्यूटिंग में मशीन-पठनीय माध्यम या कंप्यूटर-पठनीय माध्यम एक डिजिटल कंप्यूटर या यांत्रिक उपकरण (मानव पठनीय के अतिरिक्त) द्वारा आसानी से पठनीय प्रारूप में डेटा संग्रहीत करने का सक्षम माध्यम है इस परिणाम को मशीन-पठनीय डेटा या कंप्यूटर-पठनीय डेटा कहा जाता है।

डेटा

मशीन-पठनीय डेटा बनाने का प्रयास 1960 के दशक की प्रारम्भ में हुआ। उसी समय जब मशीन-पठनीय और प्राकृतिक-भाषा प्रसंस्करण में मौलिक विकास (जैसे वीज़ेनबाम की एलिज़ा) प्रारम्भ हो रहे थे तब लोग मशीन-पठनीय कार्यक्षमता की सफलता की संभावना कर रहे थे और मशीन-पठनीय दस्तावेज़ बनाने का प्रयास कर रहे थे।[1] ऐसा ही एक उदाहरण संगीतकार नैन्सी बी. रीच का 1966 में संगीतकार विलियम जे सिडेमैन के कृतियों की मशीन-पठनीय सूची बनाना था।

संयुक्त राज्य अमेरिका में 14 जनवरी 2019 का सरकारी डेटा अधिनियम मशीन-पठनीय डेटा को "एक ऐसे प्रारूप में डेटा के रूप में परिभाषित करता है जिसे मानव हस्तक्षेप के अतिरिक्त कंप्यूटर द्वारा आसानी से संसाधित किया जा सकता है जबकि यह सुनिश्चित करता है कि किसी शब्दार्थ अर्थ न समाप्त हो" अधिनियम अमेरिकी संघीय संस्थाओं को इस प्रकार से सार्वजनिक डेटा प्रकाशित करने का निर्देश देता है।[2] यह सुनिश्चित करते हुए कि "संस्था की कोई भी सार्वजनिक डेटा संपत्ति मशीन-पठनीय है।"[3]

मशीन-पठनीय डेटा को दो समूहों में वर्गीकृत किया जा सकता है: मानव-पठनीय डेटा जिसे चिह्नित किया गया है ताकि इसे मशीनों द्वारा भी पढ़ा जा सके (जैसे माइक्रोफ़ॉर्मेट, आरडीएफए, एचटीएमएल) और मुख्य रूप से मशीनों द्वारा प्रसंस्करण के लिए डेटा फ़ाइल प्रारूप (सीएसवी, आरडीएफ, एक्सएमएल, जेएसओएन) ये प्रारूप केवल मशीन द्वारा पढ़े जा सकते हैं यदि उनमें निहित डेटा औपचारिक रूप से संरचित है तो संरचित स्प्रेडशीट से सीएसवी फ़ाइल परिवर्तित करना परिभाषा को पूर्ण नहीं करता है।

मशीन-पठनीय डिजिटल रूप से सुलभ का पर्याय नहीं है एक डिजिटल रूप से सुलभ दस्तावेज़ ऑनलाइन हो सकते है जिससे कंप्यूटर के माध्यम से मनुष्यों का उपयोग करना आसान हो जाता है लेकिन मशीन-पठनीय नहीं होने पर इसके डेटा को कंप्यूटर प्रोग्रामिंग एल्गोरिथम के माध्यम से निकालना, परिवर्तित करना और संसाधित करना बहुत कठिन होता है।[4]

एक्सटेंसिबल मार्कअप भाषा (एक्सएमएल) को मानव और मशीन-पठनीय दोनों के लिए डिज़ाइन किया गया है और एक्सटेंसिबल स्टाइलशीट भाषा रूपान्तरण (एक्सएसएलटी) का उपयोग मानव पठनीयता के लिए डेटा की प्रस्तुति को अपेक्षाकृत अच्छा बनाने के लिए किया जाता है उदाहरण के लिए, एक्सएसएलटी का उपयोग एक्सएमएल को पोर्टेबल दस्तावेज़ स्वरूप (पीडीएफ) में स्वचालित रूप से प्रस्तुत करने के लिए किया जा सकता है मशीन-पठनीय डेटा को मानव-पठनीयता के लिए स्वचालित रूप से रूपांतरित किया जा सकता है लेकिन सामान्यतः यह सच नहीं होता है।

सरकारी प्रदर्शन और परिणाम अधिनियम (जीपीआरए) आधुनिकीकरण अधिनियम के कार्यान्वयन के प्रयोजनों के लिए प्रबंधन और बजट कार्यालय (ओएमबी) "मशीन पठनीय प्रारूप" को निम्नानुसार परिभाषित करता है: "मानक कंप्यूटर भाषा में प्रारूप (अंग्रेजी टेक्स्ट मे नहीं) एक वेब ब्राउज़र या कंप्यूटर सिस्टम द्वारा स्वचालित (जैसे- एक्सएमएल) रूप से पढ़ें जाते है पारंपरिक वर्ड-प्रोसेसिंग दस्तावेज़ और पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) फ़ाइलें मनुष्यों द्वारा आसानी से पढ़ी जाती हैं लेकिन सामान्यतः मशीनों की व्याख्या करना कठिन होता है अन्य प्रारूप जैसे एक्स्टेंसिबल मार्कअप भाषा (पीडीएफ) एक्सएमएल, जेएसओएन या हेडर कॉलम वाली स्प्रेडशीट जिन्हें अल्पविराम से अलग किए गए मान (सीएसवी) के रूप को परिवर्तित किया जा सकता है मशीन पठनीय प्रारूप हैं। चूंकि एचटीएमएल एक संरचनात्मक मार्कअप भाषा है जिसके दस्तावेज़ के कुछ भागों को सावधानीपूर्वक वर्गीकृत करना, कंप्यूटर दस्तावेज़ घटकों को एकत्र करने में सक्षम हैं और डेटा को साहित्य खोज ग्रंथ सूची आदि की तालिकाओं को संग्रहीत करने के लिए पारंपरिक शब्द संसाधन दस्तावेजों और अन्य प्रारूपों को मशीन पठनीय बनाना संभव होता है लेकिन दस्तावेजों में उन्नत संरचनात्मक डेटा सम्मिलित होना आवश्यक होता है।[5]

मीडिया

मशीन-पठनीय मीडिया के उदाहरणों में चुंबकीय मीडिया जैसे डिस्क भंडारण, कार्ड, चुंबकीय टेप और चुंबकीय ड्रम, पंच कार्ड और पेपर टेप, प्रकाशीय डिस्क, बारकोड और चुंबकीय स्याही संप्रतीक पहचान (एमआईसीआर) सम्मिलित हैं।

सामान्य मशीन-पठनीय तकनीकों में चुंबकीय रिकॉर्डिंग, प्रसंस्करण तरंग और बारकोड सम्मिलित हैं प्रकाशीय संप्रतीक पहचान (ओसीआर) का उपयोग मशीनों को मनुष्यों के लिए उपलब्ध जानकारी को पढ़ने में सक्षम बनाने के लिए किया जा सकता है किसी भी प्रकार की ऊर्जा द्वारा पुनर्प्राप्त की जाने वाली कोई भी जानकारी मशीन-पठनीय हो सकती है।

उदाहरणों में निम्नलिखित सम्मिलित है:

अनुप्रयोग

दस्तावेज़

Page 'Machine-readable document' not found

कैटलॉग

Page 'Machine-readable cataloging' not found

शब्दकोश

Page 'Machine-readable dictionary' not found

पासपोर्ट

Page 'Machine-readable passport' not found

यह भी देखें

संदर्भ

  1. "मशीन पठनीय". opendatahandbook.org. Retrieved 2019-07-22.
  2. "HR4174". stratml.us.
  3. "HR4174". stratml.us.
  4. "ऑनलाइन दस्तावेज़ों और डेटा के लिए मशीन पठनीयता पर एक प्राइमर". Data.gov. 2012-09-24. Retrieved 2015-02-27.
  5. OMB Circular A-11, Part 6 Archived 2020-04-22 at the Wayback Machine, Preparation, Submission, and Execution of the Budget

Public Domain This article incorporates public domain material from Federal Standard 1037C. General Services Administration. Archived from the original on 2022-01-22.