डेटा पुरातत्व: Difference between revisions
(Created page with "{{short description|Study of old data sources}} {{for|the computer-based analysis of archaeological data|Computational archaeology}} डेटा पुरातत्व क...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Study of old data sources}} | {{short description|Study of old data sources}} | ||
{{for| | {{for|पुरातात्विक डेटा का कंप्यूटर आधारित विश्लेषण|कम्प्यूटेशनल पुरातत्व}} | ||
डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान परिभाषा। | डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान परिभाषा। | ||
तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) [[संगणक]] डेटा [[कोड]] और/या अब अप्रचलित [[कंप्यूटर मीडिया]] या [[सामग्री प्रारूप]] में [[कूटलेखन]] को पुनर्प्राप्त करने की कला और विज्ञान को संदर्भित करता है। डेटा पुरातत्व [[प्राकृतिक आपदा]] या मानव त्रुटि के बाद क्षतिग्रस्त [[इलेक्ट्रानिक्स]] प्रारूपों से [[जानकारी]] पुनर्प्राप्त करने का भी उल्लेख कर सकता है। | तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) [[संगणक|कंप्यूटर]] डेटा [[कोड]] और/या अब अप्रचलित [[कंप्यूटर मीडिया]] या [[सामग्री प्रारूप]] में [[कूटलेखन]] को पुनर्प्राप्त करने की कला और विज्ञान को संदर्भित करता है। डेटा पुरातत्व [[प्राकृतिक आपदा|प्राकृतिक आपदाओं]] या मानव त्रुटि के बाद क्षतिग्रस्त [[इलेक्ट्रानिक्स]] प्रारूपों से [[जानकारी]] पुनर्प्राप्त करने का भी उल्लेख कर सकता है। | ||
यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है। | यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है। | ||
सामाजिक विज्ञान में डेटा पुरातत्व में | सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच शामिल होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना शामिल है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं। | ||
प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।<ref name=":0">{{Cite book |last=Kitchin |first=Rob |title=डेटा क्रांति|publisher=Sage |year=2022}}</ref> | प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।<ref name=":0">{{Cite book |last=Kitchin |first=Rob |title=डेटा क्रांति|publisher=Sage |year=2022}}</ref> |
Revision as of 16:33, 20 December 2022
डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान परिभाषा।
तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) कंप्यूटर डेटा कोड और/या अब अप्रचलित कंप्यूटर मीडिया या सामग्री प्रारूप में कूटलेखन को पुनर्प्राप्त करने की कला और विज्ञान को संदर्भित करता है। डेटा पुरातत्व प्राकृतिक आपदाओं या मानव त्रुटि के बाद क्षतिग्रस्त इलेक्ट्रानिक्स प्रारूपों से जानकारी पुनर्प्राप्त करने का भी उल्लेख कर सकता है।
यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है।
सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच शामिल होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना शामिल है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं।
प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।[1] डेटा पुरातत्व शब्द मूल रूप से 1993 में वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना (GODAR) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने टेप ड्राइव पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो जलवायु परिवर्तन के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने आर्कटिक की एक छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को निंबस कार्यक्रम उपग्रह द्वारा कैप्चर किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च रिज़ॉल्यूशन में नहीं देखा गया था।[2] नासा 1960 के दशक के पुराने टेप ड्राइव पर संग्रहीत जानकारी को पुनर्प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि लूनर ऑर्बिटर इमेज रिकवरी प्रोजेक्ट (LOIRP) द्वारा उदाहरण दिया गया है।[3]
रिकवरी
डेटा पुनर्प्राप्ति और डेटा बोधगम्यता के बीच अंतर है। कोई डेटा पुनर्प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को सुगम होना चाहिए।[4] डेटा पुरातत्व से संबंधित एक शब्द डेटा वंशावली है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के Paradata (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में शामिल है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।[1] सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण शामिल है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग शामिल है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे data assemblage बनाकर प्राप्त किया जा सकता है। [1] डेटा पुरातत्व चार्ट विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी google:data+friction&rlz=1C5CHFA_enCA936CA936&oq=data+friction&aqs=chrome..69i57j69i60j69i61l2.3450j0j7&sourceid=chrome&ie=UTF-8#:~:text=The%20politics%20of, राजनीति%20of%20dat...|डेटा घर्षण। [5]
आपदा वसूली
डेटा पुरातत्वविद् आग, बाढ़, भूकंप, या यहाँ तक कि उष्णकटिबंधीय चक्रवात जैसी प्राकृतिक आपदाओं के बाद भी डेटा रिकवरी का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में तूफान मर्लिन के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय अभिलेखागार और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए केस के साथ रिफिट करना संभव था, जिससे डेटा की बचत हुई।[4]
रिकवरी तकनीक
डेटा को पुनर्प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनर्प्राप्त करने में सक्षम होंगे। चुंबकीय मीडिया के मामले में, जो डेटा भंडारण के लिए सबसे आम प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनर्प्राप्त करने के लिए किया जा सकता है।[4]: 17
नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए एक गर्मी उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और एक ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।[4]: 17–18 स्नेहन हानि टेपों को नुकसान का एक अन्य स्रोत है। यह आमतौर पर भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहक पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। लुब्रिकेशन के नुकसान को टेपों को फिर से लुब्रिकेट करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।[4]: 18 पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की क्षति के प्रति अधिक संवेदनशील होते हैं।[4]: 18 अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है 'परीक्षण डेटा' तकनीकी डेटा अर्थ में परीक्षण डेटा है।
रोकथाम
डेटा पुरातत्व की आवश्यकता को रोकने के लिए, डिजिटल दस्तावेज़ों के रचनाकारों और धारकों को डिजिटल संरक्षण को नियोजित करने पर ध्यान देना चाहिए।
एक अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो आपदा होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। इष्टतम डेटा पुनर्प्राप्ति के लिए एक बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट | टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, मिरर साइट्स और एक निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके मिरर साइट से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।[6]
यह भी देखें
- डेटा गिरावट
- डेटा क्यूरेशन
- डेटा संरक्षण
- डिजिटल अंधकार युग
- डिजिटल संरक्षण
- ज्ञान की खोज
इस पेज में लापता आंतरिक लिंक की सूची
- बादल कार्यक्रम
- Paradata (लर्निंग रिसोर्स एनालिटिक्स)
- डाटा रिकवरी
- राष्ट्रीय अभिलेखागार और रिकॉर्ड प्रशासन
- बड़ा डेटा
संदर्भ
- ↑ 1.0 1.1 1.2 Kitchin, Rob (2022). डेटा क्रांति. Sage.
- ↑ Techno-archaeology rescues climate data from early satellitesU.S. National Snow and Ice Data Center (NSIDC), January 2010
- ↑ LOIRP Overview NASA website November 14, 2008 Archived
- ↑ 4.0 4.1 4.2 4.3 4.4 4.5 [1] Study on website October 23, 2011
- ↑ Bates, Jo (2016). "डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना". Big Data and Society. 3 (2): 1–12 – via Sage Journals.
- ↑ Chang, V (2015). "एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।". Ad Hoc Networks. 5: 65–82 – via Elsevier.
- World Wide Words: Data Archaeology
- O'Donnell, James Joseph. Avatars of the Word: From Papyrus to Cyperspace Harvard University Press, 1998.
- Ross, Seamus & Gow, Ann (1999). Digital archaeology : rescuing neglected and damaged data resources (PDF). Electronic libraries programme studies (in English). London & Bristol: British Library and Joint Information Systems Committee. ISBN 1-90050-851-6.
- Kitchin, Rob. (2022.) The Data Revolution: Second Edition. Sage Publications.
- Dumit, J. and Nafus, D. (2018) ‘The other ninety per cent: Thinking with data science, creating data studies,’ in Knox, H. and Nafus, D. (eds), Ethnography for a Data-Saturated World. Manchester University Press, Manchester, pp. 252–274
- Chang, V. (2015). 'Towards a Big Data system disaster recovery in a Private Cloud.' Ad Hoc Networks, vol 5, pp. 65-82. Elsevier.
- “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”.