डेटा पुरातत्व
डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान की परिभाषा।
तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) कंप्यूटर डेटा एन्कोडेड और/या अब अप्रचलित मीडिया या प्रारूप में कूटलेखन को पुनर्प्राप्त करने की कला और विज्ञान को संदर्भित करता है। डेटा पुरातत्व प्राकृतिक आपदाओं या मानवीय त्रुटि के बाद क्षतिग्रस्त इलेक्ट्रानिक्स प्रारूपों से जानकारी पुनर्प्राप्त करने का भी उल्लेख कर सकता है।
यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है।
सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच शामिल होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना शामिल है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं।
प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।[1]
डेटा पुरातत्व शब्द मूल रूप से 1993 में वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना (जीओडीएआर) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने कंप्यूटर टेप पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो जलवायु परिवर्तन के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने आर्कटिक की एक छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को निंबस कार्यक्रम उपग्रह द्वारा कैप्चर किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च प्रस्ताव में नहीं देखा गया था।[2]
नासा 1960 के दशक के पुराने कंप्यूटर टेप पर संग्रहीत जानकारी को पुनर्प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि लूनर ऑर्बिटर इमेज रिकवरी प्रोजेक्ट (एलओआईआरपी) द्वारा उदाहरण दिया गया है।[3]
रिकवरी
डेटा पुनर्प्राप्ति और डेटा बोधगम्यता के बीच अंतर है। कोई डेटा पुनर्प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को सुगम होना चाहिए।[4]
डेटा पुरातत्व से संबंधित एक शब्द डेटा वंशावली है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में शामिल है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।[1]
सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण शामिल है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग शामिल है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे डेटा संयोजन बनाकर प्राप्त किया जा सकता है। [1]
डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। [5]
आपदा वसूली
डेटा पुरातत्वविद् आग, बाढ़, भूकंप, या यहाँ तक कि उष्णकटिबंधीय चक्रवात जैसी प्राकृतिक आपदाओं के बाद भी डेटा रिकवरी का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में तूफान मर्लिन के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय अभिलेखागार और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए स्थिति के साथ रिफिट करना संभव था, जिससे डेटा की बचत हुई।[4]
रिकवरी तकनीक
डेटा को पुनर्प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनर्प्राप्त करने में सक्षम होंगे। चुंबकीय मीडिया के मामले में, जो डेटा भंडारण के लिए सबसे सामान्य प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनर्प्राप्त करने के लिए किया जा सकता है।[4]: 17
नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए ऊष्मा उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।[4]: 17–18
स्नेहस ह्रास टेपों को नुकसान का एक अन्य स्रोत है। यह प्रायः भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहस पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। स्नेहन के नुकसान को टेपों को फिर से स्नेहन करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।[4]: 18
पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की नुकसान के प्रति अधिक संवेदनशील होते हैं।[4]: 18
अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है 'परीक्षण डेटा' तकनीकी डेटा अर्थ में परीक्षण डेटा है।
निवारण
डेटा पुरातत्व की आवश्यकता को रोकने के लिए, डिजिटल दस्तावेज़ों के रचनाकारों और धारकों को डिजिटल संरक्षण को नियोजित करने पर ध्यान देना चाहिए।
अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो आपदा होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। अनुकूलतम डेटा पुनर्प्राप्ति के लिए एक बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, दर्पण स्थल और निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके दर्पण स्थल से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।[6]
यह भी देखें
- डेटा गिरावट
- डेटा क्यूरेशन
- डेटा संरक्षण
- डिजिटल अंधकार युग
- डिजिटल संरक्षण
- ज्ञान की खोज
इस पेज में लापता आंतरिक लिंक की सूची
- बादल कार्यक्रम
- Paradata (लर्निंग रिसोर्स एनालिटिक्स)
- डाटा रिकवरी
- राष्ट्रीय अभिलेखागार और रिकॉर्ड प्रशासन
- बड़ा डेटा
संदर्भ
- ↑ 1.0 1.1 1.2 Kitchin, Rob (2022). डेटा क्रांति. Sage.
- ↑ Techno-archaeology rescues climate data from early satellitesU.S. National Snow and Ice Data Center (NSIDC), January 2010
- ↑ LOIRP Overview NASA website November 14, 2008 Archived
- ↑ 4.0 4.1 4.2 4.3 4.4 4.5 [1] Study on website October 23, 2011
- ↑ Bates, Jo (2016). "डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना". Big Data and Society. 3 (2): 1–12 – via Sage Journals.
- ↑ Chang, V (2015). "एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।". Ad Hoc Networks. 5: 65–82 – via Elsevier.
- World Wide Words: Data Archaeology
- O'Donnell, James Joseph. Avatars of the Word: From Papyrus to Cyperspace Harvard University Press, 1998.
- Ross, Seamus & Gow, Ann (1999). Digital archaeology : rescuing neglected and damaged data resources (PDF). Electronic libraries programme studies (in English). London & Bristol: British Library and Joint Information Systems Committee. ISBN 1-90050-851-6.
- Kitchin, Rob. (2022.) The Data Revolution: Second Edition. Sage Publications.
- Dumit, J. and Nafus, D. (2018) ‘The other ninety per cent: Thinking with data science, creating data studies,’ in Knox, H. and Nafus, D. (eds), Ethnography for a Data-Saturated World. Manchester University Press, Manchester, pp. 252–274
- Chang, V. (2015). 'Towards a Big Data system disaster recovery in a Private Cloud.' Ad Hoc Networks, vol 5, pp. 65-82. Elsevier.
- “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”.