डेटा पुरातत्व: Difference between revisions

From Vigyanwiki
No edit summary
Line 20: Line 20:
डेटा पुनर्प्राप्ति और डेटा बोधगम्यता के बीच अंतर है। कोई डेटा पुनर्प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को सुगम होना चाहिए।<ref name="www.ukoln.ac.uk"> [http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf] Study on website October 23, 2011 </ref>
डेटा पुनर्प्राप्ति और डेटा बोधगम्यता के बीच अंतर है। कोई डेटा पुनर्प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को सुगम होना चाहिए।<ref name="www.ukoln.ac.uk"> [http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf] Study on website October 23, 2011 </ref>


डेटा पुरातत्व से संबंधित एक शब्द [[डेटा वंश|डेटा वंशावली]] है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के '''Paradata''' (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में शामिल है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।<ref name=":0" />  
डेटा पुरातत्व से संबंधित एक शब्द [[डेटा वंश|डेटा वंशावली]] है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में शामिल है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।<ref name=":0" />  
सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण शामिल है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग शामिल है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे [https://data-smart-schools.net/2021/05/21/key-concept-the-data-assemblage/ data assemblage] बनाकर प्राप्त किया जा सकता है। <ref name=":0" />  
 
डेटा पुरातत्व चार्ट विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी google:data+friction&rlz=1C5CHFA_enCA936CA936&oq=data+friction&aqs=chrome..69i57j69i60j69i61l2.3450j0j7&sourceid=chrome&ie=UTF-8#:~:text=The%20politics%20of, राजनीति%20of%20dat...|डेटा घर्षण। <ref>{{Cite journal |last=Bates |first=Jo |date=2016 |title=डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना|url=https://journals.sagepub.com/doi/full/10.1177/2053951716654502 |journal=Big Data and Society |volume=3 |issue=2 |pages=1-12 |via=Sage Journals}}</ref>  
सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण शामिल है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग शामिल है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे [https://data-smart-schools.net/2021/05/21/key-concept-the-data-assemblage/ डेटा संयोजन] बनाकर प्राप्त किया जा सकता है। <ref name=":0" />  
 
डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। <ref>{{Cite journal |last=Bates |first=Jo |date=2016 |title=डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना|url=https://journals.sagepub.com/doi/full/10.1177/2053951716654502 |journal=Big Data and Society |volume=3 |issue=2 |pages=1-12 |via=Sage Journals}}</ref>  


=== आपदा वसूली ===
=== आपदा वसूली ===

Revision as of 17:26, 20 December 2022

डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान परिभाषा।

तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) कंप्यूटर डेटा कोड और/या अब अप्रचलित कंप्यूटर मीडिया या सामग्री प्रारूप में कूटलेखन को पुनर्प्राप्त करने की कला और विज्ञान को संदर्भित करता है। डेटा पुरातत्व प्राकृतिक आपदाओं या मानव त्रुटि के बाद क्षतिग्रस्त इलेक्ट्रानिक्स प्रारूपों से जानकारी पुनर्प्राप्त करने का भी उल्लेख कर सकता है।

यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है।

सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच शामिल होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना शामिल है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं।

प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।[1]

डेटा पुरातत्व शब्द मूल रूप से 1993 में वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना (जीओडीएआर) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने कंप्यूटर टेप पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो जलवायु परिवर्तन के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने आर्कटिक की एक छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को निंबस कार्यक्रम उपग्रह द्वारा कैप्चर किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च प्रस्ताव में नहीं देखा गया था।[2]

नासा 1960 के दशक के पुराने कंप्यूटर टेप पर संग्रहीत जानकारी को पुनर्प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि लूनर ऑर्बिटर इमेज रिकवरी प्रोजेक्ट (एलओआईआरपी) द्वारा उदाहरण दिया गया है।[3]


रिकवरी

डेटा पुनर्प्राप्ति और डेटा बोधगम्यता के बीच अंतर है। कोई डेटा पुनर्प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को सुगम होना चाहिए।[4]

डेटा पुरातत्व से संबंधित एक शब्द डेटा वंशावली है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में शामिल है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।[1]

सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण शामिल है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग शामिल है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे डेटा संयोजन बनाकर प्राप्त किया जा सकता है। [1]

डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। [5]

आपदा वसूली

डेटा पुरातत्वविद् आग, बाढ़, भूकंप, या यहाँ तक कि उष्णकटिबंधीय चक्रवात जैसी प्राकृतिक आपदाओं के बाद भी डेटा रिकवरी का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में तूफान मर्लिन के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय अभिलेखागार और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए केस के साथ रिफिट करना संभव था, जिससे डेटा की बचत हुई।[4]


रिकवरी तकनीक

Two floppy disks on a desk
फ्लॉपी डिस्क जैसे पुराने स्वरूपों में संग्रहीत डेटा को नए स्वरूपों में पुनर्स्थापित करना पड़ता है

डेटा को पुनर्प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनर्प्राप्त करने में सक्षम होंगे। चुंबकीय मीडिया के मामले में, जो डेटा भंडारण के लिए सबसे आम प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनर्प्राप्त करने के लिए किया जा सकता है।[4]: 17 

नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए एक गर्मी उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और एक ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।[4]: 17–18  स्नेहन हानि टेपों को नुकसान का एक अन्य स्रोत है। यह आमतौर पर भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहक पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। लुब्रिकेशन के नुकसान को टेपों को फिर से लुब्रिकेट करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।[4]: 18  पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की क्षति के प्रति अधिक संवेदनशील होते हैं।[4]: 18  अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है 'परीक्षण डेटा' तकनीकी डेटा अर्थ में परीक्षण डेटा है।

रोकथाम

डेटा पुरातत्व की आवश्यकता को रोकने के लिए, डिजिटल दस्तावेज़ों के रचनाकारों और धारकों को डिजिटल संरक्षण को नियोजित करने पर ध्यान देना चाहिए।

Servers in a rack
अपतटीय सर्वर में डेटा संग्रहीत करना डेटा हानि के खिलाफ एक अच्छा निवारक उपाय है

एक अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो आपदा होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। इष्टतम डेटा पुनर्प्राप्ति के लिए एक बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट | टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, मिरर साइट्स और एक निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके मिरर साइट से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।[6]


यह भी देखें


इस पेज में लापता आंतरिक लिंक की सूची

  • बादल कार्यक्रम
  • Paradata (लर्निंग रिसोर्स एनालिटिक्स)
  • डाटा रिकवरी
  • राष्ट्रीय अभिलेखागार और रिकॉर्ड प्रशासन
  • बड़ा डेटा

संदर्भ

  1. 1.0 1.1 1.2 Kitchin, Rob (2022). डेटा क्रांति. Sage.
  2. Techno-archaeology rescues climate data from early satellitesU.S. National Snow and Ice Data Center (NSIDC), January 2010
  3. LOIRP Overview NASA website November 14, 2008 Archived
  4. 4.0 4.1 4.2 4.3 4.4 4.5 [1] Study on website October 23, 2011
  5. Bates, Jo (2016). "डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना". Big Data and Society. 3 (2): 1–12 – via Sage Journals.
  6. Chang, V (2015). "एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।". Ad Hoc Networks. 5: 65–82 – via Elsevier.
  • World Wide Words: Data Archaeology
  • O'Donnell, James Joseph. Avatars of the Word: From Papyrus to Cyperspace Harvard University Press, 1998.
  • Ross, Seamus & Gow, Ann (1999). Digital archaeology : rescuing neglected and damaged data resources (PDF). Electronic libraries programme studies (in English). London & Bristol: British Library and Joint Information Systems Committee. ISBN 1-90050-851-6.
  • Kitchin, Rob. (2022.) The Data Revolution: Second Edition. Sage Publications.
  • Dumit, J. and Nafus, D. (2018) ‘The other ninety per cent: Thinking with data science, creating data studies,’ in Knox, H. and Nafus, D. (eds), Ethnography for a Data-Saturated World. Manchester University Press, Manchester, pp. 252–274
  • Chang, V. (2015). 'Towards a Big Data system disaster recovery in a Private Cloud.' Ad Hoc Networks, vol 5, pp. 65-82. Elsevier.
  • “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”.