डेटा पुरातत्व: Difference between revisions
(Created page with "{{short description|Study of old data sources}} {{for|the computer-based analysis of archaeological data|Computational archaeology}} डेटा पुरातत्व क...") |
No edit summary |
||
(34 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
{{for|पुरातात्विक डेटा का कंप्यूटर आधारित विश्लेषण|संगणनात्मक पुरातत्व}} | |||
{{for| | डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान की परिभाषा। | ||
डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान परिभाषा। | |||
तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) [[संगणक | तकनीकी अर्थ में '''डेटा पुरातत्व (डेटा पुरातत्व भी)''' [[संगणक|कंप्यूटर डेटा]] को पुनः प्राप्त करने की कला और विज्ञान को संदर्भित करता है जो अब अप्रचलित [[कंप्यूटर मीडिया|मीडिया]] या [[सामग्री प्रारूप|स्वरूपों]] में [[कोड|सांकेतिक शब्दों में बदलने]] और/या [[कूटलेखन|एन्क्रिप्ट]] किया गया है। डेटा पुरातत्व [[प्राकृतिक आपदा|प्राकृतिक आपदाओं]] या मानवीय त्रुटि के बाद क्षतिग्रस्त [[इलेक्ट्रानिक्स]] स्वरूपों से [[जानकारी]] पुनः प्राप्त करने का भी उल्लेख कर सकता है। | ||
यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने / स्थानांतरित करने पर जोर देता है। | यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने/स्थानांतरित करने पर जोर देता है। | ||
सामाजिक विज्ञान में डेटा पुरातत्व में | सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच सम्मिलित होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना सम्मिलित है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं। | ||
प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।<ref name=":0">{{Cite book |last=Kitchin |first=Rob |title=डेटा क्रांति|publisher=Sage |year=2022}}</ref> | प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।<ref name=":0">{{Cite book |last=Kitchin |first=Rob |title=डेटा क्रांति|publisher=Sage |year=2022}}</ref> | ||
डेटा पुरातत्व शब्द मूल रूप से 1993 में [[वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना]] (जीओडीएआर) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने [[टेप ड्राइव|कंप्यूटर टेप]] पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो [[जलवायु परिवर्तन]] के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने [[आर्कटिक]] की छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को झलक 2 [[उपग्रह]] द्वारा आकर्षित किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च प्रस्ताव में नहीं देखा गया था।<ref>[http://nsidc.org/monthlyhighlights/january2010.html Techno-archaeology rescues climate data from early satellites]U.S. National Snow and Ice Data Center (NSIDC), January 2010</ref> | |||
[[नासा]] 1960 के दशक के पुराने कंप्यूटर टेप पर संग्रहीत जानकारी को पुनः प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि [[लूनर ऑर्बिटर इमेज रिकवरी प्रोजेक्ट|चन्द्रमा का कक्षित्र आरोग्य प्राप्ति प्रतिबिम्ब परियोजना]] (एलओआईआरपी) उदाहरण द्वारा दिया गया है।<ref>[http://www.nasa.gov/topics/moonmars/features/LOIRP/ LOIRP Overview] NASA website November 14, 2008 [https://web.archive.org/web/20110131213726/http://www.nasa.gov/topics/moonmars/features/LOIRP/ Archived]</ref> | |||
== | == पुनःप्राप्ति == | ||
डेटा | डेटा पुनःप्राप्ति और डेटा स्पष्टता के बीच अंतर है। कोई डेटा पुनः प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को स्पष्ट होना चाहिए।<ref name="www.ukoln.ac.uk"> [http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf] Study on website October 23, 2011 </ref> | ||
डेटा पुरातत्व से संबंधित शब्द [[डेटा वंश|डेटा वंशावली]] है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में सम्मिलित है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।<ref name=":0" /> | |||
सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण सम्मिलित है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग सम्मिलित है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे [https://data-smart-schools.net/2021/05/21/key-concept-the-data-assemblage/ डेटा संयोजन] बनाकर प्राप्त किया जा सकता है। <ref name=":0" /> | |||
डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। <ref>{{Cite journal |last=Bates |first=Jo |date=2016 |title=डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना|url=https://journals.sagepub.com/doi/full/10.1177/2053951716654502 |journal=Big Data and Society |volume=3 |issue=2 |pages=1-12 |via=Sage Journals}}</ref> | |||
=== आपदा पुन:प्राप्ति === | |||
डेटा पुरातत्वविद् आग, बाढ़, [[भूकंप]], या यहाँ तक कि [[उष्णकटिबंधीय चक्रवात|तूफान]] जैसी प्राकृतिक आपदाओं के बाद भी डेटा पुन:प्राप्ति का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में [[तूफान मर्लिन]] के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय व्यवस्थापक और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए स्थिति के साथ मरम्मत करना संभव था, जिससे डेटा की बचत हुई।<ref name="www.ukoln.ac.uk"/> | |||
=== पुनःप्राप्ति तकनीक === | |||
[[File:Floppy disk 2009 G1.jpg|alt=Two floppy disks on a desk|thumb|फ्लॉपी डिस्क जैसे पुराने स्वरूपों में संग्रहीत डेटा को नए स्वरूपों में पुनर्स्थापित करना पड़ता है]]डेटा को पुनः प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनः प्राप्त करने में सक्षम होंगे। [[चुंबकीय मीडिया]] के मामले में, जो डेटा भंडारण के लिए सबसे सामान्य प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनः प्राप्त करने के लिए किया जा सकता है।<ref name="www.ukoln.ac.uk"/>{{rp|17}} | |||
नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए ऊष्मा उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।<ref name="www.ukoln.ac.uk"/>{{rp|17–18}} | |||
स्नेहस ह्रास टेपों को नुकसान का एक अन्य स्रोत है। यह प्रायः भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहस पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। स्नेहन के नुकसान को टेपों को फिर से स्नेहन करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।<ref name="www.ukoln.ac.uk" />{{rp|18}} | |||
पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की नुकसान के प्रति अधिक संवेदनशील होते हैं।<ref name="www.ukoln.ac.uk" />{{rp|18}} | |||
अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है '[[परीक्षण डेटा]]' तकनीकी डेटा अर्थ में परीक्षण डेटा है। | अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है '[[परीक्षण डेटा]]' तकनीकी डेटा अर्थ में परीक्षण डेटा है। | ||
== | == निवारण == | ||
डेटा पुरातत्व की आवश्यकता को रोकने के लिए, | डेटा पुरातत्व की आवश्यकता को रोकने के लिए, अंकीय दस्तावेज़ों के रचनाकारों और धारकों को [[डिजिटल संरक्षण]] को नियोजित करने पर ध्यान देना चाहिए। | ||
[[File:Servers in a Rack.jpg|alt=Servers in a rack|thumb|अपतटीय सर्वर में डेटा संग्रहीत करना डेटा हानि के खिलाफ | [[File:Servers in a Rack.jpg|alt=Servers in a rack|thumb|अपतटीय सर्वर में डेटा संग्रहीत करना डेटा हानि के खिलाफ अच्छा निवारक उपाय है]]अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो मुसीबत होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। अनुकूलतम डेटा पुनर्प्राप्ति के लिए बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, दर्पण स्थल और निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके दर्पण स्थल से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।<ref>{{Cite journal |last=Chang |first=V |date=2015 |title=एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।|journal=Ad Hoc Networks |volume=5 |pages=65-82 |via=Elsevier}}</ref> | ||
Line 40: | Line 45: | ||
* [[डेटा क्यूरेशन]] | * [[डेटा क्यूरेशन]] | ||
* [[डेटा संरक्षण]] | * [[डेटा संरक्षण]] | ||
* [[डिजिटल अंधकार युग]] | * [[डिजिटल अंधकार युग|अंकीय अंधकार युग]] | ||
* | * अंकीय संरक्षण | ||
* [[ज्ञान की खोज]] | * [[ज्ञान की खोज]] | ||
==संदर्भ== | ==संदर्भ== | ||
<references /> | <references /> | ||
*[http://www.worldwidewords.org/turnsofphrase/tp-dat1.htm World Wide Words: Data Archaeology] | *[http://www.worldwidewords.org/turnsofphrase/tp-dat1.htm World Wide Words: Data Archaeology] | ||
*O'Donnell, James Joseph. | *O'Donnell, James Joseph. ''Avatars of the Word: From Papyrus to Cyperspace'' Harvard University Press, 1998. | ||
* {{cite book | last1 = Ross | first1 = Seamus | last2 = Gow | first2 = Ann| name-list-style = amp| title = Digital archaeology : rescuing neglected and damaged data resources| publisher = British Library and Joint Information Systems Committee| place = London & Bristol| series = Electronic libraries programme studies | * {{cite book | last1 = Ross | first1 = Seamus | last2 = Gow | first2 = Ann| name-list-style = amp| title = Digital archaeology : rescuing neglected and damaged data resources| publisher = British Library and Joint Information Systems Committee| place = London & Bristol| series = Electronic libraries programme studies | ||
| year = 1999| language = EN| url = http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf| isbn = 1-90050-851-6}} | | year = 1999| language = EN| url = http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf| isbn = 1-90050-851-6}} | ||
Line 63: | Line 61: | ||
* “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”. | * “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”. | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:Collapse templates]] | |||
[[Category:Created On 07/12/2022]] | |||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:डिजिटल संरक्षण]] | |||
[[Category:डेटा प्रबंधन|पुरातत्व]] | [[Category:डेटा प्रबंधन|पुरातत्व]] | ||
[[Category:पुरातात्विक उपविषय]] | [[Category:पुरातात्विक उपविषय]] | ||
Latest revision as of 15:06, 19 October 2023
डेटा पुरातत्व की दो अवधारणाएँ हैं, तकनीकी परिभाषा और सामाजिक विज्ञान की परिभाषा।
तकनीकी अर्थ में डेटा पुरातत्व (डेटा पुरातत्व भी) कंप्यूटर डेटा को पुनः प्राप्त करने की कला और विज्ञान को संदर्भित करता है जो अब अप्रचलित मीडिया या स्वरूपों में सांकेतिक शब्दों में बदलने और/या एन्क्रिप्ट किया गया है। डेटा पुरातत्व प्राकृतिक आपदाओं या मानवीय त्रुटि के बाद क्षतिग्रस्त इलेक्ट्रानिक्स स्वरूपों से जानकारी पुनः प्राप्त करने का भी उल्लेख कर सकता है।
यह फ्लॉपी डिस्क, चुंबकीय टेप, पंच कार्ड जैसे पुराने, पुरातन या अप्रचलित भंडारण स्वरूपों में फंसे पुराने डेटा को बचाने और पुनर्प्राप्त करने और उस डेटा को अधिक उपयोगी स्वरूपों में बदलने/स्थानांतरित करने पर जोर देता है।
सामाजिक विज्ञान में डेटा पुरातत्व में प्रायः डेटासेट के स्रोत और इतिहास और इन डेटासेट के निर्माण की जांच सम्मिलित होती है। इसमें डेटा की संपूर्ण वंशावली, इसकी प्रकृति और विशेषताओं, इसकी गुणवत्ता और सत्यता को मैप करना सम्मिलित है और ये कैसे डेटासेट के विश्लेषण और व्याख्या को प्रभावित करते हैं।
प्रदर्शन डेटा पुरातत्व के निष्कर्ष उस स्तर को प्रभावित करते हैं जिस पर डेटा विश्लेषण से निकाले गए निष्कर्षों पर भरोसा किया जा सकता है।[1]
डेटा पुरातत्व शब्द मूल रूप से 1993 में वैश्विक महासागरीय डेटा पुरातत्व और बचाव परियोजना (जीओडीएआर) के हिस्से के रूप में सामने आया था। डेटा पुरातत्व के लिए मूल प्रोत्साहन पुराने कंप्यूटर टेप पर संग्रहीत जलवायु परिस्थितियों के कम्प्यूटरीकृत रिकॉर्ड को पुनर्प्राप्त करने की आवश्यकता से आया है, जो जलवायु परिवर्तन के सिद्धांतों के परीक्षण के लिए मूल्यवान साक्ष्य प्रदान कर सकता है। इन दृष्टिकोणों ने आर्कटिक की छवि के पुनर्निर्माण की अनुमति दी जिसे 23 सितंबर, 1966 को झलक 2 उपग्रह द्वारा आकर्षित किया गया था, इस प्रकार के डेटा से पहले कभी भी उच्च प्रस्ताव में नहीं देखा गया था।[2]
नासा 1960 के दशक के पुराने कंप्यूटर टेप पर संग्रहीत जानकारी को पुनः प्राप्त करने के लिए डेटा पुरातत्वविदों की सेवाओं का भी उपयोग करता है, जैसा कि चन्द्रमा का कक्षित्र आरोग्य प्राप्ति प्रतिबिम्ब परियोजना (एलओआईआरपी) उदाहरण द्वारा दिया गया है।[3]
पुनःप्राप्ति
डेटा पुनःप्राप्ति और डेटा स्पष्टता के बीच अंतर है। कोई डेटा पुनः प्राप्त करने में सक्षम हो सकता है लेकिन इसे समझ नहीं सकता। डेटा पुरातत्व के प्रभावी होने के लिए, डेटा को स्पष्ट होना चाहिए।[4]
डेटा पुरातत्व से संबंधित शब्द डेटा वंशावली है। डेटा पुरातत्व के प्रदर्शन में पहला कदम उनके डेटा वंश की जांच है। डेटा वंशावली डेटा के इतिहास, उसके स्रोत और किसी भी परिवर्तन या परिवर्तन से गुजरती है। डेटा वंशावली किसी डेटासेट के मेटाडेटा, किसी डेटासेट के पैरा डेटा (सीखने के संसाधन विश्लेषण) या किसी भी साथ वाले पहचानकर्ताओं (पद्धति संबंधी गाइड आदि) में पाई जा सकती है। डेटा पुरातत्व के साथ पद्धति संबंधी पारदर्शिता आती है जो कि वह स्तर है जिस तक डेटा उपयोगकर्ता डेटा इतिहास तक पहुंच सकता है। उपलब्ध पद्धति संबंधी पारदर्शिता का स्तर न केवल यह निर्धारित करता है कि कितना पुनर्प्राप्त किया जा सकता है, बल्कि डेटा को जानने में सहायता करता है। डेटा वंशावली जांच में सम्मिलित है कि कौन से उपकरणों का उपयोग किया गया था, चयन मानदंड क्या हैं, माप पैरामीटर और नमूना ढांचे।[1]
सामाजिक-राजनीतिक तरीके से, डेटा पुरातत्व में उनके विवेकपूर्ण और भौतिक सामाजिक-तकनीकी तत्वों और उपकरणों को प्रकट करने के लिए डेटा संयोजनों का विश्लेषण सम्मिलित है। इस तरह के विश्लेषण से विश्लेषण किए जा रहे डेटा की राजनीति और इस प्रकार उनके उत्पादक संस्थान की राजनीति का पता चल सकता है। इस अर्थ में पुरातत्व, डेटा के उद्गम को संदर्भित करता है। इसमें उन साइटों, स्वरूपों और बुनियादी ढांचे की मैपिंग सम्मिलित है, जिनके माध्यम से डेटा प्रवाहित होता है और समय के साथ परिवर्तित या रूपांतरित होता है। इसकी डेटा के जीवन और डेटा के संचलन को आकार देने वाली राजनीति में रुचि है। यह नाटक और उनकी भूमिकाओं में प्रमुख अभिनेताओं, प्रथाओं और स्तुति को उजागर करने का कार्य करता है। इसे दो चरणों में पूरा किया जा सकता है। सबसे पहले, डेटा के भौतिक प्रतिनिधित्व को समझने के लिए डेटा के तकनीकी ढेर तक पहुंचना और उसका आकलन करना (यह बुनियादी ढांचे और डेटा को बनाने/इकट्ठा करने के लिए उपयोग की जाने वाली सामग्री तकनीकों को संदर्भित करता है)। दूसरा, डेटा के प्रासंगिक स्टैक का विश्लेषण करना जो डेटा के निर्माण, उपयोग और विश्लेषण को आकार देता है। यह विभिन्न प्रक्रियाओं, साक्षात्कारों, तकनीकी और नीति दस्तावेजों के विश्लेषण और समुदाय या संस्थागत, वित्तीय, कानूनी और भौतिक संरचना पर डेटा के प्रभाव की जांच के माध्यम से किया जा सकता है। इसे डेटा संयोजन बनाकर प्राप्त किया जा सकता है। [1]
डेटा पुरातत्व मानचित्र विभिन्न साइटों पर डेटा के स्थानांतरित होने के तरीके को चार्ट करता है और कभी-कभी डेटा घर्षण का सामना करना पड़ता है। [5]
आपदा पुन:प्राप्ति
डेटा पुरातत्वविद् आग, बाढ़, भूकंप, या यहाँ तक कि तूफान जैसी प्राकृतिक आपदाओं के बाद भी डेटा पुन:प्राप्ति का उपयोग कर सकते हैं। उदाहरण के लिए, 1995 में तूफान मर्लिन के दौरान राष्ट्रीय मीडिया लैब ने क्षतिग्रस्त उपकरणों के कारण जोखिम वाले डेटा को पुनर्प्राप्त करने में राष्ट्रीय व्यवस्थापक और अभिलेख प्रशासन की सहायता की। हार्डवेयर बारिश, खारे पानी और रेत से क्षतिग्रस्त हो गया था, फिर भी कुछ डिस्क को साफ करना और उन्हें नए स्थिति के साथ मरम्मत करना संभव था, जिससे डेटा की बचत हुई।[4]
पुनःप्राप्ति तकनीक
डेटा को पुनः प्राप्त करने का प्रयास करना है या नहीं, यह तय करते समय, लागत को ध्यान में रखा जाना चाहिए। यदि पर्याप्त समय और धन है, तो अधिकांश डेटा पुनः प्राप्त करने में सक्षम होंगे। चुंबकीय मीडिया के मामले में, जो डेटा भंडारण के लिए सबसे सामान्य प्रकार का उपयोग किया जाता है, ऐसी कई तकनीकें हैं जिनका उपयोग क्षति के प्रकार के आधार पर डेटा को पुनः प्राप्त करने के लिए किया जा सकता है।[4]: 17
नमी के कारण टेप अनुपयोगी हो सकते हैं क्योंकि वे खराब होने लगते हैं और चिपचिपे हो जाते हैं। इस मामले में, इस समस्या को ठीक करने के लिए ऊष्मा उपचार लागू किया जा सकता है, जिससे तेल और अवशेष या तो टेप में पुन: अवशोषित हो जाते हैं या टेप की सतह से वाष्पित हो जाते हैं। हालाँकि, यह केवल डेटा तक पहुँच प्रदान करने के लिए किया जाना चाहिए ताकि इसे निकाला जा सके और ऐसे माध्यम में कॉपी किया जा सके जो अधिक स्थिर हो।[4]: 17–18
स्नेहस ह्रास टेपों को नुकसान का एक अन्य स्रोत है। यह प्रायः भारी उपयोग के कारण होता है, लेकिन यह अनुचित भंडारण या प्राकृतिक वाष्पीकरण का परिणाम भी हो सकता है। भारी उपयोग के परिणामस्वरूप, कुछ स्नेहस पढ़ने-लिखने वाले सिरों पर रह सकते हैं जो धूल और कणों को इकट्ठा करते हैं। इससे टेप को नुकसान हो सकता है। स्नेहन के नुकसान को टेपों को फिर से स्नेहन करके संबोधित किया जा सकता है। यह सावधानी से किया जाना चाहिए, क्योंकि अत्यधिक पुन: स्नेहन से टेप फिसलन हो सकती है, जिसके परिणामस्वरूप मीडिया को गलत तरीके से पढ़ा जा सकता है और डेटा की हानि हो सकती है।[4]: 18
पानी के संपर्क में आने से समय के साथ टेप खराब हो जाएंगे। यह अक्सर आपदा की स्थिति में होता है। यदि मीडिया नमकीन या गंदे पानी में है, तो उसे ताजे पानी से धोना चाहिए। गर्मी के नुकसान को रोकने के लिए कमरे के तापमान पर गीले टेपों को साफ करने, धोने और सुखाने की प्रक्रिया की जानी चाहिए। पुराने टेपों को नए टेपों से पहले पुनर्प्राप्त किया जाना चाहिए, क्योंकि वे पानी की नुकसान के प्रति अधिक संवेदनशील होते हैं।[4]: 18
अगला कदम (डेटा वंश की जांच के बाद) यह स्थापित करना है कि अच्छे डेटा और खराब डेटा के रूप में क्या मायने रखता है ताकि यह सुनिश्चित किया जा सके कि केवल 'अच्छा' डेटा नए डेटा वेयरहाउस या रिपॉजिटरी में माइग्रेट हो जाता है। खराब डेटा का एक अच्छा उदाहरण है 'परीक्षण डेटा' तकनीकी डेटा अर्थ में परीक्षण डेटा है।
निवारण
डेटा पुरातत्व की आवश्यकता को रोकने के लिए, अंकीय दस्तावेज़ों के रचनाकारों और धारकों को डिजिटल संरक्षण को नियोजित करने पर ध्यान देना चाहिए।
अन्य प्रभावी निवारक उपाय अपतटीय बैकअप सुविधाओं का उपयोग है जो मुसीबत होने पर प्रभावित नहीं हो सकते। इन बैकअप सर्वरों से, खोए हुए डेटा की प्रतियाँ आसानी से प्राप्त की जा सकती हैं। अनुकूलतम डेटा पुनर्प्राप्ति के लिए बहु-साइट और बहु-तकनीक डेटा वितरण योजना की सलाह दी जाती है, विशेष रूप से बड़े डेटा के साथ व्यवहार करते समय। इंटरनेट प्रोटोकॉल सूट टीसीपी/आईपी विधि, स्नैपशॉट रिकवरी, दर्पण स्थल और निजी क्लाउड में डेटा की सुरक्षा करने वाले टेप भी सभी अच्छे निवारक तरीके हैं। दैनिक रूप से उनके दर्पण स्थल से डेटा को आपातकालीन सर्वर पर स्थानांतरित करना।[6]
यह भी देखें
- डेटा गिरावट
- डेटा क्यूरेशन
- डेटा संरक्षण
- अंकीय अंधकार युग
- अंकीय संरक्षण
- ज्ञान की खोज
संदर्भ
- ↑ 1.0 1.1 1.2 Kitchin, Rob (2022). डेटा क्रांति. Sage.
- ↑ Techno-archaeology rescues climate data from early satellitesU.S. National Snow and Ice Data Center (NSIDC), January 2010
- ↑ LOIRP Overview NASA website November 14, 2008 Archived
- ↑ 4.0 4.1 4.2 4.3 4.4 4.5 [1] Study on website October 23, 2011
- ↑ Bates, Jo (2016). "डेटा यात्राएँ: डेटा वस्तुओं और प्रवाहों के सामाजिक-भौतिक गठन को ग्रहण करना". Big Data and Society. 3 (2): 1–12 – via Sage Journals.
- ↑ Chang, V (2015). "एक निजी क्लाउड में बिग डेटा सिस्टम डिजास्टर रिकवरी की ओर।". Ad Hoc Networks. 5: 65–82 – via Elsevier.
- World Wide Words: Data Archaeology
- O'Donnell, James Joseph. Avatars of the Word: From Papyrus to Cyperspace Harvard University Press, 1998.
- Ross, Seamus & Gow, Ann (1999). Digital archaeology : rescuing neglected and damaged data resources (PDF). Electronic libraries programme studies (in English). London & Bristol: British Library and Joint Information Systems Committee. ISBN 1-90050-851-6.
- Kitchin, Rob. (2022.) The Data Revolution: Second Edition. Sage Publications.
- Dumit, J. and Nafus, D. (2018) ‘The other ninety per cent: Thinking with data science, creating data studies,’ in Knox, H. and Nafus, D. (eds), Ethnography for a Data-Saturated World. Manchester University Press, Manchester, pp. 252–274
- Chang, V. (2015). 'Towards a Big Data system disaster recovery in a Private Cloud.' Ad Hoc Networks, vol 5, pp. 65-82. Elsevier.
- “Bates, J., Lin, Y.-W. and Goodale, P. (2016) ‘Data journeys: Capturing the socio-material constitution of data objects and flows’, Big Data & Society, 4(2): 1–12.”.