अनुसंधान डेटा संग्रह: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Long-term storage of research data}}
{{short description|Long-term storage of research data}}
'''अनुसंधान [[आंकड़े|डेटा]] संग्रह''' कंप्यूटर डेटा संचयन या अस्थिरता प्राकृतिक विज्ञान, सामाजिक विज्ञान और जीवन विज्ञान सहित विद्वानों के अनुसंधान डेटा का दीर्घकालिक संचयन है। और विभिन्न शैक्षणिक पत्रिकाओं में इस संबंध में अलग-अलग नीतियां होती हैं कि शोधकर्ताओं को अपने डेटा और विधियों का कितना भाग सार्वजनिक संग्रह में संग्रहीत करना आवश्यक है, और वास्तव में क्या संग्रहीत किया जाता है, यह विभिन्न विषयों के मध्य व्यापक रूप से भिन्न होता है। इसी प्रकार, प्रमुख अनुदान देने वाले संस्थानों का डेटा के सार्वजनिक संग्रह के प्रति अलग-अलग दृष्टिकोण है। सामान्यतः , विज्ञान की परंपरा यह रही है कि प्रकाशनों में सहयोगी शोधकर्ताओं को अनुसंधान को दोहराने और परीक्षण करने की अनुमति देने के लिए पर्याप्त सूचना होती है। वर्तमान वर्षों में यह दृष्टिकोण तीव्रता से तनावपूर्ण हो गया है क्योंकि कुछ क्षेत्रों में अनुसंधान उच्च डेटासेट पर निर्भर करता है जिसे सरलता से स्वतंत्र रूप से दोहराया नहीं जा सकता है।
'''अनुसंधान [[आंकड़े|डेटा]] संग्रह''' कंप्यूटर डेटा संचयन या अस्थिरता प्राकृतिक विज्ञान, सामाजिक विज्ञान और जीवन विज्ञान सहित विद्वानों के अनुसंधान डेटा का दीर्घकालिक संचयन है। और विभिन्न शैक्षणिक पत्रिकाओं में इस संबंध में अलग-अलग नीतियां होती हैं कि शोधकर्ताओं को अपने डेटा और विधियों का कितना भाग सार्वजनिक संग्रह में संग्रहीत करना आवश्यक है, और वास्तव में क्या संग्रहीत किया जाता है, यह विभिन्न विषयों के मध्य व्यापक रूप से भिन्न होता है। इसी प्रकार, प्रमुख अनुदान देने वाले संस्थानों का डेटा के सार्वजनिक संग्रह के प्रति अलग-अलग दृष्टिकोण है। सामान्यतः विज्ञान की परंपरा यह रही है कि प्रकाशनों में सहयोगी शोधकर्ताओं को अनुसंधान को दोहराने और परीक्षण करने की अनुमति देने के लिए पर्याप्त सूचना होती है। वर्तमान वर्षों में यह दृष्टिकोण तीव्रता से तनावपूर्ण हो गया है क्योंकि कुछ क्षेत्रों में अनुसंधान उच्च डेटासेट पर निर्भर करता है जिसे सरलता से स्वतंत्र रूप से दोहराया नहीं जा सकता है।


इस प्रकार से कुछ क्षेत्रों में डेटा संग्रहण अन्य क्षेत्रों की तुलना में अधिक महत्वपूर्ण है। कुछ क्षेत्रों में, कार्य को दोहराने के लिए आवश्यक सभी डेटा जर्नल आलेख में पहले से ही उपलब्ध है। अतः प्रमाणित विकास में, उच्च मात्रा में डेटा उत्पन्न होता है और इसे संग्रहीत किया जाना चाहिए जिससे शोधकर्ता यह सत्यापित कर सकें कि दवा कंपनियां जो रिपोर्ट प्रकाशित करती हैं वह डेटा को स्पष्ट रूप से प्रतिबिंबित करती हैं।
इस प्रकार से कुछ क्षेत्रों में डेटा संग्रहण अन्य क्षेत्रों की तुलना में अधिक महत्वपूर्ण है। कुछ क्षेत्रों में, कार्य को दोहराने के लिए आवश्यक सभी डेटा जर्नल आलेख में पहले से ही उपलब्ध है। अतः प्रमाणित विकास में, उच्च मात्रा में डेटा उत्पन्न होता है और इसे संग्रहीत किया जाना चाहिए जिससे शोधकर्ता यह सत्यापित कर सकते है कि दवा कंपनियां जो रिपोर्ट प्रकाशित करती हैं वह डेटा को स्पष्ट रूप से प्रतिबिंबित करती हैं।


चूंकि डेटा संग्रह की आवश्यकता विज्ञान के इतिहास में वर्तमान समय में विकास किया गया है। यह सूचना प्रौद्योगिकी में प्रगति के कारण संभव है , जिससे उच्च मात्रा में डेटा को केंद्रीय स्थानों से संग्रहीत और एक्सेस किया जा सकता है । उदाहरण के लिए, [[ अमेरिकी भूभौतिकीय संघ |अमेरिकी जियोफिजिकल यूनियन]] (एजीयू) ने WWW. प्रारंभ के पश्चात लगभग तीन साल बाद 1993 में डेटा संग्रह पर अपनी पहली नीति अपनाई थी ।<ref>”Policy on Referencing Data in and Archiving Data for AGU Publications” [http://www.agu.org/pubs/authors/policies/data_policy.shtml]</ref> यह नीति अनिवार्य करती है कि एजीयू कागजात में उद्धृत डेटासेट को मान्यता प्राप्त डेटा केंद्र द्वारा संग्रहीत किया जाना चाहिए; और यह डेटा पेपर के निर्माण की अनुमति देता है; और यह डेटा अभिलेखागार को बनाए रखने में एजीयू की भूमिका स्थापित करता है। किन्तु यह पेपर लेखकों पर अपना डेटा संग्रहीत करने की कोई आवश्यकता नहीं रखता है।
चूंकि डेटा संग्रह की आवश्यकता विज्ञान के इतिहास में वर्तमान समय में विकास किया गया है। यह सूचना प्रौद्योगिकी में प्रगति के कारण संभव है , जिससे उच्च मात्रा में डेटा को केंद्रीय स्थानों से संग्रहीत और एक्सेस किया जा सकता है । उदाहरण के लिए, [[ अमेरिकी भूभौतिकीय संघ |अमेरिकी जियोफिजिकल यूनियन]] (एजीयू) ने WWW. प्रारंभ के पश्चात लगभग तीन साल बाद 1993 में डेटा संग्रह पर अपनी पहली नीति अपनाई थी ।<ref>”Policy on Referencing Data in and Archiving Data for AGU Publications” [http://www.agu.org/pubs/authors/policies/data_policy.shtml]</ref> यह नीति अनिवार्य करती है कि एजीयू कागजात में उद्धृत डेटासेट को मान्यता प्राप्त डेटा केंद्र द्वारा संग्रहीत किया जाना चाहिए; और यह डेटा पेपर के निर्माण की अनुमति देता है; और यह डेटा अभिलेखागार को बनाए रखने में एजीयू की भूमिका स्थापित करता है। किन्तु यह पेपर लेखकों पर अपना डेटा संग्रहीत करने की कोई आवश्यकता नहीं रखता है।


अतः संगठित डेटा संग्रह से प्रतःम , किसी पेपर का मूल्यांकन या प्रतिलिपि बनाने के इच्छुक शोधकर्ताओं को लेखक से डेटा और विधियों की सूचना का अनुरोध करना है । इस प्रकार से अकादमिक समुदाय लेखकों से [[डेटा शेयरिंग (विज्ञान)]] की अपेक्षा करता है। इस प्रक्रिया को समय और ऊर्जा की विनाश के रूप में पहचाना गया है और मिश्रित परिणाम प्राप्त किये गए है । अतः कुछ वर्षों के पश्चात्सू चना विलुप्त हो सकती है या दूषित हो सकती है। इसके अतिरिक्त कुछ स्तिथियो में, लेखक सूचना प्रदान करने से मना कर देते हैं।
संगठित डेटा संग्रह से पहले, किसी पेपर का मूल्यांकन या प्रतिलिपि बनाने के इच्छुक शोधकर्ताओं को लेखक से डेटा और विधियों की जानकारी का अनुरोध करना होगा। इस प्रकार से अकादमिक समुदाय लेखकों से [[डेटा शेयरिंग (विज्ञान)]] की अपेक्षा करता है। इस प्रक्रिया को समय और ऊर्जा की विनाश के रूप में पहचाना गया है और मिश्रित परिणाम प्राप्त किये गए है । अतः कुछ वर्षों के पश्चात्सू चना विलुप्त हो सकती है या दूषित हो सकती है। इसके अतिरिक्त कुछ स्तिथियो में, लेखक सूचना प्रदान करने से मना कर देते हैं।


जब अनुसंधान स्वास्थ्य मुद्दों या सार्वजनिक नीति निर्माण से संबंधित होता है तो डेटा संग्रह और उचित परिश्रम की आवश्यकता बहुत बढ़ जाती है।<ref>"The Case for Due Diligence When Empirical Research is Used in Policy Formation" by Bruce McCullough and Ross McKitrick. [http://economics.ca/2006/papers/0685.pdf]</ref><ref>[http://gking.harvard.edu/replication.shtml "Data Sharing and Replication" a website by Gary King] {{webarchive|url=https://web.archive.org/web/20070328035546/http://gking.harvard.edu/replication.shtml |date=2007-03-28 }}</ref>
जब अनुसंधान स्वास्थ्य उद्देश्यों या सार्वजनिक नीति निर्माण से संबंधित होता है तो डेटा संग्रह और उचित परिश्रम की आवश्यकता बहुत बढ़ जाती है।<ref>"The Case for Due Diligence When Empirical Research is Used in Policy Formation" by Bruce McCullough and Ross McKitrick. [http://economics.ca/2006/papers/0685.pdf]</ref><ref>[http://gking.harvard.edu/replication.shtml "Data Sharing and Replication" a website by Gary King] {{webarchive|url=https://web.archive.org/web/20070328035546/http://gking.harvard.edu/replication.shtml |date=2007-03-28 }}</ref>
==पत्रिकाओं द्वारा चयनित नी तियां==
==पत्रिकाओं द्वारा चयनित नी तियां==


Line 24: Line 24:
{{blockquote|किसी लेख के निष्कर्षों में अंतर्निहित प्राथमिक डेटा वैज्ञानिक उद्यम की सत्यापनीयता और पारदर्शिता के लिए महत्वपूर्ण है, और इसे भविष्य में दशकों तक प्रयोग करने योग्य रूप में संरक्षित किया जाना चाहिए। इस कारण से, ''जर्नल ऑफ हेरेडिटी'' के लिए आवश्यक है कि नए रिपोर्ट किए गए न्यूक्लियोटाइड या अमीनो एसिड अनुक्रम और संरचनात्मक निर्देशांक, उपयुक्त सार्वजनिक डेटाबेस (उदाहरण के लिए, जेनबैंक; [[ईएमबीएल न्यूक्लियोटाइड अनुक्रम डेटाबेस]]; जापान के डीएनए डेटाबेस) में प्रस्तुत किए जाएं। ; [[प्रोटीन डेटा बैंक]] ; और [[स्विस-प्रोट]])। पांडुलिपि के अंतिम संस्करण में परिग्रहण संख्याएँ अवश्य शामिल की जानी चाहिए। डेटा के अन्य रूपों (उदाहरण के लिए, माइक्रोसैटेलाइट जीनोटाइप, लिंकेज मानचित्र, छवियां) के लिए, जर्नल सभी लेखकों को प्राथमिक डेटासेट को ड्रायड, ट्रीबेस जैसे उपयुक्त सार्वजनिक संग्रह में संग्रहित करने के लिए प्रोत्साहित करने में संयुक्त डेटा संग्रह नीति (जेडीएपी) के सिद्धांतों का समर्थन करता है। , या बायोकॉम्प्लेक्सिटी के लिए नॉलेज नेटवर्क। लेखकों को प्रकाशन के समय डेटा को सार्वजनिक रूप से उपलब्ध कराने के लिए प्रोत्साहित किया जाता है या, यदि संग्रह की तकनीक अनुमति देती है, तो प्रकाशन के पश्चात्  एक वर्ष तक की अवधि के लिए डेटा तक पहुंच को प्रतिबंधित करने का विकल्प चुन सकते हैं।
{{blockquote|किसी लेख के निष्कर्षों में अंतर्निहित प्राथमिक डेटा वैज्ञानिक उद्यम की सत्यापनीयता और पारदर्शिता के लिए महत्वपूर्ण है, और इसे भविष्य में दशकों तक प्रयोग करने योग्य रूप में संरक्षित किया जाना चाहिए। इस कारण से, ''जर्नल ऑफ हेरेडिटी'' के लिए आवश्यक है कि नए रिपोर्ट किए गए न्यूक्लियोटाइड या अमीनो एसिड अनुक्रम और संरचनात्मक निर्देशांक, उपयुक्त सार्वजनिक डेटाबेस (उदाहरण के लिए, जेनबैंक; [[ईएमबीएल न्यूक्लियोटाइड अनुक्रम डेटाबेस]]; जापान के डीएनए डेटाबेस) में प्रस्तुत किए जाएं। ; [[प्रोटीन डेटा बैंक]] ; और [[स्विस-प्रोट]])। पांडुलिपि के अंतिम संस्करण में परिग्रहण संख्याएँ अवश्य शामिल की जानी चाहिए। डेटा के अन्य रूपों (उदाहरण के लिए, माइक्रोसैटेलाइट जीनोटाइप, लिंकेज मानचित्र, छवियां) के लिए, जर्नल सभी लेखकों को प्राथमिक डेटासेट को ड्रायड, ट्रीबेस जैसे उपयुक्त सार्वजनिक संग्रह में संग्रहित करने के लिए प्रोत्साहित करने में संयुक्त डेटा संग्रह नीति (जेडीएपी) के सिद्धांतों का समर्थन करता है। , या बायोकॉम्प्लेक्सिटी के लिए नॉलेज नेटवर्क। लेखकों को प्रकाशन के समय डेटा को सार्वजनिक रूप से उपलब्ध कराने के लिए प्रोत्साहित किया जाता है या, यदि संग्रह की तकनीक अनुमति देती है, तो प्रकाशन के पश्चात्  एक वर्ष तक की अवधि के लिए डेटा तक पहुंच को प्रतिबंधित करने का विकल्प चुन सकते हैं।


अमेरिकन जेनेटिक एसोसिएशन बड़े डेटासेट बनाने और क्यूरेट करने में व्यक्तिगत शोधकर्ताओं के विशाल निवेश को भी मान्यता देता है। नतीजतन, हम अनुशंसा करते हैं कि इस निवेश का सम्मान एक सहयोगात्मक भावना से माध्यमिक विश्लेषण या मेटा-विश्लेषण में किया गया है ।|oxfordjournals.org<ref>[https://web.archive.org/web/20070517013317/http://www.oxfordjournals.org/our_journals/jhered/for_authors/msprep_submission.html#4.%20DATA%20ARCHIVING%20POLICY Data archiving policy]</ref>}}
अमेरिकन जेनेटिक एसोसिएशन बड़े डेटासेट बनाने और क्यूरेट करने में व्यक्तिगत शोधकर्ताओं के विशाल निवेश को भी मान्यता देता है। परिणाम स्वरुप, हम अनुशंसा करते हैं कि इस निवेश का सम्मान एक सहयोगात्मक भावना से माध्यमिक विश्लेषण या मेटा-विश्लेषण में किया गया है ।|oxfordjournals.org<ref>[https://web.archive.org/web/20070517013317/http://www.oxfordjournals.org/our_journals/jhered/for_authors/msprep_submission.html#4.%20DATA%20ARCHIVING%20POLICY Data archiving policy]</ref>}}


===आणविक पारिस्थितिकी===
===आणविक पारिस्थितिकी===
Line 30: Line 30:


===प्रकृति===
===प्रकृति===
{{blockquote|Sऐसी सामग्री को एक मान्यता प्राप्त स्वतंत्र साइट (यूआरएल और परिग्रहण संख्या लेखक द्वारा प्रदान की जाएगी) पर होस्ट की जानी चाहिए, या सबमिशन के समय ''नेचर'' जर्नल को भेजा जाना चाहिए, या तो जर्नल की ऑनलाइन सबमिशन सेवा के माध्यम से अपलोड किया जाना चाहिए, या यदि फ़ाइलें हैं सीडी/डीवीडी (पांच प्रतियां) पर इस उद्देश्य के लिए बहुत बड़ा या अनुपयुक्त प्रारूप में। ऐसी सामग्री केवल किसी लेखक की निजी या संस्थागत वेबसाइट पर होस्ट नहीं की जा सकती.<ref>[http://www.nature.com/authors/editorial_policies/availability.html "Availability of Data and Materials: The Policy of Nature Magazine]</ref>
{{blockquote|ऐसी सामग्री को एक मान्यता प्राप्त स्वतंत्र साइट (यूआरएल और परिग्रहण संख्या लेखक द्वारा प्रदान की जाएगी) पर होस्ट की जानी चाहिए, या सबमिशन के समय ''नेचर'' जर्नल को भेजा जाना चाहिए, या तो जर्नल की ऑनलाइन सबमिशन सेवा के माध्यम से अपलोड किया जाना चाहिए, या यदि फ़ाइलें हैं सीडी/डीवीडी (पांच प्रतियां) पर इस उद्देश्य के लिए बहुत बड़ा या अनुपयुक्त प्रारूप में। ऐसी सामग्री केवल किसी लेखक की निजी या संस्थागत वेबसाइट पर होस्ट नहीं की जा सकती.<ref>[http://www.nature.com/authors/editorial_policies/availability.html "Availability of Data and Materials: The Policy of Nature Magazine]</ref>


''प्रकृति'' के लिए समीक्षक को यह निर्धारित करने की आवश्यकता होती है कि क्या सभी पूरक डेटा और विधियाँ संग्रहीत की गई हैं। नीति समीक्षकों को कई प्रश्नों पर विचार करने की सलाह देती है, जिनमें सम्मिलित हैं: "क्या लेखकों को ऑनलाइन पेपर के साथ पूरक तरीके या डेटा प्रदान करने के लिए कहा जाना चाहिए? (ऐसे डेटा में मॉडलिंग अध्ययन के लिए स्रोत कोड, विस्तृत प्रयोगात्मक प्रोटोकॉल या गणितीय व्युत्पत्तियां सम्मिलित  हो सकती हैं।)|[[प्रकृति (पत्रिका)|प्रकृति]]<ref>{{cite web|title=Guide to नेचर जर्नल्स की प्रकाशन नीतियां|तारीख=मार्च 14, 2007|url=http://www.nature.com/authors/gta.pdf}}</ref>}}
''प्रकृति'' के लिए समीक्षक को यह निर्धारित करने की आवश्यकता होती है कि क्या सभी पूरक डेटा और विधियाँ संग्रहीत की गई हैं। नीति समीक्षकों को कई प्रश्नों पर विचार करने की सलाह देती है, जिनमें सम्मिलित हैं: "क्या लेखकों को ऑनलाइन पेपर के साथ पूरक तरीके या डेटा प्रदान करने के लिए कहा जाना चाहिए? (ऐसे डेटा में मॉडलिंग अध्ययन के लिए स्रोत कोड, विस्तृत प्रयोगात्मक प्रोटोकॉल या गणितीय व्युत्पत्तियां सम्मिलित  हो सकती हैं।)|[[प्रकृति (पत्रिका)|प्रकृति]]<ref>{{cite web|title=Guide to नेचर जर्नल्स की प्रकाशन नीतियां|तारीख=मार्च 14, 2007|url=http://www.nature.com/authors/gta.pdf}}</ref>}}
Line 68: Line 68:
* उपयोगकर्ता निर्देश - विशेष विषयों पर डेटा संसाधनों का पता लगाने, डेटा को कैसे डाउनलोड करें और इसे स्प्रेडशीट, सांख्यिकीय, डेटाबेस या जीआईएस पैकेज में कैसे पढ़ें, कोडबुक और अन्य दस्तावेज़ों की व्याख्या कैसे करें, में उपयोगकर्ताओं के समूहों को व्यावहारिक प्रशिक्षण प्रदान करना है ।
* उपयोगकर्ता निर्देश - विशेष विषयों पर डेटा संसाधनों का पता लगाने, डेटा को कैसे डाउनलोड करें और इसे स्प्रेडशीट, सांख्यिकीय, डेटाबेस या जीआईएस पैकेज में कैसे पढ़ें, कोडबुक और अन्य दस्तावेज़ों की व्याख्या कैसे करें, में उपयोगकर्ताओं के समूहों को व्यावहारिक प्रशिक्षण प्रदान करना है ।
* तकनीकी सहायता - जिसमें पंजीकरण प्रक्रियाओं को सरल बनाना, डेटासेट के साथ समस्याओं का निवारण करना है , जैसे दस्तावेज़ीकरण में त्रुटियाँ, डेटा को किसी ऐसी चीज़ में पुन: स्वरूपित करना जिसके साथ उपयोगकर्ता काम कर सकता है, और सांख्यिकीय पद्धति में सहायता करना सम्मिलित है।
* तकनीकी सहायता - जिसमें पंजीकरण प्रक्रियाओं को सरल बनाना, डेटासेट के साथ समस्याओं का निवारण करना है , जैसे दस्तावेज़ीकरण में त्रुटियाँ, डेटा को किसी ऐसी चीज़ में पुन: स्वरूपित करना जिसके साथ उपयोगकर्ता काम कर सकता है, और सांख्यिकीय पद्धति में सहायता करना सम्मिलित है।
* संग्रह विकास एवं प्रबंधन - स्थानीय उपयोगकर्ता समुदाय द्वारा द्वितीयक विश्लेषण के लिए उपयोग की जाने वाली डेटा फ़ाइलों के संग्रह को प्राप्त करना , बनाए रखना और प्रबंधित करना; संस्थागत डेटा सदस्यताएँ खरीदें; संस्थान के लिए डेटा प्रदाताओं और राष्ट्रीय डेटा अभिलेखागार के लिए साइट प्रतिनिधि के रूप में कार्य कर सकते है ।
* संग्रह विकास एवं प्रबंधन - स्थानीय उपयोगकर्ता समुदाय द्वारा द्वितीयक विश्लेषण के लिए उपयोग की जाने वाली डेटा फ़ाइलों के संग्रह को प्राप्त करना, बनाए रखना और प्रबंधित करना; संस्थागत डेटा सदस्यताएँ खरीदें; संस्थान के लिए डेटा प्रदाताओं और राष्ट्रीय डेटा अभिलेखागार के लिए साइट प्रतिनिधि के रूप में कार्य कर सकते है ।
* संरक्षण और डेटा साझाकरण सेवाएँ - संग्रह में डेटासेट के संरक्षण की रणनीति पर कार्य करें, जैसे मीडिया रिफ्रेशमेंट और फ़ाइल प्रारूप माइग्रेशन; केंद्रीय संचयन से अद्यतन संस्करणों को डाउनलोड करें और रिकॉर्ड करके एकत्रित कर सकते है । इसके अतिरिक्त , उपयोगकर्ताओं को दूसरों के द्वितीयक उपयोग के लिए मूल डेटा तैयार करने में सहायता करना है ; या तो केंद्रीय या संस्थागत संचयन में एकत्रित करने के लिए है , या डेटा साझा करने के कम औपचारिक विधियों के लिए उपयोग किया गया है । इसमें डेटा को उचित एक्सएमएल मानक में चिह्नित करना भी सम्मिलित हो सकता है, जैसे डेटा दस्तावेज़ीकरण पहल, या ऑनलाइन खोज की सुविधा के लिए अन्य मेटाडेटा जोड़ना है ।
* संरक्षण और डेटा साझाकरण सेवाएँ - संग्रह में डेटासेट के संरक्षण की रणनीति पर कार्य करें, जैसे मीडिया रिफ्रेशमेंट और फ़ाइल प्रारूप माइग्रेशन; केंद्रीय संचयन से अद्यतन संस्करणों को डाउनलोड करें और रिकॉर्ड करके एकत्रित कर सकते है । इसके अतिरिक्त, उपयोगकर्ताओं को दूसरों के द्वितीयक उपयोग के लिए मूल डेटा तैयार करने में सहायता करना है; या तो केंद्रीय या संस्थागत संचयन में एकत्रित करने के लिए है, या डेटा साझा करने के कम औपचारिक विधियों के लिए उपयोग किया गया है । इसमें डेटा को उचित एक्सएमएल मानक में चिह्नित करना भी सम्मिलित हो सकता है, जैसे डेटा दस्तावेज़ीकरण पहल, या ऑनलाइन खोज की सुविधा के लिए अन्य मेटाडेटा जोड़ना है ।


==डेटा लाइब्रेरी के उदाहरण==
==डेटा लाइब्रेरी के उदाहरण==
Line 91: Line 91:
* [http://daac.ornl.gov ओक रिज राष्ट्रीय प्रयोगशाला वितरित सक्रिय पुरालेख केंद्र]
* [http://daac.ornl.gov ओक रिज राष्ट्रीय प्रयोगशाला वितरित सक्रिय पुरालेख केंद्र]
* पैंजिया (डेटा लाइब्रेरी)|पैंजिया - पृथ्वी और पर्यावरण विज्ञान के लिए डेटा प्रकाशक
* पैंजिया (डेटा लाइब्रेरी)|पैंजिया - पृथ्वी और पर्यावरण विज्ञान के लिए डेटा प्रकाशक
* [[SeaBASS (डेटा संग्रह)]]|NASA SeaBASS - समुद्री रंग डेटा के लिए डेटा संग्रह
* [[SeaBASS (डेटा संग्रह)|सीबास (डेटा संग्रह)]] या नासा [[SeaBASS (डेटा संग्रह)|सीबास]] - समुद्री रंग डेटा के लिए डेटा संग्रह
* विश्व डेटा केंद्र   
* विश्व डेटा केंद्र   


Line 97: Line 97:
सामाजिक विज्ञान में, डेटा लाइब्रेरी को डेटा अभिलेखागार के रूप में जाना जाता है।<ref>White,Howard D. (1977). Machine-Readable Social Science Data. ''Drexel Library Quarterly'' 13 (January, 1977):1-110.</ref> चूंकि डेटा अभिलेखागार सामाजिक और व्यवहारिक डेटा के अधिग्रहण, तैयारी, संरक्षण और प्रसार के लिए व्यवशाये संस्थान हैं। अतः सामाजिक विज्ञान में डेटा संग्रह 1950 के दशक में विकसित हुआ और इसे अंतरराष्ट्रीय आंदोलन के रूप में माना गया है:
सामाजिक विज्ञान में, डेटा लाइब्रेरी को डेटा अभिलेखागार के रूप में जाना जाता है।<ref>White,Howard D. (1977). Machine-Readable Social Science Data. ''Drexel Library Quarterly'' 13 (January, 1977):1-110.</ref> चूंकि डेटा अभिलेखागार सामाजिक और व्यवहारिक डेटा के अधिग्रहण, तैयारी, संरक्षण और प्रसार के लिए व्यवशाये संस्थान हैं। अतः सामाजिक विज्ञान में डेटा संग्रह 1950 के दशक में विकसित हुआ और इसे अंतरराष्ट्रीय आंदोलन के रूप में माना गया है:


इस प्रकार से 1964 तक अंतर्राष्ट्रीय सामाजिक विज्ञान परिषद (आईएसएससी) ने सामाजिक विज्ञान डेटा अभिलेखागार पर दूसरे सम्मेलन को प्रायोजित किया था और सामाजिक विज्ञान डेटा पर स्थायी समिति थी, और दोनों ने डेटा अभिलेखागार आंदोलन को प्रेरित किया था। इक्कीसवीं सदी की प्रारंभ तक, अधिकांश विकसित देशों और कुछ विकासशील देशों ने औपचारिक और सही प्रकार से कार्यशील राष्ट्रीय डेटा अभिलेखागार का आयोजन किया था। इसके अतिरिक्त , कॉलेज और विश्वविद्यालय परिसरों में प्रायः 'डेटा लाइब्रेरी' होती हैं जो उनके संकाय, कर्मचारियों और छात्रों को डेटा उपलब्ध कराती हैं; इनमें से अधिकांश न्यूनतम अभिलेखीय उत्तरदायी वहन करते हैं, उस कार्य के लिए राष्ट्रीय संस्थान पर निर्भर होते हैं (रॉकवेल, 2001, पृष्ठ 3227)।<ref>Rockwell, R. C. (2001). Data Archives: International. IN: Smelser, N. J. & Baltes, P. B. (eds.) ''International Encyclopedia of the Social and Behavioral Sciences'' (vol. 5, pp. 3225- 3230). Amsterdam: Elsevier</ref>
इस प्रकार से 1964 तक अंतर्राष्ट्रीय सामाजिक विज्ञान परिषद (आईएसएससी) ने सामाजिक विज्ञान डेटा अभिलेखागार पर दूसरे सम्मेलन को प्रायोजित किया था और सामाजिक विज्ञान डेटा पर स्थायी समिति थी, और दोनों ने डेटा अभिलेखागार आंदोलन को प्रेरित किया था। इक्कीसवीं सदी की प्रारंभ तक अधिकांश विकसित देशों और कुछ विकासशील देशों ने औपचारिक और सही प्रकार से कार्यशील राष्ट्रीय डेटा अभिलेखागार का आयोजन किया था। इसके अतिरिक्त कॉलेज और विश्वविद्यालय परिसरों में प्रायः 'डेटा लाइब्रेरी' होती हैं जो उनके संकाय, कर्मचारियों और छात्रों को डेटा उपलब्ध कराती हैं; इनमें से अधिकांश न्यूनतम अभिलेखीय उत्तरदायी वहन करते हैं, उस कार्य के लिए राष्ट्रीय संस्थान पर निर्भर होते हैं (रॉकवेल, 2001, पृष्ठ 3227)।<ref>Rockwell, R. C. (2001). Data Archives: International. IN: Smelser, N. J. & Baltes, P. B. (eds.) ''International Encyclopedia of the Social and Behavioral Sciences'' (vol. 5, pp. 3225- 3230). Amsterdam: Elsevier</ref>


* रिसर्च डेटा रिपॉजिटरी की रजिस्ट्री re3data.org सभी विषयों से रिसर्च डेटा रिपॉजिटरी इंडेक्सिंग डेटा अभिलेखागार की वैश्विक रजिस्ट्री है: http://www.re3data.org
* रिसर्च डेटा रिपॉजिटरी की रजिस्ट्री re3data.org सभी विषयों से रिसर्च डेटा रिपॉजिटरी इंडेक्सिंग डेटा अभिलेखागार की वैश्विक रजिस्ट्री है: http://www.re3data.org

Revision as of 14:17, 19 July 2023

अनुसंधान डेटा संग्रह कंप्यूटर डेटा संचयन या अस्थिरता प्राकृतिक विज्ञान, सामाजिक विज्ञान और जीवन विज्ञान सहित विद्वानों के अनुसंधान डेटा का दीर्घकालिक संचयन है। और विभिन्न शैक्षणिक पत्रिकाओं में इस संबंध में अलग-अलग नीतियां होती हैं कि शोधकर्ताओं को अपने डेटा और विधियों का कितना भाग सार्वजनिक संग्रह में संग्रहीत करना आवश्यक है, और वास्तव में क्या संग्रहीत किया जाता है, यह विभिन्न विषयों के मध्य व्यापक रूप से भिन्न होता है। इसी प्रकार, प्रमुख अनुदान देने वाले संस्थानों का डेटा के सार्वजनिक संग्रह के प्रति अलग-अलग दृष्टिकोण है। सामान्यतः विज्ञान की परंपरा यह रही है कि प्रकाशनों में सहयोगी शोधकर्ताओं को अनुसंधान को दोहराने और परीक्षण करने की अनुमति देने के लिए पर्याप्त सूचना होती है। वर्तमान वर्षों में यह दृष्टिकोण तीव्रता से तनावपूर्ण हो गया है क्योंकि कुछ क्षेत्रों में अनुसंधान उच्च डेटासेट पर निर्भर करता है जिसे सरलता से स्वतंत्र रूप से दोहराया नहीं जा सकता है।

इस प्रकार से कुछ क्षेत्रों में डेटा संग्रहण अन्य क्षेत्रों की तुलना में अधिक महत्वपूर्ण है। कुछ क्षेत्रों में, कार्य को दोहराने के लिए आवश्यक सभी डेटा जर्नल आलेख में पहले से ही उपलब्ध है। अतः प्रमाणित विकास में, उच्च मात्रा में डेटा उत्पन्न होता है और इसे संग्रहीत किया जाना चाहिए जिससे शोधकर्ता यह सत्यापित कर सकते है कि दवा कंपनियां जो रिपोर्ट प्रकाशित करती हैं वह डेटा को स्पष्ट रूप से प्रतिबिंबित करती हैं।

चूंकि डेटा संग्रह की आवश्यकता विज्ञान के इतिहास में वर्तमान समय में विकास किया गया है। यह सूचना प्रौद्योगिकी में प्रगति के कारण संभव है , जिससे उच्च मात्रा में डेटा को केंद्रीय स्थानों से संग्रहीत और एक्सेस किया जा सकता है । उदाहरण के लिए, अमेरिकी जियोफिजिकल यूनियन (एजीयू) ने WWW. प्रारंभ के पश्चात लगभग तीन साल बाद 1993 में डेटा संग्रह पर अपनी पहली नीति अपनाई थी ।[1] यह नीति अनिवार्य करती है कि एजीयू कागजात में उद्धृत डेटासेट को मान्यता प्राप्त डेटा केंद्र द्वारा संग्रहीत किया जाना चाहिए; और यह डेटा पेपर के निर्माण की अनुमति देता है; और यह डेटा अभिलेखागार को बनाए रखने में एजीयू की भूमिका स्थापित करता है। किन्तु यह पेपर लेखकों पर अपना डेटा संग्रहीत करने की कोई आवश्यकता नहीं रखता है।

संगठित डेटा संग्रह से पहले, किसी पेपर का मूल्यांकन या प्रतिलिपि बनाने के इच्छुक शोधकर्ताओं को लेखक से डेटा और विधियों की जानकारी का अनुरोध करना होगा। इस प्रकार से अकादमिक समुदाय लेखकों से डेटा शेयरिंग (विज्ञान) की अपेक्षा करता है। इस प्रक्रिया को समय और ऊर्जा की विनाश के रूप में पहचाना गया है और मिश्रित परिणाम प्राप्त किये गए है । अतः कुछ वर्षों के पश्चात्सू चना विलुप्त हो सकती है या दूषित हो सकती है। इसके अतिरिक्त कुछ स्तिथियो में, लेखक सूचना प्रदान करने से मना कर देते हैं।

जब अनुसंधान स्वास्थ्य उद्देश्यों या सार्वजनिक नीति निर्माण से संबंधित होता है तो डेटा संग्रह और उचित परिश्रम की आवश्यकता बहुत बढ़ जाती है।[2][3]

पत्रिकाओं द्वारा चयनित नी तियां

बायोट्रोपिका

बायोट्रोपिका को प्रकाशन के लिए एक नियम के रूप में, यह आवश्यक है कि पेपर में परिणामों का समर्थन करने वाला डेटा और उनका वर्णन करने वाले मेटाडेटा को उपयुक्त सार्वजनिक संग्रह में संग्रहीत किया जाना चाहिए जैसे कि ड्रायड, फिगशेयर, जेनबैंक, ट्रीबेस, or एनसीबीआई. लेखक लेख प्रकाशित होते ही डेटा को सार्वजनिक रूप से उपलब्ध कराने का चुनाव कर सकते हैं या, यदि संग्रह की तकनीक अनुमति देती है, तो लेख प्रकाशन के तीन साल बाद तक डेटा तक पहुंच पर प्रतिबंध लगा सकते हैं। जैसा कि लेखकों को दिए गए निर्देशों में वर्णित है, डेटा उपलब्धता का वर्णन करने वाला एक विवरण पांडुलिपि में सम्मिलित किया जाएगा। डेटा के आवश्यक संग्रह के अपवाद उन अध्ययनों के लिए प्रधान संपादक के विवेक पर दिए जा सकते हैं जिनमें संवेदनशील सूचना (उदाहरण के लिए, लुप्तप्राय प्रजातियों का स्थान) सम्मिलित है। इस नीति की प्रेरणा बताने वाला हमारा संपादकीय पाया जा सकता है here.डेटा रिपॉजिटरी की अधिक विस्तृत सूची उपलब्ध है here. 'डेटा एकत्र करने और संग्रहीत करने वाले शोधकर्ताओं के साथ सहयोग की संस्कृति को बढ़ावा देना:उष्णकटिबंधीय जीवविज्ञानी द्वारा एकत्र किए गए डेटा प्रायः दीर्घकालिक, समष्टि और एकत्र करने के लिए बहुमूल्य होते हैं। बायोट्रोपिका का संपादक मंडल उन लेखकों को दृढ़ता से प्रोत्साहित करता है जो संग्रहीत डेटा सेटों का पुन: उपयोग करते हैं, जिससे मूल रूप से उन्हें एकत्र करने वाले वैज्ञानिकों को पूरी तरह से संलग्न सहयोगियों के रूप में शामिल किया जा सकता है । और हमारा मानना है कि इससे अध्ययन प्रणाली के प्राकृतिक इतिहास में डेटा संग्रहकर्ता की गहन अंतर्दृष्टि का उपयोग करके परिणामी अनुसंधान की गुणवत्ता और प्रभाव में काफी वृद्धि होगी, नए विश्लेषणों में त्रुटियों के संकटजनक को कम किया जाएगा और अंतर-अनुशासनात्मक और अंतर-सांस्कृतिक को प्रोत्साहित किया जाएगा। जिसके लिए सहयोग एवं प्रशिक्षण ATBC और बायोट्रोपिका व्यापक रूप से मान्यता प्राप्त हैं।

ध्यान दें: बायोट्रोपिका केवल दो पत्रिकाओं में से है जो ड्रायड में डेटा एकत्रित करने वाले लेखकों के लिए शुल्क का भुगतान करती है।

अमेरिकी प्रकृतिवादी

अमेरिकी प्रकृतिवादी के लिए लेखकों को स्वीकृत कागजात से जुड़े डेटा को सार्वजनिक संग्रह में जमा करना आवश्यक है। जीन अनुक्रम डेटा और फ़ाइलोजेनेटिक पेड़ों के लिए, क्रमशः जेनबैंक या ट्रीबेस में जमाव आवश्यक है। ऐसे कई संभावित अभिलेख हैं जो किसी विशेष डेटा सेट के लिए उपयुक्त हो सकते हैं, जिसमें पारिस्थितिक और विकासवादी जीवविज्ञान डेटा के लिए ड्रायड संचयन भी सम्मिलित है। जेनबैंक, ट्रीबेस और ड्रायड के सभी परिग्रहण नंबरों को उत्पादन में जाने से पहले स्वीकृत पांडुलिपियों में सम्मिलित किया जाना चाहिए। यदि डेटा कहीं और जमा किया गया है, तो कृपया एक लिंक प्रदान करें। यदि डेटा प्रकाशित साहित्य से लिया गया है, तो कृपया अपने पाठकों की सुविधा के लिए संकलित डेटा को ड्रायड में जमा करें। डेटा साझा करने में आने वाली किसी भी बाधा को प्रस्तुत करते समय संपादकों के ध्यान में लाया जाना चाहिए जिससे उचित व्यवस्था की जा सकती है ।.[4]

जर्नल ऑफ़ हेरेडिटी

किसी लेख के निष्कर्षों में अंतर्निहित प्राथमिक डेटा वैज्ञानिक उद्यम की सत्यापनीयता और पारदर्शिता के लिए महत्वपूर्ण है, और इसे भविष्य में दशकों तक प्रयोग करने योग्य रूप में संरक्षित किया जाना चाहिए। इस कारण से, जर्नल ऑफ हेरेडिटी के लिए आवश्यक है कि नए रिपोर्ट किए गए न्यूक्लियोटाइड या अमीनो एसिड अनुक्रम और संरचनात्मक निर्देशांक, उपयुक्त सार्वजनिक डेटाबेस (उदाहरण के लिए, जेनबैंक; ईएमबीएल न्यूक्लियोटाइड अनुक्रम डेटाबेस; जापान के डीएनए डेटाबेस) में प्रस्तुत किए जाएं। ; प्रोटीन डेटा बैंक ; और स्विस-प्रोट)। पांडुलिपि के अंतिम संस्करण में परिग्रहण संख्याएँ अवश्य शामिल की जानी चाहिए। डेटा के अन्य रूपों (उदाहरण के लिए, माइक्रोसैटेलाइट जीनोटाइप, लिंकेज मानचित्र, छवियां) के लिए, जर्नल सभी लेखकों को प्राथमिक डेटासेट को ड्रायड, ट्रीबेस जैसे उपयुक्त सार्वजनिक संग्रह में संग्रहित करने के लिए प्रोत्साहित करने में संयुक्त डेटा संग्रह नीति (जेडीएपी) के सिद्धांतों का समर्थन करता है। , या बायोकॉम्प्लेक्सिटी के लिए नॉलेज नेटवर्क। लेखकों को प्रकाशन के समय डेटा को सार्वजनिक रूप से उपलब्ध कराने के लिए प्रोत्साहित किया जाता है या, यदि संग्रह की तकनीक अनुमति देती है, तो प्रकाशन के पश्चात् एक वर्ष तक की अवधि के लिए डेटा तक पहुंच को प्रतिबंधित करने का विकल्प चुन सकते हैं। अमेरिकन जेनेटिक एसोसिएशन बड़े डेटासेट बनाने और क्यूरेट करने में व्यक्तिगत शोधकर्ताओं के विशाल निवेश को भी मान्यता देता है। परिणाम स्वरुप, हम अनुशंसा करते हैं कि इस निवेश का सम्मान एक सहयोगात्मक भावना से माध्यमिक विश्लेषण या मेटा-विश्लेषण में किया गया है ।

— oxfordjournals.org[5]

आणविक पारिस्थितिकी

आण्विक पारिस्थितिकी आशा करती है कि पेपर में परिणामों का समर्थन करने वाले डेटा को उचित सार्वजनिक संग्रह में संग्रहीत किया जाना चाहिए, जैसे कि जेनबैंक, जीन एक्सप्रेशन ऑम्निबस, ट्रीबेस, ड्रायड, बायोकॉम्प्लेक्सिटी के लिए नॉलेज नेटवर्क, आपकी स्वयं की संस्थागत या फंडर रिपॉजिटरी, या आणविक पारिस्थितिकी वेब साइट पर सहायक सूचना के रूप में किया जाता है । डेटा वैज्ञानिक उद्यम के महत्वपूर्ण उत्पाद हैं, और उन्हें भविष्य में दशकों तक संरक्षित और उपयोग योग्य बनाया जाना चाहिए। लेखक प्रकाशन के समय डेटा को सार्वजनिक रूप से उपलब्ध कराने का चुनाव कर सकते हैं, या, यदि संग्रह की तकनीक अनुमति देती है, तो प्रकाशन के बाद एक वर्ष तक की अवधि के लिए डेटा तक पहुंच को प्रतिबंधित करने का विकल्प चुन सकते हैं। संपादक के विवेक पर अपवाद दिए जा सकते हैं, विशेष रूप से संवेदनशील सूचना जैसे मानव विषय डेटा या लुप्तप्राय प्रजातियों के स्थान के लिए किया जात है ।

— Wiley[6]

प्रकृति

ऐसी सामग्री को एक मान्यता प्राप्त स्वतंत्र साइट (यूआरएल और परिग्रहण संख्या लेखक द्वारा प्रदान की जाएगी) पर होस्ट की जानी चाहिए, या सबमिशन के समय नेचर जर्नल को भेजा जाना चाहिए, या तो जर्नल की ऑनलाइन सबमिशन सेवा के माध्यम से अपलोड किया जाना चाहिए, या यदि फ़ाइलें हैं सीडी/डीवीडी (पांच प्रतियां) पर इस उद्देश्य के लिए बहुत बड़ा या अनुपयुक्त प्रारूप में। ऐसी सामग्री केवल किसी लेखक की निजी या संस्थागत वेबसाइट पर होस्ट नहीं की जा सकती.[7] प्रकृति के लिए समीक्षक को यह निर्धारित करने की आवश्यकता होती है कि क्या सभी पूरक डेटा और विधियाँ संग्रहीत की गई हैं। नीति समीक्षकों को कई प्रश्नों पर विचार करने की सलाह देती है, जिनमें सम्मिलित हैं: "क्या लेखकों को ऑनलाइन पेपर के साथ पूरक तरीके या डेटा प्रदान करने के लिए कहा जाना चाहिए? (ऐसे डेटा में मॉडलिंग अध्ययन के लिए स्रोत कोड, विस्तृत प्रयोगात्मक प्रोटोकॉल या गणितीय व्युत्पत्तियां सम्मिलित हो सकती हैं।)

विज्ञान

विज्ञान उन डेटाबेस के प्रयासों का समर्थन करता है जो वैज्ञानिक समुदाय के उपयोग के लिए प्रकाशित डेटा एकत्र करते हैं। इसलिए, प्रकाशन से पहले, उच्च डेटा सेट (माइक्रोएरे डेटा, प्रोटीन या डीएनए अनुक्रम और मैक्रोमोलेक्युलर संरचनाओं के लिए परमाणु निर्देशांक या इलेक्ट्रॉन माइक्रोस्कोपी मानचित्र सहित) को एक अनुमोदित डेटाबेस में जमा किया जाना चाहिए और प्रकाशित पेपर में सम्मिलित करने के लिए एक परिग्रहण संख्या प्रदान की जानी चाहिए।.[9] "सामग्री और विधियाँ" - विज्ञान अब अनुरोध करता है कि, सामान्य , लेखक सामग्री और विधियों के अपने अधिकांश विवरण को सहायक सामग्री के रूप में ऑनलाइन रखें, प्रिंट पांडुलिपि में केवल उतनी ही विधियों का विवरण प्रदान करें जितना कि पालन करने के लिए आवश्यक है। पाठ का तर्क. (प्रगट है, यह प्रतिबंध प्रयुक्त नहीं होगा यदि पेपर मूल रूप से एक नई विधि या तकनीक का अध्ययन है।)

रॉयल सोसाइटी

दूसरों को रॉयल सोसाइटी पत्रिकाओं में प्रकाशित काम को सत्यापित करने और उस पर निर्माण करने की अनुमति देने के लिए, यह प्रकाशन की एक नियम है कि लेखक लेख में परिणामों का समर्थन करने वाले डेटा, कोड और शोध सामग्री उपलब्ध कराते हैं।

डेटासेट और कोड को उचित, मान्यता प्राप्त, सार्वजनिक रूप से उपलब्ध संचयन में एकत्रित किया जाना चाहिए। जहां कोई डेटा-विशिष्ट रिपॉजिटरी उपस्तिथ नहीं है, लेखकों को अपने डेटासेट को एक सामान्य रिपॉजिटरी जैसे ड्रायड (रिपॉजिटरी) या फिगशेयर में एकत्रित करना चाहिए।

जर्नल ऑफ आर्कियोलॉजिकल साइंस

जर्नल ऑफ आर्कियोलॉजिकल साइंस में एक है डेटा प्रकटीकरण नीति कम से कम 2013 से। उनकी नीति में कहा गया है कि 'लेख से संबंधित सभी डेटा को पूरक फाइलों में उपलब्ध कराया जाना चाहिए या बाहरी रिपॉजिटरी में एकत्रित किया जाना चाहिए और लेख के अन्दर लिंक किया जाना चाहिए। नीति अनुशंसा करती है कि डेटा को पुरातत्व डेटा सेवा जैसे संचयन में एकत्रित किया जाए।डिजिटल पुरातत्व रिकॉर्ड, या पैन्जिया। 2018 के एक अध्ययन में डेटा उपलब्धता दर 53% पाई गई, जो या तो इस नीति के निर्बल प्रवर्तन को दर्शाती है या संपादकों, समीक्षकों और लेखकों के मध्य इस नीति की व्याख्या और कार्यान्वयन के बारे में अधूरी समझ को दर्शाती है।.[12]

फंडिंग एजेंसियों द्वारा नीतियां

इस प्रकार से संयुक्त राज्य अमेरिका में, राष्ट्रीय विज्ञान संस्था (एनएसएफ) ने डेटा संग्रहण पर आवश्यकताओं को समष्टि कर दिया है। एनएसएफ से फंडिंग चाहने वाले शोधकर्ताओं को अब अनुदान आवेदन के दो पेज के पूरक के रूप में डेटा प्रबंधन योजना प्राप्त करने की आवश्यकता है।[13]

एनएसएफ डेटा नेटवर्क पहल के परिणामस्वरूप डेटा ऑब्जर्वेशन नेटवर्क फॉर अर्थ (डेटाओएन) परियोजना को वित्त पोषित किया गया है, जो की अनेक वैज्ञानिकों द्वारा उत्पादित पारिस्थितिक और पर्यावरणीय डेटा के लिए वैज्ञानिक डेटा संग्रह प्रदान करता है । और डेटाऑन का घोषित लक्ष्य बहु-स्तरीय, बहु-अनुशासन और बहु-राष्ट्रीय डेटा को संरक्षित करना है और उस तक पहुंच प्रदान करना है। डेटाऑन के उपयोगकर्ताओं के समुदाय में वैज्ञानिक, पारिस्थितिकी तंत्र प्रबंधक, नीति निर्माता, छात्र, शिक्षक और जनता सम्मिलित हैं।

जर्मन डॉयचे फ़ोर्सचुंग्सगेमिंसचाफ़्ट के लिए आवश्यक है कि अनुसंधान डेटा को शोधकर्ता के अपने संस्थान या उपयुक्त राष्ट्रव्यापी मूलभूत रूप में कम से कम 10 वर्षों के लिए संग्रहीत किया जाना चाहिए।[14]

अतः ब्रिटिश डिजिटल क्यूरेशन केंद्र फंडर की डेटा नीतियों का अवलोकन रखता है।[15]

डेटा लाइब्रेरी

डेटा रिपोजिटरी और पुरालेख रिपोजिटरी

इसके अतिरिक्त अनुसंधान डेटा को डेटा लाइब्रेरी या डेटा अभिलेखागार में संग्रहीत किया जाता है। और डेटा लाइब्रेरी, डेटा संग्रह, या डेटा रिपॉजिटरी अनुसंधान में द्वितीयक उपयोग के लिए संख्यात्मक और/या भू-स्थानिक डेटा सेट का संग्रह है। चूंकि डेटा लाइब्रेरी सामान्यतः उच्च संस्थान (शैक्षणिक, कॉर्पोरेट, वैज्ञानिक, चिकित्सा, सरकारी, आदि) का भाग होती है। अनुसंधान डेटा संग्रह और उस संगठन के डेटा उपयोगकर्ताओं की सेवा के लिए स्थापित किया गया है । डेटा लाइब्रेरी में स्थानीय डेटा संग्रह होते हैं और विभिन्न माध्यमों (डाउनलोड के लिए कॉम्पैक्ट डिस्क-/डीवीडी-रोम या केंद्रीय सर्वर (कंप्यूटिंग)) के माध्यम से उन तक पहुंच प्रदान की जाती है। डेटा लाइब्रेरी अपने उपयोगकर्ताओं के लिए सूचना तक पहुंचने के लिए लाइसेंस प्राप्त डेटा संसाधनों की सदस्यता भी बनाए रख सकती है। क्या डेटा लाइब्रेरी को डेटा संग्रह भी माना जाता है, यह संग्रह में अद्वितीय होल्डिंग्स की सीमा पर निर्भर हो सकता है, इस प्रकार से दीर्घकालिक संरक्षण सेवाएं प्रस्तुत की जाती हैं, और क्या यह व्यापक समुदाय को सेवा प्रदान करता है (जैसा कि राष्ट्रीय डेटा अभिलेखागार करते हैं)। अधिकांश सार्वजनिक डेटा लाइब्रेरी रिसर्च डेटा रिपॉजिटरी की रजिस्ट्री में सूचीबद्ध हैं।

महत्व और सेवाएँ

इसके अतिरिक्त अगस्त 2001 में, अनुसंधान पुस्तकालयों का संघ (एआरएल) ने रिपोर्ट प्रकाशित की गयी है [16] और संख्यात्मक डेटा संसाधनों के लिए सेवाएं एकत्र करने और प्रदान करने में सम्मिलित एआरएल सदस्य संस्थानों के सर्वेक्षण से परिणाम प्रस्तुत करना है ।

अनुसंधान में संख्यात्मक और अन्य प्रकार के डेटा सेट के उपयोग के लिए संस्थागत स्तर पर सहायता प्रदान करने वाली पुस्तकालय सेवा है ।

अतः सामान्यतः उपलब्ध सहायता गतिविधियों में से:

  • संदर्भ सहायता - उपयोगकर्ता क्वेरी के उत्तर में किसी विशेष विषय या विषयों के समूह पर मापने योग्य चर वाले संख्यात्मक या भू-स्थानिक डेटासेट का पता लगाना।
  • उपयोगकर्ता निर्देश - विशेष विषयों पर डेटा संसाधनों का पता लगाने, डेटा को कैसे डाउनलोड करें और इसे स्प्रेडशीट, सांख्यिकीय, डेटाबेस या जीआईएस पैकेज में कैसे पढ़ें, कोडबुक और अन्य दस्तावेज़ों की व्याख्या कैसे करें, में उपयोगकर्ताओं के समूहों को व्यावहारिक प्रशिक्षण प्रदान करना है ।
  • तकनीकी सहायता - जिसमें पंजीकरण प्रक्रियाओं को सरल बनाना, डेटासेट के साथ समस्याओं का निवारण करना है , जैसे दस्तावेज़ीकरण में त्रुटियाँ, डेटा को किसी ऐसी चीज़ में पुन: स्वरूपित करना जिसके साथ उपयोगकर्ता काम कर सकता है, और सांख्यिकीय पद्धति में सहायता करना सम्मिलित है।
  • संग्रह विकास एवं प्रबंधन - स्थानीय उपयोगकर्ता समुदाय द्वारा द्वितीयक विश्लेषण के लिए उपयोग की जाने वाली डेटा फ़ाइलों के संग्रह को प्राप्त करना, बनाए रखना और प्रबंधित करना; संस्थागत डेटा सदस्यताएँ खरीदें; संस्थान के लिए डेटा प्रदाताओं और राष्ट्रीय डेटा अभिलेखागार के लिए साइट प्रतिनिधि के रूप में कार्य कर सकते है ।
  • संरक्षण और डेटा साझाकरण सेवाएँ - संग्रह में डेटासेट के संरक्षण की रणनीति पर कार्य करें, जैसे मीडिया रिफ्रेशमेंट और फ़ाइल प्रारूप माइग्रेशन; केंद्रीय संचयन से अद्यतन संस्करणों को डाउनलोड करें और रिकॉर्ड करके एकत्रित कर सकते है । इसके अतिरिक्त, उपयोगकर्ताओं को दूसरों के द्वितीयक उपयोग के लिए मूल डेटा तैयार करने में सहायता करना है; या तो केंद्रीय या संस्थागत संचयन में एकत्रित करने के लिए है, या डेटा साझा करने के कम औपचारिक विधियों के लिए उपयोग किया गया है । इसमें डेटा को उचित एक्सएमएल मानक में चिह्नित करना भी सम्मिलित हो सकता है, जैसे डेटा दस्तावेज़ीकरण पहल, या ऑनलाइन खोज की सुविधा के लिए अन्य मेटाडेटा जोड़ना है ।

डेटा लाइब्रेरी के उदाहरण

प्राकृतिक विज्ञान

निम्नलिखित सूची वैज्ञानिक डेटा अभिलेखागार को संदर्भित करती है।

सामाजिक विज्ञान

सामाजिक विज्ञान में, डेटा लाइब्रेरी को डेटा अभिलेखागार के रूप में जाना जाता है।[17] चूंकि डेटा अभिलेखागार सामाजिक और व्यवहारिक डेटा के अधिग्रहण, तैयारी, संरक्षण और प्रसार के लिए व्यवशाये संस्थान हैं। अतः सामाजिक विज्ञान में डेटा संग्रह 1950 के दशक में विकसित हुआ और इसे अंतरराष्ट्रीय आंदोलन के रूप में माना गया है:

इस प्रकार से 1964 तक अंतर्राष्ट्रीय सामाजिक विज्ञान परिषद (आईएसएससी) ने सामाजिक विज्ञान डेटा अभिलेखागार पर दूसरे सम्मेलन को प्रायोजित किया था और सामाजिक विज्ञान डेटा पर स्थायी समिति थी, और दोनों ने डेटा अभिलेखागार आंदोलन को प्रेरित किया था। इक्कीसवीं सदी की प्रारंभ तक अधिकांश विकसित देशों और कुछ विकासशील देशों ने औपचारिक और सही प्रकार से कार्यशील राष्ट्रीय डेटा अभिलेखागार का आयोजन किया था। इसके अतिरिक्त कॉलेज और विश्वविद्यालय परिसरों में प्रायः 'डेटा लाइब्रेरी' होती हैं जो उनके संकाय, कर्मचारियों और छात्रों को डेटा उपलब्ध कराती हैं; इनमें से अधिकांश न्यूनतम अभिलेखीय उत्तरदायी वहन करते हैं, उस कार्य के लिए राष्ट्रीय संस्थान पर निर्भर होते हैं (रॉकवेल, 2001, पृष्ठ 3227)।[18]

यह भी देखें

संदर्भ

  1. ”Policy on Referencing Data in and Archiving Data for AGU Publications” [1]
  2. "The Case for Due Diligence When Empirical Research is Used in Policy Formation" by Bruce McCullough and Ross McKitrick. [2]
  3. "Data Sharing and Replication" a website by Gary King Archived 2007-03-28 at the Wayback Machine
  4. Supporting Data and Material
  5. Data archiving policy
  6. Policy on data archiving
  7. "Availability of Data and Materials: The Policy of Nature Magazine
  8. "Guide to नेचर जर्नल्स की प्रकाशन नीतियां" (PDF). {{cite web}}: Unknown parameter |तारीख= ignored (help)
  9. "विज्ञान पत्रिका की सामान्य नीतियाँ"
  10. ”आपकी सहायक ऑनलाइन सामग्री तैयार करना”
  11. "Data sharing and mining"
  12. Marwick, Ben; Birch, Suzanne E. Pilaar (5 April 2018). "A Standard for the Scholarly Citation of Archaeological Data as an Incentive to Data Sharing". Advances in Archaeological Practice. 6 (2): 125–143. doi:10.1017/aap.2018.3.
  13. ”NSF to Ask Every Grant Applicant for Data Management Plan”
  14. ”DFG Guidelines on the Handling of Research Data”
  15. "Overview of funders' data policies | Digital Curation Centre"
  16. SPEC Kit 263: Numeric Data Products and Services
  17. White,Howard D. (1977). Machine-Readable Social Science Data. Drexel Library Quarterly 13 (January, 1977):1-110.
  18. Rockwell, R. C. (2001). Data Archives: International. IN: Smelser, N. J. & Baltes, P. B. (eds.) International Encyclopedia of the Social and Behavioral Sciences (vol. 5, pp. 3225- 3230). Amsterdam: Elsevier


टिप्पणियाँ


अग्रिम पठन

  • Clubb, J., Austin, E., and Geda, C. "'Sharing research data in the social sciences.'" In Sharing Research Data, S. Fienberg, M. Martin, and M. Straf, Eds. National Academy Press, Washington, D.C., 1985, 39-88.
  • Geraci, D., Humphrey, C., and Jacobs, J. Data Basics. Canadian Library Association, Ottawa, ON, 2005.
  • Heim, Kathleen M. "Social Scientific Information Needs for Numeric Data: The Evolution of the International Data Archive Infrastructure." Collection Management 9 (Spring 1987): 1-53.
  • Martinez, Luis & Macdonald, Stuart, "'Supporting local data users in the UK academic community'". Ariadne, issue 44, July 2005.
  • See the IASSIST Bibliography of Selected Works Archived 2016-03-03 at the Wayback Machine for articles tracing the history of data libraries and its relationship to the archivist profession, going back to the 1960s and '70s up to 1996.
  • See IASSIST Quarterly articles from 1993 to the present, focusing on data libraries, data archives, data support, and information technology for the social sciences.


बाहरी संबंध



संघ

  • IASSIST (सामाजिक विज्ञान सूचना और सेवा प्रौद्योगिकी के लिए अंतर्राष्ट्रीय संघ)
  • DISC-UK (डेटा सूचना विशेषज्ञ समिति-यूनाइटेड किंगडम)
  • APDU (सार्वजनिक डेटा उपयोगकर्ताओं का संघ - यूएसए)
  • CAPDU (कैनेडियन एसोसिएशन ऑफ पब्लिक डेटा यूजर्स)

श्रेणी:कंप्यूटर पुरालेख श्रेणी:डेटा प्रबंधन श्रेणी:डेटा प्रकाशन श्रेणी:डिजिटल संरक्षण श्रेणी:सूचना पुनर्प्राप्ति तकनीक श्रेणी:ज्ञान प्रतिनिधित्व श्रेणी:संरचित संचयन