बायोकंडक्टर: Difference between revisions
(→लक्ष्य) |
|||
Line 35: | Line 35: | ||
== मुख्य विशेषताएं == | == मुख्य विशेषताएं == | ||
* | * '''प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान।''' प्रत्येक बायोकांडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो एक प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकांडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकांडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है। | ||
* सांख्यिकी। जैवचालक परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए शक्तिशाली सांख्यिकीय और ग्राफिकल तरीकों की एक विस्तृत श्रृंखला तक पहुंच प्रदान करना है। विश्लेषण संकुल इसके लिए उपलब्ध हैं: प्री-प्रोसेसिंग एफिमेट्रिक्स और [[ इल्लुमिना (कंपनी) ]], पूरक डीएनए सरणी डेटा; [[अभिव्यक्ति रूपरेखा]] की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा प्लॉट करना इसके अलावा, आर संकुल सिस्टम स्वयं अत्याधुनिक सांख्यिकी और सांख्यिकीय ग्राफिक्स तकनीकों की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करता है, जिसमें रैखिक प्रतिगमन और गैर-रैखिक प्रतिगमन शामिल हैं। गैर-रैखिक मॉडलिंग, [[क्लस्टर विश्लेषण]], [[भविष्यवाणी]], पुन: नमूनाकरण (सांख्यिकी), [[उत्तरजीविता विश्लेषण]] और [[समय श्रृंखला]] विश्लेषण। | * सांख्यिकी। जैवचालक परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए शक्तिशाली सांख्यिकीय और ग्राफिकल तरीकों की एक विस्तृत श्रृंखला तक पहुंच प्रदान करना है। विश्लेषण संकुल इसके लिए उपलब्ध हैं: प्री-प्रोसेसिंग एफिमेट्रिक्स और [[ इल्लुमिना (कंपनी) ]], पूरक डीएनए सरणी डेटा; [[अभिव्यक्ति रूपरेखा]] की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा प्लॉट करना इसके अलावा, आर संकुल सिस्टम स्वयं अत्याधुनिक सांख्यिकी और सांख्यिकीय ग्राफिक्स तकनीकों की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करता है, जिसमें रैखिक प्रतिगमन और गैर-रैखिक प्रतिगमन शामिल हैं। गैर-रैखिक मॉडलिंग, [[क्लस्टर विश्लेषण]], [[भविष्यवाणी]], पुन: नमूनाकरण (सांख्यिकी), [[उत्तरजीविता विश्लेषण]] और [[समय श्रृंखला]] विश्लेषण। | ||
* जीनोम एनोटेशन। जैवचालक प्रोजेक्ट [[ GenBank ]], लोकसलिंक और पबमेड (एनोटेट संकुल) जैसे वेब डेटाबेस से जैविक मेटाडेटा के लिए वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को जोड़ने के लिए सॉफ्टवेयर प्रदान करता है। एनोटेशन डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को शामिल करने के लिए कार्य भी प्रदान किए जाते हैं। जेनबैंक, [[जीन ओन्टोलॉजी]], लोकसलिंक, [[यूनीजीन]], [[ मानव जीनोम परियोजना ]] और एनोटेशनडीबीआई संकुल के साथ अन्य जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को असेंबल करने और प्रोसेस करने के लिए सॉफ्टवेयर टूल उपलब्ध हैं। विभिन्न जांच पहचानकर्ताओं (जैसे Affy IDs, LocusLink, PubMed) के बीच मैपिंग प्रदान करने के लिए डेटा संकुल वितरित किए जाते हैं। अनुकूलित एनोटेशन पुस्तकालयों को भी इकट्ठा किया जा सकता है। | * जीनोम एनोटेशन। जैवचालक प्रोजेक्ट [[ GenBank ]], लोकसलिंक और पबमेड (एनोटेट संकुल) जैसे वेब डेटाबेस से जैविक मेटाडेटा के लिए वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को जोड़ने के लिए सॉफ्टवेयर प्रदान करता है। एनोटेशन डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को शामिल करने के लिए कार्य भी प्रदान किए जाते हैं। जेनबैंक, [[जीन ओन्टोलॉजी]], लोकसलिंक, [[यूनीजीन]], [[ मानव जीनोम परियोजना ]] और एनोटेशनडीबीआई संकुल के साथ अन्य जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को असेंबल करने और प्रोसेस करने के लिए सॉफ्टवेयर टूल उपलब्ध हैं। विभिन्न जांच पहचानकर्ताओं (जैसे Affy IDs, LocusLink, PubMed) के बीच मैपिंग प्रदान करने के लिए डेटा संकुल वितरित किए जाते हैं। अनुकूलित एनोटेशन पुस्तकालयों को भी इकट्ठा किया जा सकता है। |
Revision as of 21:08, 26 June 2023
File:Bioconductor logo.svg | |
Stable release | 3.17
/ 26 April 2023 |
---|---|
Operating system | Linux, macOS, Windows |
Platform | R programming language |
Type | Bioinformatics |
License | Artistic License 2.0 |
Website | www |
आणविक जीव विज्ञान में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न जीनोमिक डेटा के विश्लेषण और समझ के लिए जैवचालक एक स्वतंत्र, स्वतंत्र स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।
जैवचालक मुख्य रूप से सांख्यिकीय R प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप शामिल है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो आर के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो आर के विकास संस्करण से संबंधित है।अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई जीनोम एनोटेशन प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के माइक्रोएरे इस पर केंद्रित हैं।
जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, जैवचालक परियोजना एक खुला स्रोत सॉफ्टवेयर रिपॉजिटरी है जो आर प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई जैवचालक संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और जैवचालक संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।
यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से फ्रेड हचिंसन कैंसर अनुसंधान केंद्र में स्थित जैवचालक कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।
संकुल
अधिकांश बायोकंडक्टर घटकों को R संकुल के रूप में वितरित किया जाता है, जो आर के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर संकुल एकल-चैनल एफिमेट्रिक्स और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, अनुक्रम या एसएनपी डेटा के विश्लेषण को शामिल करने के लिए व्यापक किया गया है।
लक्ष्य
परियोजनाओं के विस्तृत उद्देश्य हैं:
- जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक व्यापक उपयोग प्रदान करते हैं।
- जीनोमिक डेटा के विश्लेषण में जैविक मेटाडेटा को शामिल करने की सुविधा प्रदान करना, जैसे पबमेड से साहित्य डेटा, और लोकसलिंक/एन्ट्रीज़ से एनोटेशन डेटा आदि।
- एक सामान्य सॉफ़्टवेयर प्लेटफ़ॉर्म प्रदान करें जो त्वरित विकास और तीव्र, मापनीय और अन्योन्याश्रित सॉफ़्टवेयर की परिनियोजन को सक्षम बनाता है।
- आगे के वैज्ञानिक उच्च गुणवत्ता वाले प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान का उपयोग द्वारा समझ रहे हैं।
- जीनोमिक डेटा के विश्लेषण के लिए कम्प्यूटेशनल और सांख्यिकीय विधियों पर शोधकर्ताओं को प्रशिक्षण देता है।
मुख्य विशेषताएं
- प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान। प्रत्येक बायोकांडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो एक प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकांडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकांडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
- सांख्यिकी। जैवचालक परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए शक्तिशाली सांख्यिकीय और ग्राफिकल तरीकों की एक विस्तृत श्रृंखला तक पहुंच प्रदान करना है। विश्लेषण संकुल इसके लिए उपलब्ध हैं: प्री-प्रोसेसिंग एफिमेट्रिक्स और इल्लुमिना (कंपनी) , पूरक डीएनए सरणी डेटा; अभिव्यक्ति रूपरेखा की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा प्लॉट करना इसके अलावा, आर संकुल सिस्टम स्वयं अत्याधुनिक सांख्यिकी और सांख्यिकीय ग्राफिक्स तकनीकों की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करता है, जिसमें रैखिक प्रतिगमन और गैर-रैखिक प्रतिगमन शामिल हैं। गैर-रैखिक मॉडलिंग, क्लस्टर विश्लेषण, भविष्यवाणी, पुन: नमूनाकरण (सांख्यिकी), उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण।
- जीनोम एनोटेशन। जैवचालक प्रोजेक्ट GenBank , लोकसलिंक और पबमेड (एनोटेट संकुल) जैसे वेब डेटाबेस से जैविक मेटाडेटा के लिए वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को जोड़ने के लिए सॉफ्टवेयर प्रदान करता है। एनोटेशन डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को शामिल करने के लिए कार्य भी प्रदान किए जाते हैं। जेनबैंक, जीन ओन्टोलॉजी, लोकसलिंक, यूनीजीन, मानव जीनोम परियोजना और एनोटेशनडीबीआई संकुल के साथ अन्य जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को असेंबल करने और प्रोसेस करने के लिए सॉफ्टवेयर टूल उपलब्ध हैं। विभिन्न जांच पहचानकर्ताओं (जैसे Affy IDs, LocusLink, PubMed) के बीच मैपिंग प्रदान करने के लिए डेटा संकुल वितरित किए जाते हैं। अनुकूलित एनोटेशन पुस्तकालयों को भी इकट्ठा किया जा सकता है।
- खुला स्रोत सॉफ्टवेयर। जैवचालक प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन के प्रति प्रतिबद्धता है। सभी योगदान ओपन सोर्स लाइसेंस जैसे कि आर्टिस्टिक लाइसेंस | आर्टिस्टिक 2.0, जीएनयू जनरल पब्लिक लाइसेंस या बर्कले सॉफ्टवेयर वितरण के तहत मौजूद होने की उम्मीद है। कई अलग-अलग कारण हैं कि ओपन-सोर्स सॉफ़्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप अंतिम उपयोगकर्ता (कंप्यूटर विज्ञान) के लिए फायदेमंद क्यों है। कारणों में शामिल हैं:
- कलन विधि और उनके कार्यान्वयन तक पूर्ण पहुंच प्रदान करने के लिए
- सॉफ्टवेयर बग और प्लग-इन (कंप्यूटिंग) | प्लग-इन के माध्यम से सॉफ्टवेयर सुधार की सुविधा के लिए
- उचित उपकरण और निर्देश प्रदान करके अच्छे कम्प्यूटेशनल आंकड़ों को प्रोत्साहित करना
- एक अनुप्रयोग प्रक्रिया सामग्री प्रदान करने के लिए जो शोधकर्ताओं को जैविक डेटा का विश्लेषण करने के लिए उपयोग की जाने वाली विधियों का पता लगाने और विस्तार करने की अनुमति देता है
- यह सुनिश्चित करने के लिए कि अनुसंधान करने के लिए आवश्यक प्रोग्रामिंग टूल का स्वामी अंतर्राष्ट्रीय वैज्ञानिक समुदाय है
- उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और उन्हें प्रोत्साहित करना जो सफल हैं
- खुले और सुलभ उपकरण प्रदान करके पुनरुत्पादन को बढ़ावा देने के लिए जिसके साथ वह शोध किया जा सके (पुनरुत्पादन अनुसंधान स्वतंत्र सत्यापन से अलग है)
- ओपन सोर्स सॉफ्टवेयर डेवलपमेंट। एंड-यूज़र (कंप्यूटर साइंस) को सॉफ्टवेयर डेवलपर बनने के लिए प्रोत्साहित किया जाता है, या तो जैवचालक के अनुरूप संकुल या दस्तावेज़ीकरण में योगदान करके। इसके अतिरिक्त जैवचालक सॉफ्टवेयर पर सहयोग को बढ़ावा देने के लिए लक्ष्य निर्धारण के साथ विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवतः साझा विकास के स्तर पर।
मील के पत्थर
जैवचालक के प्रत्येक रिलीज को आर के चुने हुए संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित किया गया है।[1] बग फिक्स और अपडेट के अलावा, एक नया रिलीज आमतौर पर संकुल जोड़ता है। नीचे दी गई तालिका एक जैवचालक रिलीज को आर संस्करण में मैप करती है और उस रिलीज के लिए उपलब्ध जैवचालक सॉफ्टवेयर संकुलों की संख्या दिखाती है।
Version | Release date | Package count | R dependency |
---|---|---|---|
3.17 | 26 Apr 2023 | 2230 | R 4.3 |
3.16 | 2 Nov 2022 | 2183 | R 4.2 |
3.14 | 27 Oct 2021 | 2083 | R 4.1 |
3.11 | 28 Apr 2020 | 1903 | R 4.0 |
3.10 | 30 Oct 2019 | 1823 | R 3.6 |
3.8 | 31 Oct 2018 | 1649 | R 3.5 |
3.6 | 31 Oct 2017 | 1473 | R 3.4 |
3.4 | 18 Oct 2016 | 1296 | R 3.3 |
3.2 | 14 Oct 2015 | 1104 | R 3.2 |
3.0 | 14 Oct 2014 | 934 | R 3.1 |
2.13 | 15 Oct 2013 | 749 | R 3.0 |
2.11 | 3 Oct 2012 | 610 | R 2.15 |
2.9 | 1 Nov 2011 | 517 | R 2.14 |
2.8 | 14 Apr 2011 | 466 | R 2.13 |
2.7 | 18 Nov 2010 | 418 | R 2.12 |
2.6 | 23 Apr 2010 | 389 | R 2.11 |
2.5 | 28 Oct 2009 | 352 | R 2.10 |
2.4 | 21 Apr 2009 | 320 | R 2.9 |
2.3 | 22 Oct 2008 | 294 | R 2.8 |
2.2 | 1 May 2008 | 260 | R 2.7 |
2.1 | 8 Oct 2007 | 233 | R 2.6 |
2.0 | 26 Apr 2007 | 214 | R 2.5 |
1.9 | 4 Oct 2006 | 188 | R 2.4 |
1.8 | 27 Apr 2006 | 172 | R 2.3 |
1.7 | 14 Oct 2005 | 141 | R 2.2 |
1.6 | 18 May 2005 | 123 | R 2.1 |
1.5 | 25 Oct 2004 | 100 | R 2.0 |
1.4 | 17 May 2004 | 81 | R 1.9 |
1.3 | 30 Oct 2003 | 49 | R 1.8 |
1.2 | 29 May 2003 | 30 | R 1.7 |
1.1 | 19 Oct 2002 | 20 | R 1.6 |
1.0 | 1 May 2002 | 15 | R 1.5 |
संसाधन
- Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit, S. (2005). आर और बायोकंडक्टर का उपयोग करके जैव सूचना विज्ञान और कम्प्यूटेशनल जीवविज्ञान समाधान. Springer. ISBN 978-0-387-25146-2.
- Gentleman, R. (2008). जैव सूचना विज्ञान के लिए आर प्रोग्रामिंग. Chapman & Hall/CRC. ISBN 978-1-4200-6367-7.
- Hahne, F.; Huber, W.; Gentleman, R.; Falcon, S. (2008). बायोकंडक्टर केस स्टडीज. Springer. ISBN 978-0-387-77239-4.
- Gentleman, Robert C.; Carey, Vincent J.; Bates, Douglas M.; Bolstad, Ben; Dettling, Marcel; Dudoit, Sandrine; Ellis, Byron; Gautier, Laurent; Ge, Yongchao; Gentry, Jeff; Hornik, Kurt; Hothorn, Torsten; Huber, Wolfgang; Iacus, Stefano; Irizarry, Rafael; Leisch, Friedrich; Li, Cheng; Maechler, Martin; Rossini, Anthony J.; Sawitzki, Gunther; Smith, Colin; Smyth, Gordon; Tierney, Luke; Yang, Jean Y. H.; Zhang, Jianhua (2004). "बायोकंडक्टर: कम्प्यूटेशनल जीव विज्ञान और जैव सूचना विज्ञान के लिए खुला सॉफ्टवेयर विकास". Genome Biology. 5 (10): R80. doi:10.1186/gb-2004-5-10-r80. PMC 545600. PMID 15461798.
यह भी देखें
- कम्प्यूटेशनल बायोलॉजी
- जैव सूचना विज्ञान
- ओपन सोर्स बायोइनफॉरमैटिक्स सॉफ्टवेयर की सूची
- अनुक्रम संरेखण सॉफ्टवेयर की सूची
- आर (प्रोग्रामिंग भाषा)
- डीएनए माइक्रोएरे
- Affymetrix, एक माइक्रोएरे प्रौद्योगिकी मंच
संदर्भ
- ↑ "Bioconductor – Release Announcements". bioconductor.org. Bioconductor. Retrieved 28 May 2019.
बाहरी संबंध
- Official website
- The R Project GNU R is a programming language for statistical computing.
- Bioconductor Releases
- The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages Archived 2007-08-11 at the Wayback Machine for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.