बायोकंडक्टर
File:Bioconductor logo.svg | |
Stable release | |
---|---|
Operating system | लिनक्स, मैकओएस, विंडोज |
Platform | R प्रोग्रामिंग भाषा |
Type | जैव सूचना विज्ञान |
License | कलापर कलाइसेंस 2.0 |
Website | www |
आणविक जीव विज्ञान में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न जीनोमिक डेटा के विश्लेषण और समझ के लिए बायोकंडक्टर एक मुक्त, मुक्त स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।
बायोकंडक्टर मुख्य रूप से सांख्यिकीय R प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप सम्मिलित है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो R के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो R के विकास संस्करण से संबंधित है। अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई जीनोम एनोटेशन प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के माइक्रोएरे इस पर केंद्रित हैं।
जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, बायोकंडक्टर परियोजना एक मुक्त स्रोत सॉफ्टवेयर रिपॉजिटरी है जो R प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई बायोकंडक्टर संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और बायोकंडक्टर संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।
यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से फ्रेड हचिंसन कैंसर अनुसंधान केंद्र में स्थित बायोकंडक्टर कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।
संकुल
अधिकांश बायोकंडक्टर घटकों को R संकुल के रूप में वितरित किया जाता है, जो R के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर संकुल एकल-चैनल एफिमेट्रिक्स और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, अनुक्रम या एसएनपी डेटा के विश्लेषण को सम्मिलित करने के लिए व्यापक किया गया है।
लक्ष्य
परियोजनाओं के विस्तृत उद्देश्य हैं:
- जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक व्यापक उपयोग प्रदान करते हैं।
- जीनोमिक डेटा के विश्लेषण में जैविक मेटाडेटा को सम्मिलित करने की सुविधा प्रदान करना, जैसे पबमेड से साहित्य डेटा, और लोकसलिंक/एन्ट्रीज़ से एनोटेशन डेटा आदि।
- सामान्य सॉफ़्टवेयर प्लेटफ़ॉर्म प्रदान करें जो त्वरित विकास और तीव्र, मापनीय और अन्योन्याश्रित सॉफ़्टवेयर की परिनियोजन को सक्षम बनाता है।
- आगे के वैज्ञानिक उच्च गुणवत्ता वाले प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान का उपयोग द्वारा समझ रहे हैं।
- जीनोमिक डेटा के विश्लेषण के लिए कम्प्यूटेशनल और सांख्यिकीय विधियों पर शोधकर्ताओं को प्रशिक्षण देता है।
मुख्य विशेषताएं
- प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान- प्रत्येक बायोकंडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकंडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकंडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
- सांख्यिकीय और चित्रमय विधियाँ- बायोकंडक्टर परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक सीमित पहुंच प्रदान करना है। विश्लेषण पैकेज के लिए उपलब्ध हैं: पूर्व-प्रसंस्करण एफ्टीमेट्रिक्स और इलुमिना, सीडीएनए सरणी डेटा; विभेदक रूप से व्यक्त जीन की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा की योजना तैयार करना है। इसके अतिरिक्त, R पैकेज प्रणाली स्वयं अत्याधुनिक सांख्यिकीय की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करती है और आलेखीय तकनीकें, जिनमें रैखिक और गैर-रेखीय मॉडलिंग, क्लस्टर विश्लेषण, पूर्वानुमान, पुनरुत्थान, उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण सम्मिलित हैं।
- जीनोम व्याख्या- बायोकंडक्टर परियोजना वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को वेब डेटाबेस से जैविक मेटाडेटा जैसे कि जेनबैंक, लोकसलिंक और पबमेड (एनोटेट पैकेज) से जोड़ने के लिए सॉफ्टवेयर प्रदान करती है। व्याख्या डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को सम्मिलित करने के लिए भी कार्य प्रदान किए जाते हैं। सॉफ्टवेयर उपकरण जीनबैंक, जीन ओन्टोलॉजी कंसोर्टियम, लोकसलिंक, यूनीजीन जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को इकट्ठा करने और संसाधित करने के लिए उपलब्ध हैं, यूसीएससी मानव जीनोम परियोजना और अन्य एनोटेशनडीबी पैकेज के साथ। डेटा पैकेज विभिन्न जांच पहचानकर्ताओं के बीच मैपिंग प्रदान करने के लिए वितरित किए जाते हैं (उदा. एफी आईडी, लोकोसलिंक, पबमेड)। अनुकूलित व्याख्या पुस्तकालयों को भी एकत्र किया जा सकता है।
- मुक्त स्रोत- बायोकंडक्टर प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन की प्रतिबद्धता है। सभी योगदान मुक्त स्रोत लाइसेंस जैसे कि आर्टिस्टिक 2.0, जीपीएल 2 या बीएसडी के तहत उपस्थित होने की संभावना है. कई अलग-अलग कारण हैं कि मुक्त स्रोत सॉफ्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप से कम्प्यूटेशनल जीव विज्ञान के लिए लाभदायक है। कारणों में सम्मिलित हैं:
- एल्गोरिदम (कलन विधि) और उनके कार्यान्वयन के लिए पूर्ण पहुंच प्रदान करना है।
- बग फिक्सिंग और प्लग-इन के माध्यम से सॉफ्टवेयर में सुधार की सुविधा प्रदान करना है।
- उपयुक्त उपकरण और निर्देश प्रदान करके अच्छे वैज्ञानिक कंप्यूटिंग और सांख्यिकीय अभ्यास को प्रोत्साहित करना है।
- उपकरणों का कार्यक्षेत्र प्रदान करना जो शोधकर्ताओं को जैविक डेटा का विश्लेषण करने के लिए उपयोग किए जाने वाले तरीकों का पता लगाने और उनका विस्तार करने की अनुमति देता है।
- यह सुनिश्चित करने के लिए कि अंतर्राष्ट्रीय वैज्ञानिक समुदाय अनुसंधान करने के लिए आवश्यक सॉफ्टवेयर टूल का स्वामित्व है।
- उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और प्रोत्साहित करना जो सफल हैं।
- मुक्त और सुगम उपकरण प्रदान करके प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान को प्रोत्साहित करने के लिए जिसके साथ उस शोध को पूरा करना है (पुन: प्रस्तुत करने योग्य अनुसंधान मुक्त सत्यापन से अलग है)।
- मुक्त विकास- उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।
मील के पत्थर
बायोकंडक्टर की प्रत्येक प्रस्तुति R के चयनित संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित की गई है।[1] बगफिक्स और अद्यतन के अतिरिक्त, एक नई प्रविष्टि सामान्यतः संकुल बनाती है। नीचे दी गई तालिका R संस्करण के लिए बायोकंडक्टर विज्ञप्ति को दर्शाती है और उस विज्ञप्ति के लिए उपलब्ध बायोकंडक्टर सॉफ्टवेयर पैकेजों की संख्या दिखाती है।
संस्करण | निर्गमन तिथि | संकुल गणना | R निर्भरता |
---|---|---|---|
3.17 | 26 अप्रैल 2023 | 2230 | R 4.3 |
3.16 | 2 नवंबर 2022 | 2183 | R 4.2 |
3.14 | 27 अक्टूबर 2021 | 2083 | R 4.1 |
3.11 | 28 अप्रैल 2020 | 1903 | R 4.0 |
3.10 | 30 अक्टूबर 2019 | 1823 | R 3.6 |
3.8 | 31 अक्टूबर 2018 | 1649 | R 3.5 |
3.6 | 31 अक्टूबर 2017 | 1473 | R 3.4 |
3.4 | 18 अक्टूबर 2016 | 1296 | R 3.3 |
3.2 | 14 अक्टूबर 2015 | 1104 | R 3.2 |
3.0 | 14 अक्टूबर 2014 | 934 | R 3.1 |
2.13 | 15 अक्टूबर 2013 | 749 | R 3.0 |
2.11 | 3 अक्टूबर 2012 | 610 | R 2.15 |
2.9 | 1 नवंबर 2011 | 517 | R 2.14 |
2.8 | 14 अप्रैल 2011 | 466 | R 2.13 |
2.7 | 18 नवंबर 2010 | 418 | R 2.12 |
2.6 | 23 अप्रैल 2010 | 389 | R 2.11 |
2.5 | 28 अक्टूबर 2009 | 352 | R 2.10 |
2.4 | 21 अप्रैल 2009 | 320 | R 2.9 |
2.3 | 22 अक्टूबर 2008 | 294 | R 2.8 |
2.2 | 1 मई 2008 | 260 | R 2.7 |
2.1 | 8 अक्टूबर 2007 | 233 | R 2.6 |
2.0 | 26 अप्रैल 2007 | 214 | R 2.5 |
1.9 | 4 अक्टूबर 2006 | 188 | R 2.4 |
1.8 | 27 अप्रैल 2006 | 172 | R 2.3 |
1.7 | 14 अक्टूबर 2005 | 141 | R 2.2 |
1.6 | 18 मई 2005 | 123 | R 2.1 |
1.5 | 25 अक्टूबर 2004 | 100 | R 2.0 |
1.4 | 17 मई 2004 | 81 | R 1.9 |
1.3 | 30 अक्टूबर 2003 | 49 | R 1.8 |
1.2 | 29 मई 2003 | 30 | R 1.7 |
1.1 | 19 अक्टूबर 2002 | 20 | R 1.6 |
1.0 | 1 मई 2002 | 15 | R 1.5 |
संसाधन
- Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit, S. (2005). आर और बायोकंडक्टर का उपयोग करके जैव सूचना विज्ञान और कम्प्यूटेशनल जीवविज्ञान समाधान. Springer. ISBN 978-0-387-25146-2.
- Gentleman, R. (2008). जैव सूचना विज्ञान के लिए आर प्रोग्रामिंग. Chapman & Hall/CRC. ISBN 978-1-4200-6367-7.
- Hahne, F.; Huber, W.; Gentleman, R.; Falcon, S. (2008). बायोकंडक्टर केस स्टडीज. Springer. ISBN 978-0-387-77239-4.
- Gentleman, Robert C.; Carey, Vincent J.; Bates, Douglas M.; Bolstad, Ben; Dettling, Marcel; Dudoit, Sandrine; Ellis, Byron; Gautier, Laurent; Ge, Yongchao; Gentry, Jeff; Hornik, Kurt; Hothorn, Torsten; Huber, Wolfgang; Iacus, Stefano; Irizarry, Rafael; Leisch, Friedrich; Li, Cheng; Maechler, Martin; Rossini, Anthony J.; Sawitzki, Gunther; Smith, Colin; Smyth, Gordon; Tierney, Luke; Yang, Jean Y. H.; Zhang, Jianhua (2004). "बायोकंडक्टर: कम्प्यूटेशनल जीव विज्ञान और जैव सूचना विज्ञान के लिए खुला सॉफ्टवेयर विकास". Genome Biology. 5 (10): R80. doi:10.1186/gb-2004-5-10-r80. PMC 545600. PMID 15461798.
यह भी देखें
- कम्प्यूटेशनल जीवविज्ञान
- जैवसूचना विज्ञान
- ओपन सोर्स जैव सूचना विज्ञान सॉफ़्टवेयर की सूची
- अनुक्रम संरेखण सॉफ्टवेयर की सूची
- R (प्रोग्रामिंग भाषा)
- डीएनए माइक्रोएरे
- एफ़ीमेट्रिक्स, एक माइक्रोएरे प्रौद्योगिकी प्लेटफ़ॉर्म
संदर्भ
- ↑ "Bioconductor – Release Announcements". bioconductor.org. Bioconductor. Retrieved 28 May 2019.
बाहरी संबंध
- Official website
- The R Project GNU R is a programming language for statistical computing.
- Bioconductor Releases
- The community of the Debian GNU/Linux distribution strives towards an automated building of BioConductor packages Archived 2007-08-11 at the Wayback Machine for their distribution. BioKnoppix and Quantian are projects extending Knoppix that have contributed bootable Debian GNU/Linux CDs providing BioConductor installations.