बायोकंडक्टर: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{short description|Software project for the analysis of genomic data}}
{{short description|Software project for the analysis of genomic data}}
{{Infobox software
{{Infobox software
  | name                  = जैवचालक
  | name                  = बायोकंडक्टर
  | logo                  = Bioconductor logo.svg
  | logo                  = Bioconductor logo.svg
  | logo size              = 260px
  | logo size              = 260px
  | caption                = जैवचालक का स्क्रीनशॉट
  | caption                = बायोकंडक्टर का स्क्रीनशॉट
  | screenshot            =
  | screenshot            =
  | developer              =
  | developer              =
Line 15: Line 15:
  | website                = {{URL|//www.bioconductor.org/}}
  | website                = {{URL|//www.bioconductor.org/}}
}}
}}
[[आणविक जीव विज्ञान]] में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न [[जीनोम|जीनोमिक]] डेटा के विश्लेषण और समझ के लिए जैवचालक एक मुक्त, मुक्त स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।
[[आणविक जीव विज्ञान]] में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न [[जीनोम|जीनोमिक]] डेटा के विश्लेषण और समझ के लिए बायोकंडक्टर एक मुक्त, मुक्त स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।


जैवचालक मुख्य रूप से सांख्यिकीय [[आर (प्रोग्रामिंग भाषा)|R]] प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप सम्मिलित है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो R के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो R के विकास संस्करण से संबंधित है। अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई [[जीनोम एनोटेशन]] प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के [[माइक्रोएरे]] इस पर केंद्रित हैं।
बायोकंडक्टर मुख्य रूप से सांख्यिकीय [[आर (प्रोग्रामिंग भाषा)|R]] प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप सम्मिलित है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो R के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो R के विकास संस्करण से संबंधित है। अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई [[जीनोम एनोटेशन]] प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के [[माइक्रोएरे]] इस पर केंद्रित हैं।


जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, जैवचालक परियोजना एक मुक्त स्रोत सॉफ्टवेयर रिपॉजिटरी है जो R प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई जैवचालक संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और जैवचालक संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।
जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, बायोकंडक्टर परियोजना एक मुक्त स्रोत सॉफ्टवेयर रिपॉजिटरी है जो R प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई बायोकंडक्टर संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और बायोकंडक्टर संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।


यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से [[ फ्रेड हचिंसन कैंसर अनुसंधान केंद्र |फ्रेड हचिंसन कैंसर अनुसंधान केंद्र]] में स्थित जैवचालक कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।
यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से [[ फ्रेड हचिंसन कैंसर अनुसंधान केंद्र |फ्रेड हचिंसन कैंसर अनुसंधान केंद्र]] में स्थित बायोकंडक्टर कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।


== संकुल ==
== संकुल ==
अधिकांश जैवचालक घटकों को R संकुल के रूप में वितरित किया जाता है, जो R के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश जैवचालक सॉफ्टवेयर संकुल एकल-चैनल [[एफिमेट्रिक्स]] और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, [[अनुक्रम (जीव विज्ञान)|अनुक्रम]] या एसएनपी डेटा के विश्लेषण को सम्मिलित करने के लिए व्यापक किया गया है।
अधिकांश बायोकंडक्टर घटकों को R संकुल के रूप में वितरित किया जाता है, जो R के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर संकुल एकल-चैनल [[एफिमेट्रिक्स]] और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, [[अनुक्रम (जीव विज्ञान)|अनुक्रम]] या एसएनपी डेटा के विश्लेषण को सम्मिलित करने के लिए व्यापक किया गया है।


== लक्ष्य ==
== लक्ष्य ==
Line 35: Line 35:


== मुख्य विशेषताएं ==
== मुख्य विशेषताएं ==
* '''प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान-''' प्रत्येक जैवचालक पैकेज में कम से कम एक शब्दचित्र होता है, जो प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, जैवचालक परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। जैवचालक परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
* '''प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान-''' प्रत्येक बायोकंडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकंडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकंडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
* '''सांख्यिकीय और चित्रमय विधियाँ'''- जैवचालक परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक सीमित पहुंच प्रदान करना है। विश्लेषण पैकेज के लिए उपलब्ध हैं: पूर्व-प्रसंस्करण एफ्टीमेट्रिक्स और इलुमिना, सीडीएनए सरणी डेटा; विभेदक रूप से व्यक्त जीन की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा की योजना तैयार करना है। इसके अतिरिक्त, R पैकेज प्रणाली स्वयं अत्याधुनिक सांख्यिकीय की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करती है और आलेखीय तकनीकें, जिनमें रैखिक और गैर-रेखीय मॉडलिंग, क्लस्टर विश्लेषण, पूर्वानुमान, पुनरुत्थान, उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण सम्मिलित हैं।
* '''सांख्यिकीय और चित्रमय विधियाँ'''- बायोकंडक्टर परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक सीमित पहुंच प्रदान करना है। विश्लेषण पैकेज के लिए उपलब्ध हैं: पूर्व-प्रसंस्करण एफ्टीमेट्रिक्स और इलुमिना, सीडीएनए सरणी डेटा; विभेदक रूप से व्यक्त जीन की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा की योजना तैयार करना है। इसके अतिरिक्त, R पैकेज प्रणाली स्वयं अत्याधुनिक सांख्यिकीय की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करती है और आलेखीय तकनीकें, जिनमें रैखिक और गैर-रेखीय मॉडलिंग, क्लस्टर विश्लेषण, पूर्वानुमान, पुनरुत्थान, उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण सम्मिलित हैं।
* '''जीनोम व्याख्या'''- जैवचालक परियोजना वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को वेब डेटाबेस से जैविक मेटाडेटा जैसे कि जेनबैंक, लोकसलिंक और पबमेड (एनोटेट पैकेज) से जोड़ने के लिए सॉफ्टवेयर प्रदान करती है। व्याख्या डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को सम्मिलित करने के लिए भी कार्य प्रदान किए जाते हैं। सॉफ्टवेयर उपकरण जीनबैंक, [[जीन ओन्टोलॉजी]] कंसोर्टियम, लोकसलिंक, [[यूनीजीन]] जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को इकट्ठा करने और संसाधित करने के लिए उपलब्ध हैं, यूसीएससी [[ मानव जीनोम परियोजना |मानव जीनोम परियोजना]] और अन्य एनोटेशनडीबी पैकेज के साथ। डेटा पैकेज विभिन्न जांच पहचानकर्ताओं के बीच मैपिंग प्रदान करने के लिए वितरित किए जाते हैं (उदा. एफी आईडी, लोकोसलिंक, पबमेड)। अनुकूलित व्याख्या पुस्तकालयों को भी एकत्र किया जा सकता है।
* '''जीनोम व्याख्या'''- बायोकंडक्टर परियोजना वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को वेब डेटाबेस से जैविक मेटाडेटा जैसे कि जेनबैंक, लोकसलिंक और पबमेड (एनोटेट पैकेज) से जोड़ने के लिए सॉफ्टवेयर प्रदान करती है। व्याख्या डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को सम्मिलित करने के लिए भी कार्य प्रदान किए जाते हैं। सॉफ्टवेयर उपकरण जीनबैंक, [[जीन ओन्टोलॉजी]] कंसोर्टियम, लोकसलिंक, [[यूनीजीन]] जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को इकट्ठा करने और संसाधित करने के लिए उपलब्ध हैं, यूसीएससी [[ मानव जीनोम परियोजना |मानव जीनोम परियोजना]] और अन्य एनोटेशनडीबी पैकेज के साथ। डेटा पैकेज विभिन्न जांच पहचानकर्ताओं के बीच मैपिंग प्रदान करने के लिए वितरित किए जाते हैं (उदा. एफी आईडी, लोकोसलिंक, पबमेड)। अनुकूलित व्याख्या पुस्तकालयों को भी एकत्र किया जा सकता है।
*
*
* '''मुक्त स्रोत-''' जैवचालक प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन की प्रतिबद्धता है। सभी योगदान मुक्त स्रोत लाइसेंस जैसे कि आर्टिस्टिक 2.0, जीपीएल 2 या बीएसडी के तहत उपस्थित होने की संभावना है. कई अलग-अलग कारण हैं कि मुक्त स्रोत सॉफ्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप से कम्प्यूटेशनल जीव विज्ञान के लिए लाभदायक है। कारणों में सम्मिलित हैं:
* '''मुक्त स्रोत-''' बायोकंडक्टर प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन की प्रतिबद्धता है। सभी योगदान मुक्त स्रोत लाइसेंस जैसे कि आर्टिस्टिक 2.0, जीपीएल 2 या बीएसडी के तहत उपस्थित होने की संभावना है. कई अलग-अलग कारण हैं कि मुक्त स्रोत सॉफ्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप से कम्प्यूटेशनल जीव विज्ञान के लिए लाभदायक है। कारणों में सम्मिलित हैं:
** एल्गोरिदम ([[कलन विधि]]) और उनके कार्यान्वयन के लिए पूर्ण पहुंच प्रदान करना है।
** एल्गोरिदम ([[कलन विधि]]) और उनके कार्यान्वयन के लिए पूर्ण पहुंच प्रदान करना है।
**[[सॉफ्टवेयर बग|बग]] फिक्सिंग और प्लग-इन के माध्यम से सॉफ्टवेयर में सुधार की सुविधा प्रदान करना है।
**[[सॉफ्टवेयर बग|बग]] फिक्सिंग और प्लग-इन के माध्यम से सॉफ्टवेयर में सुधार की सुविधा प्रदान करना है।
Line 47: Line 47:
**उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और प्रोत्साहित करना जो सफल हैं।
**उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और प्रोत्साहित करना जो सफल हैं।
**मुक्त और सुगम उपकरण प्रदान करके प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान को प्रोत्साहित करने के लिए जिसके साथ उस शोध को पूरा करना है (पुन: प्रस्तुत करने योग्य अनुसंधान मुक्त सत्यापन से अलग है)।
**मुक्त और सुगम उपकरण प्रदान करके प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान को प्रोत्साहित करने के लिए जिसके साथ उस शोध को पूरा करना है (पुन: प्रस्तुत करने योग्य अनुसंधान मुक्त सत्यापन से अलग है)।
* '''मुक्त विकास-''' उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो जैवचालक आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त जैवचालक सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।
* '''मुक्त विकास-''' उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।


== मील के पत्थर ==
== मील के पत्थर ==
जैवचालक की प्रत्येक प्रस्तुति R के चयनित संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित की गई है।<ref name="BioCReleasePage">{{cite web |title=Bioconductor – Release Announcements |url=https://bioconductor.org/about/release-announcements/ |website=bioconductor.org |publisher=Bioconductor |accessdate=28 May 2019}}</ref> बगफिक्स और अद्यतन के अतिरिक्त, एक नई प्रविष्टि सामान्यतः संकुल बनाती है। नीचे दी गई तालिका R संस्करण के लिए जैवचालक विज्ञप्ति को दर्शाती है और उस विज्ञप्ति के लिए उपलब्ध जैवचालक सॉफ्टवेयर पैकेजों की संख्या दिखाती है।
बायोकंडक्टर की प्रत्येक प्रस्तुति R के चयनित संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित की गई है।<ref name="BioCReleasePage">{{cite web |title=Bioconductor – Release Announcements |url=https://bioconductor.org/about/release-announcements/ |website=bioconductor.org |publisher=Bioconductor |accessdate=28 May 2019}}</ref> बगफिक्स और अद्यतन के अतिरिक्त, एक नई प्रविष्टि सामान्यतः संकुल बनाती है। नीचे दी गई तालिका R संस्करण के लिए बायोकंडक्टर विज्ञप्ति को दर्शाती है और उस विज्ञप्ति के लिए उपलब्ध बायोकंडक्टर सॉफ्टवेयर पैकेजों की संख्या दिखाती है।
{| class="wikitable"
{| class="wikitable"
!संस्करण
!संस्करण

Revision as of 20:12, 27 June 2023

बायोकंडक्टर
Stable release
Operating systemलिनक्स, मैकओएस, विंडोज
PlatformR प्रोग्रामिंग भाषा
Typeजैव सूचना विज्ञान
Licenseकलापर कलाइसेंस 2.0
Websitewww.bioconductor.org

आणविक जीव विज्ञान में आर्द्र प्रयोगशाला प्रयोगों द्वारा उत्पन्न जीनोमिक डेटा के विश्लेषण और समझ के लिए बायोकंडक्टर एक मुक्त, मुक्त स्रोत और सतत विकास सॉफ्टवेयर परियोजना है।

बायोकंडक्टर मुख्य रूप से सांख्यिकीय R प्रोग्रामिंग भाषा पर आधारित है, लेकिन इसमें अन्य प्रोग्रामिंग भाषाओं में हस्तक्षेप सम्मिलित है। इसमें प्रत्येक वर्ष दो विज्ञप्ति होती हैं जो R के अर्धवार्षिक विज्ञप्ति का पालन करती हैं। किसी भी समय एक विज्ञप्ति संस्करण होता है, जो R के जारी किए गए संस्करण और एक विकास संस्करण से मेल खाता है, जो R के विकास संस्करण से संबंधित है। अधिकांश उपयोगकर्ता अपनी आवश्यकताओं के लिए विज्ञप्ति संस्करण को उपयुक्त पाएंगे. इसके अतिरिक्त कई जीनोम एनोटेशन प्रस्ताव उपलब्ध हैं जो मुख्य रूप से हैं, लेकिन पूरी तरह से नहीं, विभिन्न प्रकार के माइक्रोएरे इस पर केंद्रित हैं।

जबकि जैविक डेटा की व्याख्या करने के लिए संगणना विधियों को विकसित किया जाना जारी है, बायोकंडक्टर परियोजना एक मुक्त स्रोत सॉफ्टवेयर रिपॉजिटरी है जो R प्रोग्रामिंग वातावरण में विकसित सांख्यिकीय उपकरणों की एक विस्तृत श्रृंखला को होस्ट करता है। R में सांख्यिकीय और चित्रमय सुविधाओं की एक समृद्ध सरणी का उपयोग करते हुए, विभिन्न डेटा विश्लेषण आवश्यकताओं को पूरा करने के लिए कई बायोकंडक्टर संकुल विकसित किए गए हैं। इन संकुलों का उपयोग R प्रोग्रामिंग/कमांड भाषा की एक मूलभूत व्याख्या प्रदान करता है। नतीजतन, R और बायोकंडक्टर संकुल, जिनकी एक सुदृढ़ कंप्यूटिंग पृष्ठभूमि है, का उपयोग अधिकांश जीवविज्ञानी करते हैं जो डेटासेट का विश्लेषण करने की उनकी क्षमता से काफी लाभान्वित होंगे। ये सभी परिणाम प्रोग्रामिंग विशेषज्ञता की आवश्यकता के बिना जीनोमिक डेटा के विश्लेषण के लिए आसान पहुंच के साथ जीवविज्ञानी उपलब्ध कराते हैं।

यह परियोजना 2001 के अंत में प्रारंभ की गई थी और मुख्य रूप से फ्रेड हचिंसन कैंसर अनुसंधान केंद्र में स्थित बायोकंडक्टर कोर टीम की अध्यक्षता की जाती है, जिसमें अन्य सदस्य अंतरराष्ट्रीय संस्थानों से आते हैं।

संकुल

अधिकांश बायोकंडक्टर घटकों को R संकुल के रूप में वितरित किया जाता है, जो R के लिए ऐड-ऑन मॉड्यूल हैं। प्रारंभ में अधिकांश बायोकंडक्टर सॉफ्टवेयर संकुल एकल-चैनल एफिमेट्रिक्स और दो या दो से अधिक चैनल सीडीएनए/ओलिगो माइक्रोएरे के विश्लेषण पर केंद्रित थे। जैसा कि परियोजना परिपक्व हो गई है, सॉफ्टवेयर संकुलों के कार्यात्मक दायरे को सभी प्रकार के जीनोमिक डेटा, जैसे एसएजीई, अनुक्रम या एसएनपी डेटा के विश्लेषण को सम्मिलित करने के लिए व्यापक किया गया है।

लक्ष्य

परियोजनाओं के विस्तृत उद्देश्य हैं:

  • जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक व्यापक उपयोग प्रदान करते हैं।
  • जीनोमिक डेटा के विश्लेषण में जैविक मेटाडेटा को सम्मिलित करने की सुविधा प्रदान करना, जैसे पबमेड से साहित्य डेटा, और लोकसलिंक/एन्ट्रीज़ से एनोटेशन डेटा आदि।
  • सामान्य सॉफ़्टवेयर प्लेटफ़ॉर्म प्रदान करें जो त्वरित विकास और तीव्र, मापनीय और अन्योन्याश्रित सॉफ़्टवेयर की परिनियोजन को सक्षम बनाता है।
  • आगे के वैज्ञानिक उच्च गुणवत्ता वाले प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान का उपयोग द्वारा समझ रहे हैं।
  • जीनोमिक डेटा के विश्लेषण के लिए कम्प्यूटेशनल और सांख्यिकीय विधियों पर शोधकर्ताओं को प्रशिक्षण देता है।

मुख्य विशेषताएं

  • प्रलेखन और प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान- प्रत्येक बायोकंडक्टर पैकेज में कम से कम एक शब्दचित्र होता है, जो प्रलेखित है जो संकुल की कार्यक्षमता का एक सुव्यवस्थित, कार्य-उन्मुख विवरण प्रदान करता है। ये शब्दचित्र कई प्रकारों में आते हैं. कई सरल "हाउ-टू" हैं जो यह प्रदर्शित करने के लिए तैयार किए गए हैं कि किसी विशेष कार्य को उस संकुल के सॉफ़्टवेयर के साथ कैसे पूरा किया जा सकता है। अन्य लोग पैकेज का अधिक गहन अवलोकन प्रदान करते हैं या पैकेज से संबंधित सामान्य विषयों पर भी चर्चा कर सकते हैं। भविष्य में, बायोकंडक्टर परियोजना विगनेट्स प्रदान करने की ओर देख रही है जो विशेष रूप से एक पैकेज से जुड़े नहीं हैं, बल्कि अधिक जटिल अवधारणाओं का प्रदर्शन कर रहे हैं। बायोकंडक्टर परियोजना के सभी सिद्धांतों के साथ, उपयोगकर्ताओं को इस प्रयास में भाग लेने के लिए प्रोत्साहित किया जाता है।
  • सांख्यिकीय और चित्रमय विधियाँ- बायोकंडक्टर परियोजना का उद्देश्य जीनोमिक डेटा के विश्लेषण के लिए व्यापक सांख्यिकीय और चित्रमय विधियों की एक विस्तृत श्रृंखला तक सीमित पहुंच प्रदान करना है। विश्लेषण पैकेज के लिए उपलब्ध हैं: पूर्व-प्रसंस्करण एफ्टीमेट्रिक्स और इलुमिना, सीडीएनए सरणी डेटा; विभेदक रूप से व्यक्त जीन की पहचान करना; ग्राफ सैद्धांतिक विश्लेषण; जीनोमिक डेटा की योजना तैयार करना है। इसके अतिरिक्त, R पैकेज प्रणाली स्वयं अत्याधुनिक सांख्यिकीय की एक विस्तृत श्रृंखला के लिए कार्यान्वयन प्रदान करती है और आलेखीय तकनीकें, जिनमें रैखिक और गैर-रेखीय मॉडलिंग, क्लस्टर विश्लेषण, पूर्वानुमान, पुनरुत्थान, उत्तरजीविता विश्लेषण और समय श्रृंखला विश्लेषण सम्मिलित हैं।
  • जीनोम व्याख्या- बायोकंडक्टर परियोजना वास्तविक समय में माइक्रोएरे और अन्य जीनोमिक डेटा को वेब डेटाबेस से जैविक मेटाडेटा जैसे कि जेनबैंक, लोकसलिंक और पबमेड (एनोटेट पैकेज) से जोड़ने के लिए सॉफ्टवेयर प्रदान करती है। व्याख्या डब्ल्यूडब्ल्यूडब्ल्यू संसाधनों के लिंक के साथ एचटीएमएल रिपोर्ट में सांख्यिकीय विश्लेषण के परिणामों को सम्मिलित करने के लिए भी कार्य प्रदान किए जाते हैं। सॉफ्टवेयर उपकरण जीनबैंक, जीन ओन्टोलॉजी कंसोर्टियम, लोकसलिंक, यूनीजीन जैसे डेटाबेस से जीनोमिक एनोटेशन डेटा को इकट्ठा करने और संसाधित करने के लिए उपलब्ध हैं, यूसीएससी मानव जीनोम परियोजना और अन्य एनोटेशनडीबी पैकेज के साथ। डेटा पैकेज विभिन्न जांच पहचानकर्ताओं के बीच मैपिंग प्रदान करने के लिए वितरित किए जाते हैं (उदा. एफी आईडी, लोकोसलिंक, पबमेड)। अनुकूलित व्याख्या पुस्तकालयों को भी एकत्र किया जा सकता है।
  • मुक्त स्रोत- बायोकंडक्टर प्रोजेक्ट में SourceForge.net जैसे प्लेटफॉर्म के माध्यम से वितरण के साथ पूर्ण ओपन सोर्स अनुशासन की प्रतिबद्धता है। सभी योगदान मुक्त स्रोत लाइसेंस जैसे कि आर्टिस्टिक 2.0, जीपीएल 2 या बीएसडी के तहत उपस्थित होने की संभावना है. कई अलग-अलग कारण हैं कि मुक्त स्रोत सॉफ्टवेयर माइक्रोएरे डेटा के विश्लेषण और सामान्य रूप से कम्प्यूटेशनल जीव विज्ञान के लिए लाभदायक है। कारणों में सम्मिलित हैं:
    • एल्गोरिदम (कलन विधि) और उनके कार्यान्वयन के लिए पूर्ण पहुंच प्रदान करना है।
    • बग फिक्सिंग और प्लग-इन के माध्यम से सॉफ्टवेयर में सुधार की सुविधा प्रदान करना है।
    • उपयुक्त उपकरण और निर्देश प्रदान करके अच्छे वैज्ञानिक कंप्यूटिंग और सांख्यिकीय अभ्यास को प्रोत्साहित करना है।
    • उपकरणों का कार्यक्षेत्र प्रदान करना जो शोधकर्ताओं को जैविक डेटा का विश्लेषण करने के लिए उपयोग किए जाने वाले तरीकों का पता लगाने और उनका विस्तार करने की अनुमति देता है।
    • यह सुनिश्चित करने के लिए कि अंतर्राष्ट्रीय वैज्ञानिक समुदाय अनुसंधान करने के लिए आवश्यक सॉफ्टवेयर टूल का स्वामित्व है।
    • उन उपकरणों के व्यावसायिक समर्थन और विकास का नेतृत्व करना और प्रोत्साहित करना जो सफल हैं।
    • मुक्त और सुगम उपकरण प्रदान करके प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान को प्रोत्साहित करने के लिए जिसके साथ उस शोध को पूरा करना है (पुन: प्रस्तुत करने योग्य अनुसंधान मुक्त सत्यापन से अलग है)।
  • मुक्त विकास- उपयोगकर्ताओं को विकासकर्ता बनने के लिए प्रोत्साहित किया जाता है, या तो बायोकंडक्टर आज्ञाकारी पैकेज या प्रलेखन में योगदान करके. इसके अतिरिक्त बायोकंडक्टर सॉफ्टवेयर पर सहयोग को प्रोत्साहित करने के लिए विभिन्न समूहों को एक साथ जोड़ने के लिए एक तंत्र प्रदान करता है, संभवत: साझा विकास के स्तर पर है।

मील के पत्थर

बायोकंडक्टर की प्रत्येक प्रस्तुति R के चयनित संस्करण के साथ सबसे अच्छा काम करने के लिए विकसित की गई है।[1] बगफिक्स और अद्यतन के अतिरिक्त, एक नई प्रविष्टि सामान्यतः संकुल बनाती है। नीचे दी गई तालिका R संस्करण के लिए बायोकंडक्टर विज्ञप्ति को दर्शाती है और उस विज्ञप्ति के लिए उपलब्ध बायोकंडक्टर सॉफ्टवेयर पैकेजों की संख्या दिखाती है।

संस्करण निर्गमन तिथि संकुल गणना R निर्भरता
3.17 26 अप्रैल 2023 2230 R 4.3
3.16 2 नवंबर 2022 2183 R 4.2
3.14 27 अक्टूबर 2021 2083 R 4.1
3.11 28 अप्रैल 2020 1903 R 4.0
3.10 30 अक्टूबर 2019 1823 R 3.6
3.8 31 अक्टूबर 2018 1649 R 3.5
3.6 31 अक्टूबर 2017 1473 R 3.4
3.4 18 अक्टूबर 2016 1296 R 3.3
3.2 14 अक्टूबर 2015 1104 R 3.2
3.0 14 अक्टूबर 2014 934 R 3.1
2.13 15 अक्टूबर 2013 749 R 3.0
2.11 3 अक्टूबर 2012 610 R 2.15
2.9 1 नवंबर 2011 517 R 2.14
2.8 14 अप्रैल 2011 466 R 2.13
2.7 18 नवंबर 2010 418 R 2.12
2.6 23 अप्रैल 2010 389 R 2.11
2.5 28 अक्टूबर 2009 352 R 2.10
2.4 21 अप्रैल 2009 320 R 2.9
2.3 22 अक्टूबर 2008 294 R 2.8
2.2 1 मई 2008 260 R 2.7
2.1 8 अक्टूबर 2007 233 R 2.6
2.0 26 अप्रैल 2007 214 R 2.5
1.9 4 अक्टूबर 2006 188 R 2.4
1.8 27 अप्रैल 2006 172 R 2.3
1.7 14 अक्टूबर 2005 141 R 2.2
1.6 18 मई 2005 123 R 2.1
1.5 25 अक्टूबर 2004 100 R 2.0
1.4 17 मई 2004 81 R 1.9
1.3 30 अक्टूबर 2003 49 R 1.8
1.2 29 मई 2003 30 R 1.7
1.1 19 अक्टूबर 2002 20 R 1.6
1.0 1 मई 2002 15 R 1.5

संसाधन

यह भी देखें

  • कम्प्यूटेशनल जीवविज्ञान
  • जैवसूचना विज्ञान
  • ओपन सोर्स जैव सूचना विज्ञान सॉफ़्टवेयर की सूची
  • अनुक्रम संरेखण सॉफ्टवेयर की सूची
  • R (प्रोग्रामिंग भाषा)
  • डीएनए माइक्रोएरे
  • एफ़ीमेट्रिक्स, एक माइक्रोएरे प्रौद्योगिकी प्लेटफ़ॉर्म

संदर्भ


  1. "Bioconductor – Release Announcements". bioconductor.org. Bioconductor. Retrieved 28 May 2019.

बाहरी संबंध