बायोपर्ल
File:BioPerlLogo.png | |
Initial release | 11 June 2002 |
---|---|
Stable release | Script error: The module returned a nil value. It is supposed to return an export table.
/ Script error: The module returned a nil value. It is supposed to return an export table. |
Written in | Perl |
Type | Bioinformatics |
License | Artistic License and GPL |
Website | bioperl |
बायोपर्ल[1][2] पर्ल मॉड्यूल का संग्रह है जो जैव सूचना विज्ञान अनुप्रयोगों के लिए पर्ल स्क्रिप्ट के विकास की सुविधा प्रदान करता है। इसने मानव जीनोम परियोजना में अभिन्न भूमिका निभाई है।[3]
पृष्ठभूमि
बायोपर्ल ओपन बायोइनफॉरमैटिक्स फाउंडेशन द्वारा समर्थित सक्रिय ओपन स्रोत सॉफ्टवेयर प्रोजेक्ट है। बायोपर्ल के पर्ल कोड का प्रथम सेट टिम हब्बार्ड और जोंग भाक द्वारा चिकित्सा अनुसंधान परिषद (यूनाइटेड किंगडम) केंद्र कैम्ब्रिज में बनाया गया था जहां प्रथम जीनोम अनुक्रमण फ्रेड सेंगर द्वारा किया गया था। एमआरसी केंद्र आधुनिक जैव सूचना विज्ञान के केंद्रों और जन्मस्थानों में से था क्योंकि इसमें बड़ी मात्रा में डीएनए अनुक्रम और 3डी प्रोटीन संरचनाएं थीं। हबर्ड th_lib.pl पर्ल लाइब्रेरी का उपयोग कर रहा था, जिसमें जैव सूचना विज्ञान के लिए कई उपयोगी पर्ल सबरूटीन्स सम्मिलित थे। हबर्ड के प्रथम पीएचडी छात्र भक ने jong_lib.pl बनाया। भक ने दो पर्ल सबरूटीन लाइब्रेरीज़ को Bio.pl में विलय कर दिया। बायोपर्ल नाम भक और स्टीवन ई. ब्रेनर द्वारा प्रोटीन इंजीनियरिंग केंद्र (सीपीई) में संयुक्त रूप से रखा गया था। 1995 में, ब्रेनर ने कैम्ब्रिज में आयोजित आण्विक जीव विज्ञान के लिए इंटेलिजेंट प्रणाली सम्मेलन में बायोपर्ल सत्र का आयोजन किया। आगामी माह में बायोपर्ल के कुछ उपयोगकर्ता होंगे जिनमें जॉर्ज फ़्यूलेन भी सम्मिलित हैं जिन्होंने जर्मनी में प्रशिक्षण पाठ्यक्रम का आयोजन किया था। फ़्यूलेन के सहकर्मियों और छात्रों ने बायोपर्ल का अधिक विस्तार किया; इसे अन्य लोगों द्वारा और विस्तारित किया गया, जिनमें स्टीव चेर्विट्ज़ भी सम्मिलित थे, जो सक्रिय रूप से अपने यीस्ट जीनोम डेटाबेस के लिए पर्ल कोड विकसित कर रहे थे। बड़ा विस्तार तब हुआ जब कैम्ब्रिज के छात्र इवान बिरनी विकास समूह में सम्मिलित हुए।
प्रथम स्थिर रिलीज़ 11 जून 2002 को हुई थी; सबसे हालिया स्थिर (एपीआई के संदर्भ में) रिलीज़ 07 सितंबर 2017 से 1.7.2 है। समय-समय पर डेवलपर रिलीज़ भी तैयार की जाती हैं। संस्करण श्रृंखला 1.7.x को बायोपर्ल का सबसे स्थिर (बग के संदर्भ में) संस्करण माना जाता है और इसे प्रतिदिन के उपयोग के लिए अनुशंसित किया जाता है।
बायोपर्ल का लाभ प्राप्त करने के लिए, यूजर को पर्ल प्रोग्रामिंग भाषा के मूलभूत अध्ययन की आवश्यकता होती है, जिसमें पर्ल संदर्भों, मॉड्यूल, ऑब्जेक्ट और विधियों का उपयोग करने का अध्ययन भी सम्मिलित होता है।
मानव जीनोम परियोजना पर प्रभाव
मानव जीनोम परियोजना को अपने जीवनकाल के समय कई प्रचारणों का सामना करना होता है। इनमें से कुछ समस्याओं का समाधान तब हो गया जब कई जीनोमिक्स प्रयोगशालाओं ने पर्ल का उपयोग करना प्रारम्भ कर दिया। सभी डीएनए अनुक्रमों का विश्लेषण करने की प्रक्रिया इसी प्रकार की समस्या थी। कुछ प्रयोगशालाओं ने जटिल रिलेशनल डेटाबेस के साथ बड़ी मोनोलिथिक प्रणाली बनाई, जिन्हें डिबग करने और प्रारम्भ करने में अधिक समय लगा, और नई प्रौद्योगिकियों ने उन्हें पीछे कर दिया। अन्य प्रयोगशालाओं ने मॉड्यूलर, शिथिल-युग्मित प्रणाली निर्मित करने का अध्ययन किया, जिनके भागों को नई तकनीकों के आने पर भीतर और बाहर परिवर्तित किया जा सकता था। सभी प्रयोगशालाओं के कई प्रारंभिक परिणाम मिश्रित थे। अंततः यह ज्ञात हुआ कि कई चरणों को शिथिल युग्मित प्रोग्रामों के रूप में कार्यान्वित किया जा सकता है जो पर्ल शेल स्क्रिप्ट के साथ रन कराए गए थे। डेटा का आदान-प्रदान नामक समस्या का समाधान भी किया गया था। प्रत्येक प्रयोगशाला में सामान्यतः भिन्न-भिन्न प्रोग्राम होते थे जिन्हें वे अपनी स्क्रिप्ट के साथ रन करते थे, जिसके परिणामस्वरूप परिणामों की तुलना करते समय कई रूपांतरण होते थे। इसे उचित प्रकार से करने के लिए प्रयोगशालाओं ने सामूहिक रूप से डेटा के सुपर-सेट का उपयोग करना प्रारम्भ कर दिया था। स्क्रिप्ट का उपयोग सुपर-सेट से प्रत्येक प्रयोगशाला के सेट में परिवर्तित करने के लिए किया गया था और अन्य का उपयोग पुनः परिवर्तित करने के लिए किया गया था। इससे आवश्यक स्क्रिप्ट की संख्या कम हो गई और पर्ल के साथ डेटा विनिमय सरल हो गया।
सुविधाएँ और उदाहरण
बायोपर्ल जैव सूचना विज्ञान प्रोग्रामिंग के कई विशिष्ट कार्यों के लिए सॉफ्टवेयर मॉड्यूल प्रदान करता है। इसमे सम्मिलित है:
- स्थानीय और दूरस्थ जैविक डेटाबेस से न्यूक्लियोटाइड अनुक्रम और पेप्टाइड अनुक्रम डेटा का एक्सेस
किसी अनुक्रम को पुनः प्राप्त करने के लिए जेनबैंक के एक्सेस का उदाहरण:
<पूर्व> बायो::डीबी::जेनबैंक का उपयोग करें;
$db_obj = बायो::DB::GenBank->नया;
$seq_obj = $db_obj->get_Seq_by_acc( # परिग्रहण संख्या डालें); </पूर्व>
- फ़ाइल स्वरूपों की परिवर्तनकारी सूची
स्वरूप परिवर्तित करने के लिए उदाहरण कोड
<पूर्व> Bio::SeqIO का उपयोग करें;
मेरा $usage = all2y.pl जानकारी आउटफ़ाइल आउटफ़ाइलफ़ॉर्मेट; मेरी $सूचना = शिफ्ट या मरो $उपयोग; मेरा $आउटफ़ाइल = शिफ्ट या मरना $उपयोग; मेरा $आउटफॉर्मेट = शिफ्ट या डाई $उपयोग;
मेरा $seqin = Bio::SeqIO->new( -fh => *STDIN, -format => $informat, ); मेरा $seqout = Bio::SeqIO->new( -file => >$outfile , -format => $outformat, );
जबकि (मेरा $inseq = $seqin->next_seq) {
$seqout->write_seq($inseq);
} </पूर्व>
- व्यक्तिगत अनुक्रमों में हेरफेर करना
किसी दिए गए अनुक्रम के लिए तथ्यांक एकत्र करने का उदाहरण
<पूर्व> Bio::Tools::SeqStats का उपयोग करें; $seq_stats = Bio::Tools::SeqStats->new($seqobj);
$वजन = $seq_stats->get_mol_wt(); $monomer_ref = $seq_stats->count_monomers();
- न्यूक्लिक अम्ल अनुक्रम के लिए
$codon_ref = $seq_stats->count_codons(); </पूर्व>
- समान अनुक्रमों का शोध
- अनुक्रम संरेखण बनाना और उनमें परिवर्तन करना
- जीनोमिक डीएनए पर जीन और अन्य संरचनाओं को सर्च करना
- मशीन पठनीय अनुक्रम जीनोम प्रोजेक्ट अथवा जीनोम एनोटेशन विकसित करना
उपयोग
एन्ड यूजर द्वारा प्रत्यक्ष रूप से उपयोग किए जाने के अतिरिक्त,[4] बायोपर्ल ने विभिन्न प्रकार के जैव सूचनात्मक उपकरणों के लिए आधार भी प्रदान किया है, जिनमें सहित अन्य सम्मिलित हैं:
- सिंब्राउज[5]
- जीनकोम्बर[6]
- टीएफबीएस[7]
- मिमॉक्स[8]
- बायोपार्सर[9]
- विकृत प्राइमर डिज़ाइन[10]
- सार्वजनिक डेटाबेस की क्वेरी करना[11]
- वर्तमान तुलनात्मक तालिका[12]
बाह्य डेवलपर्स के नए उपकरण और एल्गोरिदम अधिकांशतः प्रत्यक्ष रूप से बायोपर्ल में ही एकीकृत होते हैं:
लाभ
बायोपर्ल प्रथम जैविक मॉड्यूल रिपॉजिटरी में से था जिसने इसकी प्रयोज्यता को विस्तृत किया। नम्य वैश्विक रिपॉजिटरी के साथ इसमें मॉड्यूल स्थापित करना अधिक सरल होता है। बायोपर्ल विभिन्न प्रकार की प्रक्रियाओं के लिए उत्तम परीक्षण मॉड्यूल का उपयोग करता है।
हानि
सरल स्क्रिप्टिंग से लेकर जटिल ऑब्जेक्ट प्रोग्रामिंग तक बायोपर्ल का उपयोग करने की विभिन्न विधियाँ होती हैं। इससे भाषा स्पष्ट नहीं होती है और कभी-कभी ज्ञान प्राप्त करने में कठिनाई भी होती है। बायोपर्ल के निकट जितने भी मॉड्यूल हैं, उनमें से कुछ सदैव उस प्रकार से कार्य नहीं करते जैसे वे चाहते हैं।
अन्य प्रोग्रामिंग भाषाओं में संबंधित लाइब्रेरी
ओपन बायोइनफॉरमैटिक्स फाउंडेशन के भाग के रूप में अन्य प्रोग्रामिंग भाषाओं में कार्यान्वित कई संबंधित जैव सूचना विज्ञान लाइब्रेरी उपस्थित हैं, जिनमें सम्मिलित हैं:
संदर्भ
- ↑ Stajich, J. E.; Block, D.; Boulez, K.; Brenner, S.; Chervitz, S.; Dagdigian, C.; Fuellen, G.; Gilbert, J.; Korf, I.; Lapp, H.; Lehväslaiho, H.; Matsalla, C.; Mungall, C. J.; Osborne, B. I.; Pocock, M. R.; Schattner, P.; Senger, M.; Stein, L. D.; Stupka, E.; Wilkinson, M. D.; Birney, E. (2002). "The BioPerl Toolkit: Perl Modules for the Life Sciences". Genome Research. 12 (10): 1611–1618. doi:10.1101/gr.361602. PMC 187536. PMID 12368254.
- ↑ "बायोपर्ल प्रकाशन - बायोपर्ल". Archived from the original on 2007-02-02. Retrieved 2007-01-21. A complete, up-to-date list of BioPerl references
- ↑ Lincoln Stein (1996). "How Perl saved the human genome project". The Perl Journal. 1 (2). Archived from the original on 2007-02-02. Retrieved 2009-02-25.
- ↑ Khaja R, MacDonald J, Zhang J, Scherer S (2006). "Methods for identifying and mapping recent segmental and gene duplications in eukaryotic genomes". जीन मैपिंग, डिस्कवरी, और अभिव्यक्ति. Methods Mol Biol. Vol. 338. Totowa, N.J. : Humana Press. pp. 9–20. doi:10.1385/1-59745-097-9:9. ISBN 978-1-59745-097-3. PMID 16888347.
- ↑ Pan, X.; Stein, L.; Brendel, V. (2005). "SynBrowse: A synteny browser for comparative sequence analysis". Bioinformatics. 21 (17): 3461–3468. doi:10.1093/bioinformatics/bti555. PMID 15994196.
- ↑ Shah, S. P.; McVicker, G. P.; MacKworth, A. K.; Rogic, S.; Ouellette, B. F. F. (2003). "GeneComber: Combining outputs of gene prediction programs for improved results". Bioinformatics. 19 (10): 1296–1297. doi:10.1093/bioinformatics/btg139. PMID 12835277.
- ↑ Lenhard, B.; Wasserman, W. W. (2002). "TFBS: Computational framework for transcription factor binding site analysis". Bioinformatics. 18 (8): 1135–1136. doi:10.1093/bioinformatics/18.8.1135. PMID 12176838.
- ↑ Huang, J.; Gutteridge, A.; Honda, W.; Kanehisa, M. (2006). "MIMOX: A web tool for phage display based epitope mapping". BMC Bioinformatics. 7: 451. doi:10.1186/1471-2105-7-451. PMC 1618411. PMID 17038191.
- ↑ Catanho, M.; Mascarenhas, D.; Degrave, W.; De Miranda, A. B. ?L. (2006). "बायोपार्सर". Applied Bioinformatics. 5 (1): 49–53. doi:10.2165/00822942-200605010-00007. PMID 16539538.
- ↑ Wei, X.; Kuhn, D. N.; Narasimhan, G. (2003). "Degenerate primer design via clustering". Proceedings. IEEE Computer Society Bioinformatics Conference. 2: 75–83. PMID 16452781.
- ↑ Croce, O.; Lamarre, M. L.; Christen, R. (2006). "फ़ीचर लाइनों में निहित जटिल कीवर्ड का उपयोग करके अनुक्रमों के लिए सार्वजनिक डेटाबेस को क्वेरी करना". BMC Bioinformatics. 7: 45. doi:10.1186/1471-2105-7-45. PMC 1403806. PMID 16441875.
- ↑ Landsteiner, B. R.; Olson, M. R.; Rutherford, R. (2005). "वर्तमान तुलनात्मक तालिका (सीसीटी) गतिशील जैविक डेटाबेस की अनुकूलित खोजों को स्वचालित करती है". Nucleic Acids Research. 33 (Web Server issue): W770–W773. doi:10.1093/nar/gki432. PMC 1160193. PMID 15980582.
- ↑ Llabrés, M.; Rocha, J.; Rosselló, F.; Valiente, G. (2006). "नेस्टेड टैक्सा के साथ दो फाइलोजेनेटिक पेड़ों की पैतृक अनुकूलता पर". Journal of Mathematical Biology. 53 (3): 340–364. arXiv:cs/0505086. doi:10.1007/s00285-006-0011-4. PMID 16823581. S2CID 1704494.
- ↑ Pampanwar, V.; Engler, F.; Hatfield, J.; Blundy, S.; Gupta, G.; Soderlund, C. (2005). "चावल, मक्का और वितरण के लिए एफपीसी वेब उपकरण". Plant Physiology. 138 (1): 116–126. doi:10.1104/pp.104.056291. PMC 1104167. PMID 15888684.