जीनमार्क: Difference between revisions
No edit summary |
No edit summary |
||
(11 intermediate revisions by 3 users not shown) | |||
Line 16: | Line 16: | ||
| latest preview date = <!-- {{Start date and age|YYYY|MM|DD|df=yes/no}} --> | | latest preview date = <!-- {{Start date and age|YYYY|MM|DD|df=yes/no}} --> | ||
| programming language = | | programming language = | ||
| operating system = [[ | | operating system = [[लिनक्स]], [[विंडोज़]]<nowiki>, और [मैक ओएस]]</nowiki> | ||
| platform = | | platform = | ||
| size = | | size = | ||
Line 26: | Line 26: | ||
}} | }} | ||
'''जीनमार्क''', अटलांटा में [[जॉर्जिया तकनीकी संस्थान|जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी]] में विकसित एब इनिटियो जीन भविष्यवाणी कार्यक्रमों के परिवार का सामान्य नाम है। इस प्रकार वर्ष 1993 में विकसित, मूल जीनमार्क का उपयोग वर्ष 1995 में [[हेमोफिलस इन्फ्लुएंजा]] के पहले पूरी तरह से अनुक्रमित जीवाणु जीनोम के एनोटेशन के लिए प्राथमिक जीन भविष्यवाणी उपकरण के रूप में किया गया था, और वर्ष 1996 में [[मेथनोकोकस जन्नास्ची]] के पहले पुरातन जीनोम के लिए किया गया था। इस प्रकार एल्गोरिदम ने प्रोटीन-कोडिंग [[डीएनए अनुक्रम]] के [[अमानवीय]] तीन-आवधिक [[मार्कोव श्रृंखला]] मॉडल प्रस्तुत किए जो जीन भविष्यवाणी के साथ-साथ दो डीएनए स्ट्रैंड में जीन भविष्यवाणी के लिए बायेसियन दृष्टिकोण में मानक बन गए। | |||
मॉडलों के विशिष्ट विशिष्ट मापदंडों का अनुमान ज्ञात प्रकार (प्रोटीन-कोडिंग और गैर-कोडिंग) के अनुक्रमों के प्रशिक्षण समूह से लगाया गया था। इस प्रकार एल्गोरिदम का प्रमुख चरण किसी दिए गए डीएनए टुकड़े के लिए छह संभावित रीडिंग फ़्रेमों में से प्रत्येक में '''"प्रोटीन-कोडिंग"''' (आनुवंशिक कोड ले जाना) ([[पूरक डीएनए]] स्ट्रैंड में तीन फ्रेम सहित) या '''"गैर-कोडिंग"''' होने की संभावनाओं की गणना करता है। मूल जीनमार्क (जैव सूचना विज्ञान में एचएमएम युग से पहले विकसित) एचएमएम जैसा एल्गोरिदम है; इसे उचित रूप से परिभाषित एचएमएम के लिए एचएमएम सिद्धांत पोस्टीरियर डिकोडिंग एल्गोरिदम में ज्ञात सन्निकटन के रूप में देखा जा सकता है। | |||
GeneMark.hmm एल्गोरिथ्म (1998) को छोटे जीन और जीन प्रारंभ को खोजने में जीन भविष्यवाणी | =='''प्रोकैरियोटिक जीन भविष्यवाणी'''== | ||
GeneMark.hmm एल्गोरिथ्म (1998) को छोटे जीन और जीन प्रारंभ को खोजने में जीन भविष्यवाणी त्रुटिहीनता में सुधार करने के लिए डिज़ाइन किया गया था। विचार जीनमार्क में प्रयुक्त मार्कोव श्रृंखला मॉडल को [[छिपा हुआ मार्कोव मॉडल|छिपे हुए मार्कोव मॉडल]] ढांचे में एकीकृत करने का था, जिसमें कोडिंग और गैर-कोडिंग क्षेत्रों के मध्य संक्रमण को औपचारिक रूप से छिपे हुए राज्यों के मध्य संक्रमण के रूप में व्याख्या किया गया था। इसके अतिरिक्त, [[राइबोसोम]] [[ बाध्यकारी साइट |बाइंडिंग साइट]] मॉडल का उपयोग जीन प्रारंभ भविष्यवाणी की त्रुटिहीनता में सुधार के लिए किया गया था। अगला कदम स्व-प्रशिक्षण जीन पूर्वानुमान उपकरण GeneMarkS (2001) के विकास के साथ किया गया था। नए प्रोकैरियोटिक जीनोमिक अनुक्रमों में जीन की पहचान के लिए जीनोमिक्स समुदाय द्वारा GeneMarkS का सक्रिय उपयोग किया जा रहा है। | |||
GeneMarkS+, GeneMarkS का विस्तार जीन भविष्यवाणी में समजात प्रोटीन पर जानकारी को एकीकृत करता है जिसका उपयोग प्रोकैरियोटिक जीनोम एनोटेशन के लिए एनसीबीआई पाइपलाइन में किया जाता है; पाइपलाइन प्रतिदिन 2000 जीनोम तक एनोटेट कर सकती है ({{URL|https://www.ncbi.nlm.nih.gov/genome/annotation_prok/process | www.ncbi.nlm.nih.gov/genome/annotation_prok/process }}). | GeneMarkS+, GeneMarkS का विस्तार जीन भविष्यवाणी में समजात प्रोटीन पर जानकारी को एकीकृत करता है जिसका उपयोग प्रोकैरियोटिक जीनोम एनोटेशन के लिए एनसीबीआई पाइपलाइन में किया जाता है; पाइपलाइन प्रतिदिन 2000 जीनोम तक एनोटेट कर सकती है ({{URL|https://www.ncbi.nlm.nih.gov/genome/annotation_prok/process | www.ncbi.nlm.nih.gov/genome/annotation_prok/process }}). | ||
==मेटाजेनोम्स और मेटाट्रांससिप्टोम्स में अनुमानी मॉडल और जीन भविष्यवाणी == | ==मेटाजेनोम्स और मेटाट्रांससिप्टोम्स में अनुमानी मॉडल और जीन भविष्यवाणी == | ||
जीनमार्क और GeneMark.hmm एल्गोरिदम के प्रजातियों के विशिष्ट मापदंडों की त्रुटिहीन पहचान त्रुटिहीन जीन भविष्यवाणियां करने के लिए महत्वपूर्ण शर्त थी। यद्यपि, वायरल जीनोम के अध्ययन से प्रेरित होकर यह सवाल उठाया गया था कि जीन भविष्यवाणी के लिए मापदंडों को छोटे अनुक्रम में कैसे परिभाषित किया जाए जिसका कोई बड़ा जीनोमिक संदर्भ न हो। वर्ष 1999 में इस प्रश्न को अनुक्रम जी+सी सामग्री के कार्यों के रूप में मापदंडों की अनुमानी विधि गणना के विकास द्वारा संबोधित किया गया था। वर्ष 2004 से अनुमानी दृष्टिकोण द्वारा निर्मित मॉडल का उपयोग मेटागेनोमिक अनुक्रमों में जीन खोजने में किया गया है। इसके पश्चात्, अनेक सौ प्रोकैरियोटिक जीनोम के विश्लेषण से वर्ष 2010 में अधिक उन्नत अनुमानी पद्धति (मेटाजेनमार्क में प्रयुक्त) विकसित हुई। | |||
===यूकेरियोटिक जीन भविष्यवाणी=== | ===यूकेरियोटिक जीन भविष्यवाणी=== | ||
यूकेरियोटिक जीनोम में [[ intron | | यूकेरियोटिक जीनोम में [[ intron |इंट्रोन्स]] और [[इंटरजेनिक क्षेत्र|इंटरजेनिक क्षेत्रों]] के साथ [[एक्सॉन]] सीमाओं का मॉडलिंग एचएमएम के उपयोग से संबोधित बड़ी चुनौती प्रस्तुत करता है। यूकेरियोटिक GeneMark.hmm के एचएमएम आर्किटेक्चर में प्रारंभिक, आंतरिक और टर्मिनल एक्सॉन, इंट्रॉन, इंटरजेनिक क्षेत्र और दोनों डीएनए स्ट्रैंड में स्थित एकल एक्सॉन जीन के लिए छिपे हुए राज्य सम्मिलित हैं। आरंभिक यूकेरियोटिक GeneMark.hmm को एल्गोरिथम मापदंडों के आकलन के लिए प्रशिक्षण समूह की आवश्यकता थी। वर्ष 2005 में स्व-प्रशिक्षण एल्गोरिदम जीनमार्क-ईएस का पहला संस्करण विकसित किया गया था। सत्र 2008 में जीनमार्क-ईएस एल्गोरिदम को विशेष इंट्रॉन मॉडल और स्व-प्रशिक्षण की अधिक समष्टि रणनीति विकसित करके फंगल जीनोम तक बढ़ाया गया था। फिर, वर्ष 2014 में, जीनमार्क-ईटी एल्गोरिथ्म जो मानचित्र किए गए जीनोम अनअसेंबल RNA-Seq रीड्स से जानकारी द्वारा स्व-प्रशिक्षण को बढ़ाता है, को परिवार में जोड़ा गया था। यूकेरियोटिक प्रतिलेखों में जीन की भविष्यवाणी नए एल्गोरिदम जीनमार्कएस-टी (2015) द्वारा की जा सकती है | ||
==जीन भविष्यवाणी कार्यक्रमों का जीनमार्क परिवार== | ==जीन भविष्यवाणी कार्यक्रमों का जीनमार्क परिवार== | ||
Line 52: | Line 54: | ||
===यूकेरियोट्स=== | ===यूकेरियोट्स=== | ||
* जीनमार्क | * जीनमार्क | ||
* | * GeneMark.hmm <ref>{{Cite web|url=http://exon.gatech.edu/GeneMark/gmhmme.cgi|title=GeneMark.HMM eukaryotic}}</ref> | ||
* जीनमार्क-ईएस: यूकेरियोटिक जीनोम के लिए जीन खोज एल्गोरिथ्म जो बिना पर्यवेक्षित एब इनिटियो मोड में स्वचालित प्रशिक्षण करता है।<ref>{{Cite web|url=https://academic.oup.com/nar/article/33/20/6494/1082033|title = Validate User}}</ref> | * जीनमार्क-ईएस: यूकेरियोटिक जीनोम के लिए जीन खोज एल्गोरिथ्म जो बिना पर्यवेक्षित एब इनिटियो मोड में स्वचालित प्रशिक्षण करता है।<ref>{{Cite web|url=https://academic.oup.com/nar/article/33/20/6494/1082033|title = Validate User}}</ref> | ||
* | * जीनमार्क-ईटी: जीनमार्क-ईएस को नवीन विधि के साथ संवर्धित करता है जो RNA-Seq रीड संरेखण को स्व-प्रशिक्षण प्रक्रिया में एकीकृत करता है।<ref>{{Cite web|url=https://www.rna-seqblog.com/genemark-et-gene-finding-algorithm-for-eukaryotic-genomes/|title = GeneMark-ET – gene finding algorithm for eukaryotic genomes | RNA-Seq Blog|date = 9 July 2014}}</ref> | ||
* जीनमार्क-ईएक्स: जीनोम एनोटेशन के लिए पूरी तरह से स्वचालित एकीकृत उपकरण जो विभिन्न आकार, संरचना और गुणवत्ता के इनपुट डेटा में | * जीनमार्क-ईएक्स: जीनोम एनोटेशन के लिए पूरी तरह से स्वचालित एकीकृत उपकरण जो विभिन्न आकार, संरचना और गुणवत्ता के इनपुट डेटा में शक्तिशाली प्रदर्शन दिखाता है। एल्गोरिदम इनपुट डेटा की मात्रा, गुणवत्ता और विशेषताओं, आरएनए-सीक्यू डेटासमूह के आकार, प्रजातियों की फाइलोजेनेटिक स्थिति, असेंबली विखंडन की डिग्री के आधार पर पैरामीटर अनुमान के दृष्टिकोण का चयन करता है। यह प्रश्न में जीनोम की विशेषताओं को फिट करने और जीन भविष्यवाणी की प्रक्रिया में प्रतिलेख और प्रोटीन जानकारी को एकीकृत करने के लिए एचएमएम वास्तुकला को स्वचालित रूप से संशोधित करने में सक्षम है।<ref>https://pag.confex.com/pag/xxvi/meetingapp.cgi/Paper/31299 GeneMark-EX</ref> | ||
===वायरस, फेज और प्लास्मिड=== | ===वायरस, फेज और प्लास्मिड=== | ||
* अनुमानी मॉडल | * अनुमानी मॉडल | ||
Line 79: | Line 81: | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*{{Official website|http://opal.biology.gatech.edu/GeneMark/}} | *{{Official website|http://opal.biology.gatech.edu/GeneMark/}} | ||
[[zh:基因识别]] | [[zh:基因识别]] | ||
[[Category:Created On 10/07/2023]] | [[Category:Created On 10/07/2023]] | ||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Official website not in Wikidata]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:गणितीय और सैद्धांतिक जीव विज्ञान]] | |||
[[Category:जीनोमिक्स]] | |||
[[Category:जैव सूचना विज्ञान सॉफ्टवेयर]] | |||
[[Category:मेटाजेनोमिक्स सॉफ्टवेयर]] |
Latest revision as of 16:18, 25 July 2023
Original author(s) | मार्क बोरोडोव्स्की का जैव सूचना विज्ञान समूह |
---|---|
Developer(s) | जॉर्जिया तकनीकी संस्थान |
Initial release | 1993 |
Operating system | लिनक्स, विंडोज़, और [मैक ओएस]] |
License | मुफ़्त बाइनरी-केवल शैक्षणिक, गैर-लाभकारी या अमेरिकी सरकार के उपयोग के लिए |
Website | opal.biology.gatech.edu/GeneMark |
जीनमार्क, अटलांटा में जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी में विकसित एब इनिटियो जीन भविष्यवाणी कार्यक्रमों के परिवार का सामान्य नाम है। इस प्रकार वर्ष 1993 में विकसित, मूल जीनमार्क का उपयोग वर्ष 1995 में हेमोफिलस इन्फ्लुएंजा के पहले पूरी तरह से अनुक्रमित जीवाणु जीनोम के एनोटेशन के लिए प्राथमिक जीन भविष्यवाणी उपकरण के रूप में किया गया था, और वर्ष 1996 में मेथनोकोकस जन्नास्ची के पहले पुरातन जीनोम के लिए किया गया था। इस प्रकार एल्गोरिदम ने प्रोटीन-कोडिंग डीएनए अनुक्रम के अमानवीय तीन-आवधिक मार्कोव श्रृंखला मॉडल प्रस्तुत किए जो जीन भविष्यवाणी के साथ-साथ दो डीएनए स्ट्रैंड में जीन भविष्यवाणी के लिए बायेसियन दृष्टिकोण में मानक बन गए।
मॉडलों के विशिष्ट विशिष्ट मापदंडों का अनुमान ज्ञात प्रकार (प्रोटीन-कोडिंग और गैर-कोडिंग) के अनुक्रमों के प्रशिक्षण समूह से लगाया गया था। इस प्रकार एल्गोरिदम का प्रमुख चरण किसी दिए गए डीएनए टुकड़े के लिए छह संभावित रीडिंग फ़्रेमों में से प्रत्येक में "प्रोटीन-कोडिंग" (आनुवंशिक कोड ले जाना) (पूरक डीएनए स्ट्रैंड में तीन फ्रेम सहित) या "गैर-कोडिंग" होने की संभावनाओं की गणना करता है। मूल जीनमार्क (जैव सूचना विज्ञान में एचएमएम युग से पहले विकसित) एचएमएम जैसा एल्गोरिदम है; इसे उचित रूप से परिभाषित एचएमएम के लिए एचएमएम सिद्धांत पोस्टीरियर डिकोडिंग एल्गोरिदम में ज्ञात सन्निकटन के रूप में देखा जा सकता है।
प्रोकैरियोटिक जीन भविष्यवाणी
GeneMark.hmm एल्गोरिथ्म (1998) को छोटे जीन और जीन प्रारंभ को खोजने में जीन भविष्यवाणी त्रुटिहीनता में सुधार करने के लिए डिज़ाइन किया गया था। विचार जीनमार्क में प्रयुक्त मार्कोव श्रृंखला मॉडल को छिपे हुए मार्कोव मॉडल ढांचे में एकीकृत करने का था, जिसमें कोडिंग और गैर-कोडिंग क्षेत्रों के मध्य संक्रमण को औपचारिक रूप से छिपे हुए राज्यों के मध्य संक्रमण के रूप में व्याख्या किया गया था। इसके अतिरिक्त, राइबोसोम बाइंडिंग साइट मॉडल का उपयोग जीन प्रारंभ भविष्यवाणी की त्रुटिहीनता में सुधार के लिए किया गया था। अगला कदम स्व-प्रशिक्षण जीन पूर्वानुमान उपकरण GeneMarkS (2001) के विकास के साथ किया गया था। नए प्रोकैरियोटिक जीनोमिक अनुक्रमों में जीन की पहचान के लिए जीनोमिक्स समुदाय द्वारा GeneMarkS का सक्रिय उपयोग किया जा रहा है।
GeneMarkS+, GeneMarkS का विस्तार जीन भविष्यवाणी में समजात प्रोटीन पर जानकारी को एकीकृत करता है जिसका उपयोग प्रोकैरियोटिक जीनोम एनोटेशन के लिए एनसीबीआई पाइपलाइन में किया जाता है; पाइपलाइन प्रतिदिन 2000 जीनोम तक एनोटेट कर सकती है (www.ncbi.nlm.nih.gov/genome/annotation_prok/process).
मेटाजेनोम्स और मेटाट्रांससिप्टोम्स में अनुमानी मॉडल और जीन भविष्यवाणी
जीनमार्क और GeneMark.hmm एल्गोरिदम के प्रजातियों के विशिष्ट मापदंडों की त्रुटिहीन पहचान त्रुटिहीन जीन भविष्यवाणियां करने के लिए महत्वपूर्ण शर्त थी। यद्यपि, वायरल जीनोम के अध्ययन से प्रेरित होकर यह सवाल उठाया गया था कि जीन भविष्यवाणी के लिए मापदंडों को छोटे अनुक्रम में कैसे परिभाषित किया जाए जिसका कोई बड़ा जीनोमिक संदर्भ न हो। वर्ष 1999 में इस प्रश्न को अनुक्रम जी+सी सामग्री के कार्यों के रूप में मापदंडों की अनुमानी विधि गणना के विकास द्वारा संबोधित किया गया था। वर्ष 2004 से अनुमानी दृष्टिकोण द्वारा निर्मित मॉडल का उपयोग मेटागेनोमिक अनुक्रमों में जीन खोजने में किया गया है। इसके पश्चात्, अनेक सौ प्रोकैरियोटिक जीनोम के विश्लेषण से वर्ष 2010 में अधिक उन्नत अनुमानी पद्धति (मेटाजेनमार्क में प्रयुक्त) विकसित हुई।
यूकेरियोटिक जीन भविष्यवाणी
यूकेरियोटिक जीनोम में इंट्रोन्स और इंटरजेनिक क्षेत्रों के साथ एक्सॉन सीमाओं का मॉडलिंग एचएमएम के उपयोग से संबोधित बड़ी चुनौती प्रस्तुत करता है। यूकेरियोटिक GeneMark.hmm के एचएमएम आर्किटेक्चर में प्रारंभिक, आंतरिक और टर्मिनल एक्सॉन, इंट्रॉन, इंटरजेनिक क्षेत्र और दोनों डीएनए स्ट्रैंड में स्थित एकल एक्सॉन जीन के लिए छिपे हुए राज्य सम्मिलित हैं। आरंभिक यूकेरियोटिक GeneMark.hmm को एल्गोरिथम मापदंडों के आकलन के लिए प्रशिक्षण समूह की आवश्यकता थी। वर्ष 2005 में स्व-प्रशिक्षण एल्गोरिदम जीनमार्क-ईएस का पहला संस्करण विकसित किया गया था। सत्र 2008 में जीनमार्क-ईएस एल्गोरिदम को विशेष इंट्रॉन मॉडल और स्व-प्रशिक्षण की अधिक समष्टि रणनीति विकसित करके फंगल जीनोम तक बढ़ाया गया था। फिर, वर्ष 2014 में, जीनमार्क-ईटी एल्गोरिथ्म जो मानचित्र किए गए जीनोम अनअसेंबल RNA-Seq रीड्स से जानकारी द्वारा स्व-प्रशिक्षण को बढ़ाता है, को परिवार में जोड़ा गया था। यूकेरियोटिक प्रतिलेखों में जीन की भविष्यवाणी नए एल्गोरिदम जीनमार्कएस-टी (2015) द्वारा की जा सकती है
जीन भविष्यवाणी कार्यक्रमों का जीनमार्क परिवार
बैक्टीरिया, आर्किया
- जीनमार्क
- जीनमार्क्स
- जीनमार्क्स+
मेटाजेनोम्स और मेटाट्रांसस्क्रिप्टोम्स
- मेटाजेनमार्क
यूकेरियोट्स
- जीनमार्क
- GeneMark.hmm [1]
- जीनमार्क-ईएस: यूकेरियोटिक जीनोम के लिए जीन खोज एल्गोरिथ्म जो बिना पर्यवेक्षित एब इनिटियो मोड में स्वचालित प्रशिक्षण करता है।[2]
- जीनमार्क-ईटी: जीनमार्क-ईएस को नवीन विधि के साथ संवर्धित करता है जो RNA-Seq रीड संरेखण को स्व-प्रशिक्षण प्रक्रिया में एकीकृत करता है।[3]
- जीनमार्क-ईएक्स: जीनोम एनोटेशन के लिए पूरी तरह से स्वचालित एकीकृत उपकरण जो विभिन्न आकार, संरचना और गुणवत्ता के इनपुट डेटा में शक्तिशाली प्रदर्शन दिखाता है। एल्गोरिदम इनपुट डेटा की मात्रा, गुणवत्ता और विशेषताओं, आरएनए-सीक्यू डेटासमूह के आकार, प्रजातियों की फाइलोजेनेटिक स्थिति, असेंबली विखंडन की डिग्री के आधार पर पैरामीटर अनुमान के दृष्टिकोण का चयन करता है। यह प्रश्न में जीनोम की विशेषताओं को फिट करने और जीन भविष्यवाणी की प्रक्रिया में प्रतिलेख और प्रोटीन जानकारी को एकीकृत करने के लिए एचएमएम वास्तुकला को स्वचालित रूप से संशोधित करने में सक्षम है।[4]
वायरस, फेज और प्लास्मिड
- अनुमानी मॉडल
आरएनए-सेक से इकट्ठे किए गए प्रतिलेख पढ़ें
- जीनमार्कएस-टी
यह भी देखें
- जीन भविष्यवाणी सॉफ्टवेयर की सूची
- जीन भविष्यवाणी
संदर्भ
- Borodovsky M. and McIninch J. "GeneMark: parallel gene recognition for both DNA strands." Computers & Chemistry (1993) 17 (2): 123–133.
- Lukashin A. and Borodovsky M. "GeneMark.hmm: new solutions for gene finding." Nucleic Acids Research (1998) 26 (4): 1107–1115. doi:10.1093/nar/26.4.1107
- Besemer J. and Borodovsky M. "Heuristic approach to deriving models for gene finding." Nucleic Acids Research (1999) 27 (19): 3911–3920. doi:10.1093/nar/27.19.3911
- Besemer J., Lomsadze A. and Borodovsky M. "GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions." Nucleic Acids Research (2001) 29 (12): 2607–2618. doi:10.1093/nar/29.12.2607
- Mills R., Rozanov M., Lomsadze A., Tatusova T. and Borodovsky M. "Improving gene annotation in complete viral genomes." Nucleic Acids Research (2003) 31 (23): 7041–7055. doi:10.1093/nar/gkg878
- Besemer J. and Borodovsky M. "GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses." Nucleic Acids Research (2005) 33 (Web Server Issue): W451-454. doi:10.1093/nar/gki487
- Lomsadze A., Ter-Hovhannisyan V., Chernoff Y. and Borodovsky M. "Gene identification in novel eukaryotic genomes by self-training algorithm." Nucleic Acids Research (2005) 33 (20): 6494–6506. doi:10.1093/nar/gki937
- Zhu W., Lomsadze A. and Borodovsky M. "Ab initio gene identification in metagenomic sequences." Nucleic Acids Research (2010) 38 (12): e132. doi:10.1093/nar/gkq275