डीएनए एनोटेशन
डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) है। बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।[1] यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल[2] का उपयोग करके एनोटेट किया जा सकता है।[3] आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।[4][5] प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,[6] प्रोक्का[7] और पीजीएपी[8] हैं।
डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है।[9] मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।[10]
नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन[11] के लिए उपकरण विकसित करता है।
सामान्य विधि के रूप में, DCGO[12] के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया है।
प्रक्रिया
जीनोम एनोटेशन में तीन मुख्य चरण होते हैं:।[13]
- जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
- जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
- इन तत्वों के साथ जैविक जानकारी संलग्न करना है
स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और ही एनोटेशन पाइपलाइन में एक-दूसरे के पूरक हैं।
जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।[14] हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की श्रृंखला पर निर्भर करते हैं।
- ओआरएफ (ORFs) और उनका स्थानीयकरण
- जीन संरचना
- कोडिंग क्षेत्र
- विनियामक रूपांकनों का स्थान
क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित है।
- जैव रासायनिक क्रिया
- जैविक क्रिया
- इसमें विनियमन और अंतःक्रिया सम्मिलित है
- अभिव्यंजना
इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।[15]
जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER।
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।
मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन बड़ी चुनौती बनी हुई है, हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं।[16][17] जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।[14] वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से " साथ कैसे फिट होते हैं"।[18]
जीनोम एनोटेशन जांच का सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
- डीएनए तत्वों का विश्वकोश (एनकोड)
- एन्ट्रेज़ जीन
- एन्सेंबल
- जेनकोड
- जीन ओन्टोलॉजी कंसोर्टियम
- जेनरिफ
- रेफरसेक
- यूनिप्रोट
- कशेरुकी और जीनोम एनोटेशन प्रोजेक्ट (वेगा)
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो इंटरनेट बॉट संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।[19]
संदर्भ
- ↑ "Definition of genome annotation".
- ↑ GAAS, NBIS -- National Bioinformatics Infrastructure Sweden, 2022-04-13, retrieved 2022-04-25
- ↑ Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM (Apr 2021). "FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences". BMC Bioinformatics. 44 (9): e89. doi:10.1186/s12859-021-04120-9. PMC 8056616. PMID 33879057.
- ↑ Martin, Roman; Hackl, Thomas; Hattab, Georges; Fischer, Matthias G; Heider, Dominik (2021-04-01). Birol, Inanc (ed.). "MOSGA: Modular Open-Source Genome Annotator". Bioinformatics (in English). 36 (22–23): 5514–5515. doi:10.1093/bioinformatics/btaa1003. hdl:21.11116/0000-0006-FED4-D. ISSN 1367-4803. PMID 33258916.
- ↑ Martin, Copyright (C) 2021 Roman Martin. Designed and developed by Roman. "राज्यमंत्री को". mosga.mathematik.uni-marburg.de (in English). Retrieved 2022-04-25.
- ↑ Schwengers, Oliver; Jelonek, Lukas; Dieckmann, Marius Alfred; Beyvers, Sebastian; Blom, Jochen; Goesmann, Alexander (5 November 2021). "Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification". Microbial Genomics. 7 (11). doi:10.1099/mgen.0.000685. PMC 8743544. PMID 34739369.
- ↑ Seemann, Torsten (15 July 2014). "Prokka: rapid prokaryotic genome annotation". Bioinformatics. 30 (14): 2068–2069. doi:10.1093/bioinformatics/btu153. PMID 24642063.
- ↑ Li, Wenjun; O’Neill, Kathleen R; Haft, Daniel H; DiCuccio, Michael; Chetvernin, Vyacheslav; Badretdin, Azat; Coulouris, George; Chitsaz, Farideh; Derbyshire, Myra K.; Durkin, A Scott; Gonzales, Noreen R; Gwadz, Marc; Lanczycki, Christopher J.; Song, James S; Thanki, Narmada; Wang, Jiyao; Yamashita, Roxanne A.; Yang, Mingzhang; Zheng, Chanjuan; Marchler-Bauer, Aron; Thibaud-Nissen, Françoise (8 January 2021). "RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation". Nucleic Acids Research. 49 (D1): D1020–D1028. doi:10.1093/nar/gkaa1105. PMC 7779008. PMID 33270901.
- ↑ "जाओ शिक्षण संसाधन". Archived from the original on 10 October 2006. Retrieved 21 September 2006.
- ↑ Sommer, Markus J.; Cha, Sooyoung; Varabyou, Ales; Rincon, Natalia; Park, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martin; Salzberg, Steven L. (2022-12-15). "मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान" (in English). doi:10.7554/eLife.82556.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ "NCBO Annotator | bioontology.org". ncbo.bioontology.org. Retrieved 2023-02-08.
- ↑ Fang, H; Gough, J (2013). "DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more". Nucleic Acids Research. 41 (Database issue): D536–44. doi:10.1093/nar/gks1080. PMC 3531119. PMID 23161684.
- ↑ Stein, L. (2001). "Genome annotation: from sequence to biology". Nature Reviews Genetics. 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. S2CID 12044602.
- ↑ 14.0 14.1 Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851.
- ↑ Gupta, Nitin; Stephen Tanner; Navdeep Jaitly; Joshua N Adkins; Mary Lipton; Robert Edwards; Margaret Romine; Andrei Osterman; Vineet Bafna; Richard D Smith; Pavel A Pevzner (September 2007). "Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation". Genome Research. 17 (9): 1362–1377. doi:10.1101/gr.6427907. ISSN 1088-9051. PMC 1950905. PMID 17690205.
- ↑ ENCODE Project Consortium (2011). Becker PB (ed.). "डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)". PLOS Biology. 9 (4): e1001046. doi:10.1371/journal.pbio.1001046. PMC 3079585. PMID 21526222.
- ↑ McVean, G. A.; Abecasis, D. M.; Auton, R. M.; Brooks, G. A. R.; Depristo, D. R.; Durbin, A.; Handsaker, A. G.; Kang, P.; Marth, E. E.; McVean, P.; Gabriel, S. B.; Gibbs, R. A.; Green, E. D.; Hurles, M. E.; Knoppers, B. M.; Korbel, J. O.; Lander, E. S.; Lee, C.; Lehrach, H.; Mardis, E. R.; Marth, G. T.; McVean, G. A.; Nickerson, D. A.; Schmidt, J. P.; Sherry, S. T.; Wang, J.; Wilson, R. K.; Gibbs (Principal Investigator), R. A.; Dinh, H.; et al. (2012). "An integrated map of genetic variation from 1,092 human genomes". Nature. 491 (7422): 56–65. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.
- ↑ Dunham, I.; Bernstein, A.; Birney, S. F.; Dunham, P. J.; Green, C. A.; Gunter, F.; Snyder, C. B.; Frietze, S.; Harrow, J.; Kaul, R.; Khatun, J.; Lajoie, B. R.; Landt, S. G.; Lee, B. K.; Pauli, F.; Rosenbloom, K. R.; Sabo, P.; Safi, A.; Sanyal, A.; Shoresh, N.; Simon, J. M.; Song, L.; Trinklein, N. D.; Altshuler, R. C.; Birney, E.; Brown, J. B.; Cheng, C.; Djebali, S.; Dong, X.; et al. (2012). "मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
- ↑ Huss, Jon W.; Orozco, C; Goodale, J; Wu, C; Batalov, S; Vickers, TJ; Valafar, F; Su, AI (2008). "A Gene Wiki for Community Annotation of Gene Function". PLOS Biology. 6 (7): e175. doi:10.1371/journal.pbio.0060175. PMC 2443188. PMID 18613750.