डीएनए एनोटेशन: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Process where DNA is sequenced}} | {{Short description|Process where DNA is sequenced}} | ||
'''1डीएनए (DNA) एनोटेशन''' या '''जीनोम एनोटेशन''' | '''1डीएनए (DNA) एनोटेशन''' या '''जीनोम एनोटेशन''' जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया होती है कि वे जीन क्या करते हैं।इस प्रकार से एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) माना जाता है। अतः जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।<ref>{{cite web | ||
|url=http://www.medterms.com/script/main/art.asp?articlekey=16833 | |url=http://www.medterms.com/script/main/art.asp?articlekey=16833 | ||
|title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन | |title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन उपकरण<ref>{{Citation |title=GAAS |date=2022-04-13 |url=https://github.com/NBISweden/GAAS/blob/07bd49a1623c0e13f77b1747b124d6d9385b67b7/annotation/knowledge/annotation_tools_genome.md |publisher=NBIS -- National Bioinformatics Infrastructure Sweden |access-date=2022-04-25}}</ref> का उपयोग करके एनोटेट किया जा सकता है।<ref name="pmid33879057">{{cite journal |vauthors=Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM |date=Apr 2021 |title=FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences |journal=BMC Bioinformatics |volume=44 |issue=9 |pages=e89 |doi=10.1186/s12859-021-04120-9 |pmc=8056616 |pmid=33879057 |doi-access=free}}</ref> आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (एमओएसजीए) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।<ref>{{Cite journal |last1=Martin |first1=Roman |last2=Hackl |first2=Thomas |last3=Hattab |first3=Georges |last4=Fischer |first4=Matthias G |last5=Heider |first5=Dominik |date=2021-04-01 |editor-last=Birol |editor-first=Inanc |title=MOSGA: Modular Open-Source Genome Annotator |url=https://academic.oup.com/bioinformatics/article/36/22-23/5514/6015104 |journal=Bioinformatics |language=en |volume=36 |issue=22–23 |pages=5514–5515 |doi=10.1093/bioinformatics/btaa1003 |issn=1367-4803 |pmid=33258916|hdl=21.11116/0000-0006-FED4-D |hdl-access=free }}</ref><ref>{{Cite web |last=Martin |first=Copyright (C) 2021 Roman Martin. Designed and developed by Roman |title=राज्यमंत्री को|url=https://mosga.mathematik.uni-marburg.de |access-date=2022-04-25 |website=mosga.mathematik.uni-marburg.de |language=en}}</ref> इस प्रकार से प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,<ref>{{cite journal |last1=Schwengers |first1=Oliver |last2=Jelonek |first2=Lukas |last3=Dieckmann |first3=Marius Alfred |last4=Beyvers |first4=Sebastian |last5=Blom |first5=Jochen |last6=Goesmann |first6=Alexander |title=Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification |journal=Microbial Genomics |date=5 November 2021 |volume=7 |issue=11 |doi=10.1099/mgen.0.000685 |pmid=34739369|pmc=8743544 }}</ref> प्रोक्का<ref>{{cite journal |last1=Seemann |first1=Torsten |title=Prokka: rapid prokaryotic genome annotation |journal=Bioinformatics |date=15 July 2014 |volume=30 |issue=14 |pages=2068–2069 |doi=10.1093/bioinformatics/btu153|pmid=24642063 }}</ref> और पीजीएपी<ref>{{cite journal |last1=Li |first1=Wenjun |last2=O’Neill |first2=Kathleen R |last3=Haft |first3=Daniel H |last4=DiCuccio |first4=Michael |last5=Chetvernin |first5=Vyacheslav |last6=Badretdin |first6=Azat |last7=Coulouris |first7=George |last8=Chitsaz |first8=Farideh |last9=Derbyshire |first9=Myra K. |last10=Durkin |first10=A Scott |last11=Gonzales |first11=Noreen R |last12=Gwadz |first12=Marc |last13=Lanczycki |first13=Christopher J. |last14=Song |first14=James S |last15=Thanki |first15=Narmada |last16=Wang |first16=Jiyao |last17=Yamashita |first17=Roxanne A. |last18=Yang |first18=Mingzhang |last19=Zheng |first19=Chanjuan |last20=Marchler-Bauer |first20=Aron |last21=Thibaud-Nissen |first21=Françoise |title=RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation |journal=Nucleic Acids Research |date=8 January 2021 |volume=49 |issue=D1 |pages=D1020–D1028 |doi=10.1093/nar/gkaa1105|pmid=33270901 |pmc=7779008 }}</ref> हैं। | ||
डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय | डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और [[प्रोटीन]] उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी प्रकार के आयोजनों से जैविक एनोटेशन के कुछ भागो पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध होती है।<ref>{{cite web|title=जाओ शिक्षण संसाधन|url=http://www.geneontology.org/GO.teaching.resources.shtml|access-date=21 September 2006|archive-url=https://web.archive.org/web/20061010053534/http://www.geneontology.org/GO.teaching.resources.shtml|archive-date=10 October 2006|url-status=dead}}</ref> और मानव जीनोम एनोटेशन के सीमा में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी को खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जोकी मानव जीनोम को समझने और व्याख्या करने में सहायता प्रदान करता है।<ref>{{Cite journal |last=Sommer |first=Markus J. |last2=Cha |first2=Sooyoung |last3=Varabyou |first3=Ales |last4=Rincon |first4=Natalia |last5=Park |first5=Sukhwan |last6=Minkin |first6=Ilia |last7=Pertea |first7=Mihaela |last8=Steinegger |first8=Martin |last9=Salzberg |first9=Steven L. |date=2022-12-15 |title=मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान|url=https://elifesciences.org/articles/82556 |language=en |doi=10.7554/eLife.82556}}</ref> | ||
इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित किया जाता है। | इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित किया जाता है। | ||
सामान्य विधि के रूप में, डीसीजीओ<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए | सामान्य विधि के रूप में, डीसीजीओ<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया मानी जाती है। | ||
== प्रक्रिया == | == प्रक्रिया == | ||
Line 29: | Line 29: | ||
किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक होते हैं। | किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक होते हैं। | ||
जीन एनोटेशन की | जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए बीएलएएसटी जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।<ref name='pevsner2009'>{{Cite book | ||
| edition = 2nd | | edition = 2nd | ||
| publisher = Wiley-Blackwell | | publisher = Wiley-Blackwell | ||
Line 40: | Line 40: | ||
| url-access = registration | | url-access = registration | ||
| url = https://archive.org/details/bioinformaticsfu00pevs_0 | | url = https://archive.org/details/bioinformaticsfu00pevs_0 | ||
}}</ref> चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर | }}</ref> चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर उपकरणकी श्रृंखला पर निर्भर करते हैं। | ||
* ओआरएफ और उनका स्थानीयकरण | * ओआरएफ और उनका स्थानीयकरण | ||
* जीन संरचना | * जीन संरचना | ||
Line 58: | Line 58: | ||
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है। | वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है। | ||
मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन | मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन उच्च चुनौती बनी हुई है, अधिक से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर पर पूरे हो चुके हैं।<ref name="encode2012plosGuide">{{Cite journal | editor = Becker PB | editor-link = Peter Becker (biologist) | author = ENCODE Project Consortium| title = डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)| doi = 10.1371/journal.pbio.1001046 | journal = [[PLOS Biology]] | volume = 9 | issue = 4 | pages = e1001046 | year = 2011 | pmid = 21526222| pmc = 3079585}} {{open access}}</ref><ref name="1001genomes2012">{{Cite journal | last1 = McVean | first1 = G. A. | last2 = Abecasis | first2 = D. M. | last3 = Auton | first3 = R. M. | last4 = Brooks | first4 = G. A. R. | last5 = Depristo | first5 = D. R. | last6 = Durbin | first6 = A. | last7 = Handsaker | first7 = A. G. | last8 = Kang | first8 = P. | last9 = Marth | first9 = E. E. | last10 = McVean | doi = 10.1038/nature11632 | first10 = P. | last11 = Gabriel | first11 = S. B. | last12 = Gibbs | first12 = R. A. | last13 = Green | first13 = E. D. | last14 = Hurles | first14 = M. E. | last15 = Knoppers | first15 = B. M. | last16 = Korbel | first16 = J. O. | last17 = Lander | first17 = E. S. | last18 = Lee | first18 = C. | last19 = Lehrach | first19 = H. | last20 = Mardis | first20 = E. R. | last21 = Marth | first21 = G. T. | last22 = McVean | first22 = G. A. | last23 = Nickerson | first23 = D. A. | last24 = Schmidt | first24 = J. P. | last25 = Sherry | first25 = S. T. | last26 = Wang | first26 = J. | last27 = Wilson | first27 = R. K. | last28 = Gibbs (Principal Investigator) | first28 = R. A. | last29 = Dinh | first29 = H. | last30 = Kovar | first30 = C. | display-authors = 29 | title = An integrated map of genetic variation from 1,092 human genomes | journal = Nature | volume = 491 | issue = 7422 | pages = 56–65 | year = 2012 | pmid = 23128226| pmc =3498066 | bibcode = 2012Natur.491...56T }}</ref> जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।<ref name="pevsner2009" /> इस प्रकार से वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी भाग " साथ कैसे फिट होते हैं"।<ref name="encode2012">{{Cite journal | last1 = Dunham | first1 = I. | last2 = Bernstein | first2 = A. | last3 = Birney | first3 = S. F. | last4 = Dunham | first4 = P. J. | last5 = Green | first5 = C. A. | last6 = Gunter | first6 = F. | last7 = Snyder | first7 = C. B. | last8 = Frietze | first8 = S. | last9 = Harrow | first9 = J. | last10 = Kaul | doi = 10.1038/nature11247 | first10 = R. | last11 = Khatun | first11 = J. | last12 = Lajoie | first12 = B. R. | last13 = Landt | first13 = S. G. | last14 = Lee | first14 = B. K. | last15 = Pauli | first15 = F. | last16 = Rosenbloom | first16 = K. R. | last17 = Sabo | first17 = P. | last18 = Safi | first18 = A. | last19 = Sanyal | first19 = A. | last20 = Shoresh | first20 = N. | last21 = Simon | first21 = J. M. | last22 = Song | first22 = L. | last23 = Trinklein | first23 = N. D. | last24 = Altshuler | first24 = R. C. | last25 = Birney | first25 = E. | last26 = Brown | first26 = J. B. | last27 = Cheng | first27 = C. | last28 = Djebali | first28 = S. | last29 = Dong | first29 = X. | last30 = Dunham | first30 = I. | display-authors = 29 | title = मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश| journal = Nature | volume = 489 | issue = 7414 | pages = 57–74 | year = 2012 | pmid = 22955616| pmc = 3439153| bibcode = 2012Natur.489...57T }}</ref> | ||
जीनोम एनोटेशन जांच का | जीनोम एनोटेशन जांच का सक्रिय क्षेत्र होते है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित होते हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है: | ||
* डीएनए तत्वों का विश्वकोश (एनकोड) | * डीएनए तत्वों का विश्वकोश (एनकोड) | ||
* [[जीन दर्ज करें|एन्ट्रेज़ जीन]] | * [[जीन दर्ज करें|एन्ट्रेज़ जीन]] | ||
Line 71: | Line 71: | ||
* कशेरुक और जीनोम एनोटेशन परियोजना (वेगा) | * कशेरुक और जीनोम एनोटेशन परियोजना (वेगा) | ||
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो | विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो [[इंटरनेट बॉट]] संचालित करता है जोकी अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब्स बनाता है।<ref name="Huss2008">{{Cite journal | ||
| last1 = Huss | first1 = Jon W. | | last1 = Huss | first1 = Jon W. | ||
| year = 2008 | | year = 2008 |
Revision as of 13:57, 27 June 2023
1डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया होती है कि वे जीन क्या करते हैं।इस प्रकार से एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) माना जाता है। अतः जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।[1] यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन उपकरण[2] का उपयोग करके एनोटेट किया जा सकता है।[3] आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (एमओएसजीए) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।[4][5] इस प्रकार से प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,[6] प्रोक्का[7] और पीजीएपी[8] हैं।
डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी प्रकार के आयोजनों से जैविक एनोटेशन के कुछ भागो पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध होती है।[9] और मानव जीनोम एनोटेशन के सीमा में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी को खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जोकी मानव जीनोम को समझने और व्याख्या करने में सहायता प्रदान करता है।[10]
इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन[11] के लिए उपकरण विकसित किया जाता है।
सामान्य विधि के रूप में, डीसीजीओ[12] के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया मानी जाती है।
प्रक्रिया
अतः जीनोम एनोटेशन में तीन प्रमुख्य चरण होते हैं:।[13]
- जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
- जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
- इन तत्वों के साथ जैविक जानकारी संलग्न करना है
किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन पाइपलाइन में एक-दूसरे के पूरक होते हैं।
जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए बीएलएएसटी जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।[14] चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर उपकरणकी श्रृंखला पर निर्भर करते हैं।
- ओआरएफ और उनका स्थानीयकरण
- जीन संरचना
- कोडिंग क्षेत्र
- विनियामक रूपांकनों का स्थान
इस प्रकार से क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित किया गया है।
- जैव रासायनिक क्रिया
- जैविक क्रिया
- इसमें विनियमन और अंतःक्रिया सम्मिलित है
- अभिव्यंजना
इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।[15]
जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER।
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।
मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन उच्च चुनौती बनी हुई है, अधिक से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर पर पूरे हो चुके हैं।[16][17] जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।[14] इस प्रकार से वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी भाग " साथ कैसे फिट होते हैं"।[18]
जीनोम एनोटेशन जांच का सक्रिय क्षेत्र होते है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित होते हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
- डीएनए तत्वों का विश्वकोश (एनकोड)
- एन्ट्रेज़ जीन
- एन्सेंबल
- जेनकोड
- जीन ओन्टोलॉजी कंसोर्टियम
- जेनरिफ
- रेफरसेक
- यूनिप्रोट
- कशेरुक और जीनोम एनोटेशन परियोजना (वेगा)
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो इंटरनेट बॉट संचालित करता है जोकी अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब्स बनाता है।[19]
संदर्भ
- ↑ "Definition of genome annotation".
- ↑ GAAS, NBIS -- National Bioinformatics Infrastructure Sweden, 2022-04-13, retrieved 2022-04-25
- ↑ Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM (Apr 2021). "FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences". BMC Bioinformatics. 44 (9): e89. doi:10.1186/s12859-021-04120-9. PMC 8056616. PMID 33879057.
- ↑ Martin, Roman; Hackl, Thomas; Hattab, Georges; Fischer, Matthias G; Heider, Dominik (2021-04-01). Birol, Inanc (ed.). "MOSGA: Modular Open-Source Genome Annotator". Bioinformatics (in English). 36 (22–23): 5514–5515. doi:10.1093/bioinformatics/btaa1003. hdl:21.11116/0000-0006-FED4-D. ISSN 1367-4803. PMID 33258916.
- ↑ Martin, Copyright (C) 2021 Roman Martin. Designed and developed by Roman. "राज्यमंत्री को". mosga.mathematik.uni-marburg.de (in English). Retrieved 2022-04-25.
- ↑ Schwengers, Oliver; Jelonek, Lukas; Dieckmann, Marius Alfred; Beyvers, Sebastian; Blom, Jochen; Goesmann, Alexander (5 November 2021). "Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification". Microbial Genomics. 7 (11). doi:10.1099/mgen.0.000685. PMC 8743544. PMID 34739369.
- ↑ Seemann, Torsten (15 July 2014). "Prokka: rapid prokaryotic genome annotation". Bioinformatics. 30 (14): 2068–2069. doi:10.1093/bioinformatics/btu153. PMID 24642063.
- ↑ Li, Wenjun; O’Neill, Kathleen R; Haft, Daniel H; DiCuccio, Michael; Chetvernin, Vyacheslav; Badretdin, Azat; Coulouris, George; Chitsaz, Farideh; Derbyshire, Myra K.; Durkin, A Scott; Gonzales, Noreen R; Gwadz, Marc; Lanczycki, Christopher J.; Song, James S; Thanki, Narmada; Wang, Jiyao; Yamashita, Roxanne A.; Yang, Mingzhang; Zheng, Chanjuan; Marchler-Bauer, Aron; Thibaud-Nissen, Françoise (8 January 2021). "RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation". Nucleic Acids Research. 49 (D1): D1020–D1028. doi:10.1093/nar/gkaa1105. PMC 7779008. PMID 33270901.
- ↑ "जाओ शिक्षण संसाधन". Archived from the original on 10 October 2006. Retrieved 21 September 2006.
- ↑ Sommer, Markus J.; Cha, Sooyoung; Varabyou, Ales; Rincon, Natalia; Park, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martin; Salzberg, Steven L. (2022-12-15). "मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान" (in English). doi:10.7554/eLife.82556.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ "NCBO Annotator | bioontology.org". ncbo.bioontology.org. Retrieved 2023-02-08.
- ↑ Fang, H; Gough, J (2013). "DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more". Nucleic Acids Research. 41 (Database issue): D536–44. doi:10.1093/nar/gks1080. PMC 3531119. PMID 23161684.
- ↑ Stein, L. (2001). "Genome annotation: from sequence to biology". Nature Reviews Genetics. 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. S2CID 12044602.
- ↑ 14.0 14.1 Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851.
- ↑ Gupta, Nitin; Stephen Tanner; Navdeep Jaitly; Joshua N Adkins; Mary Lipton; Robert Edwards; Margaret Romine; Andrei Osterman; Vineet Bafna; Richard D Smith; Pavel A Pevzner (September 2007). "Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation". Genome Research. 17 (9): 1362–1377. doi:10.1101/gr.6427907. ISSN 1088-9051. PMC 1950905. PMID 17690205.
- ↑ ENCODE Project Consortium (2011). Becker PB (ed.). "डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)". PLOS Biology. 9 (4): e1001046. doi:10.1371/journal.pbio.1001046. PMC 3079585. PMID 21526222.
- ↑ McVean, G. A.; Abecasis, D. M.; Auton, R. M.; Brooks, G. A. R.; Depristo, D. R.; Durbin, A.; Handsaker, A. G.; Kang, P.; Marth, E. E.; McVean, P.; Gabriel, S. B.; Gibbs, R. A.; Green, E. D.; Hurles, M. E.; Knoppers, B. M.; Korbel, J. O.; Lander, E. S.; Lee, C.; Lehrach, H.; Mardis, E. R.; Marth, G. T.; McVean, G. A.; Nickerson, D. A.; Schmidt, J. P.; Sherry, S. T.; Wang, J.; Wilson, R. K.; Gibbs (Principal Investigator), R. A.; Dinh, H.; et al. (2012). "An integrated map of genetic variation from 1,092 human genomes". Nature. 491 (7422): 56–65. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.
- ↑ Dunham, I.; Bernstein, A.; Birney, S. F.; Dunham, P. J.; Green, C. A.; Gunter, F.; Snyder, C. B.; Frietze, S.; Harrow, J.; Kaul, R.; Khatun, J.; Lajoie, B. R.; Landt, S. G.; Lee, B. K.; Pauli, F.; Rosenbloom, K. R.; Sabo, P.; Safi, A.; Sanyal, A.; Shoresh, N.; Simon, J. M.; Song, L.; Trinklein, N. D.; Altshuler, R. C.; Birney, E.; Brown, J. B.; Cheng, C.; Djebali, S.; Dong, X.; et al. (2012). "मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
- ↑ Huss, Jon W.; Orozco, C; Goodale, J; Wu, C; Batalov, S; Vickers, TJ; Valafar, F; Su, AI (2008). "A Gene Wiki for Community Annotation of Gene Function". PLOS Biology. 6 (7): e175. doi:10.1371/journal.pbio.0060175. PMC 2443188. PMID 18613750.