डीएनए एनोटेशन: Difference between revisions

From Vigyanwiki
No edit summary
Line 1: Line 1:
{{Short description|Process where DNA is sequenced}}
{{Short description|Process where DNA is sequenced}}
'''डीएनए (DNA) एनोटेशन''' या जीनोम एनोटेशन एक जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया एक शब्द (नोट) है। एक बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।<ref>{{cite web
'''डीएनए (DNA) एनोटेशन''' या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) है। बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।<ref>{{cite web
|url=http://www.medterms.com/script/main/art.asp?articlekey=16833
|url=http://www.medterms.com/script/main/art.asp?articlekey=16833
|title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल<ref>{{Citation |title=GAAS |date=2022-04-13 |url=https://github.com/NBISweden/GAAS/blob/07bd49a1623c0e13f77b1747b124d6d9385b67b7/annotation/knowledge/annotation_tools_genome.md |publisher=NBIS -- National Bioinformatics Infrastructure Sweden |access-date=2022-04-25}}</ref> का उपयोग करके एनोटेट किया जा सकता है।<ref name="pmid33879057">{{cite journal |vauthors=Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM |date=Apr 2021 |title=FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences |journal=BMC Bioinformatics |volume=44 |issue=9 |pages=e89 |doi=10.1186/s12859-021-04120-9 |pmc=8056616 |pmid=33879057 |doi-access=free}}</ref> एक आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।<ref>{{Cite journal |last1=Martin |first1=Roman |last2=Hackl |first2=Thomas |last3=Hattab |first3=Georges |last4=Fischer |first4=Matthias G |last5=Heider |first5=Dominik |date=2021-04-01 |editor-last=Birol |editor-first=Inanc |title=MOSGA: Modular Open-Source Genome Annotator |url=https://academic.oup.com/bioinformatics/article/36/22-23/5514/6015104 |journal=Bioinformatics |language=en |volume=36 |issue=22–23 |pages=5514–5515 |doi=10.1093/bioinformatics/btaa1003 |issn=1367-4803 |pmid=33258916|hdl=21.11116/0000-0006-FED4-D |hdl-access=free }}</ref><ref>{{Cite web |last=Martin |first=Copyright (C) 2021 Roman Martin. Designed and developed by Roman |title=राज्यमंत्री को|url=https://mosga.mathematik.uni-marburg.de |access-date=2022-04-25 |website=mosga.mathematik.uni-marburg.de |language=en}}</ref> प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,<ref>{{cite journal |last1=Schwengers |first1=Oliver |last2=Jelonek |first2=Lukas |last3=Dieckmann |first3=Marius Alfred |last4=Beyvers |first4=Sebastian |last5=Blom |first5=Jochen |last6=Goesmann |first6=Alexander |title=Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification |journal=Microbial Genomics |date=5 November 2021 |volume=7 |issue=11 |doi=10.1099/mgen.0.000685 |pmid=34739369|pmc=8743544 }}</ref> प्रोक्का<ref>{{cite journal |last1=Seemann |first1=Torsten |title=Prokka: rapid prokaryotic genome annotation |journal=Bioinformatics |date=15 July 2014 |volume=30 |issue=14 |pages=2068–2069 |doi=10.1093/bioinformatics/btu153|pmid=24642063 }}</ref> और पीजीएपी<ref>{{cite journal |last1=Li |first1=Wenjun |last2=O’Neill |first2=Kathleen R |last3=Haft |first3=Daniel H |last4=DiCuccio |first4=Michael |last5=Chetvernin |first5=Vyacheslav |last6=Badretdin |first6=Azat |last7=Coulouris |first7=George |last8=Chitsaz |first8=Farideh |last9=Derbyshire |first9=Myra K. |last10=Durkin |first10=A Scott |last11=Gonzales |first11=Noreen R |last12=Gwadz |first12=Marc |last13=Lanczycki |first13=Christopher J. |last14=Song |first14=James S |last15=Thanki |first15=Narmada |last16=Wang |first16=Jiyao |last17=Yamashita |first17=Roxanne A. |last18=Yang |first18=Mingzhang |last19=Zheng |first19=Chanjuan |last20=Marchler-Bauer |first20=Aron |last21=Thibaud-Nissen |first21=Françoise |title=RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation |journal=Nucleic Acids Research |date=8 January 2021 |volume=49 |issue=D1 |pages=D1020–D1028 |doi=10.1093/nar/gkaa1105|pmid=33270901 |pmc=7779008 }}</ref> हैं।
|title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल<ref>{{Citation |title=GAAS |date=2022-04-13 |url=https://github.com/NBISweden/GAAS/blob/07bd49a1623c0e13f77b1747b124d6d9385b67b7/annotation/knowledge/annotation_tools_genome.md |publisher=NBIS -- National Bioinformatics Infrastructure Sweden |access-date=2022-04-25}}</ref> का उपयोग करके एनोटेट किया जा सकता है।<ref name="pmid33879057">{{cite journal |vauthors=Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM |date=Apr 2021 |title=FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences |journal=BMC Bioinformatics |volume=44 |issue=9 |pages=e89 |doi=10.1186/s12859-021-04120-9 |pmc=8056616 |pmid=33879057 |doi-access=free}}</ref> आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।<ref>{{Cite journal |last1=Martin |first1=Roman |last2=Hackl |first2=Thomas |last3=Hattab |first3=Georges |last4=Fischer |first4=Matthias G |last5=Heider |first5=Dominik |date=2021-04-01 |editor-last=Birol |editor-first=Inanc |title=MOSGA: Modular Open-Source Genome Annotator |url=https://academic.oup.com/bioinformatics/article/36/22-23/5514/6015104 |journal=Bioinformatics |language=en |volume=36 |issue=22–23 |pages=5514–5515 |doi=10.1093/bioinformatics/btaa1003 |issn=1367-4803 |pmid=33258916|hdl=21.11116/0000-0006-FED4-D |hdl-access=free }}</ref><ref>{{Cite web |last=Martin |first=Copyright (C) 2021 Roman Martin. Designed and developed by Roman |title=राज्यमंत्री को|url=https://mosga.mathematik.uni-marburg.de |access-date=2022-04-25 |website=mosga.mathematik.uni-marburg.de |language=en}}</ref> प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,<ref>{{cite journal |last1=Schwengers |first1=Oliver |last2=Jelonek |first2=Lukas |last3=Dieckmann |first3=Marius Alfred |last4=Beyvers |first4=Sebastian |last5=Blom |first5=Jochen |last6=Goesmann |first6=Alexander |title=Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification |journal=Microbial Genomics |date=5 November 2021 |volume=7 |issue=11 |doi=10.1099/mgen.0.000685 |pmid=34739369|pmc=8743544 }}</ref> प्रोक्का<ref>{{cite journal |last1=Seemann |first1=Torsten |title=Prokka: rapid prokaryotic genome annotation |journal=Bioinformatics |date=15 July 2014 |volume=30 |issue=14 |pages=2068–2069 |doi=10.1093/bioinformatics/btu153|pmid=24642063 }}</ref> और पीजीएपी<ref>{{cite journal |last1=Li |first1=Wenjun |last2=O’Neill |first2=Kathleen R |last3=Haft |first3=Daniel H |last4=DiCuccio |first4=Michael |last5=Chetvernin |first5=Vyacheslav |last6=Badretdin |first6=Azat |last7=Coulouris |first7=George |last8=Chitsaz |first8=Farideh |last9=Derbyshire |first9=Myra K. |last10=Durkin |first10=A Scott |last11=Gonzales |first11=Noreen R |last12=Gwadz |first12=Marc |last13=Lanczycki |first13=Christopher J. |last14=Song |first14=James S |last15=Thanki |first15=Narmada |last16=Wang |first16=Jiyao |last17=Yamashita |first17=Roxanne A. |last18=Yang |first18=Mingzhang |last19=Zheng |first19=Chanjuan |last20=Marchler-Bauer |first20=Aron |last21=Thibaud-Nissen |first21=Françoise |title=RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation |journal=Nucleic Acids Research |date=8 January 2021 |volume=49 |issue=D1 |pages=D1020–D1028 |doi=10.1093/nar/gkaa1105|pmid=33270901 |pmc=7779008 }}</ref> हैं।


डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और [[प्रोटीन]] उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है।<ref>{{cite web|title=जाओ शिक्षण संसाधन|url=http://www.geneontology.org/GO.teaching.resources.shtml|access-date=21 September 2006|archive-url=https://web.archive.org/web/20061010053534/http://www.geneontology.org/GO.teaching.resources.shtml|archive-date=10 October 2006|url-status=dead}}</ref> मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए एक संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का एक खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।<ref>{{Cite journal |last=Sommer |first=Markus J. |last2=Cha |first2=Sooyoung |last3=Varabyou |first3=Ales |last4=Rincon |first4=Natalia |last5=Park |first5=Sukhwan |last6=Minkin |first6=Ilia |last7=Pertea |first7=Mihaela |last8=Steinegger |first8=Martin |last9=Salzberg |first9=Steven L. |date=2022-12-15 |title=मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान|url=https://elifesciences.org/articles/82556 |language=en |doi=10.7554/eLife.82556}}</ref>
डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और [[प्रोटीन]] उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है।<ref>{{cite web|title=जाओ शिक्षण संसाधन|url=http://www.geneontology.org/GO.teaching.resources.shtml|access-date=21 September 2006|archive-url=https://web.archive.org/web/20061010053534/http://www.geneontology.org/GO.teaching.resources.shtml|archive-date=10 October 2006|url-status=dead}}</ref> मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।<ref>{{Cite journal |last=Sommer |first=Markus J. |last2=Cha |first2=Sooyoung |last3=Varabyou |first3=Ales |last4=Rincon |first4=Natalia |last5=Park |first5=Sukhwan |last6=Minkin |first6=Ilia |last7=Pertea |first7=Mihaela |last8=Steinegger |first8=Martin |last9=Salzberg |first9=Steven L. |date=2022-12-15 |title=मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान|url=https://elifesciences.org/articles/82556 |language=en |doi=10.7554/eLife.82556}}</ref>


नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित करता है।
नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित करता है।


एक सामान्य विधि के रूप में, DCGO<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए एक स्वचालित प्रक्रिया है।
सामान्य विधि के रूप में, DCGO<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया है।


== प्रक्रिया ==
== प्रक्रिया ==
Line 27: Line 27:
# जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को [[जीन]] पूर्वानुमान कहा जाता है
# जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को [[जीन]] पूर्वानुमान कहा जाता है
# इन तत्वों के साथ जैविक जानकारी संलग्न करना है
# इन तत्वों के साथ जैविक जानकारी संलग्न करना है
स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और एक ही एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक हैं।
स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और ही एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक हैं।


जीन एनोटेशन की एक सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।<ref name='pevsner2009'>{{Cite book
जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।<ref name='pevsner2009'>{{Cite book
| edition = 2nd
| edition = 2nd
| publisher = Wiley-Blackwell
| publisher = Wiley-Blackwell
Line 40: Line 40:
| url-access = registration
| url-access = registration
| url = https://archive.org/details/bioinformaticsfu00pevs_0
| url = https://archive.org/details/bioinformaticsfu00pevs_0
}}</ref> हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की एक श्रृंखला पर निर्भर करते हैं।
}}</ref> हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की श्रृंखला पर निर्भर करते हैं।
* ओआरएफ (ORFs) और उनका स्थानीयकरण
* ओआरएफ (ORFs) और उनका स्थानीयकरण
* जीन संरचना
* जीन संरचना
Line 51: Line 51:
* इसमें विनियमन और अंतःक्रिया सम्मिलित है
* इसमें विनियमन और अंतःक्रिया सम्मिलित है
* अभिव्यंजना
* अभिव्यंजना


इन चरणों में जैविक परीक्षण और [[सिलिको में|सिलिको]] विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः [[मास स्पेक्ट्रोमेट्री]] से प्राप्त होता है।<ref name="Gupta07">{{Cite journal | doi = 10.1101/gr.6427907 | issn = 1088-9051 | volume = 17 | issue = 9 | pages = 1362–1377 | last = Gupta | first = Nitin |author2=Stephen Tanner |author3=Navdeep Jaitly |author4=Joshua N Adkins |author5=Mary Lipton |author6=Robert Edwards |author7=Margaret Romine |author8=Andrei Osterman |author9=Vineet Bafna |author10=Richard D Smith |author11=Pavel A Pevzner | title = Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation | journal = Genome Research | date = September 2007 | pmid=17690205 | pmc=1950905}}</ref>
इन चरणों में जैविक परीक्षण और [[सिलिको में|सिलिको]] विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः [[मास स्पेक्ट्रोमेट्री]] से प्राप्त होता है।<ref name="Gupta07">{{Cite journal | doi = 10.1101/gr.6427907 | issn = 1088-9051 | volume = 17 | issue = 9 | pages = 1362–1377 | last = Gupta | first = Nitin |author2=Stephen Tanner |author3=Navdeep Jaitly |author4=Joshua N Adkins |author5=Mary Lipton |author6=Robert Edwards |author7=Margaret Romine |author8=Andrei Osterman |author9=Vineet Bafna |author10=Richard D Smith |author11=Pavel A Pevzner | title = Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation | journal = Genome Research | date = September 2007 | pmid=17690205 | pmc=1950905}}</ref>
Line 59: Line 58:
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है।
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है।


मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन एक बड़ी चुनौती बनी हुई है, एक हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं।<ref name="encode2012plosGuide">{{Cite journal | editor = Becker PB | editor-link = Peter Becker (biologist) | author = ENCODE Project Consortium| title = डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)| doi = 10.1371/journal.pbio.1001046 | journal = [[PLOS Biology]] | volume = 9 | issue = 4 | pages = e1001046 | year = 2011 | pmid =  21526222| pmc = 3079585}} {{open access}}</ref><ref name="1001genomes2012">{{Cite journal | last1 = McVean | first1 = G. A. | last2 = Abecasis | first2 = D. M. | last3 = Auton | first3 = R. M. | last4 = Brooks | first4 = G. A. R. | last5 = Depristo | first5 = D. R. | last6 = Durbin | first6 = A. | last7 = Handsaker | first7 = A. G. | last8 = Kang | first8 = P. | last9 = Marth | first9 = E. E. | last10 = McVean | doi = 10.1038/nature11632 | first10 = P. | last11 = Gabriel | first11 = S. B. | last12 = Gibbs | first12 = R. A. | last13 = Green | first13 = E. D. | last14 = Hurles | first14 = M. E. | last15 = Knoppers | first15 = B. M. | last16 = Korbel | first16 = J. O. | last17 = Lander | first17 = E. S. | last18 = Lee | first18 = C. | last19 = Lehrach | first19 = H. | last20 = Mardis | first20 = E. R. | last21 = Marth | first21 = G. T. | last22 = McVean | first22 = G. A. | last23 = Nickerson | first23 = D. A. | last24 = Schmidt | first24 = J. P. | last25 = Sherry | first25 = S. T. | last26 = Wang | first26 = J. | last27 = Wilson | first27 = R. K. | last28 = Gibbs (Principal Investigator) | first28 = R. A. | last29 = Dinh | first29 = H. | last30 = Kovar | first30 = C. | display-authors = 29 | title = An integrated map of genetic variation from 1,092 human genomes | journal = Nature | volume = 491 | issue = 7422 | pages = 56–65 | year = 2012 | pmid =  23128226| pmc =3498066 | bibcode = 2012Natur.491...56T }}</ref> जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।<ref name="pevsner2009" /> वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से "एक साथ कैसे फिट होते हैं"।<ref name="encode2012">{{Cite journal | last1 = Dunham | first1 = I. | last2 = Bernstein | first2 = A. | last3 = Birney | first3 = S. F. | last4 = Dunham | first4 = P. J. | last5 = Green | first5 = C. A. | last6 = Gunter | first6 = F. | last7 = Snyder | first7 = C. B. | last8 = Frietze | first8 = S. | last9 = Harrow | first9 = J. | last10 = Kaul | doi = 10.1038/nature11247 | first10 = R. | last11 = Khatun | first11 = J. | last12 = Lajoie | first12 = B. R. | last13 = Landt | first13 = S. G. | last14 = Lee | first14 = B. K. | last15 = Pauli | first15 = F. | last16 = Rosenbloom | first16 = K. R. | last17 = Sabo | first17 = P. | last18 = Safi | first18 = A. | last19 = Sanyal | first19 = A. | last20 = Shoresh | first20 = N. | last21 = Simon | first21 = J. M. | last22 = Song | first22 = L. | last23 = Trinklein | first23 = N. D. | last24 = Altshuler | first24 = R. C. | last25 = Birney | first25 = E. | last26 = Brown | first26 = J. B. | last27 = Cheng | first27 = C. | last28 = Djebali | first28 = S. | last29 = Dong | first29 = X. | last30 = Dunham | first30 = I. | display-authors = 29 | title = मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश| journal = Nature | volume = 489 | issue = 7414 | pages = 57–74 | year = 2012 | pmid = 22955616| pmc =    3439153| bibcode = 2012Natur.489...57T }}</ref>
मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन बड़ी चुनौती बनी हुई है, हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं।<ref name="encode2012plosGuide">{{Cite journal | editor = Becker PB | editor-link = Peter Becker (biologist) | author = ENCODE Project Consortium| title = डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)| doi = 10.1371/journal.pbio.1001046 | journal = [[PLOS Biology]] | volume = 9 | issue = 4 | pages = e1001046 | year = 2011 | pmid =  21526222| pmc = 3079585}} {{open access}}</ref><ref name="1001genomes2012">{{Cite journal | last1 = McVean | first1 = G. A. | last2 = Abecasis | first2 = D. M. | last3 = Auton | first3 = R. M. | last4 = Brooks | first4 = G. A. R. | last5 = Depristo | first5 = D. R. | last6 = Durbin | first6 = A. | last7 = Handsaker | first7 = A. G. | last8 = Kang | first8 = P. | last9 = Marth | first9 = E. E. | last10 = McVean | doi = 10.1038/nature11632 | first10 = P. | last11 = Gabriel | first11 = S. B. | last12 = Gibbs | first12 = R. A. | last13 = Green | first13 = E. D. | last14 = Hurles | first14 = M. E. | last15 = Knoppers | first15 = B. M. | last16 = Korbel | first16 = J. O. | last17 = Lander | first17 = E. S. | last18 = Lee | first18 = C. | last19 = Lehrach | first19 = H. | last20 = Mardis | first20 = E. R. | last21 = Marth | first21 = G. T. | last22 = McVean | first22 = G. A. | last23 = Nickerson | first23 = D. A. | last24 = Schmidt | first24 = J. P. | last25 = Sherry | first25 = S. T. | last26 = Wang | first26 = J. | last27 = Wilson | first27 = R. K. | last28 = Gibbs (Principal Investigator) | first28 = R. A. | last29 = Dinh | first29 = H. | last30 = Kovar | first30 = C. | display-authors = 29 | title = An integrated map of genetic variation from 1,092 human genomes | journal = Nature | volume = 491 | issue = 7422 | pages = 56–65 | year = 2012 | pmid =  23128226| pmc =3498066 | bibcode = 2012Natur.491...56T }}</ref> जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।<ref name="pevsner2009" /> वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से " साथ कैसे फिट होते हैं"।<ref name="encode2012">{{Cite journal | last1 = Dunham | first1 = I. | last2 = Bernstein | first2 = A. | last3 = Birney | first3 = S. F. | last4 = Dunham | first4 = P. J. | last5 = Green | first5 = C. A. | last6 = Gunter | first6 = F. | last7 = Snyder | first7 = C. B. | last8 = Frietze | first8 = S. | last9 = Harrow | first9 = J. | last10 = Kaul | doi = 10.1038/nature11247 | first10 = R. | last11 = Khatun | first11 = J. | last12 = Lajoie | first12 = B. R. | last13 = Landt | first13 = S. G. | last14 = Lee | first14 = B. K. | last15 = Pauli | first15 = F. | last16 = Rosenbloom | first16 = K. R. | last17 = Sabo | first17 = P. | last18 = Safi | first18 = A. | last19 = Sanyal | first19 = A. | last20 = Shoresh | first20 = N. | last21 = Simon | first21 = J. M. | last22 = Song | first22 = L. | last23 = Trinklein | first23 = N. D. | last24 = Altshuler | first24 = R. C. | last25 = Birney | first25 = E. | last26 = Brown | first26 = J. B. | last27 = Cheng | first27 = C. | last28 = Djebali | first28 = S. | last29 = Dong | first29 = X. | last30 = Dunham | first30 = I. | display-authors = 29 | title = मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश| journal = Nature | volume = 489 | issue = 7414 | pages = 57–74 | year = 2012 | pmid = 22955616| pmc =    3439153| bibcode = 2012Natur.489...57T }}</ref>


जीनोम एनोटेशन जांच का एक सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
जीनोम एनोटेशन जांच का सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
* डीएनए तत्वों का विश्वकोश (एनकोड)
* डीएनए तत्वों का विश्वकोश (एनकोड)
* [[जीन दर्ज करें|एन्ट्रेज़ जीन]]
* [[जीन दर्ज करें|एन्ट्रेज़ जीन]]
Line 72: Line 71:
* कशेरुकी और जीनोम एनोटेशन प्रोजेक्ट (वेगा)
* कशेरुकी और जीनोम एनोटेशन प्रोजेक्ट (वेगा)


 
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो [[इंटरनेट बॉट]] संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।<ref name="Huss2008">{{Cite journal
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो एक [[इंटरनेट बॉट]] संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।<ref name="Huss2008">{{Cite journal
  | last1 = Huss | first1 = Jon W.
  | last1 = Huss | first1 = Jon W.
  | year = 2008
  | year = 2008
Line 99: Line 97:
  | pmc = 2443188
  | pmc = 2443188
}}</ref>
}}</ref>
==संदर्भ==
==संदर्भ==
{{Reflist}}
{{Reflist}}
{{Use dmy dates|date=April 2017}}
 
[[Category: डीएनए]]  
[[Category: डीएनए]]  



Revision as of 13:23, 27 June 2023

डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) है। बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।[1] यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल[2] का उपयोग करके एनोटेट किया जा सकता है।[3] आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।[4][5] प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,[6] प्रोक्का[7] और पीजीएपी[8] हैं।

डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है।[9] मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।[10]

नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन[11] के लिए उपकरण विकसित करता है।

सामान्य विधि के रूप में, DCGO[12] के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया है।

प्रक्रिया

जीनोम एनोटेशन में तीन मुख्य चरण होते हैं:।[13]

  1. जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
  2. जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
  3. इन तत्वों के साथ जैविक जानकारी संलग्न करना है

स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और ही एनोटेशन पाइपलाइन में एक-दूसरे के पूरक हैं।

जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।[14] हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की श्रृंखला पर निर्भर करते हैं।

  • ओआरएफ (ORFs) और उनका स्थानीयकरण
  • जीन संरचना
  • कोडिंग क्षेत्र
  • विनियामक रूपांकनों का स्थान

क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित है।

  • जैव रासायनिक क्रिया
  • जैविक क्रिया
  • इसमें विनियमन और अंतःक्रिया सम्मिलित है
  • अभिव्यंजना

इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।[15]

जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER

वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।

मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन बड़ी चुनौती बनी हुई है, हजार से अधिक मानव व्यक्तियों (द 100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं।[16][17] जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।[14] वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से " साथ कैसे फिट होते हैं"।[18]

जीनोम एनोटेशन जांच का सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:

विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो इंटरनेट बॉट संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।[19]

संदर्भ

  1. "Definition of genome annotation".
  2. GAAS, NBIS -- National Bioinformatics Infrastructure Sweden, 2022-04-13, retrieved 2022-04-25
  3. Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM (Apr 2021). "FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences". BMC Bioinformatics. 44 (9): e89. doi:10.1186/s12859-021-04120-9. PMC 8056616. PMID 33879057.
  4. Martin, Roman; Hackl, Thomas; Hattab, Georges; Fischer, Matthias G; Heider, Dominik (2021-04-01). Birol, Inanc (ed.). "MOSGA: Modular Open-Source Genome Annotator". Bioinformatics (in English). 36 (22–23): 5514–5515. doi:10.1093/bioinformatics/btaa1003. hdl:21.11116/0000-0006-FED4-D. ISSN 1367-4803. PMID 33258916.
  5. Martin, Copyright (C) 2021 Roman Martin. Designed and developed by Roman. "राज्यमंत्री को". mosga.mathematik.uni-marburg.de (in English). Retrieved 2022-04-25.
  6. Schwengers, Oliver; Jelonek, Lukas; Dieckmann, Marius Alfred; Beyvers, Sebastian; Blom, Jochen; Goesmann, Alexander (5 November 2021). "Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification". Microbial Genomics. 7 (11). doi:10.1099/mgen.0.000685. PMC 8743544. PMID 34739369.
  7. Seemann, Torsten (15 July 2014). "Prokka: rapid prokaryotic genome annotation". Bioinformatics. 30 (14): 2068–2069. doi:10.1093/bioinformatics/btu153. PMID 24642063.
  8. Li, Wenjun; O’Neill, Kathleen R; Haft, Daniel H; DiCuccio, Michael; Chetvernin, Vyacheslav; Badretdin, Azat; Coulouris, George; Chitsaz, Farideh; Derbyshire, Myra K.; Durkin, A Scott; Gonzales, Noreen R; Gwadz, Marc; Lanczycki, Christopher J.; Song, James S; Thanki, Narmada; Wang, Jiyao; Yamashita, Roxanne A.; Yang, Mingzhang; Zheng, Chanjuan; Marchler-Bauer, Aron; Thibaud-Nissen, Françoise (8 January 2021). "RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation". Nucleic Acids Research. 49 (D1): D1020–D1028. doi:10.1093/nar/gkaa1105. PMC 7779008. PMID 33270901.
  9. "जाओ शिक्षण संसाधन". Archived from the original on 10 October 2006. Retrieved 21 September 2006.
  10. Sommer, Markus J.; Cha, Sooyoung; Varabyou, Ales; Rincon, Natalia; Park, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martin; Salzberg, Steven L. (2022-12-15). "मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान" (in English). doi:10.7554/eLife.82556. {{cite journal}}: Cite journal requires |journal= (help)
  11. "NCBO Annotator | bioontology.org". ncbo.bioontology.org. Retrieved 2023-02-08.
  12. Fang, H; Gough, J (2013). "DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more". Nucleic Acids Research. 41 (Database issue): D536–44. doi:10.1093/nar/gks1080. PMC 3531119. PMID 23161684.
  13. Stein, L. (2001). "Genome annotation: from sequence to biology". Nature Reviews Genetics. 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. S2CID 12044602.
  14. 14.0 14.1 Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851.
  15. Gupta, Nitin; Stephen Tanner; Navdeep Jaitly; Joshua N Adkins; Mary Lipton; Robert Edwards; Margaret Romine; Andrei Osterman; Vineet Bafna; Richard D Smith; Pavel A Pevzner (September 2007). "Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation". Genome Research. 17 (9): 1362–1377. doi:10.1101/gr.6427907. ISSN 1088-9051. PMC 1950905. PMID 17690205.
  16. ENCODE Project Consortium (2011). Becker PB (ed.). "डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)". PLOS Biology. 9 (4): e1001046. doi:10.1371/journal.pbio.1001046. PMC 3079585. PMID 21526222. open access
  17. McVean, G. A.; Abecasis, D. M.; Auton, R. M.; Brooks, G. A. R.; Depristo, D. R.; Durbin, A.; Handsaker, A. G.; Kang, P.; Marth, E. E.; McVean, P.; Gabriel, S. B.; Gibbs, R. A.; Green, E. D.; Hurles, M. E.; Knoppers, B. M.; Korbel, J. O.; Lander, E. S.; Lee, C.; Lehrach, H.; Mardis, E. R.; Marth, G. T.; McVean, G. A.; Nickerson, D. A.; Schmidt, J. P.; Sherry, S. T.; Wang, J.; Wilson, R. K.; Gibbs (Principal Investigator), R. A.; Dinh, H.; et al. (2012). "An integrated map of genetic variation from 1,092 human genomes". Nature. 491 (7422): 56–65. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.
  18. Dunham, I.; Bernstein, A.; Birney, S. F.; Dunham, P. J.; Green, C. A.; Gunter, F.; Snyder, C. B.; Frietze, S.; Harrow, J.; Kaul, R.; Khatun, J.; Lajoie, B. R.; Landt, S. G.; Lee, B. K.; Pauli, F.; Rosenbloom, K. R.; Sabo, P.; Safi, A.; Sanyal, A.; Shoresh, N.; Simon, J. M.; Song, L.; Trinklein, N. D.; Altshuler, R. C.; Birney, E.; Brown, J. B.; Cheng, C.; Djebali, S.; Dong, X.; et al. (2012). "मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
  19. Huss, Jon W.; Orozco, C; Goodale, J; Wu, C; Batalov, S; Vickers, TJ; Valafar, F; Su, AI (2008). "A Gene Wiki for Community Annotation of Gene Function". PLOS Biology. 6 (7): e175. doi:10.1371/journal.pbio.0060175. PMC 2443188. PMID 18613750.