डीएनए एनोटेशन: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(5 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{Short description|Process where DNA is sequenced}}
{{Short description|Process where DNA is sequenced}}
'''डीएनए (DNA) एनोटेशन''' या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया है कि वे जीन क्या करते हैं। एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) है। बार जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।<ref>{{cite web
'''डीएनए (DNA) एनोटेशन''' या '''जीनोम एनोटेशन''' जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया होती है कि वे जीन क्या करते हैं।इस प्रकार से एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) माना जाता है। अतः जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।<ref>{{cite web
|url=http://www.medterms.com/script/main/art.asp?articlekey=16833
|url=http://www.medterms.com/script/main/art.asp?articlekey=16833
|title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन टूल<ref>{{Citation |title=GAAS |date=2022-04-13 |url=https://github.com/NBISweden/GAAS/blob/07bd49a1623c0e13f77b1747b124d6d9385b67b7/annotation/knowledge/annotation_tools_genome.md |publisher=NBIS -- National Bioinformatics Infrastructure Sweden |access-date=2022-04-25}}</ref> का उपयोग करके एनोटेट किया जा सकता है।<ref name="pmid33879057">{{cite journal |vauthors=Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM |date=Apr 2021 |title=FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences |journal=BMC Bioinformatics |volume=44 |issue=9 |pages=e89 |doi=10.1186/s12859-021-04120-9 |pmc=8056616 |pmid=33879057 |doi-access=free}}</ref> आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (MOSGA) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।<ref>{{Cite journal |last1=Martin |first1=Roman |last2=Hackl |first2=Thomas |last3=Hattab |first3=Georges |last4=Fischer |first4=Matthias G |last5=Heider |first5=Dominik |date=2021-04-01 |editor-last=Birol |editor-first=Inanc |title=MOSGA: Modular Open-Source Genome Annotator |url=https://academic.oup.com/bioinformatics/article/36/22-23/5514/6015104 |journal=Bioinformatics |language=en |volume=36 |issue=22–23 |pages=5514–5515 |doi=10.1093/bioinformatics/btaa1003 |issn=1367-4803 |pmid=33258916|hdl=21.11116/0000-0006-FED4-D |hdl-access=free }}</ref><ref>{{Cite web |last=Martin |first=Copyright (C) 2021 Roman Martin. Designed and developed by Roman |title=राज्यमंत्री को|url=https://mosga.mathematik.uni-marburg.de |access-date=2022-04-25 |website=mosga.mathematik.uni-marburg.de |language=en}}</ref> प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,<ref>{{cite journal |last1=Schwengers |first1=Oliver |last2=Jelonek |first2=Lukas |last3=Dieckmann |first3=Marius Alfred |last4=Beyvers |first4=Sebastian |last5=Blom |first5=Jochen |last6=Goesmann |first6=Alexander |title=Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification |journal=Microbial Genomics |date=5 November 2021 |volume=7 |issue=11 |doi=10.1099/mgen.0.000685 |pmid=34739369|pmc=8743544 }}</ref> प्रोक्का<ref>{{cite journal |last1=Seemann |first1=Torsten |title=Prokka: rapid prokaryotic genome annotation |journal=Bioinformatics |date=15 July 2014 |volume=30 |issue=14 |pages=2068–2069 |doi=10.1093/bioinformatics/btu153|pmid=24642063 }}</ref> और पीजीएपी<ref>{{cite journal |last1=Li |first1=Wenjun |last2=O’Neill |first2=Kathleen R |last3=Haft |first3=Daniel H |last4=DiCuccio |first4=Michael |last5=Chetvernin |first5=Vyacheslav |last6=Badretdin |first6=Azat |last7=Coulouris |first7=George |last8=Chitsaz |first8=Farideh |last9=Derbyshire |first9=Myra K. |last10=Durkin |first10=A Scott |last11=Gonzales |first11=Noreen R |last12=Gwadz |first12=Marc |last13=Lanczycki |first13=Christopher J. |last14=Song |first14=James S |last15=Thanki |first15=Narmada |last16=Wang |first16=Jiyao |last17=Yamashita |first17=Roxanne A. |last18=Yang |first18=Mingzhang |last19=Zheng |first19=Chanjuan |last20=Marchler-Bauer |first20=Aron |last21=Thibaud-Nissen |first21=Françoise |title=RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation |journal=Nucleic Acids Research |date=8 January 2021 |volume=49 |issue=D1 |pages=D1020–D1028 |doi=10.1093/nar/gkaa1105|pmid=33270901 |pmc=7779008 }}</ref> हैं।
|title=Definition of genome annotation}}</ref> यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन उपकरण<ref>{{Citation |title=GAAS |date=2022-04-13 |url=https://github.com/NBISweden/GAAS/blob/07bd49a1623c0e13f77b1747b124d6d9385b67b7/annotation/knowledge/annotation_tools_genome.md |publisher=NBIS -- National Bioinformatics Infrastructure Sweden |access-date=2022-04-25}}</ref> का उपयोग करके एनोटेट किया जा सकता है।<ref name="pmid33879057">{{cite journal |vauthors=Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM |date=Apr 2021 |title=FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences |journal=BMC Bioinformatics |volume=44 |issue=9 |pages=e89 |doi=10.1186/s12859-021-04120-9 |pmc=8056616 |pmid=33879057 |doi-access=free}}</ref> आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (एमओएसजीए) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।<ref>{{Cite journal |last1=Martin |first1=Roman |last2=Hackl |first2=Thomas |last3=Hattab |first3=Georges |last4=Fischer |first4=Matthias G |last5=Heider |first5=Dominik |date=2021-04-01 |editor-last=Birol |editor-first=Inanc |title=MOSGA: Modular Open-Source Genome Annotator |url=https://academic.oup.com/bioinformatics/article/36/22-23/5514/6015104 |journal=Bioinformatics |language=en |volume=36 |issue=22–23 |pages=5514–5515 |doi=10.1093/bioinformatics/btaa1003 |issn=1367-4803 |pmid=33258916|hdl=21.11116/0000-0006-FED4-D |hdl-access=free }}</ref><ref>{{Cite web |last=Martin |first=Copyright (C) 2021 Roman Martin. Designed and developed by Roman |title=राज्यमंत्री को|url=https://mosga.mathematik.uni-marburg.de |access-date=2022-04-25 |website=mosga.mathematik.uni-marburg.de |language=en}}</ref> इस प्रकार से प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,<ref>{{cite journal |last1=Schwengers |first1=Oliver |last2=Jelonek |first2=Lukas |last3=Dieckmann |first3=Marius Alfred |last4=Beyvers |first4=Sebastian |last5=Blom |first5=Jochen |last6=Goesmann |first6=Alexander |title=Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification |journal=Microbial Genomics |date=5 November 2021 |volume=7 |issue=11 |doi=10.1099/mgen.0.000685 |pmid=34739369|pmc=8743544 }}</ref> प्रोक्का<ref>{{cite journal |last1=Seemann |first1=Torsten |title=Prokka: rapid prokaryotic genome annotation |journal=Bioinformatics |date=15 July 2014 |volume=30 |issue=14 |pages=2068–2069 |doi=10.1093/bioinformatics/btu153|pmid=24642063 }}</ref> और पीजीएपी<ref>{{cite journal |last1=Li |first1=Wenjun |last2=O’Neill |first2=Kathleen R |last3=Haft |first3=Daniel H |last4=DiCuccio |first4=Michael |last5=Chetvernin |first5=Vyacheslav |last6=Badretdin |first6=Azat |last7=Coulouris |first7=George |last8=Chitsaz |first8=Farideh |last9=Derbyshire |first9=Myra K. |last10=Durkin |first10=A Scott |last11=Gonzales |first11=Noreen R |last12=Gwadz |first12=Marc |last13=Lanczycki |first13=Christopher J. |last14=Song |first14=James S |last15=Thanki |first15=Narmada |last16=Wang |first16=Jiyao |last17=Yamashita |first17=Roxanne A. |last18=Yang |first18=Mingzhang |last19=Zheng |first19=Chanjuan |last20=Marchler-Bauer |first20=Aron |last21=Thibaud-Nissen |first21=Françoise |title=RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation |journal=Nucleic Acids Research |date=8 January 2021 |volume=49 |issue=D1 |pages=D1020–D1028 |doi=10.1093/nar/gkaa1105|pmid=33270901 |pmc=7779008 }}</ref> हैं।


डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के पहले से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और [[प्रोटीन]] उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी तरह के आयोजनों से जैविक एनोटेशन के कुछ पहलुओं पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध है।<ref>{{cite web|title=जाओ शिक्षण संसाधन|url=http://www.geneontology.org/GO.teaching.resources.shtml|access-date=21 September 2006|archive-url=https://web.archive.org/web/20061010053534/http://www.geneontology.org/GO.teaching.resources.shtml|archive-date=10 October 2006|url-status=dead}}</ref> मानव जीनोम एनोटेशन के दायरे में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी का  खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जो मानव जीनोम को समझने और व्याख्या करने में सहायता करता है।<ref>{{Cite journal |last=Sommer |first=Markus J. |last2=Cha |first2=Sooyoung |last3=Varabyou |first3=Ales |last4=Rincon |first4=Natalia |last5=Park |first5=Sukhwan |last6=Minkin |first6=Ilia |last7=Pertea |first7=Mihaela |last8=Steinegger |first8=Martin |last9=Salzberg |first9=Steven L. |date=2022-12-15 |title=मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान|url=https://elifesciences.org/articles/82556 |language=en |doi=10.7554/eLife.82556}}</ref>
डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और [[प्रोटीन]] उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी प्रकार के आयोजनों से जैविक एनोटेशन के कुछ भागो पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध होती है।<ref>{{cite web|title=जाओ शिक्षण संसाधन|url=http://www.geneontology.org/GO.teaching.resources.shtml|access-date=21 September 2006|archive-url=https://web.archive.org/web/20061010053534/http://www.geneontology.org/GO.teaching.resources.shtml|archive-date=10 October 2006|url-status=dead}}</ref> और मानव जीनोम एनोटेशन के सीमा में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी को खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जोकी मानव जीनोम को समझने और व्याख्या करने में सहायता प्रदान करता है।<ref>{{Cite journal |last=Sommer |first=Markus J. |last2=Cha |first2=Sooyoung |last3=Varabyou |first3=Ales |last4=Rincon |first4=Natalia |last5=Park |first5=Sukhwan |last6=Minkin |first6=Ilia |last7=Pertea |first7=Mihaela |last8=Steinegger |first8=Martin |last9=Salzberg |first9=Steven L. |date=2022-12-15 |title=मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान|url=https://elifesciences.org/articles/82556 |language=en |doi=10.7554/eLife.82556}}</ref>


नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित करता है।
इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन<ref>{{Cite web |title=NCBO Annotator {{!}} bioontology.org |url=https://ncbo.bioontology.org/annotator-service |access-date=2023-02-08 |website=ncbo.bioontology.org}}</ref> के लिए उपकरण विकसित किया जाता है।


सामान्य विधि के रूप में, DCGO<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया है।
सामान्य विधि के रूप में, डीसीजीओ<ref name="pmid23161684">{{cite journal|pmid=23161684|pmc=3531119|year=2013|last1=Fang|first1=H|title=DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more|journal=Nucleic Acids Research|volume=41|issue=Database issue|pages=D536–44|last2=Gough|first2=J|doi=10.1093/nar/gks1080}}</ref> के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया मानी जाती है।


== प्रक्रिया ==
== प्रक्रिया ==
जीनोम एनोटेशन में तीन मुख्य चरण होते हैं:।<ref name=Stein2001>{{cite journal
अतः जीनोम एनोटेशन में तीन प्रमुख्य चरण होते हैं:।<ref name=Stein2001>{{cite journal
  | last = Stein
  | last = Stein
  | first = L.
  | first = L.
Line 27: Line 27:
# जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को [[जीन]] पूर्वानुमान कहा जाता है
# जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को [[जीन]] पूर्वानुमान कहा जाता है
# इन तत्वों के साथ जैविक जानकारी संलग्न करना है
# इन तत्वों के साथ जैविक जानकारी संलग्न करना है
स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में हैं और ही एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक हैं।
किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन [[पाइपलाइन (कंप्यूटिंग)|पाइपलाइन]] में एक-दूसरे के पूरक होते हैं।


जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए BLAST जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।<ref name='pevsner2009'>{{Cite book
जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए बीएलएएसटी जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।<ref name='pevsner2009'>{{Cite book
| edition = 2nd
| edition = 2nd
| publisher = Wiley-Blackwell
| publisher = Wiley-Blackwell
Line 40: Line 40:
| url-access = registration
| url-access = registration
| url = https://archive.org/details/bioinformaticsfu00pevs_0
| url = https://archive.org/details/bioinformaticsfu00pevs_0
}}</ref> हालाँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर टूल की  श्रृंखला पर निर्भर करते हैं।
}}</ref> चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर उपकरणकी श्रृंखला पर निर्भर करते हैं।
* ओआरएफ (ORFs) और उनका स्थानीयकरण
* ORFs और उनका स्थानीयकरण
* जीन संरचना
* जीन संरचना
* कोडिंग क्षेत्र
* कोडिंग क्षेत्र
* विनियामक रूपांकनों का स्थान
* विनियामक रूपांकनों का स्थान


''क्रियाात्मक एनोटेशन'' में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित है।
''इस प्रकार से क्रियाात्मक एनोटेशन'' में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित किया गया है।
* जैव रासायनिक क्रिया
* जैव रासायनिक क्रिया
* जैविक क्रिया
* जैविक क्रिया
Line 58: Line 58:
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है।
वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर ([http://www.yandell-lab.org/software/maker.html MAKER]) है।


मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन बड़ी चुनौती बनी हुई है, हजार से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर तक पूरे हो चुके हैं।<ref name="encode2012plosGuide">{{Cite journal | editor = Becker PB | editor-link = Peter Becker (biologist) | author = ENCODE Project Consortium| title = डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)| doi = 10.1371/journal.pbio.1001046 | journal = [[PLOS Biology]] | volume = 9 | issue = 4 | pages = e1001046 | year = 2011 | pmid =  21526222| pmc = 3079585}} {{open access}}</ref><ref name="1001genomes2012">{{Cite journal | last1 = McVean | first1 = G. A. | last2 = Abecasis | first2 = D. M. | last3 = Auton | first3 = R. M. | last4 = Brooks | first4 = G. A. R. | last5 = Depristo | first5 = D. R. | last6 = Durbin | first6 = A. | last7 = Handsaker | first7 = A. G. | last8 = Kang | first8 = P. | last9 = Marth | first9 = E. E. | last10 = McVean | doi = 10.1038/nature11632 | first10 = P. | last11 = Gabriel | first11 = S. B. | last12 = Gibbs | first12 = R. A. | last13 = Green | first13 = E. D. | last14 = Hurles | first14 = M. E. | last15 = Knoppers | first15 = B. M. | last16 = Korbel | first16 = J. O. | last17 = Lander | first17 = E. S. | last18 = Lee | first18 = C. | last19 = Lehrach | first19 = H. | last20 = Mardis | first20 = E. R. | last21 = Marth | first21 = G. T. | last22 = McVean | first22 = G. A. | last23 = Nickerson | first23 = D. A. | last24 = Schmidt | first24 = J. P. | last25 = Sherry | first25 = S. T. | last26 = Wang | first26 = J. | last27 = Wilson | first27 = R. K. | last28 = Gibbs (Principal Investigator) | first28 = R. A. | last29 = Dinh | first29 = H. | last30 = Kovar | first30 = C. | display-authors = 29 | title = An integrated map of genetic variation from 1,092 human genomes | journal = Nature | volume = 491 | issue = 7422 | pages = 56–65 | year = 2012 | pmid =  23128226| pmc =3498066 | bibcode = 2012Natur.491...56T }}</ref> जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।<ref name="pevsner2009" /> वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी हिस्से " साथ कैसे फिट होते हैं"।<ref name="encode2012">{{Cite journal | last1 = Dunham | first1 = I. | last2 = Bernstein | first2 = A. | last3 = Birney | first3 = S. F. | last4 = Dunham | first4 = P. J. | last5 = Green | first5 = C. A. | last6 = Gunter | first6 = F. | last7 = Snyder | first7 = C. B. | last8 = Frietze | first8 = S. | last9 = Harrow | first9 = J. | last10 = Kaul | doi = 10.1038/nature11247 | first10 = R. | last11 = Khatun | first11 = J. | last12 = Lajoie | first12 = B. R. | last13 = Landt | first13 = S. G. | last14 = Lee | first14 = B. K. | last15 = Pauli | first15 = F. | last16 = Rosenbloom | first16 = K. R. | last17 = Sabo | first17 = P. | last18 = Safi | first18 = A. | last19 = Sanyal | first19 = A. | last20 = Shoresh | first20 = N. | last21 = Simon | first21 = J. M. | last22 = Song | first22 = L. | last23 = Trinklein | first23 = N. D. | last24 = Altshuler | first24 = R. C. | last25 = Birney | first25 = E. | last26 = Brown | first26 = J. B. | last27 = Cheng | first27 = C. | last28 = Djebali | first28 = S. | last29 = Dong | first29 = X. | last30 = Dunham | first30 = I. | display-authors = 29 | title = मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश| journal = Nature | volume = 489 | issue = 7414 | pages = 57–74 | year = 2012 | pmid = 22955616| pmc =    3439153| bibcode = 2012Natur.489...57T }}</ref>
मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन उच्च चुनौती बनी हुई है, अधिक से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर पर पूरे हो चुके हैं।<ref name="encode2012plosGuide">{{Cite journal | editor = Becker PB | editor-link = Peter Becker (biologist) | author = ENCODE Project Consortium| title = डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)| doi = 10.1371/journal.pbio.1001046 | journal = [[PLOS Biology]] | volume = 9 | issue = 4 | pages = e1001046 | year = 2011 | pmid =  21526222| pmc = 3079585}} {{open access}}</ref><ref name="1001genomes2012">{{Cite journal | last1 = McVean | first1 = G. A. | last2 = Abecasis | first2 = D. M. | last3 = Auton | first3 = R. M. | last4 = Brooks | first4 = G. A. R. | last5 = Depristo | first5 = D. R. | last6 = Durbin | first6 = A. | last7 = Handsaker | first7 = A. G. | last8 = Kang | first8 = P. | last9 = Marth | first9 = E. E. | last10 = McVean | doi = 10.1038/nature11632 | first10 = P. | last11 = Gabriel | first11 = S. B. | last12 = Gibbs | first12 = R. A. | last13 = Green | first13 = E. D. | last14 = Hurles | first14 = M. E. | last15 = Knoppers | first15 = B. M. | last16 = Korbel | first16 = J. O. | last17 = Lander | first17 = E. S. | last18 = Lee | first18 = C. | last19 = Lehrach | first19 = H. | last20 = Mardis | first20 = E. R. | last21 = Marth | first21 = G. T. | last22 = McVean | first22 = G. A. | last23 = Nickerson | first23 = D. A. | last24 = Schmidt | first24 = J. P. | last25 = Sherry | first25 = S. T. | last26 = Wang | first26 = J. | last27 = Wilson | first27 = R. K. | last28 = Gibbs (Principal Investigator) | first28 = R. A. | last29 = Dinh | first29 = H. | last30 = Kovar | first30 = C. | display-authors = 29 | title = An integrated map of genetic variation from 1,092 human genomes | journal = Nature | volume = 491 | issue = 7422 | pages = 56–65 | year = 2012 | pmid =  23128226| pmc =3498066 | bibcode = 2012Natur.491...56T }}</ref> जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।<ref name="pevsner2009" /> इस प्रकार से वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी भाग " साथ कैसे फिट होते हैं"।<ref name="encode2012">{{Cite journal | last1 = Dunham | first1 = I. | last2 = Bernstein | first2 = A. | last3 = Birney | first3 = S. F. | last4 = Dunham | first4 = P. J. | last5 = Green | first5 = C. A. | last6 = Gunter | first6 = F. | last7 = Snyder | first7 = C. B. | last8 = Frietze | first8 = S. | last9 = Harrow | first9 = J. | last10 = Kaul | doi = 10.1038/nature11247 | first10 = R. | last11 = Khatun | first11 = J. | last12 = Lajoie | first12 = B. R. | last13 = Landt | first13 = S. G. | last14 = Lee | first14 = B. K. | last15 = Pauli | first15 = F. | last16 = Rosenbloom | first16 = K. R. | last17 = Sabo | first17 = P. | last18 = Safi | first18 = A. | last19 = Sanyal | first19 = A. | last20 = Shoresh | first20 = N. | last21 = Simon | first21 = J. M. | last22 = Song | first22 = L. | last23 = Trinklein | first23 = N. D. | last24 = Altshuler | first24 = R. C. | last25 = Birney | first25 = E. | last26 = Brown | first26 = J. B. | last27 = Cheng | first27 = C. | last28 = Djebali | first28 = S. | last29 = Dong | first29 = X. | last30 = Dunham | first30 = I. | display-authors = 29 | title = मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश| journal = Nature | volume = 489 | issue = 7414 | pages = 57–74 | year = 2012 | pmid = 22955616| pmc =    3439153| bibcode = 2012Natur.489...57T }}</ref>


जीनोम एनोटेशन जांच का सक्रिय क्षेत्र है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
जीनोम एनोटेशन जांच का सक्रिय क्षेत्र होते है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित होते हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:
* डीएनए तत्वों का विश्वकोश (एनकोड)
* डीएनए तत्वों का विश्वकोश (एनकोड)
* [[जीन दर्ज करें|एन्ट्रेज़ जीन]]
* [[जीन दर्ज करें|एन्ट्रेज़ जीन]]
Line 69: Line 69:
* [[संदर्भ|रेफरसेक]]
* [[संदर्भ|रेफरसेक]]
* [[यूनिप्रोट]]
* [[यूनिप्रोट]]
* कशेरुकी और जीनोम एनोटेशन प्रोजेक्ट (वेगा)
* कशेरुक और जीनोम एनोटेशन परियोजना (वेगा)


विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो [[इंटरनेट बॉट]] संचालित करता है जो अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब बनाता है।<ref name="Huss2008">{{Cite journal
विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो [[इंटरनेट बॉट]] संचालित करता है जोकी अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब्स बनाता है।<ref name="Huss2008">{{Cite journal
  | last1 = Huss | first1 = Jon W.
  | last1 = Huss | first1 = Jon W.
  | year = 2008
  | year = 2008
Line 100: Line 100:
{{Reflist}}
{{Reflist}}


[[Category: डीएनए]]  
[[Category:CS1 English-language sources (en)]]
 
[[Category:CS1 errors]]
 
 
[[Category: Machine Translated Page]]
[[Category:Created On 15/06/2023]]
[[Category:Created On 15/06/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:डीएनए]]

Latest revision as of 12:05, 6 July 2023

डीएनए (DNA) एनोटेशन या जीनोम एनोटेशन जीनोम में जीन के स्थान और सभी कोडिंग क्षेत्रों की पहचान करने और यह निर्धारित करने की प्रक्रिया होती है कि वे जीन क्या करते हैं।इस प्रकार से एनोटेशन स्पष्टीकरण या टिप्पणी के माध्यम से जोड़ा गया शब्द (नोट) माना जाता है। अतः जब जीनोम अनुक्रमित हो जाता है, तो उसे समझने के लिए उसे एनोटेट करने की आवश्यकता होती है।[1] यूकेरियोटिक जीनोम में जीन को फाइंडर जैसे विभिन्न एनोटेशन उपकरण[2] का उपयोग करके एनोटेट किया जा सकता है।[3] आधुनिक एनोटेशन पाइपलाइन उपयोगकर्ता के अनुकूल वेब इंटरफेस और एमओएसजीए (एमओएसजीए) जैसे सॉफ्टवेयर कंटेनरीकरण का समर्थन कर सकती है।[4][5] इस प्रकार से प्रोकैरियोटिक जीनोम के लिए आधुनिक एनोटेशन पाइपलाइन बक्टा,[6] प्रोक्का[7] और पीजीएपी[8] हैं।

डीएनए एनोटेशन के लिए, आनुवंशिक सामग्री के प्रथम समय से अज्ञात अनुक्रम प्रतिनिधित्व को जीनोमिक स्थिति से लेकर इंट्रॉन-एक्सॉन सीमाओं, नियामक अनुक्रमों, दोहराव, जीन नामों और प्रोटीन उत्पादों से संबंधित जानकारी से समृद्ध किया जाता है। यह एनोटेशन माउस जीनोम इंफॉर्मेटिक्स, फ्लाईबेस और वॉर्मबेस जैसे जीनोमिक डेटाबेस में संग्रहीत है। 2006 के जीन ओन्टोलॉजी एनोटेशन शिविर और इसी प्रकार के आयोजनों से जैविक एनोटेशन के कुछ भागो पर शैक्षिक सामग्री जीन ओन्टोलॉजी वेबसाइट पर उपलब्ध होती है।[9] और मानव जीनोम एनोटेशन के सीमा में, isoform.io प्रोटीन-कोडिंग जीन के लिए संसाधन के रूप में क्रिया करता है, जो अद्वितीय प्रोटीन संरचनाओं और संबंधित जानकारी को खोजने योग्य और डाउनलोड करने योग्य डेटाबेस प्रदान करता है, जोकी मानव जीनोम को समझने और व्याख्या करने में सहायता प्रदान करता है।[10]

इस प्रकार से नेशनल सेंटर फॉर बायोमेडिकल ओन्टोलॉजी (www.bioontology.org) उन रिकॉर्ड्स के पाठ्य विवरण के आधार पर डेटाबेस रिकॉर्ड के स्वचालित एनोटेशन[11] के लिए उपकरण विकसित किया जाता है।

सामान्य विधि के रूप में, डीसीजीओ[12] के पास ऑन्टोलॉजी शब्दों और प्रोटीन डोमेन या उपस्थिता जीन/प्रोटीन-स्तरीय एनोटेशन से डोमेन के संयोजन के बीच सांख्यिकीय रूप से अनुमान लगाने के लिए स्वचालित प्रक्रिया मानी जाती है।

प्रक्रिया

अतः जीनोम एनोटेशन में तीन प्रमुख्य चरण होते हैं:।[13]

  1. जीनोम के उन खंडों की पहचान करना जो प्रोटीन के लिए कोड नहीं करते हैं
  2. जीनोम पर तत्वों की पहचान करना, इस प्रक्रिया को जीन पूर्वानुमान कहा जाता है
  3. इन तत्वों के साथ जैविक जानकारी संलग्न करना है

किन्तु स्वचालित एनोटेशन उपकरण कंप्यूटर विश्लेषण के माध्यम से इन चरणों को निष्पादित करने का प्रयास करते हैं, मैन्युअल एनोटेशन (a.k.a. क्यूरेशन) के विपरीत जिसमें मानव विशेषज्ञता सम्मिलित होती है। और आदर्श रूप से, ये दृष्टिकोण सह-अस्तित्व में होते हैं और एनोटेशन पाइपलाइन में एक-दूसरे के पूरक होते हैं।

जीन एनोटेशन की सरल विधि विशिष्ट डेटाबेस में समजात जीन की खोज के लिए बीएलएएसटी जैसे समरूपता-आधारित खोज उपकरणों पर निर्भर करती है, जिसके परिणामस्वरूप प्राप्त जानकारी का उपयोग जीन और जीनोम को एनोटेट करने के लिए किया जाता है।[14] चूँकि, जैसे-जैसे जानकारी एनोटेशन प्लेटफ़ॉर्म में जोड़ी जाती है, मैन्युअल एनोटेटर उन जीनों के बीच विसंगतियों को कम करने में सक्षम हो गए हैं जिन्हें समान एनोटेशन दिया गया है। कुछ डेटाबेस अपने सबसिस्टम दृष्टिकोण के माध्यम से जीनोम एनोटेशन प्रदान करने के लिए जीनोम संदर्भ जानकारी, समानता स्कोर, प्रयोगात्मक डेटा और अन्य संसाधनों के एकीकरण का उपयोग करते हैं। अन्य डेटाबेस (उदाहरण के लिए एन्सेम्बल) क्यूरेटेड डेटा स्रोतों के साथ-साथ अपने स्वचालित जीनोम एनोटेशन पाइपलाइन में विभिन्न सॉफ़्टवेयर उपकरणकी श्रृंखला पर निर्भर करते हैं।

  • ORFs और उनका स्थानीयकरण
  • जीन संरचना
  • कोडिंग क्षेत्र
  • विनियामक रूपांकनों का स्थान

इस प्रकार से क्रियाात्मक एनोटेशन में जीनोमिक तत्वों को जैविक जानकारी संलग्न करना सम्मिलित किया गया है।

  • जैव रासायनिक क्रिया
  • जैविक क्रिया
  • इसमें विनियमन और अंतःक्रिया सम्मिलित है
  • अभिव्यंजना

इन चरणों में जैविक परीक्षण और सिलिको विश्लेषण दोनों सम्मिलित हो सकते हैं। प्रोटीनोजेनोमिक्स-आधारित दृष्टिकोण जीनोमिक्स एनोटेशन में सुधार करने के लिए व्यक्त प्रोटीन से जानकारी का उपयोग करते हैं, जो प्रायः मास स्पेक्ट्रोमेट्री से प्राप्त होता है।[15]

जीनोम एनोटेशन को देखने और साझा करने के लिए वैज्ञानिकों को अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए, MAKER

वैज्ञानिकों को जीनोम एनोटेशन देखने और साझा करने की अनुमति देने के लिए विभिन्न प्रकार के सॉफ़्टवेयर उपकरण विकसित किए गए हैं; उदाहरण के लिए मेकर (MAKER) है।

मानव जीनोम की जांच करने वाले वैज्ञानिकों के लिए जीनोम एनोटेशन उच्च चुनौती बनी हुई है, अधिक से अधिक मानव व्यक्तियों (100,000 जीनोम प्रोजेक्ट, यूके) और कई मॉडल जीवों के जीनोम अनुक्रम अब अत्यधिक स्तर पर पूरे हो चुके हैं।[16][17] जीन और अन्य आनुवंशिक नियंत्रण तत्वों के स्थानों की पहचान करना प्रायःकिसी जीव के संयोजन और सामान्य संचालन के लिए जैविक "खंडों की सूची" को परिभाषित करने के रूप में वर्णित किया जाता है।[14] इस प्रकार से वैज्ञानिक अभी भी इस खंडों की सूची को रेखांकित करने और यह समझने की प्रक्रिया में प्रारंभिक चरण में हैं कि सभी भाग " साथ कैसे फिट होते हैं"।[18]

जीनोम एनोटेशन जांच का सक्रिय क्षेत्र होते है और इसमें जीवन विज्ञान समुदाय में कई अलग-अलग संगठन सम्मिलित होते हैं जो वेब और अन्य इलेक्ट्रॉनिक माध्यमों के माध्यम से सार्वजनिक रूप से उपलब्ध जैविक डेटाबेस में अपने प्रयासों के परिणामों को प्रकाशित करते हैं। यहां जीनोम एनोटेशन से संबंधित चल रही परियोजनाओं की वर्णमाला क्रम में सूची दी गई है:

विकिपीडिया पर, जीन विकी पोर्टल के तत्वावधान में जीनोम एनोटेशन स्वचालित होना शुरू हो गया है जो इंटरनेट बॉट संचालित करता है जोकी अनुसंधान डेटाबेस से जीन डेटा एकत्र करता है और उस आधार पर जीन स्टब्स बनाता है।[19]

संदर्भ

  1. "Definition of genome annotation".
  2. GAAS, NBIS -- National Bioinformatics Infrastructure Sweden, 2022-04-13, retrieved 2022-04-25
  3. Banerjee S, Bhandary P, Woodhouse M, Sen TZ, Wise RP, Andorf CM (Apr 2021). "FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences". BMC Bioinformatics. 44 (9): e89. doi:10.1186/s12859-021-04120-9. PMC 8056616. PMID 33879057.
  4. Martin, Roman; Hackl, Thomas; Hattab, Georges; Fischer, Matthias G; Heider, Dominik (2021-04-01). Birol, Inanc (ed.). "MOSGA: Modular Open-Source Genome Annotator". Bioinformatics (in English). 36 (22–23): 5514–5515. doi:10.1093/bioinformatics/btaa1003. hdl:21.11116/0000-0006-FED4-D. ISSN 1367-4803. PMID 33258916.
  5. Martin, Copyright (C) 2021 Roman Martin. Designed and developed by Roman. "राज्यमंत्री को". mosga.mathematik.uni-marburg.de (in English). Retrieved 2022-04-25.
  6. Schwengers, Oliver; Jelonek, Lukas; Dieckmann, Marius Alfred; Beyvers, Sebastian; Blom, Jochen; Goesmann, Alexander (5 November 2021). "Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification". Microbial Genomics. 7 (11). doi:10.1099/mgen.0.000685. PMC 8743544. PMID 34739369.
  7. Seemann, Torsten (15 July 2014). "Prokka: rapid prokaryotic genome annotation". Bioinformatics. 30 (14): 2068–2069. doi:10.1093/bioinformatics/btu153. PMID 24642063.
  8. Li, Wenjun; O’Neill, Kathleen R; Haft, Daniel H; DiCuccio, Michael; Chetvernin, Vyacheslav; Badretdin, Azat; Coulouris, George; Chitsaz, Farideh; Derbyshire, Myra K.; Durkin, A Scott; Gonzales, Noreen R; Gwadz, Marc; Lanczycki, Christopher J.; Song, James S; Thanki, Narmada; Wang, Jiyao; Yamashita, Roxanne A.; Yang, Mingzhang; Zheng, Chanjuan; Marchler-Bauer, Aron; Thibaud-Nissen, Françoise (8 January 2021). "RefSeq: expanding the Prokaryotic Genome Annotation Pipeline reach with protein family model curation". Nucleic Acids Research. 49 (D1): D1020–D1028. doi:10.1093/nar/gkaa1105. PMC 7779008. PMID 33270901.
  9. "जाओ शिक्षण संसाधन". Archived from the original on 10 October 2006. Retrieved 21 September 2006.
  10. Sommer, Markus J.; Cha, Sooyoung; Varabyou, Ales; Rincon, Natalia; Park, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martin; Salzberg, Steven L. (2022-12-15). "मानव प्रतिलेख के लिए संरचना-निर्देशित आइसोफॉर्म पहचान" (in English). doi:10.7554/eLife.82556. {{cite journal}}: Cite journal requires |journal= (help)
  11. "NCBO Annotator | bioontology.org". ncbo.bioontology.org. Retrieved 2023-02-08.
  12. Fang, H; Gough, J (2013). "DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more". Nucleic Acids Research. 41 (Database issue): D536–44. doi:10.1093/nar/gks1080. PMC 3531119. PMID 23161684.
  13. Stein, L. (2001). "Genome annotation: from sequence to biology". Nature Reviews Genetics. 2 (7): 493–503. doi:10.1038/35080529. PMID 11433356. S2CID 12044602.
  14. 14.0 14.1 Pevsner, Jonathan (2009). Bioinformatics and functional genomics (2nd ed.). Hoboken, N.J: Wiley-Blackwell. ISBN 9780470085851.
  15. Gupta, Nitin; Stephen Tanner; Navdeep Jaitly; Joshua N Adkins; Mary Lipton; Robert Edwards; Margaret Romine; Andrei Osterman; Vineet Bafna; Richard D Smith; Pavel A Pevzner (September 2007). "Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation". Genome Research. 17 (9): 1362–1377. doi:10.1101/gr.6427907. ISSN 1088-9051. PMC 1950905. PMID 17690205.
  16. ENCODE Project Consortium (2011). Becker PB (ed.). "डीएनए तत्वों के विश्वकोश के लिए उपयोगकर्ता की मार्गदर्शिका (एनकोडे)". PLOS Biology. 9 (4): e1001046. doi:10.1371/journal.pbio.1001046. PMC 3079585. PMID 21526222. open access
  17. McVean, G. A.; Abecasis, D. M.; Auton, R. M.; Brooks, G. A. R.; Depristo, D. R.; Durbin, A.; Handsaker, A. G.; Kang, P.; Marth, E. E.; McVean, P.; Gabriel, S. B.; Gibbs, R. A.; Green, E. D.; Hurles, M. E.; Knoppers, B. M.; Korbel, J. O.; Lander, E. S.; Lee, C.; Lehrach, H.; Mardis, E. R.; Marth, G. T.; McVean, G. A.; Nickerson, D. A.; Schmidt, J. P.; Sherry, S. T.; Wang, J.; Wilson, R. K.; Gibbs (Principal Investigator), R. A.; Dinh, H.; et al. (2012). "An integrated map of genetic variation from 1,092 human genomes". Nature. 491 (7422): 56–65. Bibcode:2012Natur.491...56T. doi:10.1038/nature11632. PMC 3498066. PMID 23128226.
  18. Dunham, I.; Bernstein, A.; Birney, S. F.; Dunham, P. J.; Green, C. A.; Gunter, F.; Snyder, C. B.; Frietze, S.; Harrow, J.; Kaul, R.; Khatun, J.; Lajoie, B. R.; Landt, S. G.; Lee, B. K.; Pauli, F.; Rosenbloom, K. R.; Sabo, P.; Safi, A.; Sanyal, A.; Shoresh, N.; Simon, J. M.; Song, L.; Trinklein, N. D.; Altshuler, R. C.; Birney, E.; Brown, J. B.; Cheng, C.; Djebali, S.; Dong, X.; et al. (2012). "मानव जीनोम में डीएनए तत्वों का एक एकीकृत विश्वकोश". Nature. 489 (7414): 57–74. Bibcode:2012Natur.489...57T. doi:10.1038/nature11247. PMC 3439153. PMID 22955616.
  19. Huss, Jon W.; Orozco, C; Goodale, J; Wu, C; Batalov, S; Vickers, TJ; Valafar, F; Su, AI (2008). "A Gene Wiki for Community Annotation of Gene Function". PLOS Biology. 6 (7): e175. doi:10.1371/journal.pbio.0060175. PMC 2443188. PMID 18613750.