मानव प्रोटीन संदर्भ डेटाबेस
This article relies excessively on references to primary sources. (November 2008) (Learn how and when to remove this template message) |
मानव प्रोटीन संदर्भ डेटाबेस (एचपीआरडी) एक प्रोटीन डेटाबेस है जिसे इंटरनेट के माध्यम से एक्सेस किया जा सकता है।[1] यह प्रमुख भारत गैर-लाभकारी अनुसंधान संगठन इंस्टीट्यूट ऑफ बायोइनफॉरमैटिक्स, बैंगलोर (IOB), बैंगलोर, भारत के साथ निकटता से जुड़ा हुआ है। यह डेटाबेस IOB और जॉन्स हॉपकिन्स विश्वविद्यालय की पांडे लैब का एक सहयोगी आउटपुट है।
सिंहावलोकन
एचपीआरडी जैव सूचना विज्ञान संस्थान, बंगलौर, भारत और अखिलेश पांडे (वैज्ञानिक) के बीच बाल्टीमोर, संयुक्त राज्य अमेरिका में जॉन्स हॉपकिन्स विश्वविद्यालय में एक अंतरराष्ट्रीय सहयोगात्मक प्रयास का परिणाम है। HPRD में अधिकांश मानव प्रोटीनों के जीव विज्ञान से संबंधित मैन्युअल रूप से क्यूरेट की गई वैज्ञानिक जानकारी होती है। मानव रोगों में शामिल प्रोटीन के बारे में जानकारी को एनोटेट किया गया है और ऑनलाइन मेंडेलियन इनहेरिटेंस इन मैन (ओएमआईएम) डेटाबेस से जोड़ा गया है। नेशनल सेंटर फॉर बायोटेक्नोलॉजी इन्फॉर्मेशन अपने मानव प्रोटीन डेटाबेस (जैसे Entrez Gene, RefSeq प्रोटीन से संबंधित जीन और प्रोटीन) के माध्यम से HPRD को लिंक प्रदान करता है।
यह संसाधन प्रोटीन-प्रोटीन इंटरैक्शन, पोस्ट-ट्रांसलेशनल संशोधनों, एंजाइम-सब्सट्रेट संबंधों और रोग संघों सहित मानव प्रोटीन कार्यों के बारे में जानकारी दर्शाता है। प्रोटीन एनोटेशन जानकारी जिसे सूचीबद्ध किया गया है, विशेषज्ञ जीवविज्ञानियों द्वारा प्रकाशित साहित्य का उपयोग करके और प्रोटीन अनुक्रम के जैव सूचना विज्ञान विश्लेषण के माध्यम से मैनुअल क्यूरेशन के माध्यम से प्राप्त किया गया था। एचपीआरडी से प्रोटीन-प्रोटीन इंटरैक्शन और उपकोशिकीय स्थानीयकरण डेटा का उपयोग मानव प्रोटीन इंटरैक्शन नेटवर्क विकसित करने के लिए किया गया है।[2] एचपीआरडी की मुख्य विशेषताएं इस प्रकार हैं:
- 2003 में 3,000 प्रोटीनों के लिए एनोटेट किए गए 10,000 प्रोटीन-प्रोटीन इंटरैक्शन (पीपीआई) से, एचपीआरडी 2007 के अंत तक 6,360 आइसोफॉर्म सहित 25,000 प्रोटीनों के लिए एनोटेट किए गए 36,500 से अधिक अद्वितीय पीपीआई तक बढ़ गया है।[3] * एचपीआरडी में एनोटेट किए गए 50% से अधिक अणुओं में कम से कम एक पीपीआई है और 10% में 10 से अधिक पीपीआई हैं।
- पीपीआई के लिए प्रयोग मोटे तौर पर इन विट्रो, इन विवो और खमीर दो संकर (Y2H) नाम से तीन श्रेणियों में बांटा गया है। एचपीआरडी में एनोटेट किए गए साठ प्रतिशत पीपीआई एक ही प्रयोग द्वारा समर्थित हैं जबकि उनमें से 26% में तीन प्रायोगिक तरीकों में से दो एनोटेट पाए गए हैं।
- एचपीआरडी में 26 विभिन्न प्रकारों से संबंधित 18,000 मैन्युअल रूप से क्यूरेटेड पीटीएम डेटा शामिल हैं। फास्फारिलीकरण एचपीआरडी में एनोटेट किए गए पीटीएम डेटा के 63% योगदान देने वाले प्रोटीन का प्रमुख प्रकार है। ग्लाइकोसिलेशन, प्रोटियोलिसिस संबंधी दरार और डाइसल्फ़ाइड पुल इवेंट्स पीटीएम डेटा के अगले प्रमुख योगदानकर्ता हैं।
- एचपीआरडी डेटा टैब सीमांकित और एक्सएमएल फ़ाइल स्वरूपों में डाउनलोड के लिए उपलब्ध है।[4]
एचपीआरडी मानव प्रोटीन डेटा को एकीकृत करने के लिए एक सामुदायिक पोर्टल ह्यूमन प्रोटीनपीडिया से भी डेटा को एकीकृत करता है। एचपीआरडी से डेटा को शैक्षणिक उपयोगकर्ताओं द्वारा स्वतंत्र रूप से एक्सेस और उपयोग किया जा सकता है, जबकि वाणिज्यिक संस्थाओं को उपयोग के लिए लाइसेंस प्राप्त करने की आवश्यकता होती है। मानव प्रोटीनपीडिया[5] सामग्री किसी के भी डाउनलोड करने और उपयोग करने के लिए स्वतंत्र रूप से उपलब्ध है।
फॉस्फोमोटिफ फाइंडर
फॉस्फोमोटिफ खोजक[6] ज्ञात किनेज / फॉस्फेट सब्सट्रेट के साथ-साथ बाध्यकारी रूपांकनों को शामिल करता है जो प्रकाशित साहित्य से क्यूरेट होते हैं। यह क्वेरी क्रम में किसी भी साहित्य-व्युत्पन्न मूल भाव की उपस्थिति की रिपोर्ट करता है। फॉस्फोमोटिफ फाइंडर किसी एल्गोरिदम या अन्य कम्प्यूटेशनल रणनीतियों का उपयोग करके क्वेरी प्रोटीन अनुक्रम में किसी भी प्रारूप का अनुमान नहीं लगाता है।
प्रोटीन डेटा की तुलना
ऐसे अन्य डेटाबेस हैं जो मानव प्रोटिओम (जैसे BioGRID, BIND, DIP, HPRD, IntAct, MINT, MIPS, PDZBase और Reactome) से निपटते हैं। प्रत्येक डेटाबेस की डेटा प्रस्तुत करने की अपनी शैली होती है। प्रत्येक डेटाबेस की ताकत और कमजोरियों का निष्कर्ष निकालने के लिए अधिकांश जांचकर्ताओं के लिए इन डेटाबेस से बड़े पैमाने पर डेटा की तुलना करना एक कठिन काम है। मथिवनन और सहयोगियों [7] विभिन्न प्रश्न पूछकर प्रोटीन डेटा का विश्लेषण करते हुए इस मुद्दे को हल करने का प्रयास किया। यह विश्लेषण जीवविज्ञानियों को उनकी आवश्यकताओं के आधार पर इन डेटाबेसों में से चुनने में मदद करेगा।
संदर्भ
- ↑ Peri S, et al. (2003). "मनुष्यों में सिस्टम बायोलॉजी के लिए एक प्रारंभिक मंच के रूप में मानव प्रोटीन संदर्भ डेटाबेस का विकास". Genome Research. 13 (10): 2363–71. doi:10.1101/gr.1680803. PMC 403728. PMID 14525934.
- ↑ Gandhi T.K.B.; et al. (March 2006). "मानव प्रोटीन इंटरएक्टिव का विश्लेषण और यीस्ट, वर्म और फ्लाई इंटरेक्शन डेटासेट के साथ तुलना". Nature Genetics. 38 (3): 285–293. doi:10.1038/ng1747. PMID 16501559. S2CID 1446423.
- ↑ Mathivanan S.; et al. (2006). "An evaluation of human protein–protein interaction data in the public domain". BMC Bioinformatics. 2006 (7): S19. doi:10.1186/1471-2105-7-s5-s19. PMC 1764475. PMID 17254303.
- ↑ Mishra G.; et al. (2006). "Human protein reference database—2006 update". Nucleic Acids Research. 34 (Database issue): 411–414. doi:10.1093/nar/gkj141. PMC 1347503. PMID 16381900.
- ↑ Mathivanan S.; et al. (2008). "मानव प्रोटीनपीडिया मानव प्रोटीन डेटा साझा करने में सक्षम बनाता है" (PDF). Nature Biotechnology. 26 (2): 164–167. doi:10.1038/nbt0208-164. hdl:10261/60528. PMID 18259167. S2CID 205265347.
- ↑ Amanchy R.; et al. (2007). "क्यूरेटेड फास्फारिलीकरण-आधारित सब्सट्रेट और बाध्यकारी रूपांकनों का एक संग्रह". Nature Biotechnology. 2007 (25): 285–286. doi:10.1038/nbt0307-285. PMID 17344875. S2CID 38824337.
- ↑ Mathivanan S, Periaswamy B, Gandhi TK, et al. (2006). "सार्वजनिक डोमेन में मानव प्रोटीन-प्रोटीन इंटरैक्शन डेटा का मूल्यांकन". BMC Bioinformatics. 7 Suppl 5 (Suppl 5): S19. doi:10.1186/1471-2105-7-S5-S19. PMC 1764475. PMID 17254303.