मानव प्रोटीन संदर्भ डेटाबेस
मानव प्रोटीन संदर्भ डेटाबेस (एचपीआरडी) प्रोटीन डेटाबेस है जिसे इंटरनेट के माध्यम से एक्सेस किया जा सकता है।[1] यह प्रमुख भारत अन्य-लाभकारी अनुसंधान संगठन इंस्टीट्यूट ऑफ बायोइनफॉरमैटिक्स, बैंगलोर (आईओबी), बैंगलोर, भारत के साथ निकटता से जुड़ा हुआ है। यह डेटाबेस आईओबी और जॉन्स हॉपकिन्स विश्वविद्यालय की पांडे लैब का सहयोगी उत्पाद है।
सिंहावलोकन
एचपीआरडी जैव सूचना विज्ञान संस्थान, बंगलौर, भारत और अखिलेश पांडे (वैज्ञानिक) के मध्य बाल्टीमोर, संयुक्त राज्य अमेरिका में जॉन्स हॉपकिन्स विश्वविद्यालय में अंतरराष्ट्रीय सहयोगात्मक प्रयास का परिणाम है। एचपीआरडी में अधिकतम मानव प्रोटीनों के जीव विज्ञान से संबंधित मैन्युअल रूप से क्यूरेट की गई वैज्ञानिक विवरण होता है। मानव रोगों में सम्मिलित प्रोटीन के विषय में जानकारी को एनोटेट किया गया है और ऑनलाइन मेंडेलियन इनहेरिटेंस इन मैन (ओएमआईएम) डेटाबेस से जोड़ा गया है। नेशनल सेंटर फॉर बायोटेक्नोलॉजी इन्फॉर्मेशन अपने मानव प्रोटीन डेटाबेस (जैसे एंट्रीज़ जीन, रेफ्सेक प्रोटीन से संबंधित जीन और प्रोटीन) के माध्यम से एचपीआरडी को लिंक प्रदान करता है।
यह संसाधन प्रोटीन-प्रोटीन इंटरैक्शन, पोस्ट-ट्रांसलेशनल संसाधनों, एंजाइम-सब्सट्रेट संबंधों और रोग संघों सहित मानव प्रोटीन कार्यों के विषय में जानकारी प्रदर्शित करता है। प्रोटीन एनोटेशन जानकारी जिसे सूचीबद्ध किया गया है, विशेषज्ञ जीवविज्ञानियों द्वारा प्रकाशित साहित्य का उपयोग करके और प्रोटीन अनुक्रम के जैव सूचना विज्ञान विश्लेषण के माध्यम से मैनुअल क्यूरेशन के माध्यम से प्राप्त किया गया था। एचपीआरडी से प्रोटीन-प्रोटीन इंटरैक्शन और उपकोशिकीय स्थानीयकरण डेटा का उपयोग मानव प्रोटीन इंटरैक्शन नेटवर्क विकसित करने के लिए किया गया है।[2] एचपीआरडी की मुख्य विशेषताएं इस प्रकार हैं:
- 2003 में 3,000 प्रोटीनों के लिए एनोटेट किए गए 10,000 प्रोटीन-प्रोटीन इंटरैक्शन (पीपीआई) से, एचपीआरडी 2007 के अंत तक 6,360 आइसोफॉर्म सहित 25,000 प्रोटीनों के लिए एनोटेट किए गए 36,500 से अधिक अद्वितीय पीपीआई हो गए हैं।[3] * एचपीआरडी में एनोटेट किए गए 50% से अधिक अणुओं में कम से कम पीपीआई है और 10% में 10 से अधिक पीपीआई हैं।
- पीपीआई के लिए प्रयोग मुख्य रूप से इन विट्रो, इन विवो और खमीर दो संकर (Y2H) नाम से तीन श्रेणियों में बांटा गया है। एचपीआरडी में एनोटेट किए गए साठ प्रतिशत पीपीआई प्रयोग द्वारा समर्थित हैं चूँकि उनमें से 26% में तीन प्रायोगिक विधियों में से दो एनोटेट प्राप्त हुए हैं।
- एचपीआरडी में 26 विभिन्न प्रकारों से संबंधित 18,000 मैन्युअल रूप से क्यूरेटेड पीटीएम डेटा सम्मिलित हैं। फास्फारिलीकरण एचपीआरडी में एनोटेट किए गए पीटीएम डेटा के 63% योगदान देने वाले प्रोटीन का प्रमुख प्रकार है। ग्लाइकोसिलेशन, प्रोटियोलिसिस संबंधी दरार और डाइसल्फ़ाइड पुल इवेंट्स पीटीएम डेटा के प्रमुख योगदानकर्ता हैं।
- एचपीआरडी डेटा टैब सीमांकित और एक्सएमएल फ़ाइल स्वरूपों में डाउनलोड के लिए उपलब्ध है।[4]
एचपीआरडी मानव प्रोटीन डेटा को एकीकृत करने के लिए सामुदायिक पोर्टल ह्यूमन प्रोटीनपीडिया से भी डेटा को एकीकृत करता है। एचपीआरडी से डेटा को शैक्षणिक उपयोगकर्ताओं द्वारा स्वतंत्र रूप से एक्सेस और उपयोग किया जा सकता है, अपितु वाणिज्यिक संस्थाओं को उपयोग के लिए लाइसेंस प्राप्त करने की आवश्यकता होती है। मानव प्रोटीनपीडिया[5] सामग्री किसी के भी डाउनलोड करने और उपयोग करने के लिए स्वतंत्र रूप से उपलब्ध है।
फॉस्फोमोटिफ फाइंडर
फॉस्फोमोटिफ फाइंडर[6] ज्ञात किनेज / फॉस्फेट सब्सट्रेट के साथ-साथ बाध्यकारी रूपांकनों को सम्मिलित करता है जो प्रकाशित साहित्य से क्यूरेट होते हैं। यह क्वेरी क्रम में किसी भी साहित्य-व्युत्पन्न मूल भाव की उपस्थिति की रिपोर्ट करता है। फॉस्फोमोटिफ फाइंडर किसी एल्गोरिदम या अन्य कम्प्यूटेशनल रणनीतियों का उपयोग करके क्वेरी प्रोटीन अनुक्रम में किसी भी प्रारूप का आकलन नहीं लगाता है।
प्रोटीन डेटा की अपेक्षा
ऐसे अन्य डेटाबेस हैं जो मानव प्रोटिओम (जैसे बायोग्रिड, बिंड, डिप, एचपीआरडी, इन्टाक्ट, मिंट, एमआईपीएस,पीडीजेडबेस और रिएक्टोम) को सम्पादित हैं। प्रत्येक डेटाबेस की डेटा प्रस्तुत करने की अपनी शैली होती है। प्रत्येक डेटाबेस की शक्ति और कमजोरियों का निष्कर्ष प्राप्त करने के लिए अधिकतम शोधकर्ताओं के लिए इन डेटाबेस से बड़े स्तर पर डेटा की अपेक्षा करना कठिन कार्य है। मथिवनन और सहयोगियों [7] विभिन्न प्रश्न पूछकर प्रोटीन डेटा का विश्लेषण करते हुए इस मुद्दे का समाधान प्राप्त करने का प्रयास किया। यह विश्लेषण जीवविज्ञानियों को उनकी आवश्यकताओं के आधार पर इन डेटाबेसों में से चयन करने में सहायता करेगा।
संदर्भ
- ↑ Peri S, et al. (2003). "मनुष्यों में सिस्टम बायोलॉजी के लिए एक प्रारंभिक मंच के रूप में मानव प्रोटीन संदर्भ डेटाबेस का विकास". Genome Research. 13 (10): 2363–71. doi:10.1101/gr.1680803. PMC 403728. PMID 14525934.
- ↑ Gandhi T.K.B.; et al. (March 2006). "मानव प्रोटीन इंटरएक्टिव का विश्लेषण और यीस्ट, वर्म और फ्लाई इंटरेक्शन डेटासेट के साथ तुलना". Nature Genetics. 38 (3): 285–293. doi:10.1038/ng1747. PMID 16501559. S2CID 1446423.
- ↑ Mathivanan S.; et al. (2006). "An evaluation of human protein–protein interaction data in the public domain". BMC Bioinformatics. 2006 (7): S19. doi:10.1186/1471-2105-7-s5-s19. PMC 1764475. PMID 17254303.
- ↑ Mishra G.; et al. (2006). "Human protein reference database—2006 update". Nucleic Acids Research. 34 (Database issue): 411–414. doi:10.1093/nar/gkj141. PMC 1347503. PMID 16381900.
- ↑ Mathivanan S.; et al. (2008). "मानव प्रोटीनपीडिया मानव प्रोटीन डेटा साझा करने में सक्षम बनाता है" (PDF). Nature Biotechnology. 26 (2): 164–167. doi:10.1038/nbt0208-164. hdl:10261/60528. PMID 18259167. S2CID 205265347.
- ↑ Amanchy R.; et al. (2007). "क्यूरेटेड फास्फारिलीकरण-आधारित सब्सट्रेट और बाध्यकारी रूपांकनों का एक संग्रह". Nature Biotechnology. 2007 (25): 285–286. doi:10.1038/nbt0307-285. PMID 17344875. S2CID 38824337.
- ↑ Mathivanan S, Periaswamy B, Gandhi TK, et al. (2006). "सार्वजनिक डोमेन में मानव प्रोटीन-प्रोटीन इंटरैक्शन डेटा का मूल्यांकन". BMC Bioinformatics. 7 Suppl 5 (Suppl 5): S19. doi:10.1186/1471-2105-7-S5-S19. PMC 1764475. PMID 17254303.