एंडुरिल (वर्कफ़्लो इंजन)
एंडुरिल वैज्ञानिक डेटा विश्लेषण के लिए संवृत स्रोत घटक-आधारित कार्यप्रवाह फ़्रेमवर्क है[1] जिसे प्रणाली बायोलॉजी प्रयोगशाला, हेलसिंकी विश्वविद्यालय में विकसित किया गया।
एंडुरिल को विशेष रूप से बायोमेडिकल अनुसंधान में उच्च-थ्रूपुट प्रयोगों के क्षेत्र में व्यवस्थित, स्मूथली और कुशल डेटा विश्लेषण को सक्षम करने के लिए डिज़ाइन किया गया है। कार्यप्रवाह प्रणाली वर्तमान में कई प्रकार के विश्लेषण के लिए घटक प्रदान करती है जैसे डीएनए अनुक्रमण उच्च-थ्रूपुट अनुक्रमण, जीन अभिव्यक्ति, ल-न्यूक्लियोटाइड बहुरूपता, चिप-पर-चिप, ऐरे तुलनात्मक जीनोमिक संकरण और एक्सॉन माइक्रोएरे विश्लेषण के साथ-साथ साइटोमेट्री और सेल छवि विश्लेषण जैसे कई प्रकार के विश्लेषण के लिए घटक प्रदान करती है।
वास्तुकला और विशेषताएं
कार्यप्रवाह साथ जुड़े प्रसंस्करण चरणों की श्रृंखला है, जिससे चरण का आउटपुट दूसरे के इनपुट के रूप में उपयोग किया जा सके। प्रसंस्करण चरण डेटा आयात, सांख्यिकीय परीक्षण और रिपोर्ट निर्माण जैसे डेटा विश्लेषण कार्यों को प्रारम्भ करते हैं। एंडुरिल में, प्रसंस्करण चरणों को घटकों का उपयोग करके कार्यान्वित किया जाता है, जो पुन: प्रयोज्य निष्पादन योग्य कोड होते हैं जिन्हें किसी भी प्रोग्रामिंग भाषा में लिखा जा सकता है। घटकों को कार्यप्रवाह, या घटक नेटवर्क में साथ जोड़ा जाता है, जिसे एंडुरिल कार्यप्रवाह इंजन द्वारा निष्पादित किया जाता है। कार्यप्रवाह विन्यास सरल किन्तु जटिल स्क्रिप्टिंग भाषा, एंडुरिलस्क्रिप्ट का उपयोग करके किया जाता है। कार्यप्रवाह विन्यास और निष्पादन एक्लिप्स (सॉफ़्टवेयर), लोकप्रिय बहुउद्देशीय जीयूआई, या कमांड लाइन से किया जा सकता है।
कोर एंडुरिल इंजन जावा में लिखा गया है और घटक विभिन्न प्रोग्रामिंग भाषाओं में लिखे गए हैं, जिनमें जावा, आर (प्रोग्रामिंग भाषा), मैटलैब, लुआ (प्रोग्रामिंग भाषा), पर्ल और पायथन (प्रोग्रामिंग भाषा) सम्मिलित हैं। घटकों की निर्भरता बायोकंडक्टर जैसे तृतीय-पक्ष पुस्तकालयों पर भी हो सकती है। सेल इमेजिंग और माइक्रोएरे विश्लेषण के लिए घटक प्रदान किए जाते हैं किन्तु अतिरिक्त घटक उपयोगकर्ताओं द्वारा कार्यान्वित किए जा सकते हैं। एंडुरिल कोर का परीक्षण लिनक्स और विंडोज़ पर किया गया है।
एंडुरिल 1.0: एंडुरिलस्क्रिप्ट भाषा
एंडुरिलस्क्रिप्ट में हैलो वर्ल्ड बस है
std.echo("Hello world!")
टिप्पणी करना जावा के सिंटैक्स का अनुसरण करता है:
// A simple comment
/* Another simple comment */
/** A description that will be included in component description */
घटकों को नामित घटक उदाहरणों को उनकी कॉल निर्दिष्ट करके बुलाया जाता है। एकल कार्यप्रवाह में नामों का पुन: उपयोग नहीं किया जा सकता है, इनपुट फ़ाइलों के लिए विशेष घटक होते हैं जिनमें स्क्रिप्ट में बाहरी फ़ाइलें सम्मिलित होती हैं। समर्थित परमाणु प्रकार पूर्णांक, फ्लोट, बूलियन और स्ट्रिंग हैं, और टाइपिंग अंतर्निहित रूप से की जाती है।
in1 = INPUT(path="myFile.csv")
constant1 = 1
componentInstance1 = MyComponent(inputPort1 = in1, inputParam1 = constant1)
कार्यप्रवाह का निर्माण निम्नलिखित घटकों के इनपुट के लिए घटक उदाहरणों के आउटपुट को निर्दिष्ट करके किया जाता है।
componentInstance2 = AnotherComponent(inputPort1 = componentInstance1.outputPort1)
घटक उदाहरणों को फलन के रूप में भी धारण किया जा सकता है।
function MyFunction(InType1 in1, ..., optional InTypeM inM,
ParType1 param1, ..., ParTypeP paramP=defaultP)
-> (OutType1 out1, ..., OutTypeN outN)
{
... statements ...
return record(out1=x1, ..., outN=xN)
}
मानक if-else और स्विच-केस स्टेटमेंट के अतिरिक्त, एंडुरिलस्क्रिप्ट में फॉर-लूप भी सम्मिलित है।
// Iterates over 1, 2, ..., 10
array = record()
for i: std.range(1, 10) {
array[i] = SomeComponent(k=i)
}
विस्तारशीलता
एंडुरिल को कई स्तरों पर बढ़ाया जा सकता है। उपयोगकर्ता उपस्थित घटक समूहों में नए घटक जोड़ सकते हैं। चूंकि, यदि नया घटक या घटक ऐसे कार्य करते हैं जो उपस्थित समूहों से संबंधित नहीं हैं, तो उपयोगकर्ता नए समूह भी बना सकते हैं।
मोक्सिसकान
मोक्सिसकान कैंसर अनुसंधान और आणविक जीव विज्ञान के लिए डेटा एकीकरण फ़्रेमवर्क है।[2] फ्रेमवर्क सम्बंधित डेटाबेस प्रदान करता है जो जीन, प्रोटीन, ड्रग्स, रास्ते, रोग, जैविक प्रक्रियाओं, सेलुलर घटकों और आणविक कार्यों जैसी जैविक संस्थाओं के ग्राफ का प्रतिनिधित्व करता है। इसके अतिरिक्त, इस डेटा के शीर्ष पर विश्लेषण और परिग्रहण उपकरणों का विस्तृत समूह बनाया गया है। इनमें से अधिकांश उपकरण एंडुरिल घटकों और कार्यों के रूप में कार्यान्वित किए जाते हैं।
मोक्सीस्कान का उपयोग मुख्य रूप से जीनोमिक अध्ययनों से प्राप्त कैंसर वृद्धि में सम्मिलित कार्सिनोजेनेसिस सेल प्रकारों की सूचियों की व्याख्या करने के लिए किया जाता है। इसके उपकरणों का उपयोग इनपुट जीन से संबंधित जैविक संस्थाओं के ग्राफ़ उत्पन्न करने के लिए किया जा सकता है। इन ग्राफ़ों का स्थिर निर्धारण दवा लक्ष्य पूर्वानुमानों से लेकर सिग्नलिंग कैस्केड की समय श्रृंखला तक भिन्न हो सकता है। इन उपकरणों के कुछ लक्ष्य सरलता प्रणाली IPA से निकटता से संबंधित हैं।
यह भी देखें
- जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणाली
- जीन जीनपैटर्न
- केपलर वैज्ञानिक कार्यप्रवाह प्रणाली
- अपाचे टवेर्ना
- कार्यप्रवाह प्रबंधन प्रणाली
संदर्भ
- ↑ Ovaska, K.; Laakso, M.; Haapa-Paananen, S.; Louhimo, R.; Chen, P.; Aittomäki, V.; Valo, E.; Núñez-Fontarnau, J.; Rantanen, V.; Karinen, S.; Nousiainen, K.; Lahesmaa-Korpinen, A. M.; Miettinen, M.; Saarinen, L.; Kohonen, P.; Wu, J.; Westermarck, J.; Hautaniemi, S. (2010). "बड़े पैमाने पर डेटा एकीकरण ढांचा ग्लियोब्लास्टोमा मल्टीफॉर्म पर एक व्यापक दृष्टिकोण प्रदान करता है". Genome Medicine. 2 (9): 65. doi:10.1186/gm186. PMC 3092116. PMID 20822536.
- ↑ Laakso, M.; Hautaniemi, S. (2010). "जीन सेट को नेटवर्क में अनुवाद करने के लिए एकीकृत मंच". Bioinformatics. 26 (14): 1802–1803. doi:10.1093/bioinformatics/btq277. PMID 20507894.
अग्रिम पठन
- Scientists develop new database that provides comprehensive view of Glioblastoma Multiforme genome in the Cancer Genome Atlas Research Briefs, March 2011, by Catherine Evans.
- Almeida, J. S. (2010). "Computational ecosystems for data-driven medical genomics". Genome Medicine. 2 (9): 67. doi:10.1186/gm188. PMC 3092118. PMID 20854645.
- Sahu, B.; Laakso, M.; Ovaska, K.; Mirtti, T.; Lundin, J.; Rannikko, A.; Sankila, A.; Turunen, J. P.; Lundin, M.; Konsti, J.; Vesterinen, T.; Nordling, S.; Kallioniemi, O.; Hautaniemi, S.; Jänne, O. A. (2011). "Dual role of FoxA1 in androgen receptor binding to chromatin, androgen signalling and prostate cancer". The EMBO Journal. 30 (19): 3962–3976. doi:10.1038/emboj.2011.328. PMC 3209787. PMID 21915096.
- Pihlajamaa, P.; Zhang, F. -P.; Saarinen, L.; Mikkonen, L.; Hautaniemi, S.; Janne, O. A. (2011). "The Phytoestrogen Genistein is a Tissue-Specific Androgen Receptor Modulator". Endocrinology. 152 (11): 4395–4405. doi:10.1210/en.2011-0221. PMID 21878517.
- Blom, H.; Rönnlund, D.; Scott, L.; Spicarova, Z.; Rantanen, V.; Widengren, J.; Aperia, A.; Brismar, H. (2011). "Nearest neighbor analysis of dopamine D1 receptors and Na+-K+-ATPases in dendritic spines dissected by STED microscopy". Microscopy Research and Technique. 75 (2): 220–228. doi:10.1002/jemt.21046. PMID 21809413. S2CID 206067902.
- Ehlers, P. I.; Kivimäki, A. S.; Turpeinen, A. M.; Korpela, R.; Vapaatalo, H. (2011). "High blood pressure-lowering and vasoprotective effects of milk products in experimental hypertension". British Journal of Nutrition. 106 (9): 1353–1363. doi:10.1017/S0007114511001723. PMID 21736845.
- Maliniemi, P.; Carlsson, E.; Kaukola, A.; Ovaska, K.; Niiranen, K.; Saksela, O.; Jeskanen, L.; Hautaniemi, S.; Ranki, A. (2011). "NAV3 copy number changes and target genes in basal and squamous cell cancers". Experimental Dermatology. 20 (11): 926–931. doi:10.1111/j.1600-0625.2011.01358.x. PMID 21995814. S2CID 26219786.
- Chen, P.; Lepikhova, T.; Hu, Y.; Monni, O.; Hautaniemi, S. (2011). "Comprehensive exon array data processing method for quantitative analysis of alternative spliced variants". Nucleic Acids Research. 39 (18): e123. doi:10.1093/nar/gkr513. PMC 3185423. PMID 21745820.
- Karinen S., Heikkinen T.; et al. (2011). "Data Integration Workflow for Search of Disease Driving Genes and Genetic Variants". PLOS ONE. 6 (4): e18636. doi:10.1371/journal.pone.0018636. PMC 3075259. PMID 21533266.
- Heinonen M., Hemmes A.; et al. (2011). "Role of RNA binding protein HuR in ductal carcinoma in situ of the breast". The Journal of Pathology. 224 (4): 529–539. doi:10.1002/path.2889. PMC 3504799. PMID 21480233.
- Louhimo R., Hautaniemi S. (2011). "CNAmet: an R package for integrating copy number, methylation and expression data". Bioinformatics. 27 (6): 887–888. doi:10.1093/bioinformatics/btr019. PMID 21228048.