एंडुरिल (वर्कफ़्लो इंजन)

From Vigyanwiki

एंडुरिल वैज्ञानिक डेटा विश्लेषण के लिए संवृत स्रोत घटक-आधारित कार्यप्रवाह फ़्रेमवर्क है[1] जिसे प्रणाली बायोलॉजी प्रयोगशाला, हेलसिंकी विश्वविद्यालय में विकसित किया गया।

एंडुरिल को विशेष रूप से बायोमेडिकल अनुसंधान में उच्च-थ्रूपुट प्रयोगों के क्षेत्र में व्यवस्थित, स्मूथली और कुशल डेटा विश्लेषण को सक्षम करने के लिए डिज़ाइन किया गया है। कार्यप्रवाह प्रणाली वर्तमान में कई प्रकार के विश्लेषण के लिए घटक प्रदान करती है जैसे डीएनए अनुक्रमण उच्च-थ्रूपुट अनुक्रमण, जीन अभिव्यक्ति, ल-न्यूक्लियोटाइड बहुरूपता, चिप-पर-चिप, ऐरे तुलनात्मक जीनोमिक संकरण और एक्सॉन माइक्रोएरे विश्लेषण के साथ-साथ साइटोमेट्री और सेल छवि विश्लेषण जैसे कई प्रकार के विश्लेषण के लिए घटक प्रदान करती है।

वास्तुकला और विशेषताएं

कार्यप्रवाह साथ जुड़े प्रसंस्करण चरणों की श्रृंखला है, जिससे चरण का आउटपुट दूसरे के इनपुट के रूप में उपयोग किया जा सके। प्रसंस्करण चरण डेटा आयात, सांख्यिकीय परीक्षण और रिपोर्ट निर्माण जैसे डेटा विश्लेषण कार्यों को प्रारम्भ करते हैं। एंडुरिल में, प्रसंस्करण चरणों को घटकों का उपयोग करके कार्यान्वित किया जाता है, जो पुन: प्रयोज्य निष्पादन योग्य कोड होते हैं जिन्हें किसी भी प्रोग्रामिंग भाषा में लिखा जा सकता है। घटकों को कार्यप्रवाह, या घटक नेटवर्क में साथ जोड़ा जाता है, जिसे एंडुरिल कार्यप्रवाह इंजन द्वारा निष्पादित किया जाता है। कार्यप्रवाह विन्यास सरल किन्तु जटिल स्क्रिप्टिंग भाषा, एंडुरिलस्क्रिप्ट का उपयोग करके किया जाता है। कार्यप्रवाह विन्यास और निष्पादन एक्लिप्स (सॉफ़्टवेयर), लोकप्रिय बहुउद्देशीय जीयूआई, या कमांड लाइन से किया जा सकता है।

कोर एंडुरिल इंजन जावा में लिखा गया है और घटक विभिन्न प्रोग्रामिंग भाषाओं में लिखे गए हैं, जिनमें जावा, आर (प्रोग्रामिंग भाषा), मैटलैब, लुआ (प्रोग्रामिंग भाषा), पर्ल और पायथन (प्रोग्रामिंग भाषा) सम्मिलित हैं। घटकों की निर्भरता बायोकंडक्टर जैसे तृतीय-पक्ष पुस्तकालयों पर भी हो सकती है। सेल इमेजिंग और माइक्रोएरे विश्लेषण के लिए घटक प्रदान किए जाते हैं किन्तु अतिरिक्त घटक उपयोगकर्ताओं द्वारा कार्यान्वित किए जा सकते हैं। एंडुरिल कोर का परीक्षण लिनक्स और विंडोज़ पर किया गया है।

एंडुरिल 1.0: एंडुरिलस्क्रिप्ट भाषा

एंडुरिलस्क्रिप्ट में हैलो वर्ल्ड बस है

  std.echo("Hello world!")

टिप्पणी करना जावा के सिंटैक्स का अनुसरण करता है:

  // A simple comment
  /* Another simple comment */
  /** A description that will be included in component description */

घटकों को नामित घटक उदाहरणों को उनकी कॉल निर्दिष्ट करके बुलाया जाता है। एकल कार्यप्रवाह में नामों का पुन: उपयोग नहीं किया जा सकता है, इनपुट फ़ाइलों के लिए विशेष घटक होते हैं जिनमें स्क्रिप्ट में बाहरी फ़ाइलें सम्मिलित होती हैं। समर्थित परमाणु प्रकार पूर्णांक, फ्लोट, बूलियन और स्ट्रिंग हैं, और टाइपिंग अंतर्निहित रूप से की जाती है।

  in1 = INPUT(path="myFile.csv")
  constant1 = 1
  componentInstance1 = MyComponent(inputPort1 = in1, inputParam1 = constant1)

कार्यप्रवाह का निर्माण निम्नलिखित घटकों के इनपुट के लिए घटक उदाहरणों के आउटपुट को निर्दिष्ट करके किया जाता है।

  componentInstance2 = AnotherComponent(inputPort1 = componentInstance1.outputPort1)

घटक उदाहरणों को फलन के रूप में भी धारण किया जा सकता है।

  function MyFunction(InType1 in1, ..., optional InTypeM inM,
                      ParType1 param1, ..., ParTypeP paramP=defaultP)
                      -> (OutType1 out1, ..., OutTypeN outN)
  {
      ... statements ...
      return record(out1=x1, ..., outN=xN)
  }

मानक if-else और स्विच-केस स्टेटमेंट के अतिरिक्त, एंडुरिलस्क्रिप्ट में फॉर-लूप भी सम्मिलित है।

  // Iterates over 1, 2, ..., 10
  array = record()
  for i: std.range(1, 10) {
      array[i] = SomeComponent(k=i)
  }

विस्तारशीलता

एंडुरिल को कई स्तरों पर बढ़ाया जा सकता है। उपयोगकर्ता उपस्थित घटक समूहों में नए घटक जोड़ सकते हैं। चूंकि, यदि नया घटक या घटक ऐसे कार्य करते हैं जो उपस्थित समूहों से संबंधित नहीं हैं, तो उपयोगकर्ता नए समूह भी बना सकते हैं।

मोक्सिसकान

मोक्सिस्कान लोगो का परेशान चेहरा

मोक्सिसकान कैंसर अनुसंधान और आणविक जीव विज्ञान के लिए डेटा एकीकरण फ़्रेमवर्क है।[2] फ्रेमवर्क सम्बंधित डेटाबेस प्रदान करता है जो जीन, प्रोटीन, ड्रग्स, रास्ते, रोग, जैविक प्रक्रियाओं, सेलुलर घटकों और आणविक कार्यों जैसी जैविक संस्थाओं के ग्राफ का प्रतिनिधित्व करता है। इसके अतिरिक्त, इस डेटा के शीर्ष पर विश्लेषण और परिग्रहण उपकरणों का विस्तृत समूह बनाया गया है। इनमें से अधिकांश उपकरण एंडुरिल घटकों और कार्यों के रूप में कार्यान्वित किए जाते हैं।

मोक्सीस्कान का उपयोग मुख्य रूप से जीनोमिक अध्ययनों से प्राप्त कैंसर वृद्धि में सम्मिलित कार्सिनोजेनेसिस सेल प्रकारों की सूचियों की व्याख्या करने के लिए किया जाता है। इसके उपकरणों का उपयोग इनपुट जीन से संबंधित जैविक संस्थाओं के ग्राफ़ उत्पन्न करने के लिए किया जा सकता है। इन ग्राफ़ों का स्थिर निर्धारण दवा लक्ष्य पूर्वानुमानों से लेकर सिग्नलिंग कैस्केड की समय श्रृंखला तक भिन्न हो सकता है। इन उपकरणों के कुछ लक्ष्य सरलता प्रणाली IPA से निकटता से संबंधित हैं।

यह भी देखें

संदर्भ

  1. Ovaska, K.; Laakso, M.; Haapa-Paananen, S.; Louhimo, R.; Chen, P.; Aittomäki, V.; Valo, E.; Núñez-Fontarnau, J.; Rantanen, V.; Karinen, S.; Nousiainen, K.; Lahesmaa-Korpinen, A. M.; Miettinen, M.; Saarinen, L.; Kohonen, P.; Wu, J.; Westermarck, J.; Hautaniemi, S. (2010). "बड़े पैमाने पर डेटा एकीकरण ढांचा ग्लियोब्लास्टोमा मल्टीफॉर्म पर एक व्यापक दृष्टिकोण प्रदान करता है". Genome Medicine. 2 (9): 65. doi:10.1186/gm186. PMC 3092116. PMID 20822536.
  2. Laakso, M.; Hautaniemi, S. (2010). "जीन सेट को नेटवर्क में अनुवाद करने के लिए एकीकृत मंच". Bioinformatics. 26 (14): 1802–1803. doi:10.1093/bioinformatics/btq277. PMID 20507894.

अग्रिम पठन

बाहरी संबंध