केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली
Stable release | 2.5
/ 2015-10-28[1] |
---|---|
Written in | Java |
Operating system | Linux, Mac OS X, Windows |
Type | Scientific workflow system |
License | BSD License |
Website | kepler-project.org |
केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली को डिज़ाइन करने, निष्पादित करने, पुन: उपयोग करने, विकसित करने, संग्रह करने एवं विचारित करने के लिए निःशुल्क सॉफ़्टवेयर प्रणाली है।[2][3][4] केप्लर की सुविधाएं प्रक्रिया एवं डेटा निरीक्षण, उद्गम जानकारी एवं उच्च गति डेटा संचलन प्रदान करती हैं। सामान्य रूप से कार्यप्रवाह, एवं विशेष रूप से वैज्ञानिक कार्यप्रवाह, निर्देशित ग्राफ होते हैं जहां नोड्स भिन्न-भिन्न कम्प्यूटेशनल घटकों का प्रतिनिधित्व करते हैं, एवं किनारे उन पथों का प्रतिनिधित्व करते हैं जिनके साथ डेटा एवं परिणाम घटकों के मध्य प्रवाहित हो सकते हैं।[5] केप्लर में, नोड्स को 'एक्टर' एवं किनारों को 'चैनल' कहा जाता है। केपलर में डेस्कटॉप वातावरण में कार्यप्रवाह की रचना करने के लिए ग्राफिकल यूजर इंटरफ़ेस, जीयूआई के अंदर एवं कमांड-लाइन से स्वतंत्र रूप से कार्यप्रवाह निष्पादित करने के लिए रनटाइम इंजन एवं वितरित कंप्यूटिंग विकल्प सम्मिलित है जो कार्यप्रवाह कार्यों को कंप्यूटर क्लस्टर में कंप्यूट नोड्स के मध्य वितरित करने की अनुमति देता है। या ग्रिड कंप्यूटिंग केप्लर प्रणाली मुख्य रूप से कम्प्यूटेशनल कार्यों को व्यवस्थित करने के लिए कार्यप्रवाह रूपक के उपयोग को लक्षित करती है जो विशेष वैज्ञानिक विश्लेषण एवं मॉडलिंग लक्ष्यों की ओर निर्देशित होते हैं। इस प्रकार, केपलर वैज्ञानिक कार्यप्रवाह सामान्यतः गणनाओं की श्रृंखला में चरण से दूसरे चरण तक डेटा के प्रवाह को मॉडल करते हैं जो कुछ वैज्ञानिक लक्ष्य प्राप्त करते हैं।
वैज्ञानिक कार्यप्रवाह
वैज्ञानिक कार्यप्रवाह डेटा एवं प्रक्रियाओं को विन्यास योग्य, संरचित चरणों के समूह में संयोजित करने की प्रक्रिया है, जो वैज्ञानिक समस्या के लिए अर्ध-स्वचालित कम्प्यूटेशनल समाधान प्रारम्भ करता है। वैज्ञानिक कार्यप्रवाह प्रणालियाँ प्रायः विभिन्न प्रविधियों को संयोजित करने के साथ-साथ उनका उपयोग करने के लिए कुशल प्रविधियों के लिए ग्राफिकल यूजर इंटरफेस प्रदान करती हैं, एवं इस प्रकार वैज्ञानिकों की दक्षता में वृद्धि होती है।
वैज्ञानिक डेटा तक पहुंच
केप्लर वैज्ञानिक डेटा तक सीधी पहुंच प्रदान करता है जिसे सामान्यतः उपयोग किए जाने वाले कई डेटा अभिलेखागार में संग्रहीत किये गए है। उदाहरण के लिए, केपलर नॉलेज नेटवर्क फॉर बायोकॉम्प्लेक्सिटी (केएनबी) मेटाकैट सर्वर में संग्रहीत डेटा तक पहुंच प्रदान करता है[6] एवं पारिस्थितिक मेटाडेटा भाषा का उपयोग करके वर्णन किया गया है। समर्थित अतिरिक्त डेटा स्रोतों में डीआइजीआईआर
प्रोटोकॉल, OPeNDAP प्रोटोकॉल, ग्रिडएफटीपी, जेडीबीसी, भंडारण संसाधन दलाल एवं अन्य का उपयोग करके पहुंच योग्य डेटा सम्मिलित होते है।
संगणना के मॉडल
केपलर कई अन्य जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणालियों से भिन्न है, जिसमें यह कार्यप्रवाह मॉडल की संरचना को उसके गणना मॉडल से भिन्न करता है, जैसे कि कार्यप्रवाह की गणना के लिए विभिन्न मॉडल किसी दिए गए कार्यप्रवाह ग्राफ़ से बंधे हो सकते हैं। केप्लर को टॉलेमी प्रोजेक्ट (कंप्यूटिंग) से गणना के कई सामान्य मॉडल उत्तराधिकार में मिले हैं, जिनमें सिंक्रोनस डेटा फ्लो (एसडीएफ), सतत समय (सीटी), प्रोसेस नेटवर्क (पीएन), एवं डायनेमिक डेटा फ्लो (डीडीएफ) सम्मिलित हैं।
पदानुक्रमित कार्यप्रवाह
केप्लर कार्यप्रवाह में पदानुक्रम का समर्थन करता है, जो जटिल कार्यों को सरल घटकों से बनाने की अनुमति देता है। यह सुविधा कार्यप्रवाह लेखकों को पुन: प्रयोज्य, मॉड्यूलर घटकों का निर्माण करने की अनुमति देती है जिन्हें कई भिन्न-भिन्न कार्यप्रवाह में उपयोग के लिए रखा जा सकता है।
कार्यप्रवाह शब्दार्थ
केप्लर ओन्टोलॉजी (सूचना विज्ञान) से ली गई प्रतिबंधो का उपयोग करके कार्यप्रवाह घटकों की अर्थपूर्ण टिप्पणी के लिए मॉडल प्रदान करता है। ये टिप्पणी कई उन्नत सुविधाओं का समर्थन करते हैं, जिनमें उत्तम शोध क्षमताएं, स्वचालित कार्यप्रवाह सत्यापन एवं उत्तम कार्यप्रवाह संपादन सम्मिलित होता हैं।[7]
कार्यप्रवाह विचारित करना
केप्लर घटकों को कार्यप्रवाह या घटक को केपलर आर्काइव (KAR) फ़ाइल में निर्यात करके विचारित किया जा सकता है, जो जावा से JAR फ़ाइल प्रारूप का विस्तार है। जो KAR फ़ाइल बन जाने के पश्चात, इसे सहकर्मियों को ईमेल किया जा सकता है, वेब साइटों पर विचारित किया जा सकता है, या केपलर कंपोनेंट रिपोजिटरी पर अपलोड किया जा सकता है। कंपोनेंट रिपॉजिटरी केप्लर कार्यप्रवाह को विचारित करने के लिए केंद्रीकृत प्रणाली है जो वेब पोर्टल एवं वेब सेवा अंतरापृष्ठ दोनों के माध्यम से पहुंच योग्य होती है। उपयोगकर्ता सीधे केपलर कार्यप्रवाह कंपोज़िशन जीयूआई के अंदर से रिपॉजिटरी से घटकों का शोध एवं उपयोग कर सकते हैं।
उत्पत्ति
वैज्ञानिक कार्यप्रवाह में प्रोवेंस महत्वपूर्ण अवधारणा है, क्योंकि यह वैज्ञानिकों को उनके परिणामों की उत्पत्ति को समझने, उनके प्रयोगों को दोहराने एवं डेटा उत्पादों को प्राप्त करने के लिए उपयोग की जाने वाली प्रक्रियाओं को मान्य करने की अनुमति देता है।[8] कार्यप्रवाह को पुन: प्रस्तुत करने के लिए, उत्पति की जानकारी अंकित की जानी चाहिए, जो इंगित करती है कि डेटा कहाँ उत्पन्न हुआ, इसे कैसे परिवर्तित किया गया, एवं कौन से घटक एवं कौन से पैरामीटर सेटिंग्स का उपयोग किया गया था। इससे अन्य वैज्ञानिकों को परिणामों की पुष्टि करते हुए प्रयोग को दोबारा करने की अनुमति मिल जाएगी।[9]वर्तमान प्रणालियों में अंतिम उपयोगकर्ताओं को वैज्ञानिक रूप से सार्थक प्रविधियों से उत्पत्ति की जानकारी को क्वेरी करने की अनुमति देने के लिए अधिक अर्घ्य समर्थन उपस्थित होता है, विशेष रूप से जब उन्नत कार्यप्रवाह निष्पादन मॉडल सरल डीएजी (प्रक्रिया नेटवर्क में) से पृथक जाते हैं।[10]
केप्लर इतिहास
केपलर प्रोजेक्ट 2002 में साइंस एनवायरनमेंट फॉर इकोलॉजिकल नॉलेज (SEEK) प्रोजेक्ट के सदस्यों द्वारा बनाया गया था। [4]एवं वैज्ञानिक डेटा प्रबंधन (एसडीएम) परियोजना बनाई गयी। इस परियोजना की स्थापना कैलिफोर्निया विश्वविद्यालय, सांता बारबरा के पारिस्थितिक विश्लेषण एवं संश्लेषण के लिए राष्ट्रीय केंद्र (एनसीईएएस) एवं कैलिफोर्निया विश्वविद्यालय, सैन डिएगो के सैन डिएगो सुपरकंप्यूटर सेंटर के शोधकर्ताओं द्वारा की गई थी। केपलर टॉलेमी II का विस्तार करता है, जो यूसी बर्कले में विकसित समवर्ती, वास्तविक समय, एम्बेडेड प्रणाली के मॉडलिंग, सिमुलेशन एवं डिजाइन के लिए सॉफ्टवेयर प्रणाली है। केप्लर पर सहयोग तीव्रता से बढ़ा क्योंकि विभिन्न वैज्ञानिक विषयों के सदस्यों ने विश्लेषण एवं मॉडलिंग के लिए वैज्ञानिक कार्यप्रवाह के लाभों का अनुभव किया एवं प्रणाली में योगदान देना प्रारम्भ कर दिया। 2008 तक, केपलर सहयोगी कई विज्ञान विषयों से आते हैं, जिनमें पारिस्थितिकी, आणविक जीव विज्ञान, आनुवंशिकी, भौतिकी, रसायन विज्ञान, संरक्षण विज्ञान, समुद्र विज्ञान, जल विज्ञान, पुस्तकालय विज्ञान, कंप्यूटर विज्ञान एवं अन्य सम्मिलित हैं। केप्लर कार्यप्रवाह ऑर्केस्ट्रेशन इंजन है जिसका उपयोग एक्टर के रूप में कार्य को अधिक सरल बनाने के लिए किया जाता है।
यह भी देखें
- अपाचे टवेर्ना
- डिस्कवरी नेट
- विज़ट्रेल्स
- लोनी पाइपलाइन
- जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणाली
- डेटाऑन अन्वेषक टूलकिट
संदर्भ
- ↑ "Archived copy". Archived from the original on 2015-11-20. Retrieved 2015-11-19.
{{cite web}}
: CS1 maint: archived copy as title (link) - ↑ Ludäscher B., Altintas I., Berkley C., Higgins D., Jaeger-Frank E., Jones M., Lee E., Tao J., Zhao Y. 2006. Scientific Workflow Management and the Kepler System. Special Issue: Workflow in Grid Systems. Concurrency and Computation: Practice & Experience 18(10): 1039-1065.
- ↑ Altintas I, Berkley C, Jaeger E, Jones M, Ludäscher B, Mock S. 2004. Kepler: An Extensible System for Design and Execution of Scientific Workflows. Proceedings of the Future of Grid Data Environments, Global Grid Forum 10.
- ↑ 4.0 4.1 Michener, William K., James H. Beach, Matthew B. Jones, Bertram Ludaescher, Deana D. Pennington, Ricardo S. Pereira, Arcot Rajasekar, and Mark Schildhauer. 2007. "A Knowledge Environment for the Biodiversity and Ecological Sciences", Journal of Intelligent Information Systems, 29(1): 111-126. doi:10.1007/s10844-006-0034-8
- ↑ Taylor, I.J.; Deelman, E.; Gannon, D.B.; Shields, M. (Eds.), “Workflows for e-Science: Scientific Workflows for Grids”, 530 p., Springer. ISBN 978-1-84628-519-6.
- ↑ Jones, Matthew B., C. Berkley, J. Bojilova, M. Schildhauer. 2001. Managing Scientific Metadata. IEEE Internet Computing 5 (5): 59-68.
- ↑ Berkley, Chad, Shawn Bowers, Matthew B. Jones, Bertram Ludaescher, Mark Schildhauer, Jing Tao. 2005. Incorporating Semantics in Scientific Workflow Authoring. 17th International Conference on Scientific and Statistical Database Management. IEEE Computer Society.
- ↑ "WebHome < Challenge < TWiki". Archived from the original on 2008-07-06. Retrieved 2009-04-06.
- ↑ Barker, A.; van Hemert, J (2008). "Scientific Workflow: A Survey and Research Directions". Parallel Processing and Applied Mathematics. PPAM 2007. Lecture Notes in Computer Science. 4967. doi:10.1007/978-3-540-68111-3_78.
- ↑ Shawn Bowers, Timothy McPhillips, Bertram Ludascher, Shirley Cohen, Susan B. Davidson 2006. A Model for User-Oriented Data Provenance in Pipelined Scientific Workflows.