केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 11: Line 11:
  |website = [https://kepler-project.org/ kepler-project.org]
  |website = [https://kepler-project.org/ kepler-project.org]
}}
}}
केप्लर वैज्ञानिक वर्कफ़्लो प्रणाली को डिज़ाइन करने, निष्पादित करने, पुन: उपयोग करने, विकसित करने, संग्रह करने और साझा करने के लिए निःशुल्क सॉफ़्टवेयर प्रणाली है।<ref name="LAB06">Ludäscher B., Altintas I., Berkley C., Higgins D., Jaeger-Frank E., Jones M., Lee E., Tao J., Zhao Y. 2006. Scientific Workflow Management and the Kepler System. Special Issue: Workflow in Grid Systems.  Concurrency and Computation: Practice & Experience 18(10): 1039-1065.</ref><ref name="ABJ04">Altintas I, Berkley C, Jaeger E, Jones M, Ludäscher B, Mock S. 2004. Kepler: An Extensible System for Design and Execution of Scientific Workflows. Proceedings of the Future of Grid Data Environments, Global Grid Forum 10.</ref><ref name="MBJ07">Michener, William K., James H. Beach, Matthew B. Jones, Bertram Ludaescher, Deana D. Pennington, Ricardo S. Pereira, Arcot Rajasekar, and Mark Schildhauer. 2007. "A Knowledge Environment for the Biodiversity and Ecological Sciences", Journal of Intelligent Information Systems, 29(1): 111-126. {{doi|10.1007/s10844-006-0034-8}}</ref>
'''केप्लर''' '''वैज्ञानिक कार्यप्रवाह प्रणाली''' को डिज़ाइन करने, निष्पादित करने, पुन: उपयोग करने, विकसित करने, संग्रह करने एवं विचारित करने के लिए निःशुल्क सॉफ़्टवेयर प्रणाली है।<ref name="LAB06">Ludäscher B., Altintas I., Berkley C., Higgins D., Jaeger-Frank E., Jones M., Lee E., Tao J., Zhao Y. 2006. Scientific Workflow Management and the Kepler System. Special Issue: Workflow in Grid Systems.  Concurrency and Computation: Practice & Experience 18(10): 1039-1065.</ref><ref name="ABJ04">Altintas I, Berkley C, Jaeger E, Jones M, Ludäscher B, Mock S. 2004. Kepler: An Extensible System for Design and Execution of Scientific Workflows. Proceedings of the Future of Grid Data Environments, Global Grid Forum 10.</ref><ref name="MBJ07">Michener, William K., James H. Beach, Matthew B. Jones, Bertram Ludaescher, Deana D. Pennington, Ricardo S. Pereira, Arcot Rajasekar, and Mark Schildhauer. 2007. "A Knowledge Environment for the Biodiversity and Ecological Sciences", Journal of Intelligent Information Systems, 29(1): 111-126. {{doi|10.1007/s10844-006-0034-8}}</ref> केप्लर की सुविधाएं प्रक्रिया एवं डेटा निरीक्षण, ​​उद्गम जानकारी एवं उच्च गति डेटा संचलन प्रदान करती हैं। सामान्य रूप से कार्यप्रवाह, एवं विशेष रूप से वैज्ञानिक कार्यप्रवाह, [[निर्देशित ग्राफ]] होते हैं जहां नोड्स भिन्न-भिन्न कम्प्यूटेशनल घटकों का प्रतिनिधित्व करते हैं, एवं किनारे उन पथों का प्रतिनिधित्व करते हैं जिनके साथ डेटा एवं परिणाम घटकों के मध्य प्रवाहित हो सकते हैं।<ref name="TDG06">Taylor, I.J.; [[Ewa Deelman|Deelman, E.]]; Gannon, D.B.; Shields, M. (Eds.), “Workflows for e-Science: Scientific Workflows for Grids”,  530 p., Springer. {{ISBN|978-1-84628-519-6}}.</ref> केप्लर में, नोड्स को 'एक्टर' एवं किनारों को 'चैनल' कहा जाता है। केपलर में डेस्कटॉप वातावरण में कार्यप्रवाह की रचना करने के लिए  ग्राफिकल यूजर इंटरफ़ेस, जीयूआई के अंदर एवं कमांड-लाइन से स्वतंत्र रूप से कार्यप्रवाह निष्पादित करने के लिए  रनटाइम इंजन एवं वितरित कंप्यूटिंग विकल्प सम्मिलित है जो कार्यप्रवाह कार्यों को [[कंप्यूटर क्लस्टर]] में कंप्यूट नोड्स के मध्य वितरित करने की अनुमति देता है। या [[ग्रिड कंप्यूटिंग]] केप्लर प्रणाली मुख्य रूप से कम्प्यूटेशनल कार्यों को व्यवस्थित करने के लिए कार्यप्रवाह रूपक के उपयोग को लक्षित करती है जो विशेष वैज्ञानिक विश्लेषण एवं मॉडलिंग लक्ष्यों की ओर निर्देशित होते हैं। इस प्रकार, केपलर वैज्ञानिक कार्यप्रवाह सामान्यतः गणनाओं की श्रृंखला में  चरण से दूसरे चरण तक डेटा के प्रवाह को मॉडल करते हैं जो कुछ वैज्ञानिक लक्ष्य प्राप्त करते हैं।
केप्लर की सुविधाएं प्रक्रिया और डेटा निगरानी, ​​उद्गम जानकारी और उच्च गति डेटा संचलन प्रदान करती हैं। सामान्य रूप से वर्कफ़्लो, और विशेष रूप से वैज्ञानिक वर्कफ़्लो, [[निर्देशित ग्राफ]]होते हैं जहां नोड्स अलग-अलग कम्प्यूटेशनल घटकों का प्रतिनिधित्व करते हैं, और किनारे उन पथों का प्रतिनिधित्व करते हैं जिनके साथ डेटा और परिणाम घटकों के बीच प्रवाहित हो सकते हैं।<ref name="TDG06">Taylor, I.J.; [[Ewa Deelman|Deelman, E.]]; Gannon, D.B.; Shields, M. (Eds.), “Workflows for e-Science: Scientific Workflows for Grids”,  530 p., Springer. {{ISBN|978-1-84628-519-6}}.</ref>
केप्लर में, नोड्स को '्टर' और किनारों को 'चैनल' कहा जाता है। केपलर में डेस्कटॉप वातावरण में वर्कफ़्लोज़ की रचना करने के लिए  ग्राफिकल यूजर इंटरफ़ेस, जीयूआई के भीतर और कमांड-लाइन से स्वतंत्र रूप से वर्कफ़्लो निष्पादित करने के लिए  रनटाइम इंजन और वितरित कंप्यूटिंग विकल्प शामिल है जो वर्कफ़्लो कार्यों को [[कंप्यूटर क्लस्टर]] में कंप्यूट नोड्स के बीच वितरित करने की अनुमति देता है। या [[ग्रिड कंप्यूटिंग]]केप्लर प्रणाली मुख्य रूप से कम्प्यूटेशनल कार्यों को व्यवस्थित करने के लिए वर्कफ़्लो रूपक के उपयोग को लक्षित करती है जो विशेष वैज्ञानिक विश्लेषण और मॉडलिंग लक्ष्यों की ओर निर्देशित होते हैं। इस प्रकार, केपलर वैज्ञानिक वर्कफ़्लो आम तौर पर गणनाओं की श्रृंखला में  चरण से दूसरे चरण तक डेटा के प्रवाह को मॉडल करते हैं जो कुछ वैज्ञानिक लक्ष्य प्राप्त करते हैं।


== वैज्ञानिक कार्यप्रवाह ==
== वैज्ञानिक कार्यप्रवाह ==
वैज्ञानिक वर्कफ़्लो डेटा और प्रक्रियाओं को  विन्यास योग्य, संरचित चरणों के सेट में संयोजित करने की प्रक्रिया है जो  वैज्ञानिक समस्या के लिए अर्ध-स्वचालित कम्प्यूटेशनल समाधान लागू करता है। वैज्ञानिक वर्कफ़्लो प्रणालियाँ अक्सर विभिन्न तकनीकों को संयोजित करने के साथ-साथ उनका उपयोग करने के लिए कुशल तरीकों के लिए ग्राफिकल यूजर इंटरफेस प्रदान करती हैं, और इस प्रकार वैज्ञानिकों की दक्षता में वृद्धि होती है।
वैज्ञानिक कार्यप्रवाह डेटा एवं प्रक्रियाओं को  विन्यास योग्य, संरचित चरणों के सेट में संयोजित करने की प्रक्रिया है जो  वैज्ञानिक समस्या के लिए अर्ध-स्वचालित कम्प्यूटेशनल समाधान लागू करता है। वैज्ञानिक कार्यप्रवाह प्रणालियाँ अक्सर विभिन्न तकनीकों को संयोजित करने के साथ-साथ उनका उपयोग करने के लिए कुशल तरीकों के लिए ग्राफिकल यूजर इंटरफेस प्रदान करती हैं, एवं इस प्रकार वैज्ञानिकों की दक्षता में वृद्धि होती है।


== वैज्ञानिक डेटा तक पहुंच ==
== वैज्ञानिक डेटा तक पहुंच ==
केप्लर वैज्ञानिक डेटा तक सीधी पहुंच प्रदान करता है जिसे आमतौर पर उपयोग किए जाने वाले कई डेटा अभिलेखागार में संग्रहीत किया गया है। उदाहरण के लिए, केपलर नॉलेज नेटवर्क फॉर बायोकॉम्प्लेक्सिटी (केएनबी) मेटाकैट सर्वर में संग्रहीत डेटा तक पहुंच प्रदान करता है<ref name="JBB01">Jones, Matthew B., C. Berkley, J. Bojilova, M. Schildhauer. 2001.  Managing Scientific Metadata.  IEEE Internet Computing 5 (5): 59-68.</ref> और [[पारिस्थितिक मेटाडेटा भाषा]] का उपयोग करके वर्णन किया गया है। समर्थित अतिरिक्त डेटा स्रोतों में DiGIR प्रोटोकॉल, [[OPeNDAP]] प्रोटोकॉल, ग्रिडएफटीपी, [[जेडीबीसी]], [[ भंडारण संसाधन दलाल ]] और अन्य का उपयोग करके पहुंच योग्य डेटा शामिल है।
केप्लर वैज्ञानिक डेटा तक सीधी पहुंच प्रदान करता है जिसे आमतौर पर उपयोग किए जाने वाले कई डेटा अभिलेखागार में संग्रहीत किया गया है। उदाहरण के लिए, केपलर नॉलेज नेटवर्क फॉर बायोकॉम्प्लेक्सिटी (केएनबी) मेटाकैट सर्वर में संग्रहीत डेटा तक पहुंच प्रदान करता है<ref name="JBB01">Jones, Matthew B., C. Berkley, J. Bojilova, M. Schildhauer. 2001.  Managing Scientific Metadata.  IEEE Internet Computing 5 (5): 59-68.</ref> एवं [[पारिस्थितिक मेटाडेटा भाषा]] का उपयोग करके वर्णन किया गया है। समर्थित अतिरिक्त डेटा स्रोतों में DiGIR प्रोटोकॉल, [[OPeNDAP]] प्रोटोकॉल, ग्रिडएफटीपी, [[जेडीबीसी]], [[ भंडारण संसाधन दलाल ]] एवं अन्य का उपयोग करके पहुंच योग्य डेटा सम्मिलित है।


== संगणना के मॉडल ==
== संगणना के मॉडल ==
केपलर कई अन्य जैव सूचना विज्ञान वर्कफ़्लो प्रबंधन प्रणालियों से भिन्न है, जिसमें यह वर्कफ़्लो मॉडल की संरचना को उसके गणना मॉडल से अलग करता है, जैसे कि वर्कफ़्लो की गणना के लिए विभिन्न मॉडल किसी दिए गए वर्कफ़्लो ग्राफ़ से बंधे हो सकते हैं। केप्लर को [[टॉलेमी प्रोजेक्ट (कंप्यूटिंग)]] से गणना के कई सामान्य मॉडल विरासत में मिले हैं, जिनमें सिंक्रोनस डेटा फ्लो (एसडीएफ), सतत समय (सीटी), प्रोसेस नेटवर्क (पीएन), और डायनेमिक डेटा फ्लो (डीडीएफ) शामिल हैं।
केपलर कई अन्य जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणालियों से भिन्न है, जिसमें यह कार्यप्रवाह मॉडल की संरचना को उसके गणना मॉडल से भिन्न करता है, जैसे कि कार्यप्रवाह की गणना के लिए विभिन्न मॉडल किसी दिए गए कार्यप्रवाह ग्राफ़ से बंधे हो सकते हैं। केप्लर को [[टॉलेमी प्रोजेक्ट (कंप्यूटिंग)]] से गणना के कई सामान्य मॉडल विरासत में मिले हैं, जिनमें सिंक्रोनस डेटा फ्लो (एसडीएफ), सतत समय (सीटी), प्रोसेस नेटवर्क (पीएन), एवं डायनेमिक डेटा फ्लो (डीडीएफ) सम्मिलित हैं।


== पदानुक्रमित वर्कफ़्लो ==
== पदानुक्रमित कार्यप्रवाह ==
केप्लर वर्कफ़्लोज़ में पदानुक्रम का समर्थन करता है, जो जटिल कार्यों को सरल घटकों से बनाने की अनुमति देता है। यह सुविधा वर्कफ़्लो लेखकों को पुन: प्रयोज्य, मॉड्यूलर घटकों का निर्माण करने की अनुमति देती है जिन्हें कई अलग-अलग वर्कफ़्लो में उपयोग के लिए सहेजा जा सकता है।
केप्लर कार्यप्रवाहज़ में पदानुक्रम का समर्थन करता है, जो जटिल कार्यों को सरल घटकों से बनाने की अनुमति देता है। यह सुविधा कार्यप्रवाह लेखकों को पुन: प्रयोज्य, मॉड्यूलर घटकों का निर्माण करने की अनुमति देती है जिन्हें कई भिन्न-भिन्न कार्यप्रवाह में उपयोग के लिए सहेजा जा सकता है।


== वर्कफ़्लो शब्दार्थ ==
== कार्यप्रवाह शब्दार्थ ==
केप्लर ओन्टोलॉजी (सूचना विज्ञान) से ली गई शर्तों का उपयोग करके वर्कफ़्लो घटकों के अर्थपूर्ण एनोटेशन के लिए  मॉडल प्रदान करता है। ये एनोटेशन कई उन्नत सुविधाओं का समर्थन करते हैं, जिनमें बेहतर खोज क्षमताएं, स्वचालित वर्कफ़्लो सत्यापन और बेहतर वर्कफ़्लो संपादन शामिल हैं।<ref name="BBJ05">Berkley, Chad, Shawn Bowers, Matthew B. Jones, Bertram Ludaescher, Mark Schildhauer, Jing Tao. 2005. Incorporating Semantics in Scientific Workflow Authoring. 17th International Conference on Scientific and Statistical Database Management.  IEEE Computer Society.</ref>
केप्लर ओन्टोलॉजी (सूचना विज्ञान) से ली गई शर्तों का उपयोग करके कार्यप्रवाह घटकों के अर्थपूर्ण एनोटेशन के लिए  मॉडल प्रदान करता है। ये एनोटेशन कई उन्नत सुविधाओं का समर्थन करते हैं, जिनमें बेहतर खोज क्षमताएं, स्वचालित कार्यप्रवाह सत्यापन एवं बेहतर कार्यप्रवाह संपादन सम्मिलित हैं।<ref name="BBJ05">Berkley, Chad, Shawn Bowers, Matthew B. Jones, Bertram Ludaescher, Mark Schildhauer, Jing Tao. 2005. Incorporating Semantics in Scientific Workflow Authoring. 17th International Conference on Scientific and Statistical Database Management.  IEEE Computer Society.</ref>


== वर्कफ़्लो साझा करना ==
== कार्यप्रवाह विचारित करना ==
केप्लर घटकों को वर्कफ़्लो या घटक को केपलर आर्काइव (KAR) फ़ाइल में निर्यात करके साझा किया जा सकता है, जो जावा से JAR फ़ाइल प्रारूप का विस्तार है।  बार KAR फ़ाइल बन जाने के बाद, इसे सहकर्मियों को ईमेल किया जा सकता है, वेब साइटों पर साझा किया जा सकता है, या केपलर कंपोनेंट रिपोजिटरी पर अपलोड किया जा सकता है। कंपोनेंट रिपॉजिटरी केप्लर वर्कफ़्लो को साझा करने के लिए केंद्रीकृत प्रणाली है जो वेब पोर्टल और [[वेब सेवा]] इंटरफ़ेस दोनों के माध्यम से पहुंच योग्य है। उपयोगकर्ता सीधे केपलर वर्कफ़्लो कंपोज़िशन जीयूआई के भीतर से रिपॉजिटरी से घटकों को खोज और उपयोग कर सकते हैं।
केप्लर घटकों को कार्यप्रवाह या घटक को केपलर आर्काइव (KAR) फ़ाइल में निर्यात करके विचारित किया जा सकता है, जो जावा से JAR फ़ाइल प्रारूप का विस्तार है।  बार KAR फ़ाइल बन जाने के बाद, इसे सहकर्मियों को ईमेल किया जा सकता है, वेब साइटों पर विचारित किया जा सकता है, या केपलर कंपोनेंट रिपोजिटरी पर अपलोड किया जा सकता है। कंपोनेंट रिपॉजिटरी केप्लर कार्यप्रवाह को विचारित करने के लिए केंद्रीकृत प्रणाली है जो वेब पोर्टल एवं [[वेब सेवा]] इंटरफ़ेस दोनों के माध्यम से पहुंच योग्य है। उपयोगकर्ता सीधे केपलर कार्यप्रवाह कंपोज़िशन जीयूआई के अंदर से रिपॉजिटरी से घटकों को खोज एवं उपयोग कर सकते हैं।


== उद्गम ==
== उद्गम ==
वैज्ञानिक वर्कफ़्लो में प्रोवेंस  महत्वपूर्ण अवधारणा है, क्योंकि यह वैज्ञानिकों को उनके परिणामों की उत्पत्ति को समझने, उनके प्रयोगों को दोहराने और डेटा उत्पादों को प्राप्त करने के लिए उपयोग की जाने वाली प्रक्रियाओं को मान्य करने की अनुमति देता है।<ref name="prov1">{{Cite web |url=http://twiki.ipaw.info/bin/view/Challenge/WebHome |title=WebHome < Challenge < TWiki |access-date=2009-04-06 |archive-date=2008-07-06 |archive-url=https://web.archive.org/web/20080706052044/http://twiki.ipaw.info/bin/view/Challenge/WebHome |url-status=dead }}</ref> वर्कफ़्लो को पुन: प्रस्तुत करने के लिए, उद्गम जानकारी दर्ज की जानी चाहिए जो इंगित करती है कि डेटा कहाँ उत्पन्न हुआ, इसे कैसे बदला गया, और कौन से घटक और कौन से पैरामीटर सेटिंग्स का उपयोग किया गया था। इससे अन्य वैज्ञानिकों को परिणामों की पुष्टि करते हुए प्रयोग को दोबारा करने की अनुमति मिल जाएगी।<ref name="prov2">{{cite journal |author1=Barker, A. |author2=van Hemert, J |title=Scientific Workflow: A Survey and Research Directions |journal=Parallel Processing and Applied Mathematics. PPAM 2007. Lecture Notes in Computer Science |year=2008 |volume=4967 |doi=10.1007/978-3-540-68111-3_78}}</ref>
वैज्ञानिक कार्यप्रवाह में प्रोवेंस  महत्वपूर्ण अवधारणा है, क्योंकि यह वैज्ञानिकों को उनके परिणामों की उत्पत्ति को समझने, उनके प्रयोगों को दोहराने एवं डेटा उत्पादों को प्राप्त करने के लिए उपयोग की जाने वाली प्रक्रियाओं को मान्य करने की अनुमति देता है।<ref name="prov1">{{Cite web |url=http://twiki.ipaw.info/bin/view/Challenge/WebHome |title=WebHome < Challenge < TWiki |access-date=2009-04-06 |archive-date=2008-07-06 |archive-url=https://web.archive.org/web/20080706052044/http://twiki.ipaw.info/bin/view/Challenge/WebHome |url-status=dead }}</ref> कार्यप्रवाह को पुन: प्रस्तुत करने के लिए, उद्गम जानकारी दर्ज की जानी चाहिए जो इंगित करती है कि डेटा कहाँ उत्पन्न हुआ, इसे कैसे बदला गया, एवं कौन से घटक एवं कौन से पैरामीटर सेटिंग्स का उपयोग किया गया था। इससे अन्य वैज्ञानिकों को परिणामों की पुष्टि करते हुए प्रयोग को दोबारा करने की अनुमति मिल जाएगी।<ref name="prov2">{{cite journal |author1=Barker, A. |author2=van Hemert, J |title=Scientific Workflow: A Survey and Research Directions |journal=Parallel Processing and Applied Mathematics. PPAM 2007. Lecture Notes in Computer Science |year=2008 |volume=4967 |doi=10.1007/978-3-540-68111-3_78}}</ref>
वर्तमान प्रणालियों में अंतिम उपयोगकर्ताओं को वैज्ञानिक रूप से सार्थक तरीकों से उद्गम जानकारी को क्वेरी करने की अनुमति देने के लिए बहुत कम समर्थन मौजूद है, विशेष रूप से जब उन्नत वर्कफ़्लो निष्पादन मॉडल सरल डीएजी (प्रक्रिया नेटवर्क में) से परे जाते हैं।<ref name="prov3">Shawn Bowers, Timothy McPhillips, Bertram Ludascher, Shirley Cohen, Susan B. Davidson 2006. A [http://repository.upenn.edu/cgi/viewcontent.cgi?article=1307&context=cis_papers Model for User-Oriented Data Provenance in Pipelined Scientific Workflows.]</ref>
वर्तमान प्रणालियों में अंतिम उपयोगकर्ताओं को वैज्ञानिक रूप से सार्थक तरीकों से उद्गम जानकारी को क्वेरी करने की अनुमति देने के लिए बहुत कम समर्थन मौजूद है, विशेष रूप से जब उन्नत कार्यप्रवाह निष्पादन मॉडल सरल डीएजी (प्रक्रिया नेटवर्क में) से परे जाते हैं।<ref name="prov3">Shawn Bowers, Timothy McPhillips, Bertram Ludascher, Shirley Cohen, Susan B. Davidson 2006. A [http://repository.upenn.edu/cgi/viewcontent.cgi?article=1307&context=cis_papers Model for User-Oriented Data Provenance in Pipelined Scientific Workflows.]</ref>


== केप्लर इतिहास ==
== केप्लर इतिहास ==
केपलर प्रोजेक्ट 2002 में साइंस एनवायरनमेंट फॉर इकोलॉजिकल नॉलेज (SEEK) प्रोजेक्ट के सदस्यों द्वारा बनाया गया था। <ref  name="MBJ07"/>और वैज्ञानिक डेटा प्रबंधन (एसडीएम) परियोजना। इस परियोजना की स्थापना कैलिफोर्निया विश्वविद्यालय, सांता बारबरा के [[पारिस्थितिक विश्लेषण और संश्लेषण के लिए राष्ट्रीय केंद्र]] (एनसीईएएस) और कैलिफोर्निया विश्वविद्यालय, सैन डिएगो के [[सैन डिएगो सुपरकंप्यूटर सेंटर]] के शोधकर्ताओं द्वारा की गई थी। केपलर टॉलेमी II का विस्तार करता है, जो यूसी बर्कले में विकसित समवर्ती, वास्तविक समय, एम्बेडेड सिस्टम के मॉडलिंग, सिमुलेशन और डिजाइन के लिए  सॉफ्टवेयर प्रणाली है। केप्लर पर सहयोग तेजी से बढ़ा क्योंकि विभिन्न वैज्ञानिक विषयों के सदस्यों ने विश्लेषण और मॉडलिंग के लिए वैज्ञानिक वर्कफ़्लो के लाभों को महसूस किया और सिस्टम में योगदान देना शुरू कर दिया। 2008 तक, केपलर सहयोगी कई विज्ञान विषयों से आते हैं, जिनमें पारिस्थितिकी, आणविक जीव विज्ञान, आनुवंशिकी, भौतिकी, रसायन विज्ञान, संरक्षण विज्ञान, समुद्र विज्ञान, जल विज्ञान, पुस्तकालय विज्ञान, कंप्यूटर विज्ञान और अन्य शामिल हैं।
केपलर प्रोजेक्ट 2002 में साइंस एनवायरनमेंट फॉर इकोलॉजिकल नॉलेज (SEEK) प्रोजेक्ट के सदस्यों द्वारा बनाया गया था। <ref  name="MBJ07"/>एवं वैज्ञानिक डेटा प्रबंधन (एसडीएम) परियोजना। इस परियोजना की स्थापना कैलिफोर्निया विश्वविद्यालय, सांता बारबरा के [[पारिस्थितिक विश्लेषण और संश्लेषण के लिए राष्ट्रीय केंद्र|पारिस्थितिक विश्लेषण एवं संश्लेषण के लिए राष्ट्रीय केंद्र]] (एनसीईएएस) एवं कैलिफोर्निया विश्वविद्यालय, सैन डिएगो के [[सैन डिएगो सुपरकंप्यूटर सेंटर]] के शोधकर्ताओं द्वारा की गई थी। केपलर टॉलेमी II का विस्तार करता है, जो यूसी बर्कले में विकसित समवर्ती, वास्तविक समय, एम्बेडेड सिस्टम के मॉडलिंग, सिमुलेशन एवं डिजाइन के लिए  सॉफ्टवेयर प्रणाली है। केप्लर पर सहयोग तेजी से बढ़ा क्योंकि विभिन्न वैज्ञानिक विषयों के सदस्यों ने विश्लेषण एवं मॉडलिंग के लिए वैज्ञानिक कार्यप्रवाह के लाभों को महसूस किया एवं सिस्टम में योगदान देना शुरू कर दिया। 2008 तक, केपलर सहयोगी कई विज्ञान विषयों से आते हैं, जिनमें पारिस्थितिकी, आणविक जीव विज्ञान, आनुवंशिकी, भौतिकी, रसायन विज्ञान, संरक्षण विज्ञान, समुद्र विज्ञान, जल विज्ञान, पुस्तकालय विज्ञान, कंप्यूटर विज्ञान एवं अन्य सम्मिलित हैं।
केप्लर  वर्कफ़्लो ऑर्केस्ट्रेशन इंजन है जिसका उपयोग ्टर के रूप में कार्य को अधिक आसान बनाने के लिए किया जाता है।
केप्लर  कार्यप्रवाह ऑर्केस्ट्रेशन इंजन है जिसका उपयोग ्टर के रूप में कार्य को अधिक आसान बनाने के लिए किया जाता है।


== यह भी देखें ==
== यह भी देखें ==
Line 47: Line 45:
*[[विज़ट्रेल्स]]
*[[विज़ट्रेल्स]]
* [[लोनी पाइपलाइन]]
* [[लोनी पाइपलाइन]]
* जैव सूचना विज्ञान वर्कफ़्लो प्रबंधन प्रणाली
* जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणाली
* डेटाऑन अन्वेषक टूलकिट
* डेटाऑन अन्वेषक टूलकिट



Revision as of 14:09, 15 July 2023

Kepler Scientific Workflow System
Stable release
2.5 / 2015-10-28[1]
Written inJava
Operating systemLinux, Mac OS X, Windows
TypeScientific workflow system
LicenseBSD License
Websitekepler-project.org

केप्लर वैज्ञानिक कार्यप्रवाह प्रणाली को डिज़ाइन करने, निष्पादित करने, पुन: उपयोग करने, विकसित करने, संग्रह करने एवं विचारित करने के लिए निःशुल्क सॉफ़्टवेयर प्रणाली है।[2][3][4] केप्लर की सुविधाएं प्रक्रिया एवं डेटा निरीक्षण, ​​उद्गम जानकारी एवं उच्च गति डेटा संचलन प्रदान करती हैं। सामान्य रूप से कार्यप्रवाह, एवं विशेष रूप से वैज्ञानिक कार्यप्रवाह, निर्देशित ग्राफ होते हैं जहां नोड्स भिन्न-भिन्न कम्प्यूटेशनल घटकों का प्रतिनिधित्व करते हैं, एवं किनारे उन पथों का प्रतिनिधित्व करते हैं जिनके साथ डेटा एवं परिणाम घटकों के मध्य प्रवाहित हो सकते हैं।[5] केप्लर में, नोड्स को 'एक्टर' एवं किनारों को 'चैनल' कहा जाता है। केपलर में डेस्कटॉप वातावरण में कार्यप्रवाह की रचना करने के लिए ग्राफिकल यूजर इंटरफ़ेस, जीयूआई के अंदर एवं कमांड-लाइन से स्वतंत्र रूप से कार्यप्रवाह निष्पादित करने के लिए रनटाइम इंजन एवं वितरित कंप्यूटिंग विकल्प सम्मिलित है जो कार्यप्रवाह कार्यों को कंप्यूटर क्लस्टर में कंप्यूट नोड्स के मध्य वितरित करने की अनुमति देता है। या ग्रिड कंप्यूटिंग केप्लर प्रणाली मुख्य रूप से कम्प्यूटेशनल कार्यों को व्यवस्थित करने के लिए कार्यप्रवाह रूपक के उपयोग को लक्षित करती है जो विशेष वैज्ञानिक विश्लेषण एवं मॉडलिंग लक्ष्यों की ओर निर्देशित होते हैं। इस प्रकार, केपलर वैज्ञानिक कार्यप्रवाह सामान्यतः गणनाओं की श्रृंखला में चरण से दूसरे चरण तक डेटा के प्रवाह को मॉडल करते हैं जो कुछ वैज्ञानिक लक्ष्य प्राप्त करते हैं।

वैज्ञानिक कार्यप्रवाह

वैज्ञानिक कार्यप्रवाह डेटा एवं प्रक्रियाओं को विन्यास योग्य, संरचित चरणों के सेट में संयोजित करने की प्रक्रिया है जो वैज्ञानिक समस्या के लिए अर्ध-स्वचालित कम्प्यूटेशनल समाधान लागू करता है। वैज्ञानिक कार्यप्रवाह प्रणालियाँ अक्सर विभिन्न तकनीकों को संयोजित करने के साथ-साथ उनका उपयोग करने के लिए कुशल तरीकों के लिए ग्राफिकल यूजर इंटरफेस प्रदान करती हैं, एवं इस प्रकार वैज्ञानिकों की दक्षता में वृद्धि होती है।

वैज्ञानिक डेटा तक पहुंच

केप्लर वैज्ञानिक डेटा तक सीधी पहुंच प्रदान करता है जिसे आमतौर पर उपयोग किए जाने वाले कई डेटा अभिलेखागार में संग्रहीत किया गया है। उदाहरण के लिए, केपलर नॉलेज नेटवर्क फॉर बायोकॉम्प्लेक्सिटी (केएनबी) मेटाकैट सर्वर में संग्रहीत डेटा तक पहुंच प्रदान करता है[6] एवं पारिस्थितिक मेटाडेटा भाषा का उपयोग करके वर्णन किया गया है। समर्थित अतिरिक्त डेटा स्रोतों में DiGIR प्रोटोकॉल, OPeNDAP प्रोटोकॉल, ग्रिडएफटीपी, जेडीबीसी, भंडारण संसाधन दलाल एवं अन्य का उपयोग करके पहुंच योग्य डेटा सम्मिलित है।

संगणना के मॉडल

केपलर कई अन्य जैव सूचना विज्ञान कार्यप्रवाह प्रबंधन प्रणालियों से भिन्न है, जिसमें यह कार्यप्रवाह मॉडल की संरचना को उसके गणना मॉडल से भिन्न करता है, जैसे कि कार्यप्रवाह की गणना के लिए विभिन्न मॉडल किसी दिए गए कार्यप्रवाह ग्राफ़ से बंधे हो सकते हैं। केप्लर को टॉलेमी प्रोजेक्ट (कंप्यूटिंग) से गणना के कई सामान्य मॉडल विरासत में मिले हैं, जिनमें सिंक्रोनस डेटा फ्लो (एसडीएफ), सतत समय (सीटी), प्रोसेस नेटवर्क (पीएन), एवं डायनेमिक डेटा फ्लो (डीडीएफ) सम्मिलित हैं।

पदानुक्रमित कार्यप्रवाह

केप्लर कार्यप्रवाहज़ में पदानुक्रम का समर्थन करता है, जो जटिल कार्यों को सरल घटकों से बनाने की अनुमति देता है। यह सुविधा कार्यप्रवाह लेखकों को पुन: प्रयोज्य, मॉड्यूलर घटकों का निर्माण करने की अनुमति देती है जिन्हें कई भिन्न-भिन्न कार्यप्रवाह में उपयोग के लिए सहेजा जा सकता है।

कार्यप्रवाह शब्दार्थ

केप्लर ओन्टोलॉजी (सूचना विज्ञान) से ली गई शर्तों का उपयोग करके कार्यप्रवाह घटकों के अर्थपूर्ण एनोटेशन के लिए मॉडल प्रदान करता है। ये एनोटेशन कई उन्नत सुविधाओं का समर्थन करते हैं, जिनमें बेहतर खोज क्षमताएं, स्वचालित कार्यप्रवाह सत्यापन एवं बेहतर कार्यप्रवाह संपादन सम्मिलित हैं।[7]

कार्यप्रवाह विचारित करना

केप्लर घटकों को कार्यप्रवाह या घटक को केपलर आर्काइव (KAR) फ़ाइल में निर्यात करके विचारित किया जा सकता है, जो जावा से JAR फ़ाइल प्रारूप का विस्तार है। बार KAR फ़ाइल बन जाने के बाद, इसे सहकर्मियों को ईमेल किया जा सकता है, वेब साइटों पर विचारित किया जा सकता है, या केपलर कंपोनेंट रिपोजिटरी पर अपलोड किया जा सकता है। कंपोनेंट रिपॉजिटरी केप्लर कार्यप्रवाह को विचारित करने के लिए केंद्रीकृत प्रणाली है जो वेब पोर्टल एवं वेब सेवा इंटरफ़ेस दोनों के माध्यम से पहुंच योग्य है। उपयोगकर्ता सीधे केपलर कार्यप्रवाह कंपोज़िशन जीयूआई के अंदर से रिपॉजिटरी से घटकों को खोज एवं उपयोग कर सकते हैं।

उद्गम

वैज्ञानिक कार्यप्रवाह में प्रोवेंस महत्वपूर्ण अवधारणा है, क्योंकि यह वैज्ञानिकों को उनके परिणामों की उत्पत्ति को समझने, उनके प्रयोगों को दोहराने एवं डेटा उत्पादों को प्राप्त करने के लिए उपयोग की जाने वाली प्रक्रियाओं को मान्य करने की अनुमति देता है।[8] कार्यप्रवाह को पुन: प्रस्तुत करने के लिए, उद्गम जानकारी दर्ज की जानी चाहिए जो इंगित करती है कि डेटा कहाँ उत्पन्न हुआ, इसे कैसे बदला गया, एवं कौन से घटक एवं कौन से पैरामीटर सेटिंग्स का उपयोग किया गया था। इससे अन्य वैज्ञानिकों को परिणामों की पुष्टि करते हुए प्रयोग को दोबारा करने की अनुमति मिल जाएगी।[9] वर्तमान प्रणालियों में अंतिम उपयोगकर्ताओं को वैज्ञानिक रूप से सार्थक तरीकों से उद्गम जानकारी को क्वेरी करने की अनुमति देने के लिए बहुत कम समर्थन मौजूद है, विशेष रूप से जब उन्नत कार्यप्रवाह निष्पादन मॉडल सरल डीएजी (प्रक्रिया नेटवर्क में) से परे जाते हैं।[10]

केप्लर इतिहास

केपलर प्रोजेक्ट 2002 में साइंस एनवायरनमेंट फॉर इकोलॉजिकल नॉलेज (SEEK) प्रोजेक्ट के सदस्यों द्वारा बनाया गया था। [4]एवं वैज्ञानिक डेटा प्रबंधन (एसडीएम) परियोजना। इस परियोजना की स्थापना कैलिफोर्निया विश्वविद्यालय, सांता बारबरा के पारिस्थितिक विश्लेषण एवं संश्लेषण के लिए राष्ट्रीय केंद्र (एनसीईएएस) एवं कैलिफोर्निया विश्वविद्यालय, सैन डिएगो के सैन डिएगो सुपरकंप्यूटर सेंटर के शोधकर्ताओं द्वारा की गई थी। केपलर टॉलेमी II का विस्तार करता है, जो यूसी बर्कले में विकसित समवर्ती, वास्तविक समय, एम्बेडेड सिस्टम के मॉडलिंग, सिमुलेशन एवं डिजाइन के लिए सॉफ्टवेयर प्रणाली है। केप्लर पर सहयोग तेजी से बढ़ा क्योंकि विभिन्न वैज्ञानिक विषयों के सदस्यों ने विश्लेषण एवं मॉडलिंग के लिए वैज्ञानिक कार्यप्रवाह के लाभों को महसूस किया एवं सिस्टम में योगदान देना शुरू कर दिया। 2008 तक, केपलर सहयोगी कई विज्ञान विषयों से आते हैं, जिनमें पारिस्थितिकी, आणविक जीव विज्ञान, आनुवंशिकी, भौतिकी, रसायन विज्ञान, संरक्षण विज्ञान, समुद्र विज्ञान, जल विज्ञान, पुस्तकालय विज्ञान, कंप्यूटर विज्ञान एवं अन्य सम्मिलित हैं। केप्लर कार्यप्रवाह ऑर्केस्ट्रेशन इंजन है जिसका उपयोग ्टर के रूप में कार्य को अधिक आसान बनाने के लिए किया जाता है।

यह भी देखें

संदर्भ

  1. "Archived copy". Archived from the original on 2015-11-20. Retrieved 2015-11-19.{{cite web}}: CS1 maint: archived copy as title (link)
  2. Ludäscher B., Altintas I., Berkley C., Higgins D., Jaeger-Frank E., Jones M., Lee E., Tao J., Zhao Y. 2006. Scientific Workflow Management and the Kepler System. Special Issue: Workflow in Grid Systems. Concurrency and Computation: Practice & Experience 18(10): 1039-1065.
  3. Altintas I, Berkley C, Jaeger E, Jones M, Ludäscher B, Mock S. 2004. Kepler: An Extensible System for Design and Execution of Scientific Workflows. Proceedings of the Future of Grid Data Environments, Global Grid Forum 10.
  4. 4.0 4.1 Michener, William K., James H. Beach, Matthew B. Jones, Bertram Ludaescher, Deana D. Pennington, Ricardo S. Pereira, Arcot Rajasekar, and Mark Schildhauer. 2007. "A Knowledge Environment for the Biodiversity and Ecological Sciences", Journal of Intelligent Information Systems, 29(1): 111-126. doi:10.1007/s10844-006-0034-8
  5. Taylor, I.J.; Deelman, E.; Gannon, D.B.; Shields, M. (Eds.), “Workflows for e-Science: Scientific Workflows for Grids”, 530 p., Springer. ISBN 978-1-84628-519-6.
  6. Jones, Matthew B., C. Berkley, J. Bojilova, M. Schildhauer. 2001. Managing Scientific Metadata. IEEE Internet Computing 5 (5): 59-68.
  7. Berkley, Chad, Shawn Bowers, Matthew B. Jones, Bertram Ludaescher, Mark Schildhauer, Jing Tao. 2005. Incorporating Semantics in Scientific Workflow Authoring. 17th International Conference on Scientific and Statistical Database Management. IEEE Computer Society.
  8. "WebHome < Challenge < TWiki". Archived from the original on 2008-07-06. Retrieved 2009-04-06.
  9. Barker, A.; van Hemert, J (2008). "Scientific Workflow: A Survey and Research Directions". Parallel Processing and Applied Mathematics. PPAM 2007. Lecture Notes in Computer Science. 4967. doi:10.1007/978-3-540-68111-3_78.
  10. Shawn Bowers, Timothy McPhillips, Bertram Ludascher, Shirley Cohen, Susan B. Davidson 2006. A Model for User-Oriented Data Provenance in Pipelined Scientific Workflows.


बाहरी संबंध