ऑरेंज (सॉफ्टवेयर)
Developer(s) | University of Ljubljana |
---|---|
Initial release | 10 October 1996[1] |
Stable release | Script error: The module returned a nil value. It is supposed to return an export table.
/ Script error: The module returned a nil value. It is supposed to return an export table. |
ऑरेंज ओपन स्रोत सॉफ्टवेयर, डेटा विज़ुअलाइज़ेशन, मशीन लर्निंग और डेटा माइनिंग उपकरण किट है। यह शोध पूर्ण तीव्र गुणात्मक डेटा विश्लेषण और इंटरैक्टिव डेटा सूचना विज़ुअलाइज़ेशन के लिए दृश्य प्रोग्रामिंग फ्रंट-एंड की सुविधा प्रदान करता है।[4]
विवरण
ऑरेंज डेटा विज़ुअलाइज़ेशन, मशीन लर्निंग, डेटा माइनिंग और डेटा विश्लेषण के लिए घटक-आधारित विज़ुअल प्रोग्रामिंग सॉफ़्टवेयर पैकेज है।
ऑरेंज घटकों को विगेट्स कहा जाता है और वे सरल डेटा विज़ुअलाइज़ेशन, उप-समुच्चय चयन और प्री-प्रोसेसिंग से लेकर लर्निंग एल्गोरिदम के अनुभवजन्य मूल्यांकन तक होते हैं और द्वितीय भविष्य कहने वाला मॉडलिंग है।
विज़ुअल प्रोग्रामिंग इंटरफ़ेस के माध्यम से कार्यान्वित किया जाता है जिसमें पूर्वनिर्धारित या उपयोगकर्ता-डिज़ाइन किए गए विजेट्स को जोड़कर वर्कफ़्लोज़ बनाए जाते हैं, जबकि उन्नत उपयोगकर्ता डेटा परिवर्तन और विजेट परिवर्तन के लिए ऑरेंज को पायथन लाइब्रेरी के रूप में उपयोग कर सकते हैं।[5]
सॉफ्टवेयर
ऑरेंज जीपीएल के अनुसार प्रस्तावित ओपन सोर्स सॉफ्टवेयर पैकेज है। 3.0 तक के संस्करणों में सी++ में मुख्य घटक सम्मलित हैं जिनमें पायथन में रैपर गिटहब पर, आवरण फंक्शन के साथ उपलब्ध हैं। संस्करण 3.0 के पश्चात से, ऑरेंज वैज्ञानिक कंप्यूटिंग के लिए साधारण पायथन ओपन-सोर्स लाइब्रेरी का उपयोग करता है, जैसे कि सुन्न, स्किपी और स्किकिट-लर्न, जबकि इसका ग्राफिकल यूजर इंटरफेस क्रॉस-प्लेटफॉर्म क्यूटी (सॉफ्टवेयर) रूपरेखा के अंतर्गत कार्य करता है।
डिफ़ॉल्ट स्थापना में 6 विजेट सेट (डेटा, विज़ुअलाइज़, वर्गीकृत, प्रतिगमन, मूल्यांकन और अनुपयोगी) में कई मशीन लर्निंग, प्री-प्रोसेसिंग और डेटा विज़ुअलाइज़ेशन एल्गोरिदम सम्मलित हैं। अतिरिक्त कार्यात्मकता ऐड-ऑन (जैव सूचना विज्ञान, डेटा फ्यूजन और टेक्स्ट-माइनिंग) के रूप में उपलब्ध हैं।
ऑरेंज मैकओएस, माइक्रोसॉफ़्ट विंडोज़ और लिनक्स पर समर्थित है और इसे पायथन पैकेज इंडेक्स रिपॉजिटरी (पाइप इंस्टॉल ऑरेंज 3) से भी इंस्टॉल किया जा सकता है।
सुविधाएँ
ऑरेंज में कैनवास इंटरफ़ेस (कंप्यूटिंग) होता है, जिस पर उपयोगकर्ता विजेट रखता है और डेटा विश्लेषण वर्कफ़्लो बनाता है। विजेट डेटा पढ़ने, डेटा सारणी दिखाने, सुविधाओं का चयन करने, प्रशिक्षण भविष्यवाणियों, सीखने के एल्गोरिदम की तुलना करने, डेटा तत्वों की कल्पना करने आदि जैसी बुनियादी कार्यक्षमताओं की प्रस्तुति करते हैं। उपयोगकर्ता अंतःक्रियात्मक रूप से विज़ुअलाइज़ेशन का पता लगा सकते है या चयनित उप-समुच्चय को अन्य विजेट्स में फीड कर सकता है।
कैनवास: डेटा विश्लेषण के लिए ग्राफिकल फ्रंट-एंड है।
- विजेट:
- डेटा: डेटा इनपुट, डेटा फ़िल्टरिंग, प्रतिमानकरण, अभियोग, सुविधा परिवर्तन और सुविधा चयन के लिए विजेट है।
- विज़ुअलाइज़ करें: सामान्य विज़ुअलाइज़ेशन (बॉक्स प्लॉट, हिस्टोग्राम, स्कैटर प्लॉट) और मल्टीवेरिएट विज़ुअलाइज़ेशन (मोज़ेक डिस्प्ले, सीव डायग्राम) के लिए विजेट है।
- वर्गीकृत करें: वर्गीकरण के लिए पर्यवेक्षित पेपर लर्निंग एल्गोरिदम का समुच्चय है।
- प्रतिगमन: प्रतिगमन के लिए पर्यवेक्षित पेपर लर्निंग एल्गोरिदम का समुच्चय है।
- मूल्यांकन करें: क्रॉस-वैलिडेशन, सैंपलिंग-आधारित प्रक्रियाएं, विश्वसनीयता अनुमान और भविष्यवाणी विधियों का स्कोरिंग करना है।
- अनपर्यवेक्षित: क्लस्टर विश्लेषण (के-मीन्स, पदानुक्रमित क्लस्टरिंग) और डेटा प्रोजेक्शन तकनीक (बहुआयामी स्केलिंग, प्रमुख घटक विश्लेषण, पत्राचार विश्लेषण) के लिए अनपर्यवेक्षित लर्निंग एल्गोरिदम है।
ऐड-ऑन
- ऑरेंज उपयोगकर्ता ऐड-ऑन में घटकों के साथ अपने मुख्य घटकों का विस्तार कर सकते हैं। समर्थित ऐड-ऑन में सम्मलित हैं:
- एसोसिएट: निरंतर आइटम समुच्चय करने और एसोसिएशन नियम सीखने के लिए घटक है।
- जैव सूचना विज्ञान: जीन अभिव्यक्ति विश्लेषण, संवर्धन, और अभिव्यक्ति डेटा बेस (जैसे, जीन एक्सप्रेशन ओम्निबस) और पाथवे लाइब्रेरी तक पहुंच के लिए घटक है।
- डेटा फ्यूजन: विभिन्न डेटा समुच्चय को फ्यूज करने के लिए घटक, सामूहिक मैट्रिक्स फैक्टराइजेशन और अव्यक्त कारकों का शोध है।
- शैक्षिक: मशीन सीखने की अवधारणाओं को पढ़ाने के लिए घटक, जैसे कि के-साधन क्लस्टरिंग, बहुपद प्रतिगमन, स्टोकेस्टिक ग्रेडिएंट डिसेंट इत्यादि।
- भू: भू-स्थानिक विश्लेषण के साथ कार्य करने के लिए घटक है।
- इमेज एनालिटिक्स: इमेज और इमेज नेट एम्बेडिंग के साथ कार्य करने के लिए घटक है।
- नेटवर्क: ग्राफ और नेटवर्क सिद्धांत के लिए घटक है।
- टेक्स्ट माइनिंग: प्राकृतिक भाषा प्रसंस्करण और टेक्स्ट माइनिंग के लिए घटक है।
- समय श्रृंखला: समय श्रृंखला विश्लेषण और मॉडलिंग के लिए विज घटक टीएस है।
- स्पेक्ट्रोस्कोपी: हाइपर स्पेक्ट्रल डेटा समुच्चय के विश्लेषण और विज़ुअलाइज़ेशन के लिए घटक है। [6]
- ऑरेंज उपयोगकर्ता ऐड-ऑन में घटकों के साथ अपने मुख्य घटकों का विस्तार कर सकते हैं। समर्थित ऐड-ऑन में सम्मलित हैं:
उद्देश्य
कार्यक्रम प्रयोग चयन, अनुशंसा प्रणाली और भविष्य कहने वाला मॉडलिंग के लिए मंच प्रदान करता है और इसका उपयोग बायोमेडिसिन, जैव सूचना विज्ञान, जीनोमिक्स और शिक्षण में किया जाता है। विज्ञान में, इसका उपयोग नई मशीन लर्निंग एल्गोरिदम के परीक्षण, आनुवंशिकी और जैव सूचना विज्ञान में नई तकनीकों को लागू करने के लिए मंच के रूप में किया जाता है। शिक्षा में, जीव विज्ञान, बायोमेडिसिन और सूचना विज्ञान के छात्रों को मशीन सीखने और डेटा खनन विधियों को पढ़ाने के लिए इसका प्रयोग किया गया था।
एक्सटेंशन
ऑरेंज पर विभिन्न परियोजनाएं ऐड-ऑन के साथ मुख्य घटकों का विस्तार करके या कार्यान्वित दृश्य प्रोग्रामिंग सुविधाओं और जीयूआई का लाभ उठाने के लिए केवल ऑरेंज कैनवस का उपयोग करके निर्माण करती हैं।
- ओएसिस- ऑरेंज सिंक्रोट्रॉन सूट।[7]
- एससी ऑरेंज- सिंगल सेल बायोस्टैटिस्टिक्स।
- क्वासर - प्राकृतिक विज्ञान में डेटा विश्लेषण।
इतिहास
- 1996 में, लजुब्जाना विश्वविद्यालय और जोज़ेफ़ स्टीफ़न संस्थान ने सी++ में मशीन लर्निंग फ्रेमवर्क एमएल का विकास प्रारम्भ किया।
- 1997 में, पेपर लर्निंग के लिए पायथन (प्रोग्रामिंग लैंग्वेज) बाइंडिंग विकसित की गई थी, जो उभरते हुए पायथन मॉड्यूल के साथ मिलकर ऑरेंज नामक संयुक्त रूपरेखा का निर्माण करती है।
- बाद के वर्षों के समय, डेटा माइनिंग और पेपर लर्निंग के लिए अधिकांश प्रमुख एल्गोरिदम सी++ (ऑरेंज कोर) या पायथन मॉड्यूल में विकसित किए गए हैं।
- 2002 में, पीडब्लूएम (विंडो मैनेजर) का उपयोग करके ग्राफिकल यूजर इंटरफेस बनाने के लिए प्रथम प्रोटोटाइप डिजाइन किया गया था।
- 2003 में, पीईक्यूटी पायथन बाइंडिंग का उपयोग करके क्यूटी (सॉफ्टवेयर) फ्रेमवर्क के लिए ग्राफिकल यूजर इंटरफेस को नया रूप दिया गया और विकसित किया गया। दृश्य प्रोग्रामिंग के रूप को परिभाषित किया गया था, और घटक (डेटा विश्लेषण पाइपलाइन के ग्राफिकल घटक) का विकास प्रारम्भ हो गया है।
- 2005 में जैव सूचना विज्ञान में डेटा विश्लेषण के लिए एक्सटेंशन बनाए गए थे।
- 2008 में, मैकओएस एक्स डीएमजी और फिंक-आधारित स्थापना पैकेज विकसित किए गए थे।
- 2009 में, 100 से अधिक घटक बना कर रखे गए थे।
- 2009 से, ऑरेंज 2.0 बीटा में वेब साइट दैनिक संकलन चक्र के आधार पर इंस्टॉलेशन पैकेज प्रदान करती है।
- 2012 में, प्राचीन मॉड्यूल-आधारित संरचना का स्थान, नया ऑब्जेक्ट पदानुक्रम लगाया गया था।
- 2013 में, ग्राफिकल यूजर इंटरफेस के महत्वपूर्ण नए स्वरूप में नया उपकरण बॉक्स और वर्कफ़्लो का चित्रण सम्मिलित था।
- 2015 में, ऑरेंज 3.0 प्रस्तावित हुआ।
- 2016 में, ऑरेंज संस्करण 3.3 में है। विकास मासिक स्थिर प्रस्तावित चक्र का उपयोग करता है।
संदर्भ
- ↑ "orange3/CHANGELOG.md at master . biolab/orange3 . GitHub". GitHub.
- ↑ "नारंगी - लाइसेंस".
- ↑ "ऑरेंज 3/लाइसेंस मास्टर पर। बायोलैब/ऑरेंज3. GitHub". GitHub.
- ↑ DemšarJanez; CurkTomaž; ErjavecAleš; GorupČrt; HočevarTomaž; MilutinovičMitar; MožinaMartin; PolajnarMatija; ToplakMarko; StaričAnže; ŠtajdoharMiha (2013-01-01). "संतरा". The Journal of Machine Learning Research (in English).
- ↑ Janez Demšar; Tomaž Curk; Aleš Erjavec; Črt Gorup; Tomaž Hočevar; Mitar Milutinovič; Martin Možina; Matija Polajnar; Marko Toplak; Anže Starič; Miha Stajdohar; Lan Umek; Lan Žagar; Jure Žbontar; Marinka Žitnik; Blaž Zupan (2013). "ऑरेंज: पायथन में डेटा माइनिंग टूलबॉक्स" (PDF). JMLR. 14 (1): 2349–2353.
- ↑ M. Toplak, G. Birarda, S. Read, C. Sandt, S. Rosendahl, L. Vaccari, J. Demšar, F. Borondics, Synchrotron Radiation News 30, 40–45 (2017). https://doi.org/10.1080/08940886.2017.1338424
- ↑ L. Rebuffi, M. Sanchez del Rio, Proc. SPIE 10388, 103880S (2017). https://doi.org/10.1117/12.2274263
अग्रिम पठन
- Demšar, Janez and Blaž Zupan, Orange: Data Mining Fruitful and Fun - A Historical Perspective, Informatica 37, pgs. 55–60, (2013).
- Capurso M. , Data Science and Engineering - A learning path – Volume 1: Methodological Aspects, Data Acquisition, Management and Cleaning, Analysis and Visualization in the Python-based Orange environment , Amazon , ISBN 979-8825476490
- Capurso M. Data Science and Engineering - A learning path - Volume 2 Exploratory Data Analysis, Metrics, Models: with applications in the Orange Python-based environment, Amazon , ISBN 979-8358265325