कैर्रेट 2
कैर्रेट 2[1] ओपन सोर्स का परिणामी क्लस्टरिंग इंजन शोध है।[2]यह स्वचालित रूप से दस्तावेज़ों के लघु संग्रहों को समूहित कर सकता है, उदा.- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट 2 जावा में लिखा गया है और बीएसडी लाइसेंस के अंतर्गत वितरित किया गया है।
इतिहास
पोलिश में क्लस्टरिंग शोध परिणामों के लिए एसटीसी क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी (MSc) थीसिस के भाग के रूप में कैर्रेट 2 का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य शोध परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए,[3]उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम विशेष रूप से शोध परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया। जबकि कैर्रेट 2 का सोर्स कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक रूप में प्रस्तावित किया गया था। उसी वर्ष, संस्करण 2.0 को उत्तम यूजर इंटरफेस और विस्तारित उपकरण समुच्चय के साथ प्रस्तावित किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।
रिलीज | रिलीज़ की तारीख | प्रमुख परिवर्तन और नई सुविधाएँ |
---|---|---|
4.5.0 | नवंबर 2022 | निर्भरता अद्यतन, बग फिक्स। |
4.4.3 | अगस्त 2022 | निर्भरता अद्यतन, एसटीसी और स्टेमिंग बुनियादी ढांचे के लिए बग फिक्स। |
4.4.0, 4.4.1, 4.4.2 | दिसंबर 2021 | सुरक्षा सुधार और निर्भरता अद्यतन। |
4.3.0 | जुलाई 2021 | मामूली एपीआई परिवर्तन और बग फिक्स। कार्यक्षेत्र में सुधार (DCS खोज दृश्यपटल)। |
4.2.0, 4.2.1 | मार्च 2021 | JSON शब्दकोशों और कार्यक्षेत्र में सुधार। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना। |
4.1.0 | जनवरी 2021 | वेब आधारित कार्यक्षेत्र। JSON शब्दकोश और नए फ़िल्टरिंग विकल्प। एपीआई पॉलिशिंग। |
4.0.0 | जुलाई 2020 | एपीआई परिवर्तन और कोडबेस भर में सरलीकरण। बहिष्कृत प्रौद्योगिकियों और उपकरणों को हटाना। नया दस्तावेज़ीकरण और कोड क्लीनअप। |
3.16.2 | सितंबर 2019 | तृतीय पक्ष पुस्तकालयों को अद्यतन करें (सुरक्षा संबंधी मुद्दे)। |
3.16.1 | जनवरी 2019 | जेएस विज़ुअलाइज़ेशन का अद्यतन। माइक्रोसॉफ्ट बिंग एपीआई v5 से v7 का माइग्रेशन। |
3.16.0 | मई 2018 | जावा 9+ संगतता मुद्दों का ओवरहाल। उबंटू डिस्ट्रोस के लिए वर्कबेंच संगतता। दस्तावेज़ सोर्स अद्यतन और गैर-कार्यात्मक दस्तावेज़ सोर्सों को हटाना। |
3.15.1 | मार्च 2017 | .NET रिलीज़ के लिए एक बग फिक्स जिसके परिणामस्वरूप अप्राप्य वर्तमान कार्यशील निर्देशिका पर अनियंत्रित I/O अपवाद हो सकते हैं। |
3.15.0 | अक्टूबर 2016 | Bing API V2 से V5 संक्रमण। तृतीय पक्ष निर्भरता का उन्नयन। आंतरिक सौंदर्य प्रसाधन। |
3.14.0 | सितंबर 2016 | कार्यक्षेत्र में सुधार (उच्च DPI समर्थन, MacOSX सुधार, बग फिक्स)। PubMed HTTP पर स्विच कर रहा है। अन्य मामूली सुधार। |
3.13.0 | जुलाई 2016 | सर्वलेट एपीआई बग फिक्स, वर्कबेंच बग फिक्स, हटाए गए Google दस्तावेज़ सोर्स, कुछ भाषाओं के लिए निश्चित भाषा कोड। |
3.12.0 | फरवरी 2016 | Morfologik पोलिश शब्दकोश का उन्नयन, ढांचागत परिवर्तन और समायोजन C2 को अधिक सख्त सुरक्षा प्रबंधक नीतियों के तहत संचालित करने की अनुमति देता है। |
3.11.0 | अक्टूबर 2015 | Apache Lucene का अपग्रेड, बग फिक्स और 3.10.x माइनर से परिवर्तनों का रोलअप। |
3.10.4 | अक्टूबर 2015 | मोर्फोलॉजिक पुस्तकालय का उन्नयन। |
3.10.3 | अगस्त 2015 | सोलर में टकराव से बचने के लिए Google अमरूद को दोबारा पैक किया। |
3.10.2 | जुलाई 2015 | वर्कबेंच (अरबी क्लस्टर डिस्प्ले) में मामूली सुधार। |
3.10.1 | मई 2015 | Aduna विज़ुअलाइज़ेशन MacOS वितरण से हटा दिया गया। कार्यक्षेत्र में मामूली सुधार। |
3.10.0 | मई 2015 | विज़ुअलाइज़ेशन अद्यतन। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना। पुस्तकालय निर्भरता अद्यतन। |
3.9.4 | नवंबर 2014 | फोमट्री अपडेट। बहुभाषी क्लस्टरिंग के लिए नई विशेषताएँ। विज़ुअलाइज़ेशन ठीक करता है। |
3.9.3 | जुलाई 2014 | फोमट्री अपडेट। इन्फ्रास्ट्रक्चर फिक्स और ट्वीक्स (jflex, sonatype रिपॉजिटरी URL)। |
3.9.2 | अप्रैल 2014 | फोमट्री एचटीएमएल5 में बग फिक्स। |
3.9.1 | अप्रैल 2014 | बग फिक्स, HTML5 विज़ुअलाइज़ेशन का अपग्रेड। |
3.9.0 | फरवरी 2014 | फ़्लैश की जगह HTML5 विज़ुअलाइज़ेशन, लाइब्रेरी डिपेंडेंसी अपडेट, बग फिक्स। |
3.8.1 | अक्टूबर 2013 | बग फिक्स, कार्यक्षमता में मामूली बदलाव। |
3.8.0 | जुलाई 2013 | बग फिक्स, पुस्तकालय निर्भरता अद्यतन। |
3.7.1 | मई 2013 | मामूली बग फिक्स (3.7.0 रखरखाव रिलीज़)। |
3.7.0 | अप्रैल 2013 | कोर (स्ट्रिंग आईडी) में इंफ्रास्ट्रक्चर परिवर्तन, बेहतर सोलर इंटीग्रेशन एक्सएसएलटी, बड़े इनपुट के लिए वर्कबेंच ट्वीक्स, अपडेटेड डिपेंडेंसी। |
3.6.3 | अप्रैल 2013 | मामूली बग फिक्स और सुधार: सोलर एडॉप्टर XSLT का अनुकूलन, बड़े इनपुट के लिए कार्यक्षेत्र में बदलाव, अद्यतन निर्भरताएँ। |
3.6.2 | नवंबर 2012 | मामूली बग फिक्स और सुधार। |
3.6.1 | अगस्त 2012 | छोटे सुधार। |
3.6.0 | जून 2012 | अवसंरचनात्मक परिवर्तन, रीफैक्टरिंग और बग फिक्स। |
3.5.3 | दिसंबर 2011 | गिटहब में माइग्रेशन के परिणामस्वरूप इंफ्रास्ट्रक्चर अपडेट। वर्कबेंच SWT 3.7.1 के लिए अद्यतन। |
3.5.2 | सितंबर 2011 | दस्तावेज़ क्लस्टरिंग सर्वर में अजाक्स समर्थन, बिंग दस्तावेज़ सोर्स में सुधार, वर्कबेंच सुधार, बग फिक्स। |
3.5.1 | जून 2011 | बग फिक्स, विज़ुअलाइज़ेशन इंटीग्रेशन सुधार, Yahoo BOSS API के लिए समर्थन हटा दिया गया। |
3.5.0 | मई 2011 | फोमट्री विज़ुअलाइज़ेशन, बाइसेक्टिंग के-मतलब क्लस्टरिंग, संसाधन प्रबंधन में सुधार |
3.4.3 | मार्च 2011 | मावेन केंद्रीय भंडार को वितरण |
3.4.2 | अक्टूबर 2010 | कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना |
3.4.1 | सितंबर 2010 | Solr 1.4.x संगतता पैकेज, बग फिक्स |
3.4.0 | अगस्त 2010 | गाजर² क्लस्टरिंग को कॉल करने के लिए .NET API |
3.3.0 | अप्रैल 2010 | एसटीसी क्लस्टरिंग एल्गोरिथम में महत्वपूर्ण मापनीयता सुधार |
3.2.0 | मार्च 2010 | क्लस्टरिंग अरबी और कोरियाई सामग्री के लिए प्रायोगिक समर्थन, बैच मोड में क्लस्टरिंग के लिए कमांड लाइन एप्लिकेशन, एलजीपीएल -लाइसेंस प्राप्त निर्भरताएं हटा दी गईं |
3.1.0 | सितंबर 2009 | क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन |
3.1.0 | सितंबर 2009 | क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन |
3.0.1 | मार्च 2009 | दस्तावेज़ क्लस्टरिंग कार्यक्षेत्र मैक ओएस एक्स के लिए उपलब्ध है |
3.0.0 | जनवरी 2009 | दस्तावेज़ क्लस्टरिंग वर्कबेंच गाजर² क्लस्टरिंग के साथ आसान प्रयोग के लिए जोड़ा गया, मूल रूप से सरलीकृत जावा एपीआई, खोज परिणाम क्लस्टरिंग वेब एप्लिकेशन को फिर से लागू किया गया, उपयोगकर्ता मैनुअल उपलब्ध |
2.1.0 | अगस्त 2007 | क्लस्टरिंग को REST सेवा के रूप में उजागर करने के लिए दस्तावेज़ क्लस्टरिंग सर्वर जोड़ा गया |
2.0.0 | सितंबर 2006 | खोज परिणाम क्लस्टरिंग वेब अनुप्रयोग का नया उपयोगकर्ता इंटरफ़ेस |
1.0.0 | जनवरी 2006 | पहला आधिकारिक रिलीज, सोर्सफोर्ज पर बायनेरिज़ उपलब्ध |
0.0.0 | 2002 से | इनक्यूबेशन रिलीज़, सोर्स कोड SourceForge पर उपलब्ध है |
Developer(s) | कैर्रेट शोध |
---|---|
Stable release | 4.5.0
/ November 3, 2022 |
Repository | github |
Written in | Java |
Operating system | क्रॉस-प्लेटफ़ॉर्म |
Type | टेक्स्ट माइनिंग और क्लस्टर विश्लेषण |
License | बीएसडी लाइसेंस |
Website | search |
आर्किटेक्चर
कैर्रेट 2 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।
क्लस्टरिंग एल्गोरिदम
कैर्रेट 2 कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:
- लिंगो:[1] क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
- एसटीसी:[2] प्रत्यय ट्री क्लस्टरिंग पर आधारित है I
स्पिन-ऑफ
कैर्रेट शोध
कैर्रेटशोध,[4] कैर्रेट 2 परियोजना का वाणिज्यिक स्पिन-ऑफ, के आगे के विकास पर कार्य करता है, रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है[3] जो कैर्रेट 2 के रूप के साथ-साथ खुले सोर्स पर सॉफ्टवेयर के आधार पर पाठ खनन परामर्श सेवाएं प्रदान करता है।
कैर्रेट शोध लैब्स
कैर्रेट 2 ने सर्च लैब्स के आश्रय में प्रस्तावित कई स्वतंत्र ओपन सोर्स परियोजनाओं को उत्पन्न किया।[5] इस कार्य में भाग के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:
- रैंडमाइज्ड टेस्टिंग: प्रत्येक परीक्षण को अल्प भिन्न (यादृच्छिक) चलाने के लिए अंतर्निहित उपयोगिताओं के साथ जे इकाई परीक्षण धावक, लोड संतुलन और अन्य बेल्स के समानांतर जेवीएम (JVMs) पर जे इकाई परीक्षण चलाने के लिए भी एएनटी कार्य करता है।
- जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): जावा के लिए सूची, समुच्चय, मानचित्र और प्रिमिटिव्स के अन्य संग्रह उच्चतम प्रदर्शन और मेमोरी दक्षता के लिए प्रदर्शित किए गए हैं।
- स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स को पूर्ण रूप से स्वचालित सुरक्षा; स्प्राइटेड छवियों को जोड़ते या परिवर्तित करते सीएसएस में कोई निरुद्देश्य कॉपी और पेस्ट नहीं करना चाहिए।
बंद परियोजनाएं:
- जे सफ़्फ़िक्स ऐरेस: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन है।
- जे इकाई बेंचमार्क्स: जेइकाई4 परीक्षणों को जीसी मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में परिवर्तन के लिए एक्सटेंशन का समुच्चय हैं।
यह भी देखें
संदर्भ
- ↑ 1.0 1.1 Stanisław Osiński, Dawid Weiss: A Concept-Driven Algorithm for Clustering Search Results. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48–54.
- ↑ 2.0 2.1 Oren Zamir, Oren Etzioni: Web Document Clustering: A Feasibility Demonstration, Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46–54
- ↑ 3.0 3.1 Carrot Search s.c. "गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन".
- ↑ Carrot Search s.c. "गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर".
- ↑ Carrot Search s.c. "गाजर खोज लैब्स".