कैर्रेट 2: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(6 intermediate revisions by 5 users not shown)
Line 1: Line 1:
'''कैर्रेट 2'''<ref name="lingo" /> ओपन सोर्स का परिणामी क्लस्टरिंग इंजन शोध है।<ref name=":0" />यह स्वचालित रूप से दस्तावेज़ों के लघु [[मीडिया (संचार)|संग्रहों]] को समूहित कर सकता है, उदा.- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट 2 जावा में लिखा गया है और [[मीडिया (संचार)|बीएसडी लाइसेंस]] के अंतर्गत वितरित किया गया है।
== इतिहास ==
पोलिश में क्लस्टरिंग शोध परिणामों के लिए एसटीसी क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी (MSc) थीसिस के भाग के रूप में कैर्रेट 2 का प्रारंभिक संस्करण 2001 में '''दाविद वीस''' द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य शोध परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए,<ref name=":1" />उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम विशेष रूप से शोध परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया। जबकि कैर्रेट 2 का सोर्स कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक रूप में प्रस्तावित किया गया था। उसी वर्ष, संस्करण 2.0 को उत्तम यूजर इंटरफेस और विस्तारित उपकरण समुच्चय के साथ प्रस्तावित किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण [[मीडिया (संचार)|रिच क्लाइंट प्लेटफॉर्म]] के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।
{| class="wikitable"
|+कैर्रेट 2 रिलीज
!रिलीज
!रिलीज़ की तारीख
!प्रमुख परिवर्तन और नई सुविधाएँ
|-
|4.5.0
|नवंबर 2022
|निर्भरता अद्यतन, बग फिक्स।
|-
|4.4.3
|अगस्त 2022
|निर्भरता अद्यतन, एसटीसी और स्टेमिंग बुनियादी ढांचे के लिए बग फिक्स।
|-
|4.4.0, 4.4.1, 4.4.2
|दिसंबर 2021
|सुरक्षा सुधार और निर्भरता अद्यतन।
|-
|4.3.0
|जुलाई 2021
|मामूली एपीआई परिवर्तन और बग फिक्स। कार्यक्षेत्र में सुधार (DCS खोज दृश्यपटल)।
|-
|4.2.0, 4.2.1
|मार्च 2021
|JSON शब्दकोशों और कार्यक्षेत्र में सुधार। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना।
|-
|4.1.0
|जनवरी 2021
|वेब आधारित कार्यक्षेत्र। JSON शब्दकोश और नए फ़िल्टरिंग विकल्प। एपीआई पॉलिशिंग।
|-
|4.0.0
|जुलाई 2020
|एपीआई परिवर्तन और कोडबेस भर में सरलीकरण। बहिष्कृत प्रौद्योगिकियों और उपकरणों को हटाना। नया दस्तावेज़ीकरण और कोड क्लीनअप।
|-
|3.16.2
|सितंबर 2019
|तृतीय पक्ष पुस्तकालयों को अद्यतन करें (सुरक्षा संबंधी मुद्दे)।
|-
|3.16.1
|जनवरी 2019
|जेएस विज़ुअलाइज़ेशन का अद्यतन। माइक्रोसॉफ्ट बिंग एपीआई v5 से v7 का माइग्रेशन।
|-
|3.16.0
|मई 2018
|जावा 9+ संगतता मुद्दों का ओवरहाल। उबंटू डिस्ट्रोस के लिए वर्कबेंच संगतता। दस्तावेज़ सोर्स अद्यतन और गैर-कार्यात्मक दस्तावेज़ सोर्सों को हटाना।
|-
|3.15.1
|मार्च 2017
|.NET रिलीज़ के लिए एक बग फिक्स जिसके परिणामस्वरूप अप्राप्य वर्तमान कार्यशील निर्देशिका पर अनियंत्रित I/O अपवाद हो सकते हैं।
|-
|3.15.0
|अक्टूबर 2016
|Bing API V2 से V5 संक्रमण। तृतीय पक्ष निर्भरता का उन्नयन। आंतरिक सौंदर्य प्रसाधन।
|-
|3.14.0
|सितंबर 2016
|कार्यक्षेत्र में सुधार (उच्च DPI समर्थन, MacOSX सुधार, बग फिक्स)। PubMed HTTP पर स्विच कर रहा है। अन्य मामूली सुधार।
|-
|3.13.0
|जुलाई 2016
|सर्वलेट एपीआई बग फिक्स, वर्कबेंच बग फिक्स, हटाए गए Google दस्तावेज़ सोर्स, कुछ भाषाओं के लिए निश्चित भाषा कोड।
|-
|3.12.0
|फरवरी 2016
|Morfologik पोलिश शब्दकोश का उन्नयन, ढांचागत परिवर्तन और समायोजन C2 को अधिक सख्त सुरक्षा प्रबंधक नीतियों के तहत संचालित करने की अनुमति देता है।
|-
|3.11.0
|अक्टूबर 2015
|Apache Lucene का अपग्रेड, बग फिक्स और 3.10.x माइनर से परिवर्तनों का रोलअप।
|-
|3.10.4
|अक्टूबर 2015
|मोर्फोलॉजिक पुस्तकालय का उन्नयन।
|-
|3.10.3
|अगस्त 2015
|सोलर में टकराव से बचने के लिए Google अमरूद को दोबारा पैक किया।
|-
|3.10.2
|जुलाई 2015
|वर्कबेंच (अरबी क्लस्टर डिस्प्ले) में मामूली सुधार।
|-
|3.10.1
|मई 2015
|Aduna विज़ुअलाइज़ेशन MacOS वितरण से हटा दिया गया। कार्यक्षेत्र में मामूली सुधार।
|-
|3.10.0
|मई 2015
|विज़ुअलाइज़ेशन अद्यतन। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना। पुस्तकालय निर्भरता अद्यतन।
|-
|3.9.4
|नवंबर 2014
|फोमट्री अपडेट। बहुभाषी क्लस्टरिंग के लिए नई विशेषताएँ। विज़ुअलाइज़ेशन ठीक करता है।
|-
|3.9.3
|जुलाई 2014
|फोमट्री अपडेट। इन्फ्रास्ट्रक्चर फिक्स और ट्वीक्स (jflex, sonatype रिपॉजिटरी URL)।
|-
|3.9.2
|अप्रैल 2014
|फोमट्री एचटीएमएल5 में बग फिक्स।
|-
|3.9.1
|अप्रैल 2014
|बग फिक्स, HTML5 विज़ुअलाइज़ेशन का अपग्रेड।
|-
|3.9.0
|फरवरी 2014
|फ़्लैश की जगह HTML5 विज़ुअलाइज़ेशन, लाइब्रेरी डिपेंडेंसी अपडेट, बग फिक्स।
|-
|3.8.1
|अक्टूबर 2013
|बग फिक्स, कार्यक्षमता में मामूली बदलाव।
|-
|3.8.0
|जुलाई 2013
|बग फिक्स, पुस्तकालय निर्भरता अद्यतन।
|-
|3.7.1
|मई 2013
|मामूली बग फिक्स (3.7.0 रखरखाव रिलीज़)।
|-
|3.7.0
|अप्रैल 2013
|कोर (स्ट्रिंग आईडी) में इंफ्रास्ट्रक्चर परिवर्तन, बेहतर सोलर इंटीग्रेशन एक्सएसएलटी, बड़े इनपुट के लिए वर्कबेंच ट्वीक्स, अपडेटेड डिपेंडेंसी।
|-
|3.6.3
|अप्रैल 2013
|मामूली बग फिक्स और सुधार: सोलर एडॉप्टर XSLT का अनुकूलन, बड़े इनपुट के लिए कार्यक्षेत्र में बदलाव, अद्यतन निर्भरताएँ।
|-
|3.6.2
|नवंबर 2012
|मामूली बग फिक्स और सुधार।
|-
|3.6.1
|अगस्त 2012
|छोटे सुधार।
|-
|3.6.0
|जून 2012
|अवसंरचनात्मक परिवर्तन, रीफैक्टरिंग और बग फिक्स।
|-
|3.5.3
|दिसंबर 2011
|गिटहब में माइग्रेशन के परिणामस्वरूप इंफ्रास्ट्रक्चर अपडेट। वर्कबेंच SWT 3.7.1 के लिए अद्यतन।
|-
|3.5.2
|सितंबर 2011
|दस्तावेज़ क्लस्टरिंग सर्वर में अजाक्स समर्थन, बिंग दस्तावेज़ सोर्स में सुधार, वर्कबेंच सुधार, बग फिक्स।
|-
|3.5.1
|जून 2011
|बग फिक्स, विज़ुअलाइज़ेशन इंटीग्रेशन सुधार, Yahoo BOSS API के लिए समर्थन हटा दिया गया।
|-
|3.5.0
|मई 2011
|फोमट्री विज़ुअलाइज़ेशन, बाइसेक्टिंग के-मतलब क्लस्टरिंग, संसाधन प्रबंधन में सुधार
|-
|3.4.3
|मार्च 2011
|मावेन केंद्रीय भंडार को वितरण
|-
|3.4.2
|अक्टूबर 2010
|कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना
|-
|3.4.1
|सितंबर 2010
|Solr 1.4.x संगतता पैकेज, बग फिक्स
|-
|3.4.0
|अगस्त 2010
|गाजर² क्लस्टरिंग को कॉल करने के लिए .NET API
|-
|3.3.0
|अप्रैल 2010
|एसटीसी क्लस्टरिंग एल्गोरिथम में महत्वपूर्ण मापनीयता सुधार
|-
|3.2.0
|मार्च 2010
|क्लस्टरिंग अरबी और कोरियाई सामग्री के लिए प्रायोगिक समर्थन, बैच मोड में क्लस्टरिंग के लिए कमांड लाइन एप्लिकेशन, एलजीपीएल -लाइसेंस प्राप्त निर्भरताएं हटा दी गईं
|-
|3.1.0
|सितंबर 2009
|क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
|-
|3.1.0
|सितंबर 2009
|क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
|-
|3.0.1
|मार्च 2009
|दस्तावेज़ क्लस्टरिंग कार्यक्षेत्र मैक ओएस एक्स के लिए उपलब्ध है
|-
|3.0.0
|जनवरी 2009
|दस्तावेज़ क्लस्टरिंग वर्कबेंच गाजर² क्लस्टरिंग के साथ आसान प्रयोग के लिए जोड़ा गया, मूल रूप से सरलीकृत जावा एपीआई, खोज परिणाम क्लस्टरिंग वेब एप्लिकेशन को फिर से लागू किया गया, उपयोगकर्ता मैनुअल  उपलब्ध
|-
|2.1.0
|अगस्त 2007
|क्लस्टरिंग को REST सेवा के रूप में उजागर करने के लिए दस्तावेज़ क्लस्टरिंग सर्वर जोड़ा गया
|-
|2.0.0
|सितंबर 2006
|खोज परिणाम क्लस्टरिंग वेब अनुप्रयोग का नया उपयोगकर्ता इंटरफ़ेस
|-
|1.0.0
|जनवरी 2006
|पहला आधिकारिक रिलीज, सोर्सफोर्ज पर बायनेरिज़ उपलब्ध
|-
|0.0.0
|2002 से
|इनक्यूबेशन रिलीज़, सोर्स कोड SourceForge पर उपलब्ध है
|}
{{Infobox software
{{Infobox software
| name = Carrot<sup>2</sup>
| name = Carrot<sup>2</sup>
Line 5: Line 223:
| screenshot size =
| screenshot size =
| caption = Web search results clustered using Carrot<sup>2</sup>'s Lingo algorithm.
| caption = Web search results clustered using Carrot<sup>2</sup>'s Lingo algorithm.
| developer = Carrot Search
| developer = कैर्रेट शोध
| latest release version = 4.5.0
| latest release version = 4.5.0
| latest release date = {{release date|2022|11|03}}
| latest release date = {{release date|2022|11|03}}
| latest preview version =  
| latest preview version =  
| latest preview date =  
| latest preview date =  
| operating system = [[Cross-platform]]
| operating system = [[क्रॉस-प्लेटफ़ॉर्म]]
| repo = {{URL|https://github.com/carrot2/carrot2/}}
| repo = {{URL|https://github.com/carrot2/carrot2/}}
| programming language = [[Java (programming language)|Java]]
| programming language = [[Java (programming language)|Java]]
| genre = [[Text mining]] and [[cluster analysis]]
| genre = [[टेक्स्ट माइनिंग]] और [[क्लस्टर विश्लेषण]]
| license = [[BSD license]]
| license = [[बीएसडी लाइसेंस]]
| website = {{URL|https://search.carrot2.org/}}
| website = {{URL|https://search.carrot2.org/}}
}}
}}
== आर्किटेक्चर ==
== आर्किटेक्चर ==


कैर्रेट² 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।
कैर्रेट 2 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।


=== क्लस्टरिंग एल्गोरिदम ===
=== क्लस्टरिंग एल्गोरिदम ===


कैर्रेट² कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:
कैर्रेट 2 कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:


* '''लिंगो:'''<ref name="lingo">Stanisław Osiński, Dawid Weiss: ''A Concept-Driven Algorithm for Clustering Search Results''. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48&ndash;54.</ref> क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
* '''लिंगो:'''<ref name="lingo">Stanisław Osiński, Dawid Weiss: ''A Concept-Driven Algorithm for Clustering Search Results''. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48&ndash;54.</ref> क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
* एसटीसी:<ref>Oren Zamir, [[Oren Etzioni]]: ''Web Document Clustering: A Feasibility Demonstration'', Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46&ndash;54</ref> प्रत्यय ट्री क्लस्टरिंग पर आधारित है I
* एसटीसी:<ref name=":0">Oren Zamir, [[Oren Etzioni]]: ''Web Document Clustering: A Feasibility Demonstration'', Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46&ndash;54</ref> प्रत्यय ट्री क्लस्टरिंग पर आधारित है I


== स्पिन-ऑफ ==
== स्पिन-ऑफ ==


=== कैर्रेटखोज ===
=== कैर्रेट शोध ===


कैर्रेटशोध,<ref>{{cite web|url=https://carrotsearch.com|title=गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर|author=Carrot Search s.c.|publisher=}}</ref> कैर्रेट² परियोजना का एक वाणिज्यिक स्पिन-ऑफ,   कैर्रेट² के आगे के विकास पर काम करता है, एक रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है<ref>{{cite web|url=https://carrotsearch.com/lingo3g|title=गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन|author=Carrot Search s.c.|publisher=}}</ref> ओपन सोर्स और मालिकाना सॉफ्टवेयर के आधार पर   कैर्रेट² ढांचे के साथ-साथ पाठ खनन परामर्श सेवाओं के अनुरूप।
कैर्रेटशोध,<ref>{{cite web|url=https://carrotsearch.com|title=गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर|author=Carrot Search s.c.|publisher=}}</ref> कैर्रेट 2 परियोजना का वाणिज्यिक स्पिन-ऑफ, के आगे के विकास पर कार्य करता है, रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है<ref name=":1">{{cite web|url=https://carrotsearch.com/lingo3g|title=गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन|author=Carrot Search s.c.|publisher=}}</ref> जो कैर्रेट 2 के रूप के साथ-साथ खुले सोर्स पर सॉफ्टवेयर के आधार पर पाठ खनन परामर्श सेवाएं प्रदान करता है।


=== कैर्रेटखोज लैब्स ===
=== कैर्रेट शोध लैब्स ===


कैर्रेट² ने कैर्रेटसर्च लैब्स की छत्रछाया में जारी कई स्वतंत्र ओपन सोर्स परियोजनाओं को जन्म दिया।<ref>{{cite web|url=https://labs.carrotsearch.com|title=गाजर खोज लैब्स|author=Carrot Search s.c.|publisher=}}</ref> इस पहल के हिस्से के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:
कैर्रेट 2 ने सर्च लैब्स के आश्रय में प्रस्तावित कई स्वतंत्र ओपन सोर्स परियोजनाओं को उत्पन्न किया।<ref>{{cite web|url=https://labs.carrotsearch.com|title=गाजर खोज लैब्स|author=Carrot Search s.c.|publisher=}}</ref> इस कार्य में भाग के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:


* रैंडमाइज्ड टेस्टिंग: हर टेस्ट रन को थोड़ा अलग (यादृच्छिक) बनाने के लिए बिल्ट-इन यूटिलिटीज के साथ एक JUnit टेस्ट रनर। लोड संतुलन और अन्य घंटियों और सीटी के साथ समानांतर JVMs पर JUnit परीक्षण चलाने के लिए भी एक ANT कार्य।
* '''रैंडमाइज्ड टेस्टिंग:''' प्रत्येक परीक्षण को अल्प भिन्न (यादृच्छिक) चलाने के लिए अंतर्निहित उपयोगिताओं के साथ जे इकाई परीक्षण धावक, लोड संतुलन और अन्य बेल्स के समानांतर जेवीएम (JVMs) पर जे इकाई परीक्षण चलाने के लिए भी एएनटी कार्य करता है।
* जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): उच्चतम प्रदर्शन और स्मृति दक्षता के लिए ट्यून किए गए जावा के लिए सूची, सेट, मानचित्र और आदिम के अन्य संग्रह।
* '''जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी):''' जावा के लिए सूची, समुच्चय, मानचित्र और प्रिमिटिव्स के अन्य संग्रह उच्चतम प्रदर्शन और मेमोरी दक्षता के लिए प्रदर्शित किए गए हैं।
* स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स का पूरी तरह से स्वचालित रखरखाव; स्प्राइटेड छवियों को जोड़ते या बदलते समय CSS में कोई थकाऊ कॉपी और पेस्ट नहीं करना।
* '''स्मार्टस्प्राइट्स:''' सीएसएस स्प्राइट्स को पूर्ण रूप से स्वचालित सुरक्षा; स्प्राइटेड छवियों को जोड़ते या परिवर्तित करते सीएसएस में कोई निरुद्देश्य कॉपी और पेस्ट नहीं करना चाहिए।


बंद परियोजनाएं:
'''बंद परियोजनाएं:'''


* jSuffixArrays: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन।
* '''जे सफ़्फ़िक्स ऐरेस:''' विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन है।
* JUnitBenchmarks: JUnit4 परीक्षणों को GC मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में बदलने के लिए एक्सटेंशन का एक सेट।
* '''जे इकाई बेंचमार्क्स:''' जेइकाई4 परीक्षणों को जीसी मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में परिवर्तन के लिए एक्सटेंशन का समुच्चय हैं।


== यह भी देखें ==
== यह भी देखें ==
*{{Portal-inline|Free software}}
*


 
[[मीडिया (संचार)|ओपन सॉफ्टवेयर पोर्टल]]
 
==इस पेज में लापता आंतरिक लिंक की सूची==
 
*क्लस्टर विश्लेषण
*विलक्षण मान अपघटन
*प्रत्यय वृक्ष
== संदर्भ ==
== संदर्भ ==
{{reflist}}
{{reflist}}
[[Category: इंटरनेट सर्च इंजन]]
[[Category: बीएसडी लाइसेंस का प्रयोग करने वाला सॉफ्टवेयर]]


[[Category: Machine Translated Page]]
[[Category:Created On 06/12/2022]]
[[Category:Created On 06/12/2022]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:इंटरनेट सर्च इंजन]]
[[Category:बीएसडी लाइसेंस का प्रयोग करने वाला सॉफ्टवेयर]]

Latest revision as of 13:18, 27 October 2023

कैर्रेट 2[1] ओपन सोर्स का परिणामी क्लस्टरिंग इंजन शोध है।[2]यह स्वचालित रूप से दस्तावेज़ों के लघु संग्रहों को समूहित कर सकता है, उदा.- विषयगत श्रेणियों में शोध परिणाम या दस्तावेज़ सार इत्यादि। कैर्रेट 2 जावा में लिखा गया है और बीएसडी लाइसेंस के अंतर्गत वितरित किया गया है।

इतिहास

पोलिश में क्लस्टरिंग शोध परिणामों के लिए एसटीसी क्लस्टरिंग एल्गोरिदम की प्रयोज्यता को मान्य करने के लिए अपने एमएससी (MSc) थीसिस के भाग के रूप में कैर्रेट 2 का प्रारंभिक संस्करण 2001 में दाविद वीस द्वारा लागू किया गया था। 2003 में, लिंगो सहित कई अन्य शोध परिणाम क्लस्टरिंग एल्गोरिदम जोड़े गए,[3]उपन्यास टेक्स्ट क्लस्टरिंग एल्गोरिदम विशेष रूप से शोध परिणामों के क्लस्टरिंग के लिए डिज़ाइन किया गया। जबकि कैर्रेट 2 का सोर्स कोड 2002 से उपलब्ध था, यह केवल 2006 में था जब संस्करण 1.0 आधिकारिक रूप में प्रस्तावित किया गया था। उसी वर्ष, संस्करण 2.0 को उत्तम यूजर इंटरफेस और विस्तारित उपकरण समुच्चय के साथ प्रस्तावित किया गया था। 2009 में, संस्करण 3.0 ने ग्रहण रिच क्लाइंट प्लेटफॉर्म के आधार पर क्लस्टरिंग गुणवत्ता, सरलीकृत एपीआई और ट्यूनिंग क्लस्टरिंग के लिए नए जीयूआई आवेदन में महत्वपूर्ण सुधार लाए। 2020 में, संस्करण 4.0.0 ने एपीआई, कोड क्लीनअप और डेस्कटॉप वर्कबेंच को हटाने के लिए और सरलीकरण लाया। संस्करण 4.1.0 कार्यक्षेत्र को वेब-आधारित अनुप्रयोग के रूप में वापस लाता है।

कैर्रेट 2 रिलीज
रिलीज रिलीज़ की तारीख प्रमुख परिवर्तन और नई सुविधाएँ
4.5.0 नवंबर 2022 निर्भरता अद्यतन, बग फिक्स।
4.4.3 अगस्त 2022 निर्भरता अद्यतन, एसटीसी और स्टेमिंग बुनियादी ढांचे के लिए बग फिक्स।
4.4.0, 4.4.1, 4.4.2 दिसंबर 2021 सुरक्षा सुधार और निर्भरता अद्यतन।
4.3.0 जुलाई 2021 मामूली एपीआई परिवर्तन और बग फिक्स। कार्यक्षेत्र में सुधार (DCS खोज दृश्यपटल)।
4.2.0, 4.2.1 मार्च 2021 JSON शब्दकोशों और कार्यक्षेत्र में सुधार। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना।
4.1.0 जनवरी 2021 वेब आधारित कार्यक्षेत्र। JSON शब्दकोश और नए फ़िल्टरिंग विकल्प। एपीआई पॉलिशिंग।
4.0.0 जुलाई 2020 एपीआई परिवर्तन और कोडबेस भर में सरलीकरण। बहिष्कृत प्रौद्योगिकियों और उपकरणों को हटाना। नया दस्तावेज़ीकरण और कोड क्लीनअप।
3.16.2 सितंबर 2019 तृतीय पक्ष पुस्तकालयों को अद्यतन करें (सुरक्षा संबंधी मुद्दे)।
3.16.1 जनवरी 2019 जेएस विज़ुअलाइज़ेशन का अद्यतन। माइक्रोसॉफ्ट बिंग एपीआई v5 से v7 का माइग्रेशन।
3.16.0 मई 2018 जावा 9+ संगतता मुद्दों का ओवरहाल। उबंटू डिस्ट्रोस के लिए वर्कबेंच संगतता। दस्तावेज़ सोर्स अद्यतन और गैर-कार्यात्मक दस्तावेज़ सोर्सों को हटाना।
3.15.1 मार्च 2017 .NET रिलीज़ के लिए एक बग फिक्स जिसके परिणामस्वरूप अप्राप्य वर्तमान कार्यशील निर्देशिका पर अनियंत्रित I/O अपवाद हो सकते हैं।
3.15.0 अक्टूबर 2016 Bing API V2 से V5 संक्रमण। तृतीय पक्ष निर्भरता का उन्नयन। आंतरिक सौंदर्य प्रसाधन।
3.14.0 सितंबर 2016 कार्यक्षेत्र में सुधार (उच्च DPI समर्थन, MacOSX सुधार, बग फिक्स)। PubMed HTTP पर स्विच कर रहा है। अन्य मामूली सुधार।
3.13.0 जुलाई 2016 सर्वलेट एपीआई बग फिक्स, वर्कबेंच बग फिक्स, हटाए गए Google दस्तावेज़ सोर्स, कुछ भाषाओं के लिए निश्चित भाषा कोड।
3.12.0 फरवरी 2016 Morfologik पोलिश शब्दकोश का उन्नयन, ढांचागत परिवर्तन और समायोजन C2 को अधिक सख्त सुरक्षा प्रबंधक नीतियों के तहत संचालित करने की अनुमति देता है।
3.11.0 अक्टूबर 2015 Apache Lucene का अपग्रेड, बग फिक्स और 3.10.x माइनर से परिवर्तनों का रोलअप।
3.10.4 अक्टूबर 2015 मोर्फोलॉजिक पुस्तकालय का उन्नयन।
3.10.3 अगस्त 2015 सोलर में टकराव से बचने के लिए Google अमरूद को दोबारा पैक किया।
3.10.2 जुलाई 2015 वर्कबेंच (अरबी क्लस्टर डिस्प्ले) में मामूली सुधार।
3.10.1 मई 2015 Aduna विज़ुअलाइज़ेशन MacOS वितरण से हटा दिया गया। कार्यक्षेत्र में मामूली सुधार।
3.10.0 मई 2015 विज़ुअलाइज़ेशन अद्यतन। कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना। पुस्तकालय निर्भरता अद्यतन।
3.9.4 नवंबर 2014 फोमट्री अपडेट। बहुभाषी क्लस्टरिंग के लिए नई विशेषताएँ। विज़ुअलाइज़ेशन ठीक करता है।
3.9.3 जुलाई 2014 फोमट्री अपडेट। इन्फ्रास्ट्रक्चर फिक्स और ट्वीक्स (jflex, sonatype रिपॉजिटरी URL)।
3.9.2 अप्रैल 2014 फोमट्री एचटीएमएल5 में बग फिक्स।
3.9.1 अप्रैल 2014 बग फिक्स, HTML5 विज़ुअलाइज़ेशन का अपग्रेड।
3.9.0 फरवरी 2014 फ़्लैश की जगह HTML5 विज़ुअलाइज़ेशन, लाइब्रेरी डिपेंडेंसी अपडेट, बग फिक्स।
3.8.1 अक्टूबर 2013 बग फिक्स, कार्यक्षमता में मामूली बदलाव।
3.8.0 जुलाई 2013 बग फिक्स, पुस्तकालय निर्भरता अद्यतन।
3.7.1 मई 2013 मामूली बग फिक्स (3.7.0 रखरखाव रिलीज़)।
3.7.0 अप्रैल 2013 कोर (स्ट्रिंग आईडी) में इंफ्रास्ट्रक्चर परिवर्तन, बेहतर सोलर इंटीग्रेशन एक्सएसएलटी, बड़े इनपुट के लिए वर्कबेंच ट्वीक्स, अपडेटेड डिपेंडेंसी।
3.6.3 अप्रैल 2013 मामूली बग फिक्स और सुधार: सोलर एडॉप्टर XSLT का अनुकूलन, बड़े इनपुट के लिए कार्यक्षेत्र में बदलाव, अद्यतन निर्भरताएँ।
3.6.2 नवंबर 2012 मामूली बग फिक्स और सुधार।
3.6.1 अगस्त 2012 छोटे सुधार।
3.6.0 जून 2012 अवसंरचनात्मक परिवर्तन, रीफैक्टरिंग और बग फिक्स।
3.5.3 दिसंबर 2011 गिटहब में माइग्रेशन के परिणामस्वरूप इंफ्रास्ट्रक्चर अपडेट। वर्कबेंच SWT 3.7.1 के लिए अद्यतन।
3.5.2 सितंबर 2011 दस्तावेज़ क्लस्टरिंग सर्वर में अजाक्स समर्थन, बिंग दस्तावेज़ सोर्स में सुधार, वर्कबेंच सुधार, बग फिक्स।
3.5.1 जून 2011 बग फिक्स, विज़ुअलाइज़ेशन इंटीग्रेशन सुधार, Yahoo BOSS API के लिए समर्थन हटा दिया गया।
3.5.0 मई 2011 फोमट्री विज़ुअलाइज़ेशन, बाइसेक्टिंग के-मतलब क्लस्टरिंग, संसाधन प्रबंधन में सुधार
3.4.3 मार्च 2011 मावेन केंद्रीय भंडार को वितरण
3.4.2 अक्टूबर 2010 कंप्यूटर प्रोग्राम या प्रणाली में बग को दूर करना
3.4.1 सितंबर 2010 Solr 1.4.x संगतता पैकेज, बग फिक्स
3.4.0 अगस्त 2010 गाजर² क्लस्टरिंग को कॉल करने के लिए .NET API
3.3.0 अप्रैल 2010 एसटीसी क्लस्टरिंग एल्गोरिथम में महत्वपूर्ण मापनीयता सुधार
3.2.0 मार्च 2010 क्लस्टरिंग अरबी और कोरियाई सामग्री के लिए प्रायोगिक समर्थन, बैच मोड में क्लस्टरिंग के लिए कमांड लाइन एप्लिकेशन, एलजीपीएल -लाइसेंस प्राप्त निर्भरताएं हटा दी गईं
3.1.0 सितंबर 2009 क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
3.1.0 सितंबर 2009 क्लस्टरिंग चीनी सामग्री के लिए प्रायोगिक समर्थन, अपाचे सोलर के लिए खोज परिणाम क्लस्टरिंग प्लगइन
3.0.1 मार्च 2009 दस्तावेज़ क्लस्टरिंग कार्यक्षेत्र मैक ओएस एक्स के लिए उपलब्ध है
3.0.0 जनवरी 2009 दस्तावेज़ क्लस्टरिंग वर्कबेंच गाजर² क्लस्टरिंग के साथ आसान प्रयोग के लिए जोड़ा गया, मूल रूप से सरलीकृत जावा एपीआई, खोज परिणाम क्लस्टरिंग वेब एप्लिकेशन को फिर से लागू किया गया, उपयोगकर्ता मैनुअल उपलब्ध
2.1.0 अगस्त 2007 क्लस्टरिंग को REST सेवा के रूप में उजागर करने के लिए दस्तावेज़ क्लस्टरिंग सर्वर जोड़ा गया
2.0.0 सितंबर 2006 खोज परिणाम क्लस्टरिंग वेब अनुप्रयोग का नया उपयोगकर्ता इंटरफ़ेस
1.0.0 जनवरी 2006 पहला आधिकारिक रिलीज, सोर्सफोर्ज पर बायनेरिज़ उपलब्ध
0.0.0 2002 से इनक्यूबेशन रिलीज़, सोर्स कोड SourceForge पर उपलब्ध है
Carrot2
Developer(s)कैर्रेट शोध
Stable release
4.5.0 / November 3, 2022 (2022-11-03)
Repositorygithub.com/carrot2/carrot2/
Written inJava
Operating systemक्रॉस-प्लेटफ़ॉर्म
Typeटेक्स्ट माइनिंग और क्लस्टर विश्लेषण
Licenseबीएसडी लाइसेंस
Websitesearch.carrot2.org

आर्किटेक्चर

कैर्रेट 2 4.0 मुख्य रूप से भाषा-विशिष्ट संसाधनों, एल्गोरिथम कॉन्फ़िगरेशन और निष्पादन के प्रबंधन के लिए सार्वजनिक एपीआई के साथ जावा प्रोग्रामिंग लाइब्रेरी करता है। अन्य भाषाओं के साथ इंटर-ऑपरेबिलिटी के लिए एचटीटीपी (HTTP)/रेस्ट (REST) घटक (दस्तावेज़ क्लस्टरिंग सर्वर) प्रदान किया जाता है।

क्लस्टरिंग एल्गोरिदम

कैर्रेट 2 कुछ दस्तावेज़ क्लस्टरिंग एल्गोरिदम प्रदान करता है जो क्लस्टर लेबल की गुणवत्ता पर बल देता है:

  • लिंगो:[1] क्लस्टरिंग एल्गोरिदम एकवचन मूल्य अपघटन पर आधारित है I
  • एसटीसी:[2] प्रत्यय ट्री क्लस्टरिंग पर आधारित है I

स्पिन-ऑफ

कैर्रेट शोध

कैर्रेटशोध,[4] कैर्रेट 2 परियोजना का वाणिज्यिक स्पिन-ऑफ, के आगे के विकास पर कार्य करता है, रीयल-टाइम टेक्स्ट क्लस्टरिंग एल्गोरिदम प्रदान करता है[3] जो कैर्रेट 2 के रूप के साथ-साथ खुले सोर्स पर सॉफ्टवेयर के आधार पर पाठ खनन परामर्श सेवाएं प्रदान करता है।

कैर्रेट शोध लैब्स

कैर्रेट 2 ने सर्च लैब्स के आश्रय में प्रस्तावित कई स्वतंत्र ओपन सोर्स परियोजनाओं को उत्पन्न किया।[5] इस कार्य में भाग के रूप में निम्नलिखित परियोजनाएं प्रकाशित की गई हैं या प्रकाशित की गई थीं:

  • रैंडमाइज्ड टेस्टिंग: प्रत्येक परीक्षण को अल्प भिन्न (यादृच्छिक) चलाने के लिए अंतर्निहित उपयोगिताओं के साथ जे इकाई परीक्षण धावक, लोड संतुलन और अन्य बेल्स के समानांतर जेवीएम (JVMs) पर जे इकाई परीक्षण चलाने के लिए भी एएनटी कार्य करता है।
  • जावा के लिए उच्च प्रदर्शन आदिम संग्रह (एचपीपीसी): जावा के लिए सूची, समुच्चय, मानचित्र और प्रिमिटिव्स के अन्य संग्रह उच्चतम प्रदर्शन और मेमोरी दक्षता के लिए प्रदर्शित किए गए हैं।
  • स्मार्टस्प्राइट्स: सीएसएस स्प्राइट्स को पूर्ण रूप से स्वचालित सुरक्षा; स्प्राइटेड छवियों को जोड़ते या परिवर्तित करते सीएसएस में कोई निरुद्देश्य कॉपी और पेस्ट नहीं करना चाहिए।

बंद परियोजनाएं:

  • जे सफ़्फ़िक्स ऐरेस: विभिन्न प्रदर्शन और स्मृति विशेषताओं के साथ प्रत्यय सरणी डेटा संरचना के कई जावा कार्यान्वयन है।
  • जे इकाई बेंचमार्क्स: जेइकाई4 परीक्षणों को जीसी मॉनिटरिंग, समय विचरण माप और सरल ग्राफिकल विज़ुअलाइज़ेशन के साथ प्रदर्शन माइक्रो-बेंचमार्क में परिवर्तन के लिए एक्सटेंशन का समुच्चय हैं।

यह भी देखें

ओपन सॉफ्टवेयर पोर्टल

संदर्भ

  1. 1.0 1.1 Stanisław Osiński, Dawid Weiss: A Concept-Driven Algorithm for Clustering Search Results. IEEE Intelligent Systems, May/June, 3 (vol. 20), 2005, pp. 48–54.
  2. 2.0 2.1 Oren Zamir, Oren Etzioni: Web Document Clustering: A Feasibility Demonstration, Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (1998), pp. 46–54
  3. 3.0 3.1 Carrot Search s.c. "गाजर खोज: Lingo3G: टेक्स्ट दस्तावेज़ क्लस्टरिंग इंजन".
  4. Carrot Search s.c. "गाजर खोज: दस्तावेज़ क्लस्टरिंग और विज़ुअलाइज़ेशन सॉफ़्टवेयर".
  5. Carrot Search s.c. "गाजर खोज लैब्स".