क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{refimprove|date=September 2014}} | {{refimprove|date=September 2014}} | ||
'''क्रॉस-लैंग्वेज सूचना''' पुनर्प्राप्ति (सीएलआईआर) सूचना पुनर्प्राप्ति का एक उपक्षेत्र है, जो उपयोगकर्ता की क्वेरी की भाषा से भिन्न भाषा में लिखी गई जानकारी को पुनः प्राप्त करने से संबंधित है।<ref>Wang, Jianqiang, and Douglas W. Oard. "Matching meaning for cross-language information retrieval." ''Information Processing & Management''48.4 (2012): 631-53.</ref> इस शब्द में क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति शब्द के कई समानार्थक शब्द हैं, जिनमें से निम्नलिखित संभवतः सबसे अधिक बार मिलते हैं और इस प्रकार | '''क्रॉस-लैंग्वेज सूचना''' पुनर्प्राप्ति (सीएलआईआर) सूचना पुनर्प्राप्ति का एक उपक्षेत्र है, जो उपयोगकर्ता की क्वेरी की भाषा से भिन्न भाषा में लिखी गई जानकारी को पुनः प्राप्त करने से संबंधित है।<ref>Wang, Jianqiang, and Douglas W. Oard. "Matching meaning for cross-language information retrieval." ''Information Processing & Management''48.4 (2012): 631-53.</ref> इस शब्द में क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति शब्द के कई समानार्थक शब्द हैं, जिनमें से निम्नलिखित संभवतः सबसे अधिक बार मिलते हैं और इस प्रकार क्रॉस-लिंगुअल सूचना पुनर्प्राप्ति, ट्रांसलिंगुअल सूचना पुनर्प्राप्ति, बहुभाषी सूचना पुनर्प्राप्ति शब्द सामान्य रूप से बहुभाषी संग्रहों की पुनर्प्राप्ति के लिए प्रौद्योगिकी के लिए संदर्भित करता है, जिसे एक भाषा से दूसरी भाषा में सामग्री को संभालने के लिए स्थानांतरित किया जाता है। बहुभाषी सूचना पुनर्प्राप्ति (एमएलआईआर) शब्द में उन प्रणालियों का अध्ययन सम्मलित है, जो विभिन्न भाषाओं में जानकारी के लिए प्रश्नों को स्वीकार करते हैं और विभिन्न भाषाओं के ऑब्जेक्ट टेक्स्ट और अन्य मीडिया को उपयोगकर्ता की भाषा में अनुवादित करते हैं। क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति अधिक विशेष रूप से उपयोग के स्थितियों को संदर्भित करती है जहां उपयोगकर्ता एक भाषा में अपनी जानकारी की आवश्यकता का निरुपण करते हैं और प्रणाली किसी अन्य भाषा में प्रासंगिक दस्तावेजों को पुनः प्राप्त करता है। ऐसा करने के लिए अधिकांश सीएलआईआर प्रणालियाँ विभिन्न अनुवाद प्रौद्योगिकीय ों का उपयोग करती हैं। सीएलआईआर प्रौद्योगिकीय ों को विभिन्न अनुवाद संसाधनों के आधार पर विभिन्न श्रेणियों में वर्गीकृत किया जा सकता है।<ref>{{Cite web |last=Tsai |first=Peishan |title=क्रॉस-लैंग्वेज इंफॉर्मेशन रिट्रीवल एप्रोच का परिचय|url=http://www.mikeandpeishan.com/psSchool/Papers/PBartley-CLIR-Intro.htm |url-status=live |archive-url=https://web.archive.org/web/20221104152445/http://www.mikeandpeishan.com/psSchool/Papers/PBartley-CLIR-Intro.htm |archive-date=2022-11-04 |access-date=2022-11-04 |website=www.mikeandpeishan.com}}</ref> | ||
* शब्दकोश आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है | * शब्दकोश आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है | ||
Line 9: | Line 9: | ||
* मशीन अनुवादक आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है | * मशीन अनुवादक आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है | ||
सीएलआईआर प्रणाली में इतना सुधार हुआ है कि आज सबसे सटीक बहुभाषी और क्रॉस-लिंगुअल एडहॉक सूचना पुनर्प्राप्ति | सीएलआईआर प्रणाली में इतना सुधार हुआ है कि आज सबसे सटीक बहुभाषी और क्रॉस-लिंगुअल एडहॉक सूचना पुनर्प्राप्ति प्रणाली लगभग मोनोलिंगुअल प्रणाली के रूप में प्रभावी होता हैं।<ref>Oard, Douglas. "Multilingual Information Access." ''Understanding Information Retrieval Systems''(2011): 373-80. Web.</ref> अन्य संबंधित सूचना एक्सेस कार्यों, जैसे कि[[ मीडिया निगरानी | मीडिया मॉनिटरिंग]], [[सूचना फ़िल्टरिंग]] और रूटिंग, सेंटीमेंट विश्लेषण और [[सूचना निष्कर्षण]] के लिए अधिक परिष्कृत मॉडल की आवश्यकता होती है और सामान्य रूप से ब्याज की सूचना वस्तुओं के अधिक प्रसंस्करण और विश्लेषण की आवश्यकता होती है। उस प्रसंस्करण में से अधिकांश को उन लक्षित भाषाओं की बारीकियों के बारे में पता होना चाहिए, जिनमें इसे तैनात किया गया है। | ||
अधिकतर मानव भाषा में परिवर्तन के विभिन्न तंत्रों से सूचना पुनर्प्राप्ति प्रणालियों के लिए कवरेज चुनौतियों का सामना करते हैं और इस प्रकार संग्रह में लिखे गए पाठ रुचि के विषय का उपचार कर सकते हैं लेकिन उन शब्दों या अभिव्यक्तियों का उपयोग करते हैं जो उपयोगकर्ता द्वारा दी गई जानकारी की अभिव्यक्ति से मेल नहीं खाते हैं। यह एक भाषी स्थिति में भी सच हो सकता है, लेकिन यह विशेष रूप से क्रॉस-भाषी सूचना पुनर्प्राप्ति में सच है, जहां पर उपयोगकर्ता कुछ | अधिकतर मानव भाषा में परिवर्तन के विभिन्न तंत्रों से सूचना पुनर्प्राप्ति प्रणालियों के लिए कवरेज चुनौतियों का सामना करते हैं और इस प्रकार संग्रह में लिखे गए पाठ रुचि के विषय का उपचार कर सकते हैं लेकिन उन शब्दों या अभिव्यक्तियों का उपयोग करते हैं जो उपयोगकर्ता द्वारा दी गई जानकारी की अभिव्यक्ति से मेल नहीं खाते हैं। यह एक भाषी स्थिति में भी सच हो सकता है, लेकिन यह विशेष रूप से क्रॉस-भाषी सूचना पुनर्प्राप्ति में सच है, जहां पर उपयोगकर्ता कुछ स्तर तक लक्ष्य भाषा जान सकते हैं। लक्ष्य भाषा में खराब से मध्यम क्षमता वाले उपयोगकर्ताओं के लिए सीएलआईआर प्रौद्योगिकीय का लाभ धाराप्रवाह बोलने वालों की तुलना में अधिक पाया गया है।<ref>{{cite journal|last1=Airio|first1=Eija|title=Who benefits from CLIR in web retrieval?|journal=Journal of Documentation|date=2008|volume=64|issue=5|pages=760–778|doi=10.1108/00220410810899754|url=http://tampub.uta.fi/handle/10024/65923}}</ref> सीएलआईआर सेवाओं के लिए उपस्थित विशिष्ट प्रौद्योगिकीय ों में कंपाउंड (भाषा विज्ञान) को संभालने के लिए रूपान्तरण डीकंपाउंडिंग या कंपाउंड स्प्लिटिंग को संभालने के लिए [[आकृति विज्ञान (भाषा विज्ञान)]] और एक भाषा से दूसरी भाषा में क्वेरी का अनुवाद करने के लिए अनुवाद तंत्र के रूप में सम्मलित हैं। | ||
एसआईजीआईआर-96 सम्मेलन के समय ज़्यूरिख में सीएलआईआर पर पहली कार्यशाला आयोजित की गई थी।<ref>The proceedings of this workshop can be found in the book ''Cross-Language Information Retrieval'' (Grefenstette, ed; Kluwer, 1998) {{ISBN|0-7923-8122-X}}.</ref> [[क्रॉस लैंग्वेज इवैल्यूएशन फोरम|क्रॉस लैंग्वेज मूल्यांकन फोरम]] (सीएलईएफ) की बैठकों में वर्ष 2000 से सालाना कार्यशालाएं आयोजित की जाती हैं और इस प्रकार अनुसंधानकर्ता विभिन्न प्रणालियों और सूचना पुनर्प्राप्ति की विभिन्न प्रणालियों और पद्धतियों से संबंधित अपने निष्कर्षों पर चर्चा करने के लिए वार्षिक [[पाठ्य पुनर्प्राप्ति सम्मेलन]] (टीआरसी) का भी आयोजन करते हैं और सम्मेलन ने सीएलआईआर उपक्षेत्र के संदर्भ बिंदु के रूप में कार्य किया है।<ref>Olvera-Lobo, María-Dolores. "Cross-Language Information Retrieval on the Web." ''Handbook of Research on Social Dimensions of Semantic Technologies and Web Services''(n.d.): 704-19. Web.</ref> राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) में 19-21 नवंबर, 1997 को आयोजित प्रारंभिक क्लियर प्रयोग ट्राईसी-6 में किए गए थे।<ref>{{Cite journal |last=Vorhees |first=Ellen M. |last2=Harman |first2=Donna |year=1999 |title=Overview of the Sixth Text REtrieval Conference (TREC-6) |url=https://tsapps.nist.gov/publication/get_pdf.cfm?pub_id=151399 |journal=[[Information Processing and Management]]}}</ref> | एसआईजीआईआर-96 सम्मेलन के समय ज़्यूरिख में सीएलआईआर पर पहली कार्यशाला आयोजित की गई थी।<ref>The proceedings of this workshop can be found in the book ''Cross-Language Information Retrieval'' (Grefenstette, ed; Kluwer, 1998) {{ISBN|0-7923-8122-X}}.</ref> [[क्रॉस लैंग्वेज इवैल्यूएशन फोरम|क्रॉस लैंग्वेज मूल्यांकन फोरम]] (सीएलईएफ) की बैठकों में वर्ष 2000 से सालाना कार्यशालाएं आयोजित की जाती हैं और इस प्रकार अनुसंधानकर्ता विभिन्न प्रणालियों और सूचना पुनर्प्राप्ति की विभिन्न प्रणालियों और पद्धतियों से संबंधित अपने निष्कर्षों पर चर्चा करने के लिए वार्षिक [[पाठ्य पुनर्प्राप्ति सम्मेलन]] (टीआरसी) का भी आयोजन करते हैं और सम्मेलन ने सीएलआईआर उपक्षेत्र के संदर्भ बिंदु के रूप में कार्य किया है।<ref>Olvera-Lobo, María-Dolores. "Cross-Language Information Retrieval on the Web." ''Handbook of Research on Social Dimensions of Semantic Technologies and Web Services''(n.d.): 704-19. Web.</ref> राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) में 19-21 नवंबर, 1997 को आयोजित प्रारंभिक क्लियर प्रयोग ट्राईसी-6 में किए गए थे।<ref>{{Cite journal |last=Vorhees |first=Ellen M. |last2=Harman |first2=Donna |year=1999 |title=Overview of the Sixth Text REtrieval Conference (TREC-6) |url=https://tsapps.nist.gov/publication/get_pdf.cfm?pub_id=151399 |journal=[[Information Processing and Management]]}}</ref> | ||
Line 17: | Line 17: | ||
गूगल खोज में एक क्रॉस-भाषा खोज सुविधा के रूप में थी, जिसे 2013 में हटा दिया गया था।<ref>{{cite web|url=http://searchengineland.com/google-drops-translated-foreign-pages-search-option-due-to-lack-of-use-160157|title=उपयोग में कमी के कारण Google "अनुवादित विदेशी पृष्ठ" खोज विकल्प को छोड़ देता है|date=20 May 2013}}</ref> | गूगल खोज में एक क्रॉस-भाषा खोज सुविधा के रूप में थी, जिसे 2013 में हटा दिया गया था।<ref>{{cite web|url=http://searchengineland.com/google-drops-translated-foreign-pages-search-option-due-to-lack-of-use-160157|title=उपयोग में कमी के कारण Google "अनुवादित विदेशी पृष्ठ" खोज विकल्प को छोड़ देता है|date=20 May 2013}}</ref> | ||
== यह भी देखें == | == यह भी देखें == | ||
*[[EXCLAIM]] | *[[EXCLAIM|एक्सक्लिम]] एक्सटेंसिबल क्रॉस-भाषाई स्वचालित सूचना मशीन के रूप में होती है | ||
*[[CLEF]] | *[[CLEF|सीएलईएफ]] मूल्यांकन फोरम का सम्मेलन और लैब्स के रूप में होते है, जिसे पहले क्रॉस-लैंग्वेज मूल्यांकन फोरम के रूप में जाना जाता था | ||
==संदर्भ== | ==संदर्भ== |
Revision as of 20:50, 25 June 2023
This article needs additional citations for verification. (September 2014) (Learn how and when to remove this template message) |
क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति (सीएलआईआर) सूचना पुनर्प्राप्ति का एक उपक्षेत्र है, जो उपयोगकर्ता की क्वेरी की भाषा से भिन्न भाषा में लिखी गई जानकारी को पुनः प्राप्त करने से संबंधित है।[1] इस शब्द में क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति शब्द के कई समानार्थक शब्द हैं, जिनमें से निम्नलिखित संभवतः सबसे अधिक बार मिलते हैं और इस प्रकार क्रॉस-लिंगुअल सूचना पुनर्प्राप्ति, ट्रांसलिंगुअल सूचना पुनर्प्राप्ति, बहुभाषी सूचना पुनर्प्राप्ति शब्द सामान्य रूप से बहुभाषी संग्रहों की पुनर्प्राप्ति के लिए प्रौद्योगिकी के लिए संदर्भित करता है, जिसे एक भाषा से दूसरी भाषा में सामग्री को संभालने के लिए स्थानांतरित किया जाता है। बहुभाषी सूचना पुनर्प्राप्ति (एमएलआईआर) शब्द में उन प्रणालियों का अध्ययन सम्मलित है, जो विभिन्न भाषाओं में जानकारी के लिए प्रश्नों को स्वीकार करते हैं और विभिन्न भाषाओं के ऑब्जेक्ट टेक्स्ट और अन्य मीडिया को उपयोगकर्ता की भाषा में अनुवादित करते हैं। क्रॉस-लैंग्वेज सूचना पुनर्प्राप्ति अधिक विशेष रूप से उपयोग के स्थितियों को संदर्भित करती है जहां उपयोगकर्ता एक भाषा में अपनी जानकारी की आवश्यकता का निरुपण करते हैं और प्रणाली किसी अन्य भाषा में प्रासंगिक दस्तावेजों को पुनः प्राप्त करता है। ऐसा करने के लिए अधिकांश सीएलआईआर प्रणालियाँ विभिन्न अनुवाद प्रौद्योगिकीय ों का उपयोग करती हैं। सीएलआईआर प्रौद्योगिकीय ों को विभिन्न अनुवाद संसाधनों के आधार पर विभिन्न श्रेणियों में वर्गीकृत किया जा सकता है।[2]
- शब्दकोश आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
- समानांतर कॉर्पोरा आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
- तुलनीय कॉर्पोरा आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
- मशीन अनुवादक आधारित सीएलआईआर प्रौद्योगिकीय के रूप में होती है
सीएलआईआर प्रणाली में इतना सुधार हुआ है कि आज सबसे सटीक बहुभाषी और क्रॉस-लिंगुअल एडहॉक सूचना पुनर्प्राप्ति प्रणाली लगभग मोनोलिंगुअल प्रणाली के रूप में प्रभावी होता हैं।[3] अन्य संबंधित सूचना एक्सेस कार्यों, जैसे कि मीडिया मॉनिटरिंग, सूचना फ़िल्टरिंग और रूटिंग, सेंटीमेंट विश्लेषण और सूचना निष्कर्षण के लिए अधिक परिष्कृत मॉडल की आवश्यकता होती है और सामान्य रूप से ब्याज की सूचना वस्तुओं के अधिक प्रसंस्करण और विश्लेषण की आवश्यकता होती है। उस प्रसंस्करण में से अधिकांश को उन लक्षित भाषाओं की बारीकियों के बारे में पता होना चाहिए, जिनमें इसे तैनात किया गया है।
अधिकतर मानव भाषा में परिवर्तन के विभिन्न तंत्रों से सूचना पुनर्प्राप्ति प्रणालियों के लिए कवरेज चुनौतियों का सामना करते हैं और इस प्रकार संग्रह में लिखे गए पाठ रुचि के विषय का उपचार कर सकते हैं लेकिन उन शब्दों या अभिव्यक्तियों का उपयोग करते हैं जो उपयोगकर्ता द्वारा दी गई जानकारी की अभिव्यक्ति से मेल नहीं खाते हैं। यह एक भाषी स्थिति में भी सच हो सकता है, लेकिन यह विशेष रूप से क्रॉस-भाषी सूचना पुनर्प्राप्ति में सच है, जहां पर उपयोगकर्ता कुछ स्तर तक लक्ष्य भाषा जान सकते हैं। लक्ष्य भाषा में खराब से मध्यम क्षमता वाले उपयोगकर्ताओं के लिए सीएलआईआर प्रौद्योगिकीय का लाभ धाराप्रवाह बोलने वालों की तुलना में अधिक पाया गया है।[4] सीएलआईआर सेवाओं के लिए उपस्थित विशिष्ट प्रौद्योगिकीय ों में कंपाउंड (भाषा विज्ञान) को संभालने के लिए रूपान्तरण डीकंपाउंडिंग या कंपाउंड स्प्लिटिंग को संभालने के लिए आकृति विज्ञान (भाषा विज्ञान) और एक भाषा से दूसरी भाषा में क्वेरी का अनुवाद करने के लिए अनुवाद तंत्र के रूप में सम्मलित हैं।
एसआईजीआईआर-96 सम्मेलन के समय ज़्यूरिख में सीएलआईआर पर पहली कार्यशाला आयोजित की गई थी।[5] क्रॉस लैंग्वेज मूल्यांकन फोरम (सीएलईएफ) की बैठकों में वर्ष 2000 से सालाना कार्यशालाएं आयोजित की जाती हैं और इस प्रकार अनुसंधानकर्ता विभिन्न प्रणालियों और सूचना पुनर्प्राप्ति की विभिन्न प्रणालियों और पद्धतियों से संबंधित अपने निष्कर्षों पर चर्चा करने के लिए वार्षिक पाठ्य पुनर्प्राप्ति सम्मेलन (टीआरसी) का भी आयोजन करते हैं और सम्मेलन ने सीएलआईआर उपक्षेत्र के संदर्भ बिंदु के रूप में कार्य किया है।[6] राष्ट्रीय मानक एवं प्रौद्योगिकी संस्थान (एनआईएसटी) में 19-21 नवंबर, 1997 को आयोजित प्रारंभिक क्लियर प्रयोग ट्राईसी-6 में किए गए थे।[7]
गूगल खोज में एक क्रॉस-भाषा खोज सुविधा के रूप में थी, जिसे 2013 में हटा दिया गया था।[8]
यह भी देखें
- एक्सक्लिम एक्सटेंसिबल क्रॉस-भाषाई स्वचालित सूचना मशीन के रूप में होती है
- सीएलईएफ मूल्यांकन फोरम का सम्मेलन और लैब्स के रूप में होते है, जिसे पहले क्रॉस-लैंग्वेज मूल्यांकन फोरम के रूप में जाना जाता था
संदर्भ
- ↑ Wang, Jianqiang, and Douglas W. Oard. "Matching meaning for cross-language information retrieval." Information Processing & Management48.4 (2012): 631-53.
- ↑ Tsai, Peishan. "क्रॉस-लैंग्वेज इंफॉर्मेशन रिट्रीवल एप्रोच का परिचय". www.mikeandpeishan.com. Archived from the original on 2022-11-04. Retrieved 2022-11-04.
- ↑ Oard, Douglas. "Multilingual Information Access." Understanding Information Retrieval Systems(2011): 373-80. Web.
- ↑ Airio, Eija (2008). "Who benefits from CLIR in web retrieval?". Journal of Documentation. 64 (5): 760–778. doi:10.1108/00220410810899754.
- ↑ The proceedings of this workshop can be found in the book Cross-Language Information Retrieval (Grefenstette, ed; Kluwer, 1998) ISBN 0-7923-8122-X.
- ↑ Olvera-Lobo, María-Dolores. "Cross-Language Information Retrieval on the Web." Handbook of Research on Social Dimensions of Semantic Technologies and Web Services(n.d.): 704-19. Web.
- ↑ Vorhees, Ellen M.; Harman, Donna (1999). "Overview of the Sixth Text REtrieval Conference (TREC-6)". Information Processing and Management.
- ↑ "उपयोग में कमी के कारण Google "अनुवादित विदेशी पृष्ठ" खोज विकल्प को छोड़ देता है". 20 May 2013.