वर्तनी जांचकर्ता (स्पेल चेकर): Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Software to help correct spelling errors}}सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी...")
 
No edit summary
Line 1: Line 1:
{{Short description|Software to help correct spelling errors}}सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी जांचकर्ता या वर्तनी जांच) एक [[सॉफ्टवेयर सुविधा]] है जो [[पाठ फ़ाइल]] में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अक्सर [[सॉफ़्टवेयर]] या सेवाओं में अंतर्निहित होती हैं, जैसे [[ शब्द संसाधक ]], [[ईमेल क्लाइंट]], इलेक्ट्रॉनिक शब्दकोश या [[खोज इंजन]]।
{{Short description|Software to help correct spelling errors}}सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी जांचकर्ता या वर्तनी जांच) एक [[सॉफ्टवेयर सुविधा]] है जो [[पाठ फ़ाइल]] में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अक्सर [[सॉफ़्टवेयर]] या सेवाओं में अंतर्निहित होती हैं, जैसे [[ शब्द संसाधक |शब्द संसाधक]] , [[ईमेल क्लाइंट]], इलेक्ट्रॉनिक शब्दकोश या [[खोज इंजन]]।


{{image frame
{{image frame
Line 45: Line 45:
इन घटकों के सहायक के रूप में, प्रोग्राम का उपयोगकर्ता इंटरफ़ेस उपयोगकर्ताओं को प्रतिस्थापन को स्वीकृत या अस्वीकार करने और प्रोग्राम के संचालन को संशोधित करने की अनुमति देता है।
इन घटकों के सहायक के रूप में, प्रोग्राम का उपयोगकर्ता इंटरफ़ेस उपयोगकर्ताओं को प्रतिस्थापन को स्वीकृत या अस्वीकार करने और प्रोग्राम के संचालन को संशोधित करने की अनुमति देता है।


वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए [[लेवेनशेटिन दूरी]] जैसे [[अनुमानित स्ट्रिंग मिलान]] एल्गोरिदम का उपयोग कर सकते हैं।<ref>{{Cite book|last=Perner|first=Petra|url=https://books.google.com/books?id=wnXJfsCGQC8C&q=%22spell+checking%22|title=Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings|date=2010-07-05|publisher=Springer Science & Business Media|isbn=978-3-642-14399-1|language=en}}</ref> एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के बजाय त्रुटियों को पहचानने के लिए केवल [[एन-ग्राम]] जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में आमतौर पर पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम स्टोरेज की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता शामिल है जो शब्दकोश में शामिल नहीं हैं।<ref>U.S. Patent 6618697, [https://patentimages.storage.googleapis.com/84/a6/5f/6b58b2e2c2da12/US6618697.pdf Method for rule-based correction of spelling and grammar errors]</ref> <!-- The cited U.S. patent was used to implement a dictionary-less spelling correction algorithm for Graffiti on the Palm Pilot in only about 8k of memory. Another reference is "What Makes a Great Invention?", Wall Street Journal, 10/23/2003, https://www.wsj.com/articles/SB106684550065867100. An n-gram based algorithm is also included in Solr: http://lucidworks.com/blog/getting-started-spell-checking-with-apache-lucene-and-solr/.-->
वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए [[लेवेनशेटिन दूरी]] जैसे [[अनुमानित स्ट्रिंग मिलान]] एल्गोरिदम का उपयोग कर सकते हैं।<ref>{{Cite book|last=Perner|first=Petra|url=https://books.google.com/books?id=wnXJfsCGQC8C&q=%22spell+checking%22|title=Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings|date=2010-07-05|publisher=Springer Science & Business Media|isbn=978-3-642-14399-1|language=en}}</ref> एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के बजाय त्रुटियों को पहचानने के लिए केवल [[एन-ग्राम]] जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में आमतौर पर पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम स्टोरेज की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता शामिल है जो शब्दकोश में शामिल नहीं हैं।<ref>U.S. Patent 6618697, [https://patentimages.storage.googleapis.com/84/a6/5f/6b58b2e2c2da12/US6618697.pdf Method for rule-based correction of spelling and grammar errors]</ref>  
 
कुछ मामलों में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए [[वर्तनी सुझाव]] का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अक्सर कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।
कुछ मामलों में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए [[वर्तनी सुझाव]] का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अक्सर कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।


Line 91: Line 92:
   |url=https://www.commodore.ca/gallery/magazines/compute/Compute-008.pdf
   |url=https://www.commodore.ca/gallery/magazines/compute/Compute-008.pdf
   |title=माइक्रो कंप्यूटर इंडस्ट्रीज लिमिटेड|work=Compute! Magazine, Issue 8, Vol. 3, No. 1
   |title=माइक्रो कंप्यूटर इंडस्ट्रीज लिमिटेड|work=Compute! Magazine, Issue 8, Vol. 3, No. 1
   |date=January 1981  |author=Advertisement |page=119}}</ref> मारिया मारियानी जैसे डेवलपर्स<ref name="cled.georgetown.edu"/>और [[ आकस्मिक घर ]]<ref name="pc198211">{{cite magazine |magazine=[[PC Magazine]]
   |date=January 1981  |author=Advertisement |page=119}}</ref> मारिया मारियानी जैसे डेवलपर्स<ref name="cled.georgetown.edu"/>और [[ आकस्मिक घर |आकस्मिक घर]] <ref name="pc198211">{{cite magazine |magazine=[[PC Magazine]]
|url=https://books.google.com/books?id=vy3cBZkjbZgC&pg=PA165
|url=https://books.google.com/books?id=vy3cBZkjbZgC&pg=PA165
|title=The Spelling Bee Is Over
|title=The Spelling Bee Is Over
|date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया। प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के भीतर से [[ समाप्त करें-और-निवासी रहें ]] मोड में चलाया जा सकता था।
|date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया। प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के भीतर से [[ समाप्त करें-और-निवासी रहें |समाप्त करें-और-निवासी रहें]] मोड में चलाया जा सकता था।


हालाँकि, स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को शामिल कर लिया था, जो ज्यादातर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी। हालाँकि, इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में। हालाँकि [[आइसलैंड]] जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को लागू करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी [[WordPerfect]] जैसी कंपनियाँ अपनी वैश्विक [[ विपणन ]] रणनीति के हिस्से के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।
हालाँकि, स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को शामिल कर लिया था, जो ज्यादातर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी। हालाँकि, इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में। हालाँकि [[आइसलैंड]] जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को लागू करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी [[WordPerfect]] जैसी कंपनियाँ अपनी वैश्विक [[ विपणन |विपणन]] रणनीति के हिस्से के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।


जब Apple ने Mac OS<ref>{{cite book
जब Apple ने Mac OS<ref>{{cite book
|title=Mac OS X Snow Leopard: The Missing Manual |author=David Pogue |year=2009}}</ref> यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।<ref>{{cite book |title=Switching to the Mac: The Missing Manual
|title=Mac OS X Snow Leopard: The Missing Manual |author=David Pogue |year=2009}}</ref> यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।<ref>{{cite book |title=Switching to the Mac: The Missing Manual
|author=David Pogue |year=2015|url=https://books.google.com/books?id=1XFmBgAAQBAJ}}</ref> [[ Mac OS X ]] के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन शामिल हैं।
|author=David Pogue |year=2015|url=https://books.google.com/books?id=1XFmBgAAQBAJ}}</ref> [[ Mac OS X |Mac OS X]] के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन शामिल हैं।


विज़ुअल टूल्स का वीटी स्पेलर, 1994 में पेश किया गया था, जो विंडोज़ का समर्थन करने वाले अनुप्रयोगों के डेवलपर्स के लिए डिज़ाइन किया गया था।<ref>{{cite news |newspaper=[[Computerworld]]
विज़ुअल टूल्स का वीटी स्पेलर, 1994 में पेश किया गया था, जो विंडोज़ का समर्थन करने वाले अनुप्रयोगों के डेवलपर्स के लिए डिज़ाइन किया गया था।<ref>{{cite news |newspaper=[[Computerworld]]
Line 113: Line 114:


===ब्राउज़र===
===ब्राउज़र===
[[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors &#124; Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]]ों और [[ सामाजिक नेटवर्किंग ]] वेबसाइटों पर लिखना। वेब ब्राउज़र Google Chrome, [[Konqueror]], और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट [[Kmail]] और [[ तात्कालिक संदेशन ]] [[क्लाइंट (कंप्यूटिंग)]] पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले GNU एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।
[[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors &#124; Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]]ों और [[ सामाजिक नेटवर्किंग |सामाजिक नेटवर्किंग]] वेबसाइटों पर लिखना। वेब ब्राउज़र Google Chrome, [[Konqueror]], और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट [[Kmail]] और [[ तात्कालिक संदेशन |तात्कालिक संदेशन]] [[क्लाइंट (कंप्यूटिंग)]] पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले GNU एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।


===विशेषताएं===
===विशेषताएं===
Line 125: Line 126:
[[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले MS-DOS वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के भीतर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की तलाश में पाठ को स्कैन किया। हालाँकि, बाद में, [[Oracle Corporation]] के अल्पकालिक CoAuthor जैसे पैकेजों में बैच प्रोसेसिंग की पेशकश की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव तरीके से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से [[माइक्रोसॉफ्ट वर्ड]] के मामले में हुआ है।
[[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले MS-DOS वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के भीतर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की तलाश में पाठ को स्कैन किया। हालाँकि, बाद में, [[Oracle Corporation]] के अल्पकालिक CoAuthor जैसे पैकेजों में बैच प्रोसेसिंग की पेशकश की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव तरीके से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से [[माइक्रोसॉफ्ट वर्ड]] के मामले में हुआ है।


वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में सक्षम। हालाँकि, अपनी सर्वश्रेष्ठ स्थिति में भी, वे शायद ही किसी पाठ में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि [[ होमोफ़ोन ]] त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। बहरहाल, वर्तनी जांचकर्ताओं को एक प्रकार की [[विदेशी भाषा लेखन सहायता]] के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए भरोसा कर सकते हैं।<ref>Banks, T. (2008). [http://eric.ed.gov/PDFS/ED501062.pdf ''Foreign Language Learning Difficulties and Teaching Strategies'']. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.</ref>
वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में सक्षम। हालाँकि, अपनी सर्वश्रेष्ठ स्थिति में भी, वे शायद ही किसी पाठ में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि [[ होमोफ़ोन |होमोफ़ोन]] त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। बहरहाल, वर्तनी जांचकर्ताओं को एक प्रकार की [[विदेशी भाषा लेखन सहायता]] के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए भरोसा कर सकते हैं।<ref>Banks, T. (2008). [http://eric.ed.gov/PDFS/ED501062.pdf ''Foreign Language Learning Difficulties and Teaching Strategies'']. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.</ref>





Revision as of 12:13, 16 July 2023

सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी जांचकर्ता या वर्तनी जांच) एक सॉफ्टवेयर सुविधा है जो पाठ फ़ाइल में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अक्सर सॉफ़्टवेयर या सेवाओं में अंतर्निहित होती हैं, जैसे शब्द संसाधक , ईमेल क्लाइंट, इलेक्ट्रॉनिक शब्दकोश या खोज इंजन

Eye have a spelling chequer,
It came with my Pea Sea.
It plane lee marks four my revue
Miss Steaks I can knot sea.

Eye strike the quays and type a whirred
And weight four it two say
Weather eye am write oar wrong
It tells me straight a weigh.

Eye ran this poem threw it,
Your shore real glad two no.
Its vary polished in its weigh.
My chequer tolled me sew.

A chequer is a bless thing,
It freeze yew lodes of thyme.
It helps me right all stiles of righting,
And aides me when eye rime.

Each frays come posed up on my screen
Eye trussed too bee a joule.
The chequer pours o'er every word
Two cheque sum spelling rule.

The original version of this poem was written by Jerrold H. Zar in 1992. An unsophisticated spell checker will find little or no fault with this poem because it checks words in isolation. A more sophisticated spell checker will make use of a language model to consider the context in which a word occurs.
उपरोक्त कविता के लिए Google Chrome वर्तनी जांचकर्ता कार्य कर रहा है, शब्द जांचकर्ता को अपरिचित शब्द के रूप में चिह्नित किया गया है

डिज़ाइन

एक बुनियादी वर्तनी जाँचकर्ता निम्नलिखित प्रक्रियाएँ करता है:

  • यह टेक्स्ट को स्कैन करता है और उसमें मौजूद शब्दों को निकालता है।
  • इसके बाद यह प्रत्येक शब्द की तुलना सही ढंग से लिखे गए शब्दों की ज्ञात सूची (यानी एक शब्दकोश) से करता है। इसमें केवल शब्दों की एक सूची हो सकती है, या इसमें अतिरिक्त जानकारी भी हो सकती है, जैसे हाइफ़नेशन बिंदु या शाब्दिक और व्याकरण संबंधी विशेषताएँ।
  • एक अतिरिक्त कदम आकृति विज्ञान (भाषा विज्ञान) को संभालने के लिए एक भाषा-निर्भर एल्गोरिदम है। यहां तक ​​कि अंग्रेजी भाषा जैसी हल्की विभक्ति वाली भाषा के लिए भी, वर्तनी जांचकर्ता को एक ही शब्द के विभिन्न रूपों, जैसे बहुवचन, मौखिक रूप, संकुचन (व्याकरण), और स्वामित्व (भाषाविज्ञान) पर विचार करने की आवश्यकता होगी। कई अन्य भाषाओं के लिए, जैसे कि एग्लूटिनेशन और अधिक जटिल गिरावट और संयुग्मन की विशेषता वाली भाषाओं के लिए, प्रक्रिया का यह हिस्सा अधिक जटिल है।

यह स्पष्ट नहीं है कि क्या रूपात्मक विश्लेषण - किसी शब्द की व्याकरणिक भूमिका के आधार पर उसके कई रूपों की अनुमति देना - अंग्रेजी के लिए एक महत्वपूर्ण लाभ प्रदान करता है, हालांकि जर्मन, हंगेरियन या तुर्की जैसी अत्यधिक सिंथेटिक भाषाओं के लिए इसके लाभ स्पष्ट हैं।

इन घटकों के सहायक के रूप में, प्रोग्राम का उपयोगकर्ता इंटरफ़ेस उपयोगकर्ताओं को प्रतिस्थापन को स्वीकृत या अस्वीकार करने और प्रोग्राम के संचालन को संशोधित करने की अनुमति देता है।

वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए लेवेनशेटिन दूरी जैसे अनुमानित स्ट्रिंग मिलान एल्गोरिदम का उपयोग कर सकते हैं।[1] एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के बजाय त्रुटियों को पहचानने के लिए केवल एन-ग्राम जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में आमतौर पर पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम स्टोरेज की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता शामिल है जो शब्दकोश में शामिल नहीं हैं।[2]

कुछ मामलों में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए वर्तनी सुझाव का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अक्सर कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।

वर्तनी जाँच के लिए क्लस्टरिंग एल्गोरिदम का भी उपयोग किया गया है[3] ध्वन्यात्मक जानकारी के साथ संयुक्त।[4]


इतिहास

प्री-पीसी

1961 में, लेस अर्नेस्ट, जिन्होंने इस नवोदित तकनीक पर शोध का नेतृत्व किया, ने 10,000 स्वीकार्य शब्दों की सूची तक पहुंचने वाले पहले वर्तनी जांचकर्ता को शामिल करना आवश्यक समझा।[5] उस समय अर्नेस्ट के तहत स्नातक छात्र राल्फ गोरिन ने सामान्य अंग्रेजी पाठ के लिए एक एप्लिकेशन प्रोग्राम (शोध के बजाय) के रूप में लिखा गया पहला सच्चा वर्तनी जांच कार्यक्रम बनाया: फरवरी में स्टैनफोर्ड यूनिवर्सिटी की आर्टिफिशियल इंटेलिजेंस प्रयोगशाला में डीईसी पीडीपी -10 के लिए वर्तनी 1971.[6] तेज़ कार्रवाई के लिए गोरिन ने असेंबली भाषा में SPELL लिखा; उन्होंने शब्द सूची में एक अक्षर या आसन्न अक्षर स्थानान्तरण से भिन्न प्रशंसनीय सही वर्तनी की खोज करके और उन्हें उपयोगकर्ता के सामने प्रस्तुत करके पहला वर्तनी सुधारक बनाया। गोरिन ने SPELL को सार्वजनिक रूप से सुलभ बना दिया, जैसा कि अधिकांश SAIL (स्टैनफोर्ड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी) कार्यक्रमों के साथ किया गया था, और यह जल्द ही नए ARPAnet के माध्यम से दुनिया भर में फैल गया, पर्सनल कंप्यूटर के सामान्य उपयोग में आने से लगभग दस साल पहले।[7] SPELL, इसके एल्गोरिदम और डेटा संरचनाओं ने Unix ispell प्रोग्राम को प्रेरित किया।

पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की।[8] हेनरी कुएसेरा ने 1981 में डिजिटल इक्विपमेंट कॉर्प की VAX मशीनों के लिए एक का आविष्कार किया।[9]


यूनिक्स

यूनिक्स में आमतौर पर उपयोग किया जाने वाला मेरा जादू प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।[10] जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता जीएनयू एस्पेल है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक सटीक रूप से सही विकल्प सुझा सकता है।[11] पारंपरिक वर्तनी जांचकर्ताओं की जटिल विभक्ति वाली भाषाओं में शब्दों की जांच करने में असमर्थता के कारण, हंगेरियन लास्ज़लो नेमेथ ने हन्सपेल विकसित किया, एक वर्तनी जांचकर्ता जो एग्लूटिनेटिव भाषाओं और जटिल यौगिक शब्दों का समर्थन करता है। हन्सपेल अपने शब्दकोशों में यूनिकोड का भी उपयोग करता है।[12] संस्करण 2.0.2 में हन्सपेल ने OpenOffice.org में पिछले MySpell को प्रतिस्थापित कर दिया।

एन्चांट (सॉफ्टवेयर) एक अन्य सामान्य वर्तनी जांचकर्ता है, जो अबीवर्ड से लिया गया है। इसका लक्ष्य विभिन्न भाषाओं जैसे एस्पेल, हन्सपेल, नुस्पेल, एचस्पेल (हिब्रू), वोइक्को (फिनिश), ज़ेम्बरेक (तुर्की) और ऐप्पलस्पेल को एक इंटरफ़ेस के तहत समर्थन करने वाले कार्यक्रमों को संयोजित करना है।[13]


पीसी

पर्सनल कंप्यूटर के लिए पहला वर्तनी जांचकर्ता 1980 में सामने आया, जैसे कि कमोडोर सिस्टम के लिए वर्डचेक जिसे 1980 के अंत में जनवरी 1981 में विज्ञापनों के प्रिंट होने के समय जारी किया गया था।[14] मारिया मारियानी जैसे डेवलपर्स[8]और आकस्मिक घर [15] मूल उपकरण निर्माता पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया। प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के भीतर से समाप्त करें-और-निवासी रहें मोड में चलाया जा सकता था।

हालाँकि, स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक वर्डस्टार और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को शामिल कर लिया था, जो ज्यादातर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः एशियाई भाषाएँ भी। हालाँकि, इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से हंगेरियन भाषा और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में। हालाँकि आइसलैंड जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को लागू करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी WordPerfect जैसी कंपनियाँ अपनी वैश्विक विपणन रणनीति के हिस्से के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।

जब Apple ने Mac OS[16] यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।[17] Mac OS X के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन शामिल हैं।

विज़ुअल टूल्स का वीटी स्पेलर, 1994 में पेश किया गया था, जो विंडोज़ का समर्थन करने वाले अनुप्रयोगों के डेवलपर्स के लिए डिज़ाइन किया गया था।[18][19] यह एक शब्दकोश के साथ आया था लेकिन इसमें द्वितीयक शब्दकोशों के निर्माण और उपयोग को शामिल करने की क्षमता थी।[20]


ब्राउज़र

फ़ायरफ़ॉक्स 2.0, एक वेब ब्राउज़र, उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,[21] जैसे कि विकीटेक्स्ट को संपादित करते समय, कई वेबमेल साइटों, ब्लॉगों और सामाजिक नेटवर्किंग वेबसाइटों पर लिखना। वेब ब्राउज़र Google Chrome, Konqueror, और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट Kmail और तात्कालिक संदेशन क्लाइंट (कंप्यूटिंग) पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले GNU एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।

विशेषताएं

चिकित्सीय त्रुटियों को रोकने में मदद के लिए कुछ वर्तनी जांचकर्ताओं के पास चिकित्सा शब्दकोशों के लिए अलग से समर्थन होता है।[22][23][24]


कार्यक्षमता

पहले वर्तनी जांचकर्ता सुधारक के बजाय सत्यापनकर्ता थे। उन्होंने ग़लत वर्तनी वाले शब्दों के लिए कोई सुझाव नहीं दिया। यह लेखन संबंधी गलतियों के लिए तो मददगार था लेकिन तार्किक या ध्वन्यात्मक त्रुटियों के लिए उतना मददगार नहीं था। डेवलपर्स को जिस चुनौती का सामना करना पड़ा वह गलत वर्तनी वाले शब्दों के लिए उपयोगी सुझाव देने में कठिनाई थी। इसके लिए शब्दों को कंकाल रूप में कम करना और पैटर्न-मिलान एल्गोरिदम लागू करना आवश्यक है।

यह तर्कसंगत लग सकता है कि जहां तक ​​वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना बेहतर, ताकि सही शब्दों को गलत के रूप में चिह्नित न किया जाए। हालाँकि, व्यवहार में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् कॉर्पस भाषाविज्ञान के आधार पर यह निर्धारित कर सकता है कि बाट शब्द थाई मुद्रा के संदर्भ की तुलना में अक्सर बाथ या बैट की गलत वर्तनी है। इसलिए, यह आमतौर पर अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, बजाय इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को नजरअंदाज कर दिया जाए।

एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।

पहले MS-DOS वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के भीतर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की तलाश में पाठ को स्कैन किया। हालाँकि, बाद में, Oracle Corporation के अल्पकालिक CoAuthor जैसे पैकेजों में बैच प्रोसेसिंग की पेशकश की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव तरीके से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से माइक्रोसॉफ्ट वर्ड के मामले में हुआ है।

वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब व्याकरण संबंधी त्रुटियों को पहचानने में सक्षम। हालाँकि, अपनी सर्वश्रेष्ठ स्थिति में भी, वे शायद ही किसी पाठ में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि होमोफ़ोन त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। बहरहाल, वर्तनी जांचकर्ताओं को एक प्रकार की विदेशी भाषा लेखन सहायता के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए भरोसा कर सकते हैं।[25]


अंग्रेजी के अलावा अन्य भाषाओं के लिए वर्तनी-जांच

अंग्रेजी इस मायने में असामान्य है कि औपचारिक लेखन में उपयोग किए जाने वाले अधिकांश शब्दों में एक ही वर्तनी होती है जो कि कुछ शब्दजाल और संशोधित शब्दों के अपवाद के साथ, एक विशिष्ट शब्दकोश में पाई जा सकती है। कई भाषाओं में, शब्दों को अक्सर शब्दों के नए संयोजनों में संयोजित किया जाता है। जर्मन में, यौगिक संज्ञाएं अक्सर अन्य मौजूदा संज्ञाओं से बनाई जाती हैं। कुछ स्क्रिप्ट स्पष्ट रूप से एक शब्द को दूसरे से अलग नहीं करती हैं, जिसके लिए शब्द-विभाजन एल्गोरिदम की आवश्यकता होती है। इनमें से प्रत्येक गैर-अंग्रेजी भाषा वर्तनी जांचकर्ताओं के लिए अद्वितीय चुनौतियां प्रस्तुत करता है।

संदर्भ-संवेदनशील वर्तनी जांचकर्ता

ऐसे एल्गोरिदम विकसित करने पर शोध किया गया है जो गलत वर्तनी वाले शब्द को पहचानने में सक्षम हैं, भले ही वह शब्द आसपास के शब्दों के संदर्भ (भाषा उपयोग) के आधार पर शब्दावली में ही क्यों न हो। यह न केवल उपरोक्त कविता जैसे शब्दों को पकड़ने की अनुमति देता है, बल्कि यह शब्दकोशों को बड़ा करने के हानिकारक प्रभाव को कम करता है, जिससे अधिक शब्दों को पहचाना जा सकता है। उदाहरण के लिए, थाई या थाईलैंड के समान पैराग्राफ में baht को बाथ की गलत वर्तनी के रूप में मान्यता नहीं दी जाएगी। ऐसी प्रणाली द्वारा पकड़ी गई त्रुटियों का सबसे आम उदाहरण होमोफ़ोन त्रुटियां हैं, जैसे कि निम्नलिखित वाक्य में बोल्ड शब्द:

'उनका' आ रहा है 'भी' 'समुद्र' अगर 'यह' है 'रील'।

आज तक का सबसे सफल एल्गोरिदम एंड्रयू गोल्डिंग और डैन रोथ का विन्नो (एल्गोरिदम)-आधारित वर्तनी सुधार एल्गोरिदम है,[26] 1999 में प्रकाशित, जो सामान्य गैर-शब्द वर्तनी त्रुटियों के अलावा, लगभग 96% संदर्भ-संवेदनशील वर्तनी त्रुटियों को पहचानने में सक्षम है। संदर्भ-संवेदनशील वर्तनी जांचकर्ता अब बंद हो चुके अनुप्रयोगों Microsoft Office 2007 में दिखाई दिए[27] और गूगल वेव.[28] व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं।

यह भी देखें

संदर्भ

  1. Perner, Petra (2010-07-05). Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings (in English). Springer Science & Business Media. ISBN 978-3-642-14399-1.
  2. U.S. Patent 6618697, Method for rule-based correction of spelling and grammar errors
  3. de Amorim, R.C.; Zampieri, M. (2013) Effective Spell Checking Methods Using Clustering Algorithms. Archived 2017-08-17 at the Wayback Machine Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.
  4. Zampieri, M.; de Amorim, R.C. (2014) Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery. Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.
  5. Earnest, Les. "पहले तीन वर्तनी जाँचकर्ता" (PDF). Stanford University. Archived from the original (PDF) on 22 October 2012. Retrieved 10 October 2011.
  6. Peterson, James (December 1980). Computer Programs for Detecting and Correcting Spelling Errors (PDF). Retrieved 2011-02-18.
  7. Earnest, Les. Visible Legacies for Y3K (PDF). Archived from the original (PDF) on 2011-07-20. Retrieved 2011-02-18.
  8. 8.0 8.1 "Georgetown U Faculty & Staff: The Center for Language, Education & Development". Archived from the original on 2009-02-05. Retrieved 2008-12-18., citation: "Maria Mariani... was one of a group of six linguists from Georgetown University who developed the first spell-check system for the IBM corporation."
  9. Harvey, Charlotte Bruce (May–June 2010). "Teaching Computers to Spell (obituary for Henry Kučera)". Brown Alumni Magazine. p. 79.
  10. "अंतर्राष्ट्रीय इसपेल". www.cs.hmc.edu. Retrieved 2023-02-19.
  11. "जीएनयू एस्पेल". aspell.net. Retrieved 2023-02-19.
  12. "Hunspell: About". hunspell.github.io. Retrieved 2023-02-19.
  13. AbiWord/enchant, AbiWord, 2023-02-13, retrieved 2023-02-19
  14. Advertisement (January 1981). "माइक्रो कंप्यूटर इंडस्ट्रीज लिमिटेड" (PDF). Compute! Magazine, Issue 8, Vol. 3, No. 1. p. 119.
  15. Advertisement (November 1982). "The Spelling Bee Is Over". PC Magazine. p. 165. Retrieved 21 October 2013.
  16. David Pogue (2009). Mac OS X Snow Leopard: The Missing Manual.
  17. David Pogue (2015). Switching to the Mac: The Missing Manual.
  18. "VisualTools VT-Speller". Computerworld. February 21, 1994. p. 68.
  19. "Browse September 27, 1993". VT-SPELLER
  20. Peter G. Aitken (November 8, 1994). "Spell-Checking for your Apps". PC Magazine. p. 299.
  21. "Check my email for spelling errors | Workspace Email - GoDaddy Help US". www.godaddy.com.
  22. "फ़ायरफ़ॉक्स और थंडरबर्ड के लिए मेडिकल वर्तनी परीक्षक". e-MedTools. 2017. Archived from the original on 2019-05-04. Retrieved 2018-08-29.
  23. Quathamer, Dr. Tobias (2016). "जर्मन चिकित्सा शब्दकोश शब्द". Dr. Tobias Quathamer. Retrieved 2018-08-29.
  24. Friedman, Richard A.; D, M (2003). "CASES; Do Spelling and Penmanship Count? In Medicine, You Bet". The New York Times. Retrieved 2018-08-29.
  25. Banks, T. (2008). Foreign Language Learning Difficulties and Teaching Strategies. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.
  26. Golding, Andrew R.; Roth, Dan (1999). "जर्नल लेख". Machine Learning. SpringerLink. 34: 107–130. doi:10.1023/A:1007545901558.
  27. Walt Mossberg (4 January 2007). "समीक्षा". Wall Street Journal. Retrieved 24 September 2010.
  28. "गूगल ऑपरेटिंग सिस्टम". googlesystem.blogspot.com. 29 May 2009. Retrieved 25 September 2010. "Google's Context-Sensitive Spell Checker". May 29, 2009. Retrieved 25 September 2010.


बाहरी संबंध