वर्तनी जांचकर्ता (स्पेल चेकर): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(6 intermediate revisions by 4 users not shown)
Line 5: Line 5:
| content =
| content =
<poem style="width:240px;" style="font-family: arial; font-size: 12px; font-weight: bold; background-color: #ffffff">
<poem style="width:240px;" style="font-family: arial; font-size: 12px; font-weight: bold; background-color: #ffffff">
Eye have a spelling chequer,
आँख के पास एक स्पेलिंग चेकर है,
It came with my Pea Sea.
यह मेरे मटर सागर के साथ आया था।
It plane lee marks four my revue
यह प्लेन ली मार्क फोर माई रिव्यू है
Miss Steaks I can knot sea.
मिस स्टेक्स मैं समुद्र में गाँठ बाँध सकता हूँ।


Eye strike the quays and type a whirred
आँखों पर प्रहार करो और एक व्हिर्रेड टाइप करो
And weight four it two say
और वजन चार यह दो कहते हैं
Weather eye am write oar wrong
मौसम की नज़र गलत लिख रही हूँ
It tells me straight a weigh.
यह मुझे सीधे वजन बताता है।


Eye ran this poem threw it,
आँख दौड़ी यह कविता फेंक दी,
Your shore real glad two no.
आपका किनारा वास्तव में दो नंबरों से खुश है।
Its vary polished in its weigh.
इसकी पॉलिश इसके वजन में भिन्न होती है।
My chequer tolled me sew.
मेरे चेकर ने मुझसे सिलाई करने को कहा।


A chequer is a bless thing,
एक चेकर एक धन्य चीज़ है,
It freeze yew lodes of thyme.
यह थाइम की कुछ गांठों को जमा देता है।
It helps me right all stiles of righting,
यह मुझे सही करने की सभी शैलियों को सही करने में सहायता करता है,
And aides me when eye rime.
और आँख में जलन होने पर मेरी सहायता करता है।


Each frays come posed up on my screen
प्रत्येक लड़ाई मेरी स्क्रीन पर दिखाई देती है
Eye trussed too bee a joule.
आँख भी एक जूल तक उलझी हुई है।
The chequer pours o'er every word
चेकर हर शब्द पर कुछ न कुछ डालता है
Two cheque sum spelling rule.
दो चेक योग वर्तनी नियम.
</poem>
</poem>
|caption =
|caption =
The original version of this poem was written by Jerrold H. Zar in 1992. An unsophisticated spell checker will find little or no fault with this poem because it checks words in isolation.  A more sophisticated spell checker will make use of a [[language model]] to consider the context in which a word occurs.
इस कविता का मूल संस्करण 1992 में जेरोल्ड एच. ज़ार द्वारा लिखा गया था। एक अपरिष्कृत वर्तनी जांचकर्ता को इस कविता में बहुत कम या कोई दोष नहीं मिलेगा क्योंकि यह शब्दों को अलग-अलग जांचता है। एक अधिक परिष्कृत वर्तनी जांचकर्ता उस संदर्भ पर विचार करने के लिए [[भाषा मॉडल]] का उपयोग करेगा जिसमें कोई शब्द आता है।
}}सॉफ्टवेयर में, '''वर्तनी जांचकर्ता''' (या वर्तनी जांचकर्ता या वर्तनी जांच) एक सॉफ्टवेयर सुविधा है जो किसी टेक्स्ट में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अधिकांशतः सॉफ़्टवेयर या सेवाओं जैसे वर्ड प्रोसेसर, ईमेल क्लाइंट, इलेक्ट्रॉनिक शब्दकोश या खोज इंजन में अंतर्निहित होती हैं।[[File:Spell checker.jpg|thumb|उपरोक्त कविता के लिए [[Google Chrome]] वर्तनी जांचकर्ता कार्य कर रहा है, शब्द जांचकर्ता को अपरिचित शब्द के रूप में चिह्नित किया गया है]]
}}सॉफ्टवेयर में, '''वर्तनी जांचकर्ता''' (या वर्तनी जांचकर्ता या वर्तनी जांच) एक सॉफ्टवेयर सुविधा है जो किसी टेक्स्ट में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अधिकांशतः सॉफ़्टवेयर या सेवाओं जैसे वर्ड प्रोसेसर, ईमेल क्लाइंट, इलेक्ट्रॉनिक शब्दकोश या खोज इंजन में अंतर्निहित होती हैं।[[File:Spell checker.jpg|thumb|उपरोक्त कविता के लिए [[Google Chrome]] वर्तनी जांचकर्ता कार्य कर रहा है, शब्द जांचकर्ता को अपरिचित शब्द के रूप में चिह्नित किया गया है]]


==डिज़ाइन==
==डिज़ाइन                                                                                                     ==
एक मूलभूत वर्तनी जाँचकर्ता निम्नलिखित प्रक्रियाएँ करता है:
एक मूलभूत वर्तनी जाँचकर्ता निम्नलिखित प्रक्रियाएँ करता है:
* यह टेक्स्ट को स्कैन करता है और उसमें उपस्थित शब्दों को निकालता है।
* यह टेक्स्ट को स्कैन करता है और उसमें उपस्थित शब्दों को निकालता है।
Line 46: Line 46:
वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए [[लेवेनशेटिन दूरी]] जैसे [[अनुमानित स्ट्रिंग मिलान]] एल्गोरिदम का उपयोग कर सकते हैं।<ref>{{Cite book|last=Perner|first=Petra|url=https://books.google.com/books?id=wnXJfsCGQC8C&q=%22spell+checking%22|title=Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings|date=2010-07-05|publisher=Springer Science & Business Media|isbn=978-3-642-14399-1|language=en}}</ref> एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के अतिरीक्त त्रुटियों को पहचानने के लिए केवल [[एन-ग्राम]] जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में सामान्यतः पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम संचयन की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता सम्मिलित है जो शब्दकोश में सम्मिलित नहीं हैं।<ref>U.S. Patent 6618697, [https://patentimages.storage.googleapis.com/84/a6/5f/6b58b2e2c2da12/US6618697.pdf Method for rule-based correction of spelling and grammar errors]</ref>  
वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए [[लेवेनशेटिन दूरी]] जैसे [[अनुमानित स्ट्रिंग मिलान]] एल्गोरिदम का उपयोग कर सकते हैं।<ref>{{Cite book|last=Perner|first=Petra|url=https://books.google.com/books?id=wnXJfsCGQC8C&q=%22spell+checking%22|title=Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings|date=2010-07-05|publisher=Springer Science & Business Media|isbn=978-3-642-14399-1|language=en}}</ref> एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के अतिरीक्त त्रुटियों को पहचानने के लिए केवल [[एन-ग्राम]] जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में सामान्यतः पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम संचयन की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता सम्मिलित है जो शब्दकोश में सम्मिलित नहीं हैं।<ref>U.S. Patent 6618697, [https://patentimages.storage.googleapis.com/84/a6/5f/6b58b2e2c2da12/US6618697.pdf Method for rule-based correction of spelling and grammar errors]</ref>  


कुछ स्थिति में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए [[वर्तनी सुझाव]] का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अधिकांशतः कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।
कुछ स्थिति में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए [[वर्तनी सुझाव]] का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अधिकांशतः कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।


क्लस्टरिंग एल्गोरिदम का उपयोग ध्वन्यात्मक जानकारी के साथ संयोजन में वर्तनी जांच<ref>de Amorim, R.C.; Zampieri, M. (2013) [http://anthology.aclweb.org/R/R13/R13-1.pdf#page=200 Effective Spell Checking Methods Using Clustering Algorithms.] {{Webarchive|url=https://web.archive.org/web/20170817162117/http://anthology.aclweb.org/R/R13/R13-1.pdf#page=200 |date=2017-08-17 }} Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.</ref> के लिए भी किया गया है।<ref>Zampieri, M.; de Amorim, R.C. (2014) [https://www.researchgate.net/profile/Renato_Amorim/publication/262603118_Between_Sound_and_Spelling_Combining_Phonetics_and_Clustering_Algorithms_to_Improve_Target_Word_Recovery/links/0a85e53cd2485a27fb000000.pdf Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery.] Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.</ref>
क्लस्टरिंग एल्गोरिदम का उपयोग ध्वन्यात्मक जानकारी के साथ संयोजन में वर्तनी जांच<ref>de Amorim, R.C.; Zampieri, M. (2013) [http://anthology.aclweb.org/R/R13/R13-1.pdf#page=200 Effective Spell Checking Methods Using Clustering Algorithms.] {{Webarchive|url=https://web.archive.org/web/20170817162117/http://anthology.aclweb.org/R/R13/R13-1.pdf#page=200 |date=2017-08-17 }} Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.</ref> के लिए भी किया गया है।<ref>Zampieri, M.; de Amorim, R.C. (2014) [https://www.researchgate.net/profile/Renato_Amorim/publication/262603118_Between_Sound_and_Spelling_Combining_Phonetics_and_Clustering_Algorithms_to_Improve_Target_Word_Recovery/links/0a85e53cd2485a27fb000000.pdf Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery.] Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.</ref>
Line 55: Line 55:
|last=Peterson |first=James |title=Computer Programs for Detecting and Correcting Spelling Errors
|last=Peterson |first=James |title=Computer Programs for Detecting and Correcting Spelling Errors
|date=December 1980 |url= http://simson.net/ref/2006/csci_e-180/ref/spelling-p676-peterson.pdf
|date=December 1980 |url= http://simson.net/ref/2006/csci_e-180/ref/spelling-p676-peterson.pdf
|access-date=2011-02-18}}</ref> तेज़ कार्रवाई के लिए गोरिन ने असेंबली भाषा में वर्तनी लिखा गया था; उन्होंने शब्द सूची में एक अक्षर या आसन्न अक्षर स्थानान्तरण से भिन्न प्रशंसनीय सही वर्तनी की खोज करके और उन्हें उपयोगकर्ता के सामने प्रस्तुत करके पहला वर्तनी सुधारक बनाया था और गोरिन ने वर्तनी को सार्वजनिक रूप से सुलभ बना दिया जाता है, जैसा कि अधिकांश सैल (स्टैनफोर्ड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी) कार्यक्रमों के साथ किया गया था, और यह जल्द ही नए अरपानेट के माध्यम से दुनिया भर में फैल गया था, जिसे पर्सनल कंप्यूटर के सामान्य उपयोग में आने से लगभग दस साल पहले।<ref>{{cite book
|access-date=2011-02-18}}</ref> तेज़ कार्रवाई के लिए गोरिन ने असेंबली भाषा में वर्तनी लिखा गया था; उन्होंने शब्द सूची में एक अक्षर या आसन्न अक्षर स्थानान्तरण से भिन्न प्रशंसनीय सही वर्तनी की खोज करके और उन्हें उपयोगकर्ता के सामने प्रस्तुत करके पहला वर्तनी सुधारक बनाया था और गोरिन ने वर्तनी को सार्वजनिक रूप से सुलभ बना दिया जाता है, जैसा कि अधिकांश सैल (स्टैनफोर्ड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी) कार्यक्रमों के साथ किया गया था, और यह जल्द ही नए अरपानेट के माध्यम से दुनिया भर में फैल गया था, जिसे पर्सनल कंप्यूटर के सामान्य उपयोग में आने से लगभग दस साल पहले।<ref>{{cite book
     |last=Earnest |first=Les
     |last=Earnest |first=Les
     |title=Visible Legacies for Y3K
     |title=Visible Legacies for Y3K
Line 61: Line 61:
     |access-date=2011-02-18 |url-status=dead
     |access-date=2011-02-18 |url-status=dead
     |archive-url=https://web.archive.org/web/20110720044806/http://stanford.edu/~learnest/legacies.pdf
     |archive-url=https://web.archive.org/web/20110720044806/http://stanford.edu/~learnest/legacies.pdf
     |archive-date=2011-07-20}}</ref> वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने Unix iवर्तनी प्रोग्राम को प्रेरित किया।
     |archive-date=2011-07-20}}</ref> वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने यूनिक्स वर्तनी प्रोग्राम को प्रेरित किया था।
    
    
पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।<ref name="cled.georgetown.edu">{{cite web
पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।<ref name="cled.georgetown.edu">{{cite web
Line 74: Line 74:
|last=Harvey |first=Charlotte Bruce |date=May–June 2010
|last=Harvey |first=Charlotte Bruce |date=May–June 2010
|work=Brown Alumni Magazine |page=79|url=https://www.brownalumnimagazine.com/articles/2010-05-13/teaching-computers-to-spell}}</ref>
|work=Brown Alumni Magazine |page=79|url=https://www.brownalumnimagazine.com/articles/2010-05-13/teaching-computers-to-spell}}</ref>
===यूनिक्स===
===यूनिक्स===


यूनिक्स में सामान्यतः उपयोग किया जाने वाला [[मेरा जादू]] प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।<ref>{{Cite web |title=अंतर्राष्ट्रीय इसपेल|url=https://www.cs.hmc.edu/~geoff/ispell.html |access-date=2023-02-19 |website=www.cs.hmc.edu}} </ref>
यूनिक्स में सामान्यतः उपयोग किया जाने वाला [[मेरा जादू|माय मैजिक]] प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।<ref>{{Cite web |title=अंतर्राष्ट्रीय इसपेल|url=https://www.cs.hmc.edu/~geoff/ispell.html |access-date=2023-02-19 |website=www.cs.hmc.edu}} </ref>


जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता [[जीएनयू एस्पेल]] है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।<ref>{{Cite web |title=जीएनयू एस्पेल|url=http://aspell.net/ |access-date=2023-02-19 |website=aspell.net}} </ref>
जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता [[जीएनयू एस्पेल]] है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।<ref>{{Cite web |title=जीएनयू एस्पेल|url=http://aspell.net/ |access-date=2023-02-19 |website=aspell.net}} </ref>
Line 95: Line 92:
|date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से [[ समाप्त करें-और-निवासी रहें |समाप्त करें-और-निवासी रहें]] मोड में चलाया जा सकता था।
|date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से [[ समाप्त करें-और-निवासी रहें |समाप्त करें-और-निवासी रहें]] मोड में चलाया जा सकता था।


चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में। चूँकि [[आइसलैंड]] जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को प्रयुक्त करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी [[WordPerfect|वर्डपरफेक्ट]] जैसी कंपनियाँ अपनी वैश्विक [[ विपणन |विपणन]] रणनीति के भाग के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।
चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में चूँकि [[आइसलैंड]] जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को प्रयुक्त करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी [[WordPerfect|वर्डपरफेक्ट]] जैसी कंपनियाँ अपनी वैश्विक [[ विपणन |विपणन]] रणनीति के भाग के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।


जब एप्पल ने मैक ओएस<ref>{{cite book
जब एप्पल ने मैक ओएस<ref>{{cite book
|title=Mac OS X Snow Leopard: The Missing Manual |author=David Pogue |year=2009}}</ref> यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।<ref>{{cite book |title=Switching to the Mac: The Missing Manual
|title=Mac OS X Snow Leopard: The Missing Manual |author=David Pogue |year=2009}}</ref> यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।<ref>{{cite book |title=Switching to the Mac: The Missing Manual
|author=David Pogue |year=2015|url=https://books.google.com/books?id=1XFmBgAAQBAJ}}</ref> [[ Mac OS X |मैक ओएस एक्स]] के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन सम्मिलित हैं।
|author=David Pogue |year=2015|url=https://books.google.com/books?id=1XFmBgAAQBAJ}}</ref> [[ Mac OS X |मैक ओएस एक्स]] के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन सम्मिलित हैं।
Line 111: Line 108:




===ब्राउज़र===
===ब्राउज़र                                                                                                                                                                                   ===
[[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors &#124; Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]]ों और [[ सामाजिक नेटवर्किंग |सामाजिक नेटवर्किंग]] वेबसाइटों पर लिखना। वेब ब्राउज़र गूगल क्रोम,, [[Konqueror|कॉन्करर]] , और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट [[Kmail|केमेल]] और [[ तात्कालिक संदेशन |तात्कालिक संदेशन]] [[क्लाइंट (कंप्यूटिंग)]] पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले जीएनयू एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।
[[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors &#124; Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]] और [[ सामाजिक नेटवर्किंग |सामाजिक नेटवर्किंग]] वेबसाइटों पर लिखना वेब ब्राउज़र गूगल क्रोम,, [[Konqueror|कॉन्करर]] , और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट [[Kmail|केमेल]] और [[ तात्कालिक संदेशन |तात्कालिक संदेशन]] [[क्लाइंट (कंप्यूटिंग)]] पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले जीएनयू एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।


===विशेषताएं===
===विशेषताएं                                                                                                                                                       ===
चिकित्सीय त्रुटियों को रोकने में सहायता के लिए कुछ वर्तनी जांचकर्ताओं के पास चिकित्सा शब्दकोशों के लिए अलग से समर्थन होता है।<ref>{{cite web |year=2017 |url=https://e-medtools.com/openmedspel.html |title=फ़ायरफ़ॉक्स और थंडरबर्ड के लिए मेडिकल वर्तनी परीक्षक|publisher=e-MedTools |access-date=2018-08-29 |archive-date=2019-05-04 |archive-url=https://web.archive.org/web/20190504223323/https://e-medtools.com/openmedspel.html |url-status=dead }}</ref><ref>{{cite web |last1=Quathamer |first1=Dr. Tobias |year=2016 |url=https://github.com/toddy15/medicalterms |title=जर्मन चिकित्सा शब्दकोश शब्द|publisher=Dr. Tobias Quathamer |access-date=2018-08-29}}</ref><ref>{{cite web |last1=Friedman |first1=Richard A. |last2=D |first2=M |year=2003 |url=https://www.nytimes.com/2003/03/11/health/cases-do-spelling-and-penmanship-count-in-medicine-you-bet.html |title=CASES; Do Spelling and Penmanship Count? In Medicine, You Bet |work=The New York Times |access-date=2018-08-29}}</ref>
चिकित्सीय त्रुटियों को रोकने में सहायता के लिए कुछ वर्तनी जांचकर्ताओं के पास चिकित्सा शब्दकोशों के लिए अलग से समर्थन होता है।<ref>{{cite web |year=2017 |url=https://e-medtools.com/openmedspel.html |title=फ़ायरफ़ॉक्स और थंडरबर्ड के लिए मेडिकल वर्तनी परीक्षक|publisher=e-MedTools |access-date=2018-08-29 |archive-date=2019-05-04 |archive-url=https://web.archive.org/web/20190504223323/https://e-medtools.com/openmedspel.html |url-status=dead }}</ref><ref>{{cite web |last1=Quathamer |first1=Dr. Tobias |year=2016 |url=https://github.com/toddy15/medicalterms |title=जर्मन चिकित्सा शब्दकोश शब्द|publisher=Dr. Tobias Quathamer |access-date=2018-08-29}}</ref><ref>{{cite web |last1=Friedman |first1=Richard A. |last2=D |first2=M |year=2003 |url=https://www.nytimes.com/2003/03/11/health/cases-do-spelling-and-penmanship-count-in-medicine-you-bet.html |title=CASES; Do Spelling and Penmanship Count? In Medicine, You Bet |work=The New York Times |access-date=2018-08-29}}</ref>


Line 121: Line 118:
पहले वर्तनी जांचकर्ता सुधारक के अतिरीक्त सत्यापनकर्ता थे। उन्होंने ग़लत वर्तनी वाले शब्दों के लिए कोई सुझाव नहीं दिया। यह [[लेखन]] संबंधी गलतियों के लिए तो साह्कृत था किंतु तार्किक या ध्वन्यात्मक त्रुटियों के लिए उतना साह्कृत नहीं था। डेवलपर्स को जिस चुनौती का सामना करना पड़ा वह गलत वर्तनी वाले शब्दों के लिए उपयोगी सुझाव देने में कठिनाई थी। इसके लिए शब्दों को स्केलेटल रूप में कम करना और पैटर्न-मिलान एल्गोरिदम प्रयुक्त करना आवश्यक है।
पहले वर्तनी जांचकर्ता सुधारक के अतिरीक्त सत्यापनकर्ता थे। उन्होंने ग़लत वर्तनी वाले शब्दों के लिए कोई सुझाव नहीं दिया। यह [[लेखन]] संबंधी गलतियों के लिए तो साह्कृत था किंतु तार्किक या ध्वन्यात्मक त्रुटियों के लिए उतना साह्कृत नहीं था। डेवलपर्स को जिस चुनौती का सामना करना पड़ा वह गलत वर्तनी वाले शब्दों के लिए उपयोगी सुझाव देने में कठिनाई थी। इसके लिए शब्दों को स्केलेटल रूप में कम करना और पैटर्न-मिलान एल्गोरिदम प्रयुक्त करना आवश्यक है।


यह तर्कसंगत लग सकता है कि जहां तक ​​वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् [[कॉर्पस भाषाविज्ञान]] के आधार पर यह निर्धारित कर सकता है कि [[बाट|बाहत]] शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है।
यह तर्कसंगत लग सकता है कि जहां तक ​​वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् [[कॉर्पस भाषाविज्ञान]] के आधार पर यह निर्धारित कर सकता है कि [[बाट|बाहत]] शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है।
[[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि , बाद में, [[Oracle Corporation|ओरेकल कारपोरेशन]] के अल्पकालिक कोऑथर जैसे पैकेजों में बैच प्रोसेसिंग की प्रस्तुति की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव विधि से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से [[माइक्रोसॉफ्ट वर्ड]] के स्थिति में हुआ है।
[[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि बाद में, [[Oracle Corporation|ओरेकल कारपोरेशन]] के अल्पकालिक कोऑथर जैसे पैकेजों में बैच प्रोसेसिंग की प्रस्तुति की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव विधि से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से [[माइक्रोसॉफ्ट वर्ड]] के स्थिति में हुआ है।


वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में सक्षम। चूँकि अपनी सर्वश्रेष्ठ स्थिति में भी, वे संभवतः ही किसी टेक्स्ट में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि [[ होमोफ़ोन |होमोफ़ोन]] त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। तथापि, वर्तनी जांचकर्ताओं को एक प्रकार की [[विदेशी भाषा लेखन सहायता]] के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए विश्वाश कर सकते हैं।<ref>Banks, T. (2008). [http://eric.ed.gov/PDFS/ED501062.pdf ''Foreign Language Learning Difficulties and Teaching Strategies'']. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.</ref>
वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में सक्षम था  चूँकि अपनी सर्वश्रेष्ठ स्थिति में भी, वे संभवतः ही किसी टेक्स्ट में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि [[ होमोफ़ोन |होमोफ़ोन]] त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। तथापि, वर्तनी जांचकर्ताओं को एक प्रकार की [[विदेशी भाषा लेखन सहायता]] के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए विश्वाश कर सकते हैं।<ref>Banks, T. (2008). [http://eric.ed.gov/PDFS/ED501062.pdf ''Foreign Language Learning Difficulties and Teaching Strategies'']. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.</ref>




== अंग्रेजी के अतिरिक्त अन्य भाषाओं के लिए वर्तनी-जांच ==
== अंग्रेजी के अतिरिक्त अन्य भाषाओं के लिए वर्तनी-जांच ==


अंग्रेजी इस तात्पर्य में असामान्य है कि औपचारिक लेखन में उपयोग किए जाने वाले अधिकांश शब्दों में एक ही वर्तनी होती है जो कि कुछ शब्दजाल और संशोधित शब्दों के अपवाद के साथ, एक विशिष्ट शब्दकोश में पाई जा सकती है। कई भाषाओं में, शब्दों को अधिकांशतः शब्दों के नए संयोजनों में संयोजित किया जाता है। जर्मन में, यौगिक संज्ञाएं अधिकांशतः अन्य उपस्थित संज्ञाओं से बनाई जाती हैं। कुछ स्क्रिप्ट स्पष्ट रूप से एक शब्द को दूसरे से अलग नहीं करती हैं, जिसके लिए शब्द-विभाजन एल्गोरिदम की आवश्यकता होती है। इनमें से प्रत्येक गैर-अंग्रेजी भाषा वर्तनी जांचकर्ताओं के लिए अद्वितीय चुनौतियां प्रस्तुत करता है।
अंग्रेजी इस तात्पर्य में असामान्य है कि औपचारिक लेखन में उपयोग किए जाने वाले अधिकांश शब्दों में एक ही वर्तनी होती है जो कि कुछ शब्दजाल और संशोधित शब्दों के अपवाद के साथ, एक विशिष्ट शब्दकोश में पाई जा सकती है। कई भाषाओं में, शब्दों को अधिकांशतः शब्दों के नए संयोजनों में संयोजित किया जाता है। जर्मन में, यौगिक संज्ञाएं अधिकांशतः अन्य उपस्थित संज्ञाओं से बनाई जाती हैं। कुछ स्क्रिप्ट स्पष्ट रूप से एक शब्द को दूसरे से अलग नहीं करती हैं, जिसके लिए शब्द-विभाजन एल्गोरिदम की आवश्यकता होती है। इनमें से प्रत्येक गैर-अंग्रेजी भाषा वर्तनी जांचकर्ताओं के लिए अद्वितीय चुनौतियां प्रस्तुत करता है।


==संदर्भ-संवेदनशील वर्तनी जांचकर्ता==
==संदर्भ-संवेदनशील वर्तनी जांचकर्ता==
ऐसे एल्गोरिदम विकसित करने पर शोध किया गया है जो गलत वर्तनी वाले शब्द को पहचानने में सक्षम हैं, तथापि वह शब्द आसपास के शब्दों के संदर्भ (भाषा उपयोग) के आधार पर शब्दावली में ही क्यों न हो और यह न केवल उपरोक्त कविता जैसे शब्दों को पकड़ने की अनुमति देता है, किंतु यह शब्दकोशों को बड़ा करने के हानिकारक प्रभाव को कम करता है, जिससे अधिक शब्दों को पहचाना जा सकता है। उदाहरण के लिए, थाई या थाईलैंड के समान पैराग्राफ में बहत को बाथ की गलत वर्तनी के रूप में मान्यता नहीं दी जाएगी। ऐसी प्रणाली द्वारा पकड़ी गई त्रुटियों का सबसे समान्य उदाहरण होमोफ़ोन त्रुटियां हैं, जैसे कि निम्नलिखित वाक्य में बोल्ड शब्द है:
ऐसे एल्गोरिदम विकसित करने पर शोध किया गया है जो गलत वर्तनी वाले शब्द को पहचानने में सक्षम हैं, तथापि वह शब्द आसपास के शब्दों के संदर्भ (भाषा उपयोग) के आधार पर शब्दावली में ही क्यों न हो और यह न केवल उपरोक्त कविता जैसे शब्दों को पकड़ने की अनुमति देता है, किंतु यह शब्दकोशों को बड़ा करने के हानिकारक प्रभाव को कम करता है, जिससे अधिक शब्दों को पहचाना जा सकता है। उदाहरण के लिए, थाई या थाईलैंड के समान पैराग्राफ में बहत को बाथ की गलत वर्तनी के रूप में मान्यता नहीं दी जाएगी। ऐसी प्रणाली द्वारा पकड़ी गई त्रुटियों का सबसे समान्य उदाहरण होमोफ़ोन त्रुटियां हैं, जैसे कि निम्नलिखित वाक्य में बोल्ड शब्द है:
:'''<nowiki/>'उनका'''<nowiki/>' आ रहा है ''''भी' 'समुद्र'''<nowiki/>' यदि 'यह' '''है 'रील'''<nowiki/>'।
:'''<nowiki/>'उनका'''<nowiki/>' आ रहा है ''''भी' 'समुद्र'''<nowiki/>' यदि 'यह' '''है 'रील'''<nowiki/>'।


Line 139: Line 136:
व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं।
व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं।


== यह भी देखें ==
== यह भी देखें                                                                     ==
{{Wikiquote}}
{{Wikiquote}}
*[[क्यूपर्टिनो प्रभाव]]
*[[क्यूपर्टिनो प्रभाव]]
Line 164: Line 161:
{{Natural Language Processing}}
{{Natural Language Processing}}


{{DEFAULTSORT:Spell Checker}}[[Category: वर्तनी जांचकर्ता|*]] [[Category: पाठ संपादक सुविधाएँ]] [[Category: वर्तनी]] [[Category: प्राकृतिक भाषा प्रसंस्करण]]
{{DEFAULTSORT:Spell Checker}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with Curlie links|Spell Checker]]
[[Category:Created On 10/07/2023]]
[[Category:CS1 English-language sources (en)]]
[[Category:Citation Style 1 templates|M]]
[[Category:Collapse templates|Spell Checker]]
[[Category:Commons category link is locally defined|Spell Checker]]
[[Category:Created On 10/07/2023|Spell Checker]]
[[Category:Lua-based templates|Spell Checker]]
[[Category:Machine Translated Page|Spell Checker]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Spell Checker]]
[[Category:Pages with script errors|Spell Checker]]
[[Category:Sidebars with styles needing conversion|Spell Checker]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Spell Checker]]
[[Category:Templates based on the Citation/CS1 Lua module]]
[[Category:Templates generating COinS|Cite magazine]]
[[Category:Templates generating microformats|Spell Checker]]
[[Category:Templates that add a tracking category|Spell Checker]]
[[Category:Templates that are not mobile friendly|Spell Checker]]
[[Category:Templates that generate short descriptions|Spell Checker]]
[[Category:Templates using TemplateData|Spell Checker]]
[[Category:Webarchive template wayback links]]
[[Category:Wikipedia fully protected templates|Cite magazine]]
[[Category:Wikipedia metatemplates|Spell Checker]]
[[Category:पाठ संपादक सुविधाएँ|Spell Checker]]
[[Category:प्राकृतिक भाषा प्रसंस्करण|Spell Checker]]
[[Category:वर्तनी|Spell Checker]]
[[Category:वर्तनी जांचकर्ता|*]]

Latest revision as of 13:58, 28 July 2023

आँख के पास एक स्पेलिंग चेकर है,
यह मेरे मटर सागर के साथ आया था।
यह प्लेन ली मार्क फोर माई रिव्यू है
मिस स्टेक्स मैं समुद्र में गाँठ बाँध सकता हूँ।

आँखों पर प्रहार करो और एक व्हिर्रेड टाइप करो
और वजन चार यह दो कहते हैं
मौसम की नज़र गलत लिख रही हूँ
यह मुझे सीधे वजन बताता है।

आँख दौड़ी यह कविता फेंक दी,
आपका किनारा वास्तव में दो नंबरों से खुश है।
इसकी पॉलिश इसके वजन में भिन्न होती है।
मेरे चेकर ने मुझसे सिलाई करने को कहा।

एक चेकर एक धन्य चीज़ है,
यह थाइम की कुछ गांठों को जमा देता है।
यह मुझे सही करने की सभी शैलियों को सही करने में सहायता करता है,
और आँख में जलन होने पर मेरी सहायता करता है।

प्रत्येक लड़ाई मेरी स्क्रीन पर दिखाई देती है
आँख भी एक जूल तक उलझी हुई है।
चेकर हर शब्द पर कुछ न कुछ डालता है
दो चेक योग वर्तनी नियम.

इस कविता का मूल संस्करण 1992 में जेरोल्ड एच. ज़ार द्वारा लिखा गया था। एक अपरिष्कृत वर्तनी जांचकर्ता को इस कविता में बहुत कम या कोई दोष नहीं मिलेगा क्योंकि यह शब्दों को अलग-अलग जांचता है। एक अधिक परिष्कृत वर्तनी जांचकर्ता उस संदर्भ पर विचार करने के लिए भाषा मॉडल का उपयोग करेगा जिसमें कोई शब्द आता है।

सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी जांचकर्ता या वर्तनी जांच) एक सॉफ्टवेयर सुविधा है जो किसी टेक्स्ट में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अधिकांशतः सॉफ़्टवेयर या सेवाओं जैसे वर्ड प्रोसेसर, ईमेल क्लाइंट, इलेक्ट्रॉनिक शब्दकोश या खोज इंजन में अंतर्निहित होती हैं।

उपरोक्त कविता के लिए Google Chrome वर्तनी जांचकर्ता कार्य कर रहा है, शब्द जांचकर्ता को अपरिचित शब्द के रूप में चिह्नित किया गया है

डिज़ाइन

एक मूलभूत वर्तनी जाँचकर्ता निम्नलिखित प्रक्रियाएँ करता है:

  • यह टेक्स्ट को स्कैन करता है और उसमें उपस्थित शब्दों को निकालता है।
  • इसके बाद यह प्रत्येक शब्द की तुलना सही विधि से लिखे गए शब्दों की ज्ञात सूची (अथार्त एक शब्दकोश) से करता है। इसमें केवल शब्दों की एक सूची हो सकती है, या इसमें अतिरिक्त जानकारी भी हो सकती है, जैसे हाइफ़नेशन बिंदु या शाब्दिक और व्याकरण संबंधी विशेषताएँ है।
  • एक अतिरिक्त कदम आकृति विज्ञान (भाषा विज्ञान) को संभालने के लिए एक भाषा-निर्भर एल्गोरिदम है। यहां तक ​​कि अंग्रेजी भाषा जैसी हल्की विभक्ति वाली भाषा के लिए भी, वर्तनी जांचकर्ता को एक ही शब्द के विभिन्न रूपों, जैसे बहुवचन, मौखिक रूप, संकुचन (व्याकरण), और स्वामित्व (भाषाविज्ञान) पर विचार करने की आवश्यकता होती है। जो की कई अन्य भाषाओं के लिए, जैसे कि एग्लूटिनेशन और अधिक जटिल गिरावट और संयुग्मन की विशेषता वाली भाषाओं के लिए, प्रक्रिया का यह भाग अधिक जटिल है।

यह स्पष्ट नहीं है कि क्या रूपात्मक विश्लेषण - किसी शब्द की व्याकरणिक भूमिका के आधार पर उसके कई रूपों की अनुमति देना - अंग्रेजी के लिए एक महत्वपूर्ण लाभ प्रदान करता है, चूँकि जर्मन, हंगेरियन या तुर्की जैसी अत्यधिक सिंथेटिक भाषाओं के लिए इसके लाभ स्पष्ट हैं।

इन घटकों के सहायक के रूप में, प्रोग्राम का उपयोगकर्ता इंटरफ़ेस उपयोगकर्ताओं को प्रतिस्थापन को स्वीकृत या अस्वीकार करने और प्रोग्राम के संचालन को संशोधित करने की अनुमति देता है।

वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए लेवेनशेटिन दूरी जैसे अनुमानित स्ट्रिंग मिलान एल्गोरिदम का उपयोग कर सकते हैं।[1] एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के अतिरीक्त त्रुटियों को पहचानने के लिए केवल एन-ग्राम जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में सामान्यतः पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम संचयन की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता सम्मिलित है जो शब्दकोश में सम्मिलित नहीं हैं।[2]

कुछ स्थिति में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए वर्तनी सुझाव का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अधिकांशतः कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।

क्लस्टरिंग एल्गोरिदम का उपयोग ध्वन्यात्मक जानकारी के साथ संयोजन में वर्तनी जांच[3] के लिए भी किया गया है।[4]

इतिहास

प्री-पीसी

1961 में, लेस अर्नेस्ट, जिन्होंने इस नवोदित तकनीक पर शोध का नेतृत्व किया, ने 10,000 स्वीकार्य शब्दों की सूची तक पहुंचने वाले पहले वर्तनी जांचकर्ता को सम्मिलित करना आवश्यक समझा जाता है।[5] उस समय अर्नेस्ट के तहत स्नातक छात्र राल्फ गोरिन ने सामान्य अंग्रेजी टेक्स्ट के लिए एक एप्लिकेशन प्रोग्राम (शोध के अतिरिक्त) के रूप में लिखा गया पहला सच्चा वर्तनी जांच कार्य बनाया: फरवरी में स्टैनफोर्ड यूनिवर्सिटी की आर्टिफिशियल इंटेलिजेंस प्रयोगशाला में डीईसी पीडीपी -10 के लिए वर्तनी 1971.[6] तेज़ कार्रवाई के लिए गोरिन ने असेंबली भाषा में वर्तनी लिखा गया था; उन्होंने शब्द सूची में एक अक्षर या आसन्न अक्षर स्थानान्तरण से भिन्न प्रशंसनीय सही वर्तनी की खोज करके और उन्हें उपयोगकर्ता के सामने प्रस्तुत करके पहला वर्तनी सुधारक बनाया था और गोरिन ने वर्तनी को सार्वजनिक रूप से सुलभ बना दिया जाता है, जैसा कि अधिकांश सैल (स्टैनफोर्ड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी) कार्यक्रमों के साथ किया गया था, और यह जल्द ही नए अरपानेट के माध्यम से दुनिया भर में फैल गया था, जिसे पर्सनल कंप्यूटर के सामान्य उपयोग में आने से लगभग दस साल पहले।[7] वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने यूनिक्स वर्तनी प्रोग्राम को प्रेरित किया था।

पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।[8]

हेनरी कुएसेरा ने 1981 में डिजिटल इक्विपमेंट कॉर्प की वैक्स मशीनों के लिए एक का आविष्कार किया था।[9]

यूनिक्स

यूनिक्स में सामान्यतः उपयोग किया जाने वाला माय मैजिक प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।[10]

जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता जीएनयू एस्पेल है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।[11]

पारंपरिक वर्तनी जांचकर्ताओं की जटिल विभक्ति वाली भाषाओं में शब्दों की जांच करने में असमर्थता के कारण, हंगेरियन लास्ज़लो नेमेथ ने हन्सपेल विकसित किया, एक वर्तनी जांचकर्ता जो एग्लूटिनेटिव भाषाओं और जटिल यौगिक शब्दों का समर्थन करता है। हन्सपेल अपने शब्दकोशों में यूनिकोड का भी उपयोग करता है।[12] संस्करण 2.0.2 में हन्सपेल ने ओपनऑफिस.ऑर्ग में पिछले माईस्पेल को प्रतिस्थापित कर दिया था।

एन्चांट (सॉफ्टवेयर) एक अन्य सामान्य वर्तनी जांचकर्ता है, जो अबीवर्ड से लिया गया है। इसका लक्ष्य विभिन्न भाषाओं जैसे एस्पेल, हन्सपेल, नुस्पेल, एचस्पेल (हिब्रू), वोइक्को (फिनिश), ज़ेम्बरेक (तुर्की) और ऐप्पलस्पेल को एक इंटरफ़ेस के तहत समर्थन करने वाले कार्यक्रमों को संयोजित करना है।[13]

पीसी

पर्सनल कंप्यूटर के लिए पहला वर्तनी जांचकर्ता 1980 में सामने आया था, जैसे कि कमोडोर सिस्टम के लिए वर्डचेक जिसे 1980 के अंत में जनवरी 1981 में विज्ञापनों के प्रिंट होने के समय जारी किया गया था।[14] मारिया मारिअथार्त जैसे डेवलपर्स[8]और आकस्मिक घर [15] मूल उपकरण निर्माता पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से समाप्त करें-और-निवासी रहें मोड में चलाया जा सकता था।

चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक वर्डस्टार और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः एशियाई भाषाएँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से हंगेरियन भाषा और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में चूँकि आइसलैंड जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को प्रयुक्त करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी वर्डपरफेक्ट जैसी कंपनियाँ अपनी वैश्विक विपणन रणनीति के भाग के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।

जब एप्पल ने मैक ओएस[16] यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।[17] मैक ओएस एक्स के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन सम्मिलित हैं।

दृश्य उपकरण का वीटी स्पेलर, 1994 में प्रस्तुत किया गया था, जो विंडोज़ का समर्थन करने वाले अनुप्रयोगों के डेवलपर्स के लिए डिज़ाइन किया गया था।[18][19] यह एक शब्दकोश के साथ आया था किंतु इसमें द्वितीयक शब्दकोशों के निर्माण और उपयोग को सम्मिलित करने की क्षमता थी।[20]


ब्राउज़र

फ़ायरफ़ॉक्स 2.0, एक वेब ब्राउज़र, उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,[21] जैसे कि विकीटेक्स्ट को संपादित करते समय, कई वेबमेल साइटों, ब्लॉग और सामाजिक नेटवर्किंग वेबसाइटों पर लिखना वेब ब्राउज़र गूगल क्रोम,, कॉन्करर , और ओपेरा (वेब ​​​​ब्राउज़र), ईमेल क्लाइंट केमेल और तात्कालिक संदेशन क्लाइंट (कंप्यूटिंग) पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले जीएनयू एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।

विशेषताएं

चिकित्सीय त्रुटियों को रोकने में सहायता के लिए कुछ वर्तनी जांचकर्ताओं के पास चिकित्सा शब्दकोशों के लिए अलग से समर्थन होता है।[22][23][24]


कार्यक्षमता

पहले वर्तनी जांचकर्ता सुधारक के अतिरीक्त सत्यापनकर्ता थे। उन्होंने ग़लत वर्तनी वाले शब्दों के लिए कोई सुझाव नहीं दिया। यह लेखन संबंधी गलतियों के लिए तो साह्कृत था किंतु तार्किक या ध्वन्यात्मक त्रुटियों के लिए उतना साह्कृत नहीं था। डेवलपर्स को जिस चुनौती का सामना करना पड़ा वह गलत वर्तनी वाले शब्दों के लिए उपयोगी सुझाव देने में कठिनाई थी। इसके लिए शब्दों को स्केलेटल रूप में कम करना और पैटर्न-मिलान एल्गोरिदम प्रयुक्त करना आवश्यक है।

यह तर्कसंगत लग सकता है कि जहां तक ​​वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् कॉर्पस भाषाविज्ञान के आधार पर यह निर्धारित कर सकता है कि बाहत शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है।

एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।

पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि बाद में, ओरेकल कारपोरेशन के अल्पकालिक कोऑथर जैसे पैकेजों में बैच प्रोसेसिंग की प्रस्तुति की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव विधि से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से माइक्रोसॉफ्ट वर्ड के स्थिति में हुआ है।

वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब व्याकरण संबंधी त्रुटियों को पहचानने में सक्षम था चूँकि अपनी सर्वश्रेष्ठ स्थिति में भी, वे संभवतः ही किसी टेक्स्ट में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि होमोफ़ोन त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। तथापि, वर्तनी जांचकर्ताओं को एक प्रकार की विदेशी भाषा लेखन सहायता के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए विश्वाश कर सकते हैं।[25]


अंग्रेजी के अतिरिक्त अन्य भाषाओं के लिए वर्तनी-जांच

अंग्रेजी इस तात्पर्य में असामान्य है कि औपचारिक लेखन में उपयोग किए जाने वाले अधिकांश शब्दों में एक ही वर्तनी होती है जो कि कुछ शब्दजाल और संशोधित शब्दों के अपवाद के साथ, एक विशिष्ट शब्दकोश में पाई जा सकती है। कई भाषाओं में, शब्दों को अधिकांशतः शब्दों के नए संयोजनों में संयोजित किया जाता है। जर्मन में, यौगिक संज्ञाएं अधिकांशतः अन्य उपस्थित संज्ञाओं से बनाई जाती हैं। कुछ स्क्रिप्ट स्पष्ट रूप से एक शब्द को दूसरे से अलग नहीं करती हैं, जिसके लिए शब्द-विभाजन एल्गोरिदम की आवश्यकता होती है। इनमें से प्रत्येक गैर-अंग्रेजी भाषा वर्तनी जांचकर्ताओं के लिए अद्वितीय चुनौतियां प्रस्तुत करता है।

संदर्भ-संवेदनशील वर्तनी जांचकर्ता

ऐसे एल्गोरिदम विकसित करने पर शोध किया गया है जो गलत वर्तनी वाले शब्द को पहचानने में सक्षम हैं, तथापि वह शब्द आसपास के शब्दों के संदर्भ (भाषा उपयोग) के आधार पर शब्दावली में ही क्यों न हो और यह न केवल उपरोक्त कविता जैसे शब्दों को पकड़ने की अनुमति देता है, किंतु यह शब्दकोशों को बड़ा करने के हानिकारक प्रभाव को कम करता है, जिससे अधिक शब्दों को पहचाना जा सकता है। उदाहरण के लिए, थाई या थाईलैंड के समान पैराग्राफ में बहत को बाथ की गलत वर्तनी के रूप में मान्यता नहीं दी जाएगी। ऐसी प्रणाली द्वारा पकड़ी गई त्रुटियों का सबसे समान्य उदाहरण होमोफ़ोन त्रुटियां हैं, जैसे कि निम्नलिखित वाक्य में बोल्ड शब्द है:

'उनका' आ रहा है 'भी' 'समुद्र' यदि 'यह' है 'रील'।

आज तक का सबसे सफल एल्गोरिदम एंड्रयू गोल्डिंग और डैन रोथ का विन्नो (एल्गोरिदम)-आधारित वर्तनी सुधार एल्गोरिदम है,[26] 1999 में प्रकाशित, जो सामान्य गैर-शब्द वर्तनी त्रुटियों के अतिरिक्त, लगभग 96% संदर्भ-संवेदनशील वर्तनी त्रुटियों को पहचानने में सक्षम है। संदर्भ-संवेदनशील वर्तनी जांचकर्ता अब बंद हो चुके अनुप्रयोगों माइक्रोसॉफ्ट ऑफिस 2007 में [27] और गूगल वेव. दिखाई दिए थे[28]

व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं।

यह भी देखें

संदर्भ

  1. Perner, Petra (2010-07-05). Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings (in English). Springer Science & Business Media. ISBN 978-3-642-14399-1.
  2. U.S. Patent 6618697, Method for rule-based correction of spelling and grammar errors
  3. de Amorim, R.C.; Zampieri, M. (2013) Effective Spell Checking Methods Using Clustering Algorithms. Archived 2017-08-17 at the Wayback Machine Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.
  4. Zampieri, M.; de Amorim, R.C. (2014) Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery. Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.
  5. Earnest, Les. "पहले तीन वर्तनी जाँचकर्ता" (PDF). Stanford University. Archived from the original (PDF) on 22 October 2012. Retrieved 10 October 2011.
  6. Peterson, James (December 1980). Computer Programs for Detecting and Correcting Spelling Errors (PDF). Retrieved 2011-02-18.
  7. Earnest, Les. Visible Legacies for Y3K (PDF). Archived from the original (PDF) on 2011-07-20. Retrieved 2011-02-18.
  8. 8.0 8.1 "Georgetown U Faculty & Staff: The Center for Language, Education & Development". Archived from the original on 2009-02-05. Retrieved 2008-12-18., citation: "Maria Mariani... was one of a group of six linguists from Georgetown University who developed the first spell-check system for the IBM corporation."
  9. Harvey, Charlotte Bruce (May–June 2010). "Teaching Computers to Spell (obituary for Henry Kučera)". Brown Alumni Magazine. p. 79.
  10. "अंतर्राष्ट्रीय इसपेल". www.cs.hmc.edu. Retrieved 2023-02-19.
  11. "जीएनयू एस्पेल". aspell.net. Retrieved 2023-02-19.
  12. "Hunspell: About". hunspell.github.io. Retrieved 2023-02-19.
  13. AbiWord/enchant, AbiWord, 2023-02-13, retrieved 2023-02-19
  14. Advertisement (January 1981). "माइक्रो कंप्यूटर इंडस्ट्रीज लिमिटेड" (PDF). Compute! Magazine, Issue 8, Vol. 3, No. 1. p. 119.
  15. Advertisement (November 1982). "The Spelling Bee Is Over". PC Magazine. p. 165. Retrieved 21 October 2013.
  16. David Pogue (2009). Mac OS X Snow Leopard: The Missing Manual.
  17. David Pogue (2015). Switching to the Mac: The Missing Manual.
  18. "VisualTools VT-Speller". Computerworld. February 21, 1994. p. 68.
  19. "Browse September 27, 1993". VT-SPELLER
  20. Peter G. Aitken (November 8, 1994). "Spell-Checking for your Apps". PC Magazine. p. 299.
  21. "Check my email for spelling errors | Workspace Email - GoDaddy Help US". www.godaddy.com.
  22. "फ़ायरफ़ॉक्स और थंडरबर्ड के लिए मेडिकल वर्तनी परीक्षक". e-MedTools. 2017. Archived from the original on 2019-05-04. Retrieved 2018-08-29.
  23. Quathamer, Dr. Tobias (2016). "जर्मन चिकित्सा शब्दकोश शब्द". Dr. Tobias Quathamer. Retrieved 2018-08-29.
  24. Friedman, Richard A.; D, M (2003). "CASES; Do Spelling and Penmanship Count? In Medicine, You Bet". The New York Times. Retrieved 2018-08-29.
  25. Banks, T. (2008). Foreign Language Learning Difficulties and Teaching Strategies. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.
  26. Golding, Andrew R.; Roth, Dan (1999). "जर्नल लेख". Machine Learning. SpringerLink. 34: 107–130. doi:10.1023/A:1007545901558.
  27. Walt Mossberg (4 January 2007). "समीक्षा". Wall Street Journal. Retrieved 24 September 2010.
  28. "गूगल ऑपरेटिंग सिस्टम". googlesystem.blogspot.com. 29 May 2009. Retrieved 25 September 2010. "Google's Context-Sensitive Spell Checker". May 29, 2009. Retrieved 25 September 2010.


बाहरी संबंध