वर्तनी जांचकर्ता (स्पेल चेकर): Difference between revisions
No edit summary |
No edit summary |
||
Line 61: | Line 61: | ||
|access-date=2011-02-18 |url-status=dead | |access-date=2011-02-18 |url-status=dead | ||
|archive-url=https://web.archive.org/web/20110720044806/http://stanford.edu/~learnest/legacies.pdf | |archive-url=https://web.archive.org/web/20110720044806/http://stanford.edu/~learnest/legacies.pdf | ||
|archive-date=2011-07-20}}</ref> वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने | |archive-date=2011-07-20}}</ref> वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने यूनिक्स वर्तनी प्रोग्राम को प्रेरित किया था। | ||
पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।<ref name="cled.georgetown.edu">{{cite web | पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।<ref name="cled.georgetown.edu">{{cite web | ||
Line 74: | Line 74: | ||
|last=Harvey |first=Charlotte Bruce |date=May–June 2010 | |last=Harvey |first=Charlotte Bruce |date=May–June 2010 | ||
|work=Brown Alumni Magazine |page=79|url=https://www.brownalumnimagazine.com/articles/2010-05-13/teaching-computers-to-spell}}</ref> | |work=Brown Alumni Magazine |page=79|url=https://www.brownalumnimagazine.com/articles/2010-05-13/teaching-computers-to-spell}}</ref> | ||
===यूनिक्स=== | ===यूनिक्स=== | ||
यूनिक्स में सामान्यतः उपयोग किया जाने वाला [[मेरा जादू]] प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।<ref>{{Cite web |title=अंतर्राष्ट्रीय इसपेल|url=https://www.cs.hmc.edu/~geoff/ispell.html |access-date=2023-02-19 |website=www.cs.hmc.edu}} </ref> | यूनिक्स में सामान्यतः उपयोग किया जाने वाला [[मेरा जादू|माय मैजिक]] प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।<ref>{{Cite web |title=अंतर्राष्ट्रीय इसपेल|url=https://www.cs.hmc.edu/~geoff/ispell.html |access-date=2023-02-19 |website=www.cs.hmc.edu}} </ref> | ||
जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता [[जीएनयू एस्पेल]] है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।<ref>{{Cite web |title=जीएनयू एस्पेल|url=http://aspell.net/ |access-date=2023-02-19 |website=aspell.net}} </ref> | जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता [[जीएनयू एस्पेल]] है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।<ref>{{Cite web |title=जीएनयू एस्पेल|url=http://aspell.net/ |access-date=2023-02-19 |website=aspell.net}} </ref> | ||
Line 95: | Line 92: | ||
|date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से [[ समाप्त करें-और-निवासी रहें |समाप्त करें-और-निवासी रहें]] मोड में चलाया जा सकता था। | |date=November 1982 |access-date=21 October 2013 |author=Advertisement |pages=165}}</ref> [[मूल उपकरण निर्माता]] पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से [[ समाप्त करें-और-निवासी रहें |समाप्त करें-और-निवासी रहें]] मोड में चलाया जा सकता था। | ||
चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध | चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक [[वर्डस्टार]] और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः [[एशियाई भाषा]]एँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से [[हंगेरियन भाषा]] और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में चूँकि [[आइसलैंड]] जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को प्रयुक्त करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी [[WordPerfect|वर्डपरफेक्ट]] जैसी कंपनियाँ अपनी वैश्विक [[ विपणन |विपणन]] रणनीति के भाग के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं। | ||
जब एप्पल ने मैक ओएस<ref>{{cite book | जब एप्पल ने मैक ओएस<ref>{{cite book | ||
Line 112: | Line 109: | ||
===ब्राउज़र === | ===ब्राउज़र === | ||
[[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors | Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]] | [[फ़ायरफ़ॉक्स]] 2.0, एक [[वेब ब्राउज़र]], उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,<ref>{{Cite web|url=https://www.godaddy.com/help/check-my-email-for-spelling-errors-2759|title=Check my email for spelling errors | Workspace Email - GoDaddy Help US|website=www.godaddy.com}}</ref> जैसे कि विकीटेक्स्ट को संपादित करते समय, कई [[वेबमेल]] साइटों, [[ब्लॉग]] और [[ सामाजिक नेटवर्किंग |सामाजिक नेटवर्किंग]] वेबसाइटों पर लिखना वेब ब्राउज़र गूगल क्रोम,, [[Konqueror|कॉन्करर]] , और ओपेरा (वेब ब्राउज़र), ईमेल क्लाइंट [[Kmail|केमेल]] और [[ तात्कालिक संदेशन |तात्कालिक संदेशन]] [[क्लाइंट (कंप्यूटिंग)]] पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले जीएनयू एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं। | ||
===विशेषताएं === | ===विशेषताएं === | ||
Line 122: | Line 119: | ||
यह तर्कसंगत लग सकता है कि जहां तक वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् [[कॉर्पस भाषाविज्ञान]] के आधार पर यह निर्धारित कर सकता है कि [[बाट|बाहत]] शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है। | यह तर्कसंगत लग सकता है कि जहां तक वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् [[कॉर्पस भाषाविज्ञान]] के आधार पर यह निर्धारित कर सकता है कि [[बाट|बाहत]] शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है। | ||
[[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि | [[Image:Spell check.PNG|right|thumb|एंचेंट (सॉफ्टवेयर), एबिवर्ड वर्तनी परीक्षक का एक स्क्रीनशॉट।]]पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि बाद में, [[Oracle Corporation|ओरेकल कारपोरेशन]] के अल्पकालिक कोऑथर जैसे पैकेजों में बैच प्रोसेसिंग की प्रस्तुति की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव विधि से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से [[माइक्रोसॉफ्ट वर्ड]] के स्थिति में हुआ है। | ||
वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में | वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब [[व्याकरण]] संबंधी त्रुटियों को पहचानने में सक्षम था चूँकि अपनी सर्वश्रेष्ठ स्थिति में भी, वे संभवतः ही किसी टेक्स्ट में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि [[ होमोफ़ोन |होमोफ़ोन]] त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। तथापि, वर्तनी जांचकर्ताओं को एक प्रकार की [[विदेशी भाषा लेखन सहायता]] के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए विश्वाश कर सकते हैं।<ref>Banks, T. (2008). [http://eric.ed.gov/PDFS/ED501062.pdf ''Foreign Language Learning Difficulties and Teaching Strategies'']. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.</ref> | ||
Line 139: | Line 136: | ||
व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं। | व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं। | ||
== यह भी देखें == | == यह भी देखें == | ||
{{Wikiquote}} | {{Wikiquote}} | ||
*[[क्यूपर्टिनो प्रभाव]] | *[[क्यूपर्टिनो प्रभाव]] |
Revision as of 09:30, 17 July 2023
आँख के पास एक स्पेलिंग चेकर है,
यह मेरे मटर सागर के साथ आया था।
यह प्लेन ली मार्क फोर माई रिव्यू है
मिस स्टेक्स मैं समुद्र में गाँठ बाँध सकता हूँ।
आँखों पर प्रहार करो और एक व्हिर्रेड टाइप करो
और वजन चार यह दो कहते हैं
मौसम की नज़र गलत लिख रही हूँ
यह मुझे सीधे वजन बताता है।
आँख दौड़ी यह कविता फेंक दी,
आपका किनारा वास्तव में दो नंबरों से खुश है।
इसकी पॉलिश इसके वजन में भिन्न होती है।
मेरे चेकर ने मुझसे सिलाई करने को कहा।
एक चेकर एक धन्य चीज़ है,
यह थाइम की कुछ गांठों को जमा देता है।
यह मुझे सही करने की सभी शैलियों को सही करने में सहायता करता है,
और आँख में जलन होने पर मेरी सहायता करता है।
प्रत्येक लड़ाई मेरी स्क्रीन पर दिखाई देती है
आँख भी एक जूल तक उलझी हुई है।
चेकर हर शब्द पर कुछ न कुछ डालता है
दो चेक योग वर्तनी नियम.
सॉफ्टवेयर में, वर्तनी जांचकर्ता (या वर्तनी जांचकर्ता या वर्तनी जांच) एक सॉफ्टवेयर सुविधा है जो किसी टेक्स्ट में गलत वर्तनी की जांच करती है। वर्तनी-जाँच सुविधाएँ अधिकांशतः सॉफ़्टवेयर या सेवाओं जैसे वर्ड प्रोसेसर, ईमेल क्लाइंट, इलेक्ट्रॉनिक शब्दकोश या खोज इंजन में अंतर्निहित होती हैं।
डिज़ाइन
एक मूलभूत वर्तनी जाँचकर्ता निम्नलिखित प्रक्रियाएँ करता है:
- यह टेक्स्ट को स्कैन करता है और उसमें उपस्थित शब्दों को निकालता है।
- इसके बाद यह प्रत्येक शब्द की तुलना सही विधि से लिखे गए शब्दों की ज्ञात सूची (अथार्त एक शब्दकोश) से करता है। इसमें केवल शब्दों की एक सूची हो सकती है, या इसमें अतिरिक्त जानकारी भी हो सकती है, जैसे हाइफ़नेशन बिंदु या शाब्दिक और व्याकरण संबंधी विशेषताएँ है।
- एक अतिरिक्त कदम आकृति विज्ञान (भाषा विज्ञान) को संभालने के लिए एक भाषा-निर्भर एल्गोरिदम है। यहां तक कि अंग्रेजी भाषा जैसी हल्की विभक्ति वाली भाषा के लिए भी, वर्तनी जांचकर्ता को एक ही शब्द के विभिन्न रूपों, जैसे बहुवचन, मौखिक रूप, संकुचन (व्याकरण), और स्वामित्व (भाषाविज्ञान) पर विचार करने की आवश्यकता होती है। जो की कई अन्य भाषाओं के लिए, जैसे कि एग्लूटिनेशन और अधिक जटिल गिरावट और संयुग्मन की विशेषता वाली भाषाओं के लिए, प्रक्रिया का यह भाग अधिक जटिल है।
यह स्पष्ट नहीं है कि क्या रूपात्मक विश्लेषण - किसी शब्द की व्याकरणिक भूमिका के आधार पर उसके कई रूपों की अनुमति देना - अंग्रेजी के लिए एक महत्वपूर्ण लाभ प्रदान करता है, चूँकि जर्मन, हंगेरियन या तुर्की जैसी अत्यधिक सिंथेटिक भाषाओं के लिए इसके लाभ स्पष्ट हैं।
इन घटकों के सहायक के रूप में, प्रोग्राम का उपयोगकर्ता इंटरफ़ेस उपयोगकर्ताओं को प्रतिस्थापन को स्वीकृत या अस्वीकार करने और प्रोग्राम के संचालन को संशोधित करने की अनुमति देता है।
वर्तनी जांचकर्ता गलत वर्तनी वाले शब्दों की सही वर्तनी खोजने के लिए लेवेनशेटिन दूरी जैसे अनुमानित स्ट्रिंग मिलान एल्गोरिदम का उपयोग कर सकते हैं।[1] एक वैकल्पिक प्रकार का वर्तनी जांचकर्ता सही वर्तनी वाले शब्दों के अतिरीक्त त्रुटियों को पहचानने के लिए केवल एन-ग्राम जैसी सांख्यिकीय जानकारी का उपयोग करता है। इस दृष्टिकोण में सामान्यतः पर्याप्त सांख्यिकीय जानकारी प्राप्त करने के लिए बहुत अधिक प्रयास की आवश्यकता होती है। मुख्य लाभों में कम रनटाइम संचयन की आवश्यकता और उन शब्दों में त्रुटियों को ठीक करने की क्षमता सम्मिलित है जो शब्दकोश में सम्मिलित नहीं हैं।[2]
कुछ स्थिति में, वर्तनी जांचकर्ता गलत वर्तनी की एक निश्चित सूची और उन गलत वर्तनी के लिए वर्तनी सुझाव का उपयोग करते हैं; इस कम लचीले दृष्टिकोण का उपयोग अधिकांशतः कागज-आधारित सुधार विधियों में किया जाता है, जैसे कि विश्वकोश की प्रविष्टियाँ भी देखें।
क्लस्टरिंग एल्गोरिदम का उपयोग ध्वन्यात्मक जानकारी के साथ संयोजन में वर्तनी जांच[3] के लिए भी किया गया है।[4]
इतिहास
प्री-पीसी
1961 में, लेस अर्नेस्ट, जिन्होंने इस नवोदित तकनीक पर शोध का नेतृत्व किया, ने 10,000 स्वीकार्य शब्दों की सूची तक पहुंचने वाले पहले वर्तनी जांचकर्ता को सम्मिलित करना आवश्यक समझा जाता है।[5] उस समय अर्नेस्ट के तहत स्नातक छात्र राल्फ गोरिन ने सामान्य अंग्रेजी टेक्स्ट के लिए एक एप्लिकेशन प्रोग्राम (शोध के अतिरिक्त) के रूप में लिखा गया पहला सच्चा वर्तनी जांच कार्य बनाया: फरवरी में स्टैनफोर्ड यूनिवर्सिटी की आर्टिफिशियल इंटेलिजेंस प्रयोगशाला में डीईसी पीडीपी -10 के लिए वर्तनी 1971.[6] तेज़ कार्रवाई के लिए गोरिन ने असेंबली भाषा में वर्तनी लिखा गया था; उन्होंने शब्द सूची में एक अक्षर या आसन्न अक्षर स्थानान्तरण से भिन्न प्रशंसनीय सही वर्तनी की खोज करके और उन्हें उपयोगकर्ता के सामने प्रस्तुत करके पहला वर्तनी सुधारक बनाया था और गोरिन ने वर्तनी को सार्वजनिक रूप से सुलभ बना दिया जाता है, जैसा कि अधिकांश सैल (स्टैनफोर्ड आर्टिफिशियल इंटेलिजेंस लेबोरेटरी) कार्यक्रमों के साथ किया गया था, और यह जल्द ही नए अरपानेट के माध्यम से दुनिया भर में फैल गया था, जिसे पर्सनल कंप्यूटर के सामान्य उपयोग में आने से लगभग दस साल पहले।[7] वर्तनी, इसके एल्गोरिदम और डेटा संरचनाओं ने यूनिक्स वर्तनी प्रोग्राम को प्रेरित किया था।
पहले वर्तनी जांचकर्ता 1970 के दशक के अंत में मेनफ्रेम कंप्यूटरों पर व्यापक रूप से उपलब्ध थे। जॉर्जटाउन विश्वविद्यालय के छह भाषाविदों के एक समूह ने आईबीएम कॉर्पोरेशन के लिए पहली वर्तनी-जांच प्रणाली विकसित की थी।[8]
हेनरी कुएसेरा ने 1981 में डिजिटल इक्विपमेंट कॉर्प की वैक्स मशीनों के लिए एक का आविष्कार किया था।[9]
यूनिक्स
यूनिक्स में सामान्यतः उपयोग किया जाने वाला माय मैजिक प्रोग्राम आर. ई. गोरिन के स्पेल पर आधारित है। इसे एमआईटी में पेस विलिसन द्वारा सी में परिवर्तित किया गया था।[10]
जीएनयू प्रोजेक्ट का अपना वर्तनी जांचकर्ता जीएनयू एस्पेल है। एस्पेल का मुख्य सुधार यह है कि यह गलत वर्तनी वाले अंग्रेजी शब्दों के लिए अधिक स्पष्ट रूप से सही विकल्प सुझा सकता है।[11]
पारंपरिक वर्तनी जांचकर्ताओं की जटिल विभक्ति वाली भाषाओं में शब्दों की जांच करने में असमर्थता के कारण, हंगेरियन लास्ज़लो नेमेथ ने हन्सपेल विकसित किया, एक वर्तनी जांचकर्ता जो एग्लूटिनेटिव भाषाओं और जटिल यौगिक शब्दों का समर्थन करता है। हन्सपेल अपने शब्दकोशों में यूनिकोड का भी उपयोग करता है।[12] संस्करण 2.0.2 में हन्सपेल ने ओपनऑफिस.ऑर्ग में पिछले माईस्पेल को प्रतिस्थापित कर दिया था।
एन्चांट (सॉफ्टवेयर) एक अन्य सामान्य वर्तनी जांचकर्ता है, जो अबीवर्ड से लिया गया है। इसका लक्ष्य विभिन्न भाषाओं जैसे एस्पेल, हन्सपेल, नुस्पेल, एचस्पेल (हिब्रू), वोइक्को (फिनिश), ज़ेम्बरेक (तुर्की) और ऐप्पलस्पेल को एक इंटरफ़ेस के तहत समर्थन करने वाले कार्यक्रमों को संयोजित करना है।[13]
पीसी
पर्सनल कंप्यूटर के लिए पहला वर्तनी जांचकर्ता 1980 में सामने आया था, जैसे कि कमोडोर सिस्टम के लिए वर्डचेक जिसे 1980 के अंत में जनवरी 1981 में विज्ञापनों के प्रिंट होने के समय जारी किया गया था।[14] मारिया मारिअथार्त जैसे डेवलपर्स[8]और आकस्मिक घर [15] मूल उपकरण निर्माता पैकेजों या अंतिम-उपयोगकर्ता उत्पादों को तेजी से बढ़ते सॉफ़्टवेयर बाज़ार में पहुँचाया था। जिसे प्री-विंडोज पीसी पर, ये वर्तनी जांचकर्ता स्टैंडअलोन प्रोग्राम थे, जिनमें से कई को पर्याप्त मेमोरी वाले पीसी पर वर्ड-प्रोसेसिंग पैकेज के अंदर से समाप्त करें-और-निवासी रहें मोड में चलाया जा सकता था।
चूँकि स्टैंडअलोन पैकेजों का बाजार अल्पकालिक था, क्योंकि 1980 के दशक के मध्य तक वर्डस्टार और वर्डपरफेक्ट जैसे लोकप्रिय वर्ड-प्रोसेसिंग पैकेजों के डेवलपर्स ने अपने पैकेजों में वर्तनी जांचकर्ताओं को सम्मिलित कर लिया था, जो अधिकत्तर उपरोक्त कंपनियों से लाइसेंस प्राप्त थे, जिन्होंने तेजी से समर्थन बढ़ाया। अंग्रेजी भाषा से लेकर कई यूरोपीय भाषाएँ और अंततः एशियाई भाषाएँ भी है चूँकि इसके लिए सॉफ़्टवेयर की आकृति विज्ञान दिनचर्या में बढ़ते परिष्कार की आवश्यकता थी, विशेष रूप से हंगेरियन भाषा और फ़िनिश भाषा जैसी भारी-समूहनात्मक भाषाओं के संबंध में चूँकि आइसलैंड जैसे देश में वर्ड-प्रोसेसिंग बाज़ार का आकार वर्तनी जाँचकर्ता को प्रयुक्त करने के निवेश को उचित नहीं ठहरा सकता है, फिर भी वर्डपरफेक्ट जैसी कंपनियाँ अपनी वैश्विक विपणन रणनीति के भाग के रूप में अपने सॉफ़्टवेयर को यथासंभव अधिक से अधिक राष्ट्रीय बाज़ारों के लिए स्थानीयकृत करने का प्रयास करती हैं।
जब एप्पल ने मैक ओएस[16] यह पहली बार था: प्रत्येक कार्यक्रम के लिए एक अलग वर्तनी जांचकर्ता रखने की आवश्यकता नहीं थी।[17] मैक ओएस एक्स के वर्तनी जांच कवरेज में वस्तुतः सभी बंडल और तृतीय पक्ष एप्लिकेशन सम्मिलित हैं।
दृश्य उपकरण का वीटी स्पेलर, 1994 में प्रस्तुत किया गया था, जो विंडोज़ का समर्थन करने वाले अनुप्रयोगों के डेवलपर्स के लिए डिज़ाइन किया गया था।[18][19] यह एक शब्दकोश के साथ आया था किंतु इसमें द्वितीयक शब्दकोशों के निर्माण और उपयोग को सम्मिलित करने की क्षमता थी।[20]
ब्राउज़र
फ़ायरफ़ॉक्स 2.0, एक वेब ब्राउज़र, उपयोगकर्ता-लिखित सामग्री के लिए वर्तनी जांच समर्थन प्रदान करता है,[21] जैसे कि विकीटेक्स्ट को संपादित करते समय, कई वेबमेल साइटों, ब्लॉग और सामाजिक नेटवर्किंग वेबसाइटों पर लिखना वेब ब्राउज़र गूगल क्रोम,, कॉन्करर , और ओपेरा (वेब ब्राउज़र), ईमेल क्लाइंट केमेल और तात्कालिक संदेशन क्लाइंट (कंप्यूटिंग) पिडगिन (सॉफ़्टवेयर) भी वर्तनी जाँच समर्थन प्रदान करते हैं, पारदर्शी रूप से पहले जीएनयू एस्पेल और वर्तमान में हनस्पेल को अपने इंजन के रूप में उपयोग करते हैं।
विशेषताएं
चिकित्सीय त्रुटियों को रोकने में सहायता के लिए कुछ वर्तनी जांचकर्ताओं के पास चिकित्सा शब्दकोशों के लिए अलग से समर्थन होता है।[22][23][24]
कार्यक्षमता
पहले वर्तनी जांचकर्ता सुधारक के अतिरीक्त सत्यापनकर्ता थे। उन्होंने ग़लत वर्तनी वाले शब्दों के लिए कोई सुझाव नहीं दिया। यह लेखन संबंधी गलतियों के लिए तो साह्कृत था किंतु तार्किक या ध्वन्यात्मक त्रुटियों के लिए उतना साह्कृत नहीं था। डेवलपर्स को जिस चुनौती का सामना करना पड़ा वह गलत वर्तनी वाले शब्दों के लिए उपयोगी सुझाव देने में कठिनाई थी। इसके लिए शब्दों को स्केलेटल रूप में कम करना और पैटर्न-मिलान एल्गोरिदम प्रयुक्त करना आवश्यक है।
यह तर्कसंगत लग सकता है कि जहां तक वर्तनी-जांच करने वाले शब्दकोशों का संबंध है, जितना बड़ा उतना उत्तम है जिससे सही शब्दों को गलत के रूप में चिह्नित न किया जाए। चूँकि वास्तव में, अंग्रेजी के लिए इष्टतम आकार लगभग 90,000 प्रविष्टियाँ प्रतीत होता है। यदि इससे अधिक हैं, तो गलत वर्तनी वाले शब्दों को छोड़ दिया जा सकता है क्योंकि उन्हें गलती से अन्य शब्द समझ लिया जाता है। उदाहरण के लिए, एक भाषाविद् कॉर्पस भाषाविज्ञान के आधार पर यह निर्धारित कर सकता है कि बाहत शब्द थाई मुद्रा के संदर्भ की तुलना में अधिकांशतः बाथ या बैट की गलत वर्तनी है। इसलिए, यह सामान्यतः अधिक उपयोगी होगा यदि थाई मुद्रा के बारे में लिखने वाले कुछ लोगों को थोड़ी असुविधा हुई हो, अतिरीक्त इसके कि स्नान पर चर्चा करने वाले कई लोगों की वर्तनी त्रुटियों को अनदेखा कर दिया जाता है।
पहले एमएस-डॉस वर्तनी जांचकर्ताओं का उपयोग अधिकतर वर्ड प्रोसेसिंग पैकेज के अंदर से प्रूफ़िंग मोड में किया जाता था। दस्तावेज़ तैयार करने के बाद, एक उपयोगकर्ता ने गलत वर्तनी की खोज में टेक्स्ट को स्कैन किया जाता है। चूँकि बाद में, ओरेकल कारपोरेशन के अल्पकालिक कोऑथर जैसे पैकेजों में बैच प्रोसेसिंग की प्रस्तुति की गई और उपयोगकर्ता को दस्तावेज़ संसाधित होने के बाद परिणाम देखने और केवल उन शब्दों को सही करने की अनुमति दी गई जो गलत थे। जब मेमोरी और प्रसंस्करण शक्ति प्रचुर हो गई, तो पृष्ठभूमि में इंटरैक्टिव विधि से वर्तनी जांच की गई, जैसे कि 1987 में जारी सेक्टर सॉफ्टवेयर निर्मित स्पेलबाउंड प्रोग्राम और वर्ड 95 के बाद से माइक्रोसॉफ्ट वर्ड के स्थिति में हुआ है।
वर्तनी जांचकर्ता तेजी से परिष्कृत होते गए; अब व्याकरण संबंधी त्रुटियों को पहचानने में सक्षम था चूँकि अपनी सर्वश्रेष्ठ स्थिति में भी, वे संभवतः ही किसी टेक्स्ट में सभी त्रुटियों को पकड़ पाते हैं (जैसे कि होमोफ़ोन त्रुटियाँ) और नवविज्ञान और विदेशी शब्दों को गलत वर्तनी के रूप में चिह्नित करेंगे। तथापि, वर्तनी जांचकर्ताओं को एक प्रकार की विदेशी भाषा लेखन सहायता के रूप में माना जा सकता है, जिस पर गैर-देशी भाषा सीखने वाले लक्ष्य भाषा में अपनी गलत वर्तनी का पता लगाने और उसे ठीक करने के लिए विश्वाश कर सकते हैं।[25]
अंग्रेजी के अतिरिक्त अन्य भाषाओं के लिए वर्तनी-जांच
अंग्रेजी इस तात्पर्य में असामान्य है कि औपचारिक लेखन में उपयोग किए जाने वाले अधिकांश शब्दों में एक ही वर्तनी होती है जो कि कुछ शब्दजाल और संशोधित शब्दों के अपवाद के साथ, एक विशिष्ट शब्दकोश में पाई जा सकती है। कई भाषाओं में, शब्दों को अधिकांशतः शब्दों के नए संयोजनों में संयोजित किया जाता है। जर्मन में, यौगिक संज्ञाएं अधिकांशतः अन्य उपस्थित संज्ञाओं से बनाई जाती हैं। कुछ स्क्रिप्ट स्पष्ट रूप से एक शब्द को दूसरे से अलग नहीं करती हैं, जिसके लिए शब्द-विभाजन एल्गोरिदम की आवश्यकता होती है। इनमें से प्रत्येक गैर-अंग्रेजी भाषा वर्तनी जांचकर्ताओं के लिए अद्वितीय चुनौतियां प्रस्तुत करता है।
संदर्भ-संवेदनशील वर्तनी जांचकर्ता
ऐसे एल्गोरिदम विकसित करने पर शोध किया गया है जो गलत वर्तनी वाले शब्द को पहचानने में सक्षम हैं, तथापि वह शब्द आसपास के शब्दों के संदर्भ (भाषा उपयोग) के आधार पर शब्दावली में ही क्यों न हो और यह न केवल उपरोक्त कविता जैसे शब्दों को पकड़ने की अनुमति देता है, किंतु यह शब्दकोशों को बड़ा करने के हानिकारक प्रभाव को कम करता है, जिससे अधिक शब्दों को पहचाना जा सकता है। उदाहरण के लिए, थाई या थाईलैंड के समान पैराग्राफ में बहत को बाथ की गलत वर्तनी के रूप में मान्यता नहीं दी जाएगी। ऐसी प्रणाली द्वारा पकड़ी गई त्रुटियों का सबसे समान्य उदाहरण होमोफ़ोन त्रुटियां हैं, जैसे कि निम्नलिखित वाक्य में बोल्ड शब्द है:
- 'उनका' आ रहा है 'भी' 'समुद्र' यदि 'यह' है 'रील'।
आज तक का सबसे सफल एल्गोरिदम एंड्रयू गोल्डिंग और डैन रोथ का विन्नो (एल्गोरिदम)-आधारित वर्तनी सुधार एल्गोरिदम है,[26] 1999 में प्रकाशित, जो सामान्य गैर-शब्द वर्तनी त्रुटियों के अतिरिक्त, लगभग 96% संदर्भ-संवेदनशील वर्तनी त्रुटियों को पहचानने में सक्षम है। संदर्भ-संवेदनशील वर्तनी जांचकर्ता अब बंद हो चुके अनुप्रयोगों माइक्रोसॉफ्ट ऑफिस 2007 में [27] और गूगल वेव. दिखाई दिए थे[28]
व्याकरण जांचकर्ता शब्दों के गलत चयन सहित वर्तनी त्रुटियों से परे व्याकरण संबंधी समस्याओं को ठीक करने का प्रयास करते हैं।
यह भी देखें
- क्यूपर्टिनो प्रभाव
- व्याकरण जांचकर्ता
- रिकॉर्ड लिंकेज समस्या
- वर्तनी सुझाव
- शब्द (यूनिक्स)
- स्वतः सुधार
- भाषा उपकरण
संदर्भ
- ↑ Perner, Petra (2010-07-05). Advances in Data Mining: Applications and Theoretical Aspects: 10th Industrial Conference, ICDM 2010, Berlin, Germany, July 12-14, 2010. Proceedings (in English). Springer Science & Business Media. ISBN 978-3-642-14399-1.
- ↑ U.S. Patent 6618697, Method for rule-based correction of spelling and grammar errors
- ↑ de Amorim, R.C.; Zampieri, M. (2013) Effective Spell Checking Methods Using Clustering Algorithms. Archived 2017-08-17 at the Wayback Machine Proceedings of Recent Advances in Natural Language Processing (RANLP2013). Hissar, Bulgaria. p. 172-178.
- ↑ Zampieri, M.; de Amorim, R.C. (2014) Between Sound and Spelling: Combining Phonetics and Clustering Algorithms to Improve Target Word Recovery. Proceedings of the 9th International Conference on Natural Language Processing (PolTAL). Lecture Notes in Computer Science (LNCS). Springer. p. 438-449.
- ↑ Earnest, Les. "पहले तीन वर्तनी जाँचकर्ता" (PDF). Stanford University. Archived from the original (PDF) on 22 October 2012. Retrieved 10 October 2011.
- ↑ Peterson, James (December 1980). Computer Programs for Detecting and Correcting Spelling Errors (PDF). Retrieved 2011-02-18.
- ↑ Earnest, Les. Visible Legacies for Y3K (PDF). Archived from the original (PDF) on 2011-07-20. Retrieved 2011-02-18.
- ↑ 8.0 8.1 "Georgetown U Faculty & Staff: The Center for Language, Education & Development". Archived from the original on 2009-02-05. Retrieved 2008-12-18., citation: "Maria Mariani... was one of a group of six linguists from Georgetown University who developed the first spell-check system for the IBM corporation."
- ↑ Harvey, Charlotte Bruce (May–June 2010). "Teaching Computers to Spell (obituary for Henry Kučera)". Brown Alumni Magazine. p. 79.
- ↑ "अंतर्राष्ट्रीय इसपेल". www.cs.hmc.edu. Retrieved 2023-02-19.
- ↑ "जीएनयू एस्पेल". aspell.net. Retrieved 2023-02-19.
- ↑ "Hunspell: About". hunspell.github.io. Retrieved 2023-02-19.
- ↑ AbiWord/enchant, AbiWord, 2023-02-13, retrieved 2023-02-19
- ↑ Advertisement (January 1981). "माइक्रो कंप्यूटर इंडस्ट्रीज लिमिटेड" (PDF). Compute! Magazine, Issue 8, Vol. 3, No. 1. p. 119.
- ↑ Advertisement (November 1982). "The Spelling Bee Is Over". PC Magazine. p. 165. Retrieved 21 October 2013.
- ↑ David Pogue (2009). Mac OS X Snow Leopard: The Missing Manual.
- ↑ David Pogue (2015). Switching to the Mac: The Missing Manual.
- ↑ "VisualTools VT-Speller". Computerworld. February 21, 1994. p. 68.
- ↑ "Browse September 27, 1993".
VT-SPELLER
- ↑ Peter G. Aitken (November 8, 1994). "Spell-Checking for your Apps". PC Magazine. p. 299.
- ↑ "Check my email for spelling errors | Workspace Email - GoDaddy Help US". www.godaddy.com.
- ↑ "फ़ायरफ़ॉक्स और थंडरबर्ड के लिए मेडिकल वर्तनी परीक्षक". e-MedTools. 2017. Archived from the original on 2019-05-04. Retrieved 2018-08-29.
- ↑ Quathamer, Dr. Tobias (2016). "जर्मन चिकित्सा शब्दकोश शब्द". Dr. Tobias Quathamer. Retrieved 2018-08-29.
- ↑ Friedman, Richard A.; D, M (2003). "CASES; Do Spelling and Penmanship Count? In Medicine, You Bet". The New York Times. Retrieved 2018-08-29.
- ↑ Banks, T. (2008). Foreign Language Learning Difficulties and Teaching Strategies. (pp. 29). Master's Thesis, Dominican University of California. Retrieved 19 March 2012.
- ↑ Golding, Andrew R.; Roth, Dan (1999). "जर्नल लेख". Machine Learning. SpringerLink. 34: 107–130. doi:10.1023/A:1007545901558.
- ↑ Walt Mossberg (4 January 2007). "समीक्षा". Wall Street Journal. Retrieved 24 September 2010.
- ↑ "गूगल ऑपरेटिंग सिस्टम". googlesystem.blogspot.com. 29 May 2009. Retrieved 25 September 2010. "Google's Context-Sensitive Spell Checker". May 29, 2009. Retrieved 25 September 2010.
बाहरी संबंध
- List of spell checkers at Curlie
- Norvig.com, "How to Write a वर्तनी ing Corrector", by Peter Norvig
- BBK.ac.uk, "वर्तनी checking by computer", by Roger Mitton
- CBSNews.com, वर्तनी -Check Crutch Curtails Correctness, by Lloyd de Vries
- History and text of "Candidate for a Pullet Surprise" by Mark Eckman and Jerrold H. Zar