टेक्स्ट प्रोसेसिंग: Difference between revisions
No edit summary |
No edit summary |
||
Line 3: | Line 3: | ||
[[File:P.Oxy.6.993 text transcribed.svg|right|thumb]]कंप्यूटिंग में, '''टेक्स्ट प्रोसेसिंग''' शब्द इलेक्ट्रॉनिक टेक्स्ट के निर्माण या परिवर्तन को स्वचालित करने के सिद्धांत और अभ्यास को संदर्भित करता है। | [[File:P.Oxy.6.993 text transcribed.svg|right|thumb]]कंप्यूटिंग में, '''टेक्स्ट प्रोसेसिंग''' शब्द इलेक्ट्रॉनिक टेक्स्ट के निर्माण या परिवर्तन को स्वचालित करने के सिद्धांत और अभ्यास को संदर्भित करता है। | ||
टेक्स्ट समान्य रूप से अभ्यास में संलग्न व्यक्ति के कीबोर्ड पर निर्दिष्ट सभी अल्फ़ान्यूमेरिक वर्णों को संदर्भित करता है, किन्तु सामान्य रूप से | टेक्स्ट समान्य रूप से अभ्यास में संलग्न व्यक्ति के कीबोर्ड पर निर्दिष्ट सभी अल्फ़ान्यूमेरिक वर्णों को संदर्भित करता है, किन्तु सामान्य रूप से टेक्स्ट का अर्थ लक्ष्य टेक्स्ट के मानक [[अक्षरों को सांकेतिक अक्षरों में बदलना]] के ठीक ऊपर [[अमूर्त परत]] है। | ||
प्रोसेसिंग शब्द स्वचालित (या यंत्रीकृत) प्रोसेसिंग को संदर्भित करता है, जो मैन्युअल रूप से किए गए समान परिवर्तन के विपरीत है। | प्रोसेसिंग शब्द स्वचालित (या यंत्रीकृत) प्रोसेसिंग को संदर्भित करता है, जो मैन्युअल रूप से किए गए समान परिवर्तन के विपरीत है। | ||
Line 12: | Line 12: | ||
* या की विषय की संसाधित रिपोर्ट तैयार करें | * या की विषय की संसाधित रिपोर्ट तैयार करें | ||
* किसी फ़ाइल या टेक्स्ट फ़ाइल की रिपोर्ट को फ़िल्टर करें। | * किसी फ़ाइल या टेक्स्ट फ़ाइल की रिपोर्ट को फ़िल्टर करें। | ||
[[ नियमित अभिव्यक्ति | नियमित अभिव्यक्ति]] की टेक्स्ट प्रोसेसिंग वर्चुअल एडिटिंग मशीन है, जिसमें प्रिमिटिव | [[ नियमित अभिव्यक्ति | नियमित अभिव्यक्ति]] की टेक्स्ट प्रोसेसिंग वर्चुअल एडिटिंग मशीन है, जिसमें प्रिमिटिव प्रोग्रामिंग लैंग्वेज होती है जिसमें रजिस्टरों (पहचानकर्ता) का नाम होता है, और टेक्स्ट में वर्णों के अनुक्रम में पदों का नाम दिया जाता है। इनका उपयोग करके, टेक्स्ट प्रोसेसर, उदाहरण के लिए, टेक्स्ट के क्षेत्र को चिह्नित कर सकता है और फिर उसे स्थानांतरित कर सकता है। ''[[ यूनिक्स उपयोगिता |यूनिक्स उपयोगिता]]'' का टेक्स्ट प्रोसेसिंग [[फ़िल्टर प्रोग्राम]], या ''फ़िल्टर'' है। इन दो तंत्रों में टेक्स्ट प्रोसेसिंग सम्मिलित है। | ||
==परिभाषा== | ==परिभाषा== | ||
चूंकि [[एएनएसआई एस्केप कोड]] जैसे मानकीकृत मार्कअप समान्य रूप से | चूंकि [[एएनएसआई एस्केप कोड]] जैसे मानकीकृत मार्कअप समान्य रूप से एडिटर के लिए अदृश्य होते हैं, उनमें क्षणिक गुणों का सेट सम्मिलित होता है जो कभी-कभी वर्ड प्रोसेसिंग से अप्रभेद्य हो जाते हैं। किन्तु वर्ड प्रोसेसिंग से निश्चित अंतर यह है कि टेक्स्ट प्रोसेसिंग उचित है: | ||
*केवळ "टेक्स्ट एडिटिंग" ऍप्लिकेशन्स नव्हे तर "टेक्स्ट प्रोसेसिंग युटिलिटीज" चे प्रतिनिधित्व करते. | *केवळ "टेक्स्ट एडिटिंग" ऍप्लिकेशन्स नव्हे तर "टेक्स्ट प्रोसेसिंग युटिलिटीज" चे प्रतिनिधित्व करते. | ||
*संपादन प्रारंभ करने के "माउस विधि " (उदाहरण के लिए खींचें और छोड़ें, काटें और पेस्ट करें) के विपरीत, यह "कीबोर्ड विधि " से कहीं अधिक है। | *संपादन प्रारंभ करने के "माउस विधि " (उदाहरण के लिए खींचें और छोड़ें, काटें और पेस्ट करें) के विपरीत, यह "कीबोर्ड विधि " से कहीं अधिक है। | ||
* दृष्टिकोण में यादृच्छिक पहुंच के अतिरिक्त अनुक्रमिक पहुंच है। | * दृष्टिकोण में यादृच्छिक पहुंच के अतिरिक्त अनुक्रमिक पहुंच है। | ||
* अप्रत्यक्ष रूप से [[अनुप्रयोग परत|एप्लीकेशन]] [[प्रेजेंटेशन लेयर|लेयर]] के अतिरिक्त [[प्रेजेंटेशन लेयर]] पर सीधे काम करता है। | * अप्रत्यक्ष रूप से [[अनुप्रयोग परत|एप्लीकेशन]] [[प्रेजेंटेशन लेयर|लेयर]] के अतिरिक्त [[प्रेजेंटेशन लेयर]] पर सीधे काम करता है। | ||
* रॉ डेटा पर काम करता है जो मानकीकृत होता है और किसी मालिकाना विधियों की ओर रुझान करने के अतिरिक्त अधिक विवर्त रूप से | * रॉ डेटा पर काम करता है जो मानकीकृत होता है और किसी मालिकाना विधियों की ओर रुझान करने के अतिरिक्त अधिक विवर्त रूप से काम करता है। | ||
इस तरह फ़ॉन्ट और रंग जैसे मार्कअप वास्तव में विशिष्ट कारक नहीं हैं, क्योंकि फ़ॉन्ट और रंग को प्रभावित करने वाले वर्ण अनुक्रम केवल ''पृष्ठभूमि टेक्स्ट प्रोसेसिंग'' मोड द्वारा स्वचालित रूप से डाले गए मानक वर्ण हैं, जो अनुरूप टेक्स्ट एडिटर द्वारा पारदर्शी रूप से काम करने के लिए बनाए जाते हैं। , फिर भी वह मोड प्रभावी नहीं होने पर ''टेक्स्ट प्रोसेसिंग कमांड'' के रूप में दृश्यमान हो जाता है। इसलिए टेक्स्ट प्रोसेसिंग को मानक, फिर भी अदृश्य वर्णों के अतिरिक्त दृश्य वर्णों (या ग्रैफेम्स) के आसपास मूल रूप से (किन्तु पूरी तरह से नहीं) परिभाषित किया गया है। | इस तरह फ़ॉन्ट और रंग जैसे मार्कअप वास्तव में विशिष्ट कारक नहीं हैं, क्योंकि फ़ॉन्ट और रंग को प्रभावित करने वाले वर्ण अनुक्रम केवल ''पृष्ठभूमि टेक्स्ट प्रोसेसिंग'' मोड द्वारा स्वचालित रूप से डाले गए मानक वर्ण हैं, जो अनुरूप टेक्स्ट एडिटर द्वारा पारदर्शी रूप से काम करने के लिए बनाए जाते हैं। , फिर भी वह मोड प्रभावी नहीं होने पर ''टेक्स्ट प्रोसेसिंग कमांड'' के रूप में दृश्यमान हो जाता है। इसलिए टेक्स्ट प्रोसेसिंग को मानक, फिर भी अदृश्य वर्णों के अतिरिक्त दृश्य वर्णों (या ग्रैफेम्स) के आसपास मूल रूप से (किन्तु पूरी तरह से नहीं) परिभाषित किया गया है। | ||
Line 27: | Line 27: | ||
==मूलभूत अवधारणाएँ== | ==मूलभूत अवधारणाएँ== | ||
एक एडिटर | एक एडिटर अनिवार्य रूप से इनपुट स्ट्रीम को आमंत्रित करता है और इसे टेक्स्ट प्रोसेसिंग वातावरण में निर्देशित करता है, जो या तो [[कमांड शेल]] या [[ पाठ संपादक |टेक्स्ट एडिटर]] होता है। जिसमे परिणामी आउटपुट आगे की टेक्स्ट प्रोसेसिंग पर प्रयुक्त होता है, जिसका अंतिम परिणाम अधिक परिष्कृत और संरचित कंप्यूटर प्रोग्राम द्वारा एक बार प्रयुक्त एल्गोरिदम के एकल एप्लीकेशन के समान होता है। | ||
टेक्स्ट प्रोसेसिंग, एल्गोरिदम के विपरीत, सरल मैक्रोज़ का मैन्युअल रूप से प्रशासित अनुक्रम है जो पैटर्न-एक्शन अभिव्यक्ति और फ़िल्टरिंग तंत्र हैं। किसी भी स्थिति | टेक्स्ट प्रोसेसिंग, एल्गोरिदम के विपरीत, सरल मैक्रोज़ का मैन्युअल रूप से प्रशासित अनुक्रम है जो पैटर्न-एक्शन अभिव्यक्ति और फ़िल्टरिंग तंत्र हैं। किसी भी स्थिति में प्रोग्रामर का संकेत टेक्स्ट प्रोसेसिंग के कार्य में पाठ्य वर्णों के दिए गए सेट पर अप्रत्यक्ष रूप से प्रभावित होता है। टेक्स्ट प्रोसेसिंग चरण के परिणाम कभी-कभी केवल आशाजनक होते हैं, और प्रयास किया गया तंत्र अक्सर दृश्य प्रतिक्रिया के माध्यम से विभिन्न ड्राफ्ट के अधीन होता है, जब तक कि नियमित अभिव्यक्ति या मार्कअप लैंग्वेज विवरण, या उपयोगिता विकल्पों में पूरी तरह से प्रभुत्व प्राप्त नहीं हो जाती है। | ||
टेक्स्ट प्रोसेसिंग का संबंध अधिकत्तर कंप्यूटिंग के उच्चतम स्तर पर टेक्स्ट कैरेक्टर तैयार करने से है, जहां इसकी गतिविधियां कंप्यूटिंग के व्यावहारिक उपयोग-सूचना के मैन्युअल ट्रांसमिशन से ठीक नीचे हैं। | टेक्स्ट प्रोसेसिंग का संबंध अधिकत्तर कंप्यूटिंग के उच्चतम स्तर पर टेक्स्ट कैरेक्टर तैयार करने से है, जहां इसकी गतिविधियां कंप्यूटिंग के व्यावहारिक उपयोग-सूचना के मैन्युअल ट्रांसमिशन से ठीक नीचे हैं। |
Revision as of 09:06, 2 October 2023
कंप्यूटिंग में, टेक्स्ट प्रोसेसिंग शब्द इलेक्ट्रॉनिक टेक्स्ट के निर्माण या परिवर्तन को स्वचालित करने के सिद्धांत और अभ्यास को संदर्भित करता है।
टेक्स्ट समान्य रूप से अभ्यास में संलग्न व्यक्ति के कीबोर्ड पर निर्दिष्ट सभी अल्फ़ान्यूमेरिक वर्णों को संदर्भित करता है, किन्तु सामान्य रूप से टेक्स्ट का अर्थ लक्ष्य टेक्स्ट के मानक अक्षरों को सांकेतिक अक्षरों में बदलना के ठीक ऊपर अमूर्त परत है।
प्रोसेसिंग शब्द स्वचालित (या यंत्रीकृत) प्रोसेसिंग को संदर्भित करता है, जो मैन्युअल रूप से किए गए समान परिवर्तन के विपरीत है।
टेक्स्ट प्रोसेसिंग में कंप्यूटर कमांड सम्मिलित होते हैं जो उदाहरण के लिए विषय, विषय परिवर्तन और कर्सर आंदोलन को प्रयुक्त करते हैं
- खोजें और बदलें
- प्रारूप
- या की विषय की संसाधित रिपोर्ट तैयार करें
- किसी फ़ाइल या टेक्स्ट फ़ाइल की रिपोर्ट को फ़िल्टर करें।
नियमित अभिव्यक्ति की टेक्स्ट प्रोसेसिंग वर्चुअल एडिटिंग मशीन है, जिसमें प्रिमिटिव प्रोग्रामिंग लैंग्वेज होती है जिसमें रजिस्टरों (पहचानकर्ता) का नाम होता है, और टेक्स्ट में वर्णों के अनुक्रम में पदों का नाम दिया जाता है। इनका उपयोग करके, टेक्स्ट प्रोसेसर, उदाहरण के लिए, टेक्स्ट के क्षेत्र को चिह्नित कर सकता है और फिर उसे स्थानांतरित कर सकता है। यूनिक्स उपयोगिता का टेक्स्ट प्रोसेसिंग फ़िल्टर प्रोग्राम, या फ़िल्टर है। इन दो तंत्रों में टेक्स्ट प्रोसेसिंग सम्मिलित है।
परिभाषा
चूंकि एएनएसआई एस्केप कोड जैसे मानकीकृत मार्कअप समान्य रूप से एडिटर के लिए अदृश्य होते हैं, उनमें क्षणिक गुणों का सेट सम्मिलित होता है जो कभी-कभी वर्ड प्रोसेसिंग से अप्रभेद्य हो जाते हैं। किन्तु वर्ड प्रोसेसिंग से निश्चित अंतर यह है कि टेक्स्ट प्रोसेसिंग उचित है:
- केवळ "टेक्स्ट एडिटिंग" ऍप्लिकेशन्स नव्हे तर "टेक्स्ट प्रोसेसिंग युटिलिटीज" चे प्रतिनिधित्व करते.
- संपादन प्रारंभ करने के "माउस विधि " (उदाहरण के लिए खींचें और छोड़ें, काटें और पेस्ट करें) के विपरीत, यह "कीबोर्ड विधि " से कहीं अधिक है।
- दृष्टिकोण में यादृच्छिक पहुंच के अतिरिक्त अनुक्रमिक पहुंच है।
- अप्रत्यक्ष रूप से एप्लीकेशन लेयर के अतिरिक्त प्रेजेंटेशन लेयर पर सीधे काम करता है।
- रॉ डेटा पर काम करता है जो मानकीकृत होता है और किसी मालिकाना विधियों की ओर रुझान करने के अतिरिक्त अधिक विवर्त रूप से काम करता है।
इस तरह फ़ॉन्ट और रंग जैसे मार्कअप वास्तव में विशिष्ट कारक नहीं हैं, क्योंकि फ़ॉन्ट और रंग को प्रभावित करने वाले वर्ण अनुक्रम केवल पृष्ठभूमि टेक्स्ट प्रोसेसिंग मोड द्वारा स्वचालित रूप से डाले गए मानक वर्ण हैं, जो अनुरूप टेक्स्ट एडिटर द्वारा पारदर्शी रूप से काम करने के लिए बनाए जाते हैं। , फिर भी वह मोड प्रभावी नहीं होने पर टेक्स्ट प्रोसेसिंग कमांड के रूप में दृश्यमान हो जाता है। इसलिए टेक्स्ट प्रोसेसिंग को मानक, फिर भी अदृश्य वर्णों के अतिरिक्त दृश्य वर्णों (या ग्रैफेम्स) के आसपास मूल रूप से (किन्तु पूरी तरह से नहीं) परिभाषित किया गया है।
इतिहास
कंप्यूटर टेक्स्ट प्रोसेसिंग का विकास क्लेन द्वारा नियमित लैंग्वेज को औपचारिक रूप देने के साथ ही प्रारंभ हुआ था। इस तरह की नियमित अभिव्यक्तियाँ तब मिनी-प्रोग्राम बन सकती हैं, जो संकलन प्रक्रिया के साथ पूर्ण होती है, किसी भी संपादन को करने के लिए उपलब्ध होती है, एक बार उस लैंग्वेज का विस्तार हो जाता है। इसी तरह, फिल्टर को विशेष कमांड (कंप्यूटिंग) विकसित करके बढ़ाया जाता है।
मूलभूत अवधारणाएँ
एक एडिटर अनिवार्य रूप से इनपुट स्ट्रीम को आमंत्रित करता है और इसे टेक्स्ट प्रोसेसिंग वातावरण में निर्देशित करता है, जो या तो कमांड शेल या टेक्स्ट एडिटर होता है। जिसमे परिणामी आउटपुट आगे की टेक्स्ट प्रोसेसिंग पर प्रयुक्त होता है, जिसका अंतिम परिणाम अधिक परिष्कृत और संरचित कंप्यूटर प्रोग्राम द्वारा एक बार प्रयुक्त एल्गोरिदम के एकल एप्लीकेशन के समान होता है।
टेक्स्ट प्रोसेसिंग, एल्गोरिदम के विपरीत, सरल मैक्रोज़ का मैन्युअल रूप से प्रशासित अनुक्रम है जो पैटर्न-एक्शन अभिव्यक्ति और फ़िल्टरिंग तंत्र हैं। किसी भी स्थिति में प्रोग्रामर का संकेत टेक्स्ट प्रोसेसिंग के कार्य में पाठ्य वर्णों के दिए गए सेट पर अप्रत्यक्ष रूप से प्रभावित होता है। टेक्स्ट प्रोसेसिंग चरण के परिणाम कभी-कभी केवल आशाजनक होते हैं, और प्रयास किया गया तंत्र अक्सर दृश्य प्रतिक्रिया के माध्यम से विभिन्न ड्राफ्ट के अधीन होता है, जब तक कि नियमित अभिव्यक्ति या मार्कअप लैंग्वेज विवरण, या उपयोगिता विकल्पों में पूरी तरह से प्रभुत्व प्राप्त नहीं हो जाती है।
टेक्स्ट प्रोसेसिंग का संबंध अधिकत्तर कंप्यूटिंग के उच्चतम स्तर पर टेक्स्ट कैरेक्टर तैयार करने से है, जहां इसकी गतिविधियां कंप्यूटिंग के व्यावहारिक उपयोग-सूचना के मैन्युअल ट्रांसमिशन से ठीक नीचे हैं।
अंततः सभी कंप्यूटिंग टेक्स्ट प्रोसेसिंग है, असेंबलर के स्व-संकलित पाठ्य वर्णों से, ग्राफिकल डेटा के ब्लॉब को संभालने के लिए उत्पन्न स्वचालित प्रोग्रामिंग लैंग्वेज के माध्यम से, और अंत में नियमित अभिव्यक्तियों के मेटाकैरेक्टर्स तक जो उपस्थित टेक्स्ट डॉक्यूमेंट को तैयार करते हैं।
टेक्स्ट प्रोसेसिंग का अपना स्वचालन है।
अक्षर
पाठ्य वर्ण मानकीकृत वर्ण सेटों में आते हैं जिनमें न्यूलाइन वर्ण जैसे नियंत्रण वर्ण भी होते हैं, जो टेक्स्ट को व्यवस्थित करते हैं। अन्य प्रकार के नियंत्रण वर्ण ट्रांसमिशन की व्यवस्था करते हैं, वर्ण सेट को परिभाषित करते हैं, और अन्य हाउसकीपिंग कार्य करते हैं।
यह भी देखें
- टेक्स्ट एडिटर
- यूनिक्स कमांड की सूची
बाहरी संबंध
- The subject matter of the book Automatic Text Processing by Gerard Salton
- Database with Text Processing Tools (2013-10-23)
- Content analysis software Software for Content Analysis.
- Text Tools Online Online Text processing tools.