टेक्स्ट प्रोसेसिंग: Difference between revisions
m (added Category:Vigyan Ready using HotCat) |
m (8 revisions imported from alpha:टेक्स्ट_प्रोसेसिंग) |
(No difference)
|
Latest revision as of 22:29, 10 October 2023
कंप्यूटिंग में, टेक्स्ट प्रोसेसिंग शब्द इलेक्ट्रॉनिक टेक्स्ट के निर्माण या परिवर्तन को स्वचालित करने के सिद्धांत और अभ्यास को संदर्भित करता है।
टेक्स्ट समान्य रूप से अभ्यास में संलग्न व्यक्ति के कीबोर्ड पर निर्दिष्ट सभी अल्फ़ान्यूमेरिक वर्णों को संदर्भित करता है, किन्तु सामान्य रूप से टेक्स्ट का अर्थ लक्ष्य टेक्स्ट के मानक अक्षरों को सांकेतिक अक्षरों में परिवर्तन के ठीक ऊपर अमूर्त परत है।
प्रोसेसिंग शब्द स्वचालित (या यंत्रीकृत) प्रोसेसिंग को संदर्भित करता है, जो मैन्युअल रूप से किए गए समान परिवर्तन के विपरीत है।
टेक्स्ट प्रोसेसिंग में कंप्यूटर कमांड सम्मिलित होते हैं जो उदाहरण के लिए विषय, विषय परिवर्तन और कर्सर आंदोलन को प्रयुक्त करते हैं
- खोजें और रिप्लेस
- प्रारूप
- या की विषय की संसाधित रिपोर्ट तैयार करें
- किसी फ़ाइल या टेक्स्ट फ़ाइल की रिपोर्ट को फ़िल्टर करें।
नियमित अभिव्यक्ति की टेक्स्ट प्रोसेसिंग वर्चुअल एडिटिंग मशीन है, जिसमें प्रिमिटिव प्रोग्रामिंग लैंग्वेज होती है जिसमें रजिस्टरों (पहचानकर्ता) का नाम होता है, और टेक्स्ट में वर्णों के अनुक्रम में पदों का नाम दिया जाता है। इनका उपयोग करके, टेक्स्ट प्रोसेसर, उदाहरण के लिए, टेक्स्ट के क्षेत्र को चिह्नित कर सकता है और फिर उसे स्थानांतरित कर सकता है। यूनिक्स उपयोगिता का टेक्स्ट प्रोसेसिंग फ़िल्टर प्रोग्राम, या फ़िल्टर है। इन दो तंत्रों में टेक्स्ट प्रोसेसिंग सम्मिलित है।
परिभाषा
चूंकि एएनएसआई एस्केप कोड जैसे मानकीकृत मार्कअप समान्य रूप से एडिटर के लिए अदृश्य होते हैं, उनमें क्षणिक गुणों का सेट सम्मिलित होता है जो कभी-कभी वर्ड प्रोसेसिंग से अप्रभेद्य हो जाते हैं। किन्तु वर्ड प्रोसेसिंग से निश्चित अंतर यह है कि टेक्स्ट प्रोसेसिंग उचित है:
- केवळ "टेक्स्ट एडिटिंग" ऍप्लिकेशन्स नव्हे तर "टेक्स्ट प्रोसेसिंग युटिलिटीज" चे प्रतिनिधित्व करते.
- संपादन प्रारंभ करने के "माउस विधि " (उदाहरण के लिए ड्रैग और ड्राप, कट और पेस्ट करें) के विपरीत, यह "कीबोर्ड विधि " से कहीं अधिक है।
- दृष्टिकोण में यादृच्छिक पहुंच के अतिरिक्त अनुक्रमिक पहुंच है।
- अप्रत्यक्ष रूप से एप्लीकेशन लेयर के अतिरिक्त प्रेजेंटेशन लेयर पर सीधे कार्य करता है।
- रॉ डेटा पर कार्य करता है जो मानकीकृत होता है और किसी मालिकाना विधियों की ओर रुझान करने के अतिरिक्त अधिक विवर्त रूप से कार्य करता है।
इस प्रकार फ़ॉन्ट और रंग जैसे मार्कअप वास्तव में विशिष्ट कारक नहीं हैं, क्योंकि फ़ॉन्ट और रंग को प्रभावित करने वाले वर्ण अनुक्रम केवल पृष्ठभूमि टेक्स्ट प्रोसेसिंग मोड द्वारा स्वचालित रूप से डाले गए मानक वर्ण हैं, जो अनुरूप टेक्स्ट एडिटर द्वारा पारदर्शी रूप से कार्य करने के लिए बनाए जाते हैं। , फिर भी वह मोड प्रभावी नहीं होने पर टेक्स्ट प्रोसेसिंग कमांड के रूप में दृश्यमान हो जाता है। इसलिए टेक्स्ट प्रोसेसिंग को मानक, फिर भी अदृश्य वर्णों के अतिरिक्त दृश्य वर्णों (या ग्रैफेम्स) के आसपास मूल रूप से (किन्तु पूर्ण रूप से नहीं) परिभाषित किया गया है।
इतिहास
कंप्यूटर टेक्स्ट प्रोसेसिंग का विकास क्लेन द्वारा नियमित लैंग्वेज को औपचारिक रूप देने के साथ ही प्रारंभ हुआ था। इस तरह की नियमित अभिव्यक्तियाँ तब मिनी-प्रोग्राम बन सकती हैं, जो की संकलन प्रक्रिया के साथ पूर्ण होती है, किसी भी संपादन को करने के लिए उपलब्ध होती है, एक बार उस लैंग्वेज का विस्तार हो जाता है। इसी तरह, फिल्टर को विशेष कमांड (कंप्यूटिंग) विकसित करके बढ़ाया जाता है।
मूलभूत अवधारणाएँ
एक एडिटर अनिवार्य रूप से इनपुट स्ट्रीम को आमंत्रित करता है और इसे टेक्स्ट प्रोसेसिंग वातावरण में निर्देशित करता है, जो या तो कमांड शेल या टेक्स्ट एडिटर होता है। जिसमे परिणामी आउटपुट आगे की टेक्स्ट प्रोसेसिंग पर प्रयुक्त होता है, जिसका अंतिम परिणाम अधिक परिष्कृत और संरचित कंप्यूटर प्रोग्राम द्वारा एक बार प्रयुक्त एल्गोरिदम के एकल एप्लीकेशन के समान होता है।
टेक्स्ट प्रोसेसिंग, एल्गोरिदम के विपरीत, सरल मैक्रोज़ का मैन्युअल रूप से प्रशासित अनुक्रम है जो पैटर्न-एक्शन अभिव्यक्ति और फ़िल्टरिंग तंत्र हैं। किसी भी स्थिति में प्रोग्रामर का संकेत टेक्स्ट प्रोसेसिंग के कार्य में पाठ्य वर्णों के दिए गए सेट पर अप्रत्यक्ष रूप से प्रभावित होता है। टेक्स्ट प्रोसेसिंग चरण के परिणाम कभी-कभी केवल आशाजनक होते हैं, और प्रयास किया गया तंत्र अक्सर दृश्य प्रतिक्रिया के माध्यम से विभिन्न ड्राफ्ट के अधीन होता है, जब तक कि नियमित अभिव्यक्ति या मार्कअप लैंग्वेज विवरण, या उपयोगिता विकल्पों में पूर्ण रूप से प्रभुत्व प्राप्त नहीं हो जाती है।
इस प्रकार से टेक्स्ट प्रोसेसिंग का संबंध अधिकत्तर कंप्यूटिंग के उच्चतम स्तर पर टेक्स्ट कैरेक्टर तैयार करने से है, जहां इसकी गतिविधियां कंप्यूटिंग के व्यावहारिक उपयोग-सूचना के मैन्युअल ट्रांसमिशन से ठीक नीचे हैं।
अंततः सभी कंप्यूटिंग टेक्स्ट प्रोसेसिंग है, असेंबलर के स्व-संकलित पाठ्य वर्णों से, ग्राफिकल डेटा के ब्लॉब को संभालने के लिए उत्पन्न स्वचालित प्रोग्रामिंग लैंग्वेज के माध्यम से, और अंत में नियमित अभिव्यक्तियों के मेटाकैरेक्टर्स तक जो उपस्थित टेक्स्ट डॉक्यूमेंट को तैयार करते हैं।
टेक्स्ट प्रोसेसिंग का अपना स्वचालन है।
अक्षर
पाठ्य वर्ण मानकीकृत वर्ण सेटों में आते हैं जिनमें न्यूलाइन वर्ण जैसे नियंत्रण वर्ण भी होते हैं, जो टेक्स्ट को व्यवस्थित करते हैं। अन्य प्रकार के नियंत्रण वर्ण ट्रांसमिशन की व्यवस्था करते हैं, वर्ण सेट को परिभाषित करते हैं, और अन्य हाउसकीपिंग कार्य करते हैं।
यह भी देखें
- टेक्स्ट एडिटर
- यूनिक्स कमांड की सूची
बाहरी संबंध
- The subject matter of the book Automatic Text Processing by Gerard Salton
- Database with Text Processing Tools (2013-10-23)
- Content analysis software Software for Content Analysis.
- Text Tools Online Online Text processing tools.