नियमित भाषाओं के लिए पंपिंग लेम्मा: Difference between revisions
No edit summary |
m (added Category:Vigyan Ready using HotCat) |
||
Line 103: | Line 103: | ||
[[Category: Machine Translated Page]] | [[Category: Machine Translated Page]] | ||
[[Category:Created On 20/07/2023]] | [[Category:Created On 20/07/2023]] | ||
[[Category:Vigyan Ready]] |
Revision as of 15:47, 28 July 2023
औपचारिक भाषाओं के सिद्धांत में, नियमित भाषाओं के लिए पंपिंग लेम्मा (गणित) का उपयोग किया जाता है, जो सभी नियमित भाषाओं के आवश्यक गुणों का वर्णन करता है। इस प्रकार अनौपचारिक रूप से, यह कहा जाता है कि नियमित भाषा में सभी पर्याप्त लंबी स्ट्रिंग्स (कंप्यूटर विज्ञान) को पंप किया जा सकता है- अर्थात, स्ट्रिंग के मध्य भाग को स्वयं अपनी तरह से कई बार दोहराया जा सकता है- इस प्रकार की नई स्ट्रिंग्स का उत्पादन करने के लिए भी यह इस भाषा का विशेष भाग हैं।
विशेष रूप से, पंपिंग लेम्मा किसी भी नियमित भाषा के लिए यह उचित करती है, जिसमें को यहाँ पर स्थिरांक द्वारा स्थापित किया जाता है, जैसे कि कोई भी स्ट्रिंग में कम से कम लंबाई के साथ तीन सबस्ट्रिंग में विभाजित किया जा सकता है, जिसे , और के लिए , के साथ गैर-रिक्त होना आवश्यक होता हैं, जैसे कि स्ट्रिंग दोहराने के पश्चात बनाया गया हैं। इस कारण शून्य या अधिक बार का मान अभी भी उपस्थित हैं, इसके दोहराव होने के कारण इस प्रक्रिया को पंपिंग के रूप में जाना जाता है। इसके अतिरिक्त, पंपिंग लेम्मा इसकी लंबाई की गारंटी देता है, जिसके लिए का अधिकतम मान होगा, इन विधियों पर उपयुक्त सीमा के लिए द्वारा विभाजित किया जाता है, इस प्रकार किसी परिमित भाषाएँ शून्य सत्य होने से पंपिंग लेम्मा को संतुष्ट करती हैं, इसके आधार पर के अधिकतम मान के लिए स्ट्रिंग की लंबाई के बराबर होती हैं।
पंपिंग लेम्मा प्रश्न में किसी विशिष्ट भाषा की नियमितता को अस्वीकार करने के लिए उपयोगी है। इसे पहली बार 1959 में माइकल ओ. राबिन और डाना स्कॉट द्वारा सिद्ध किया गया था,[1] और कुछ समय बाद 1961 में येहोशुआ बार-हिलेल, मीका ए. पर्ल्स और शमीर को द्वारा संदर्भ-मुक्त भाषाओं के लिए उनके पंपिंग लेम्मा के सरलीकरण के रूप में फिर से खोजा गया था।[2][3]
औपचारिक कथन
इस प्रकार को नियमित भाषा बनाने के लिए पुनः वहाँ पूर्णांक को सम्मिलित किया जाता है, जिसके लिए यह केवल पर निर्भर करता है, इस प्रकार ऐसी हर स्ट्रिंग में कम से कम लंबाई का जहाँ पंपिंग लंबाई कहलाती है,[4] जिसे के रूप में लिखा जा सकता है, अर्थात यहाँ पर को निम्नलिखित शर्तों को पूरा करते हुए तीन सबस्ट्रिंग्स में विभाजित किया जा सकता है:
वह सबस्ट्रिंग है, जिसे कितनी भी बार पंप किया जा सकता है, इस प्रकार इसे यहाँ से हटाया या दोहराया जा सकता है, और परिणामी स्ट्रिंग सदैव के अंदर रहती है, इस प्रकार समीकरण (1) का अर्थ है कि लूप पंप किए जाने के लिए कम से कम लंबाई होनी चाहिए, इसी प्रकार समीकरण (2) का अर्थ है कि लूप पहले के भीतर होना चाहिए, यहाँ पर पात्र के लिए का मान कम होना चाहिए, तथा ((1) और (2) का निष्कर्ष के बाद इसे पुनः इसके अतिरिक्त और के लिए किसी भी प्रकार का प्रतिबंध नहीं रखते है।
सरल शब्दों में, किसी भी नियमित भाषा के लिए , कोई भी पर्याप्त लंबी स्ट्रिंग (में ) को 3 भागों में विभाजित किया जा सकता है। अर्थात , जैसे कि सभी स्ट्रिंग के लिए में भी हैं,
इस प्रकार नीचे पम्पिंग लेम्मा की औपचारिक अभिव्यक्ति है।
लेम्मा का उपयोग
पंपिंग लेम्मा का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि विशेष भाषा गैर-नियमित है: इसके विरोधाभास के प्रमाण में भाषा में स्ट्रिंग को आवश्यक के अनुसार विशेषतः इस लंबाई के अनुसार प्रदर्शित किया जा सकता हैं जिसमें यह सम्मिलित रहता है, जिसमें पंपिंग लेम्मा में उल्लिखित गुणोंका अभाव है।
उदाहरण के लिए, भाषा वर्णमाला के ऊपर निम्नानुसार गैर-नियमित दिखाया जा सकता है:
इसके आधार पर , और जैसा कि नियमित भाषाओं के लिए पंपिंग लेम्मा में उपयोग किया जाता है, यहाँ पर ऊपर औपचारिक विवरण दिया गया हैं। इस प्रकार मान लीजिए कि कोई स्थिरांक है, जिसके लिए लेम्मा की आवश्यकता के अनुसार इसे सम्मिलित किया जाता है। इसके अनुसार में को द्वारा दिया जाता हैं, जो कि इससे स्ट्रिंग तक लंबी है, इस प्रकार पंपिंग लेम्मा द्वारा अपघटन होने के अतिरिक्त इसका उपस्थित आवश्यक होना चाहिए, जिसके लिए के साथ और का मान प्राप्त होता हैं।
में को इसके प्रत्येक मान के लिए के लिए , समीकरण के आधार पर डोर तक केवल इस उदाहरण के लिए उपस्थित किया जाता हैं, इस प्रकार के अतिरिक्त, , के मान के लिए इसमें उचित पत्र के आधार पर इसका कम से कम उदाहरण उपस्थिति होता है, यहाँ पर का मान चूंकि के पत्र पर और भी उदाहरण हैं, इसके लिए पत्र की तुलना में के कुछ उदाहरणों के बाद इसे मान के लिए इसे के मान के लिए इसका कोई भी मान नहीं जोड़ा गया था। इसलिए, इसमें उपस्थिति नहीं है, इस कारण जो पम्पिंग लेम्मा का खंडन करता है। इसलिए को यहाँ पर नियमित रूप से उपयोग नहीं किया जा सकता हैं।
इस बात का प्रमाण हैं कि डाइक भाषा या संतुलित अर्थात, उचित रूप से नेस्टेड कोष्ठकों की भाषा नियमित नहीं है, यह इसी प्रकार उसी विचार का अनुसरण करती है। इस कारण यहाँ पर दिया गया का मान संतुलित कोष्ठकों की श्रृंखला को निरूपित करता है, जो इससे अधिक मान के लिए प्रारंभ होता है, यहाँ पर कोष्ठक को बाएँ ओर जिससे कि को पूर्ण रूप से बाएँ कोष्ठक से युक्त किया जाता हैं। इसे दोहराते हुए , स्ट्रिंग का उत्पादन किया जा सकता है, जिसमें बाएँ और दाएँ कोष्ठकों की समान संख्या नहीं है, और इसलिए उन्हें संतुलित नहीं किया जा सकता है।
पंपिंग लेम्मा का प्रमाण
प्रत्येक नियमित भाषा के लिए परिमित स्थिति के लिए ऑटोमेटन के लिए एफएसए होता है जो भाषा को स्वीकार करता है। ऐसे एफएसए में स्थितिों की संख्या की गणना की जाती है और उस गणना का उपयोग पंपिंग लंबाई के रूप में किया जाता है, इसमें कम से कम लंबाई की स्ट्रिंग के लिए , के आधार पर के आरंभिक अवस्था के रूप में निरूपित किया जाता हैं। इस प्रकार के लिए इसके अगले मान के क्रम को स्ट्रिंग द्वारा उत्सर्जित होने पर इस स्थिति को प्राप्त करता है। क्योंकि एफएसए के पास स्थितियाँ ही है, इस प्रकार इसके इस क्रम के भीतर के लिए इन स्थितियों का मान प्राप्त किया गया हैं, इस प्रकार यहां पर कम से कम इस स्थिति के लिए इसे अवश्य ही दोहराया जाना चाहिए। इसे द्वारा लिखा जाता हैं, ऐसी स्थिति के लिए परिवर्तन जो मशीन को इस स्थिति की पहली मुठभेड़ से लेते हैं, जिसके लिए स्थिति का दूसरी स्थिति के लिए को इस प्रकार की स्ट्रिंग से संयोजित करते हैं, इस स्ट्रिंग को लेम्मा कहा जाता है, और चूंकि मशीन बिना किसी स्ट्रिंग से मेल खाएगी, इसलिए भाग या इस स्ट्रिंग के साथ को कितनी भी बार दोहराए जाने पर, लेम्मा की शर्तें संतुष्ट हो जाती हैं।
उदाहरण के लिए, निम्न प्रतिबिंब एफएसए दिखाती है।
एफएसए स्ट्रिंग एबीसीडी को अधिकृत करता है। चूंकि इस स्ट्रिंग की लंबाई कम से कम इन स्थितियों की संख्या के आधार पर जितनी ज्यादा होती है, जिसका मान सामान्यतः चार रहता है, पिजनहोल सिद्धांत इंगित करता है कि प्रारंभ स्थिति और अगले चार विज़िट किए गए स्थितिों के बीच कम से कम दोहराया स्थिति होना चाहिए। इस उदाहरण में, केवल बार-बार दोहराई जाने वाली स्थिति है, चूंकि सबस्ट्रिंग बीसी मशीन को उन बदलावों के माध्यम से ले जाती है, जो स्थिति में प्रारंभ होते हैं, और स्थिति पर समाप्त होता है, इस कारण उस भाग को दोहराया जा सकता है और एफएसए स्ट्रिंग देते हुए अभी भी स्वीकार करेगा, जैसे abcbcd को वैकल्पिक रूप से बीसी के उचित भाग के लिए हटाया जा सकता है, और इस प्रकार एफएसए अभी भी स्ट्रिंग विज्ञापन देना स्वीकार करेगा। इसके आधार पर पंपिंग लेम्मा के संदर्भ में, स्ट्रिंग एबीसीडी को में तोड़ दिया गया है, जिसके लिए भाग a, a भाग bc और a भाग d द्वारा निरूपित करते हैं।
इसके अतिरिक्त टिप्पणी के रूप में यह जाँचने की समस्या कि क्या किसी दिए गए स्ट्रिंग को किसी दिए गए गैर-नियतात्मक परिमित ऑटोमेटन द्वारा किसी भी स्थिति में बार-बार आए बिना स्वीकार किया जा सकता है, यहाँ पर एनपी कठिन है।
नियमित भाषाओं के लिए पंपिंग लेम्मा का सामान्य संस्करण
यदि कोई भाषा पूर्ण रूप से नियमित है, तो संख्या यहाँ पर सम्मिलित रहती है, यहाँ पर पंपिंग लंबाई इस प्रकार हैं कि हर स्ट्रिंग का मान में साथ फॉर्म में लिखा जा सकता है। इस प्रकार उक्त समीकरण प्राप्त होता हैं-
स्ट्रिंग के साथ , और का मान इस प्रकार हैं कि , और
- में है प्रत्येक पूर्णांक के लिए मान प्राप्त होता हैं।[5]
इसके लिए औपचारिक कथन मानक संस्करण दोनों के साथ विशेष स्थिति का अनुसरण करता है, जिसके लिए और रिक्त स्ट्रिंग को प्रकट करते हैं।
चूँकि सामान्य संस्करण भाषा पर इसकी अधिक आवश्यकताएँ होती है, इसका उपयोग कई और भाषाओं की गैर-नियमितता को प्रमाणित करने के लिए किया जा सकता है।
लेम्मा का व्युत्क्रम असत्य मान
जबकि पंपिंग लेम्मा में कहा गया है कि सभी नियमित भाषाएँ ऊपर वर्णित शर्तों को पूरा करती हैं, इस कथन का विपरीत मान असत्य होता है, जिसके कारण इस भाषा के अनुसार जो इन शर्तों को पूरा करती है वह अभी भी गैर-नियमित हो सकती है। दूसरे शब्दों में, पंपिंग लेम्मा का मूल और सामान्य संस्करण दोनों ही किसी भाषा के नियमित होने के लिए आवश्यक और पर्याप्त स्थिति देते हैं।
उदाहरण के लिए, निम्नलिखित भाषा पर विचार करें:
- .
दूसरे शब्दों में, इसमें वर्णमाला के सभी स्ट्रिंग उपस्थित हैं, जिसके लिए डुप्लिकेट वर्ण सहित लंबाई 3 की सबस्ट्रिंग के साथ ही इस वर्णमाला की सभी स्ट्रिंग्स जहां स्ट्रिंग के वर्णों का 1/7 भाग 3 है। यह भाषा नियमित नहीं है लेकिन फिर भी के लिए इसका उपयोग किया जा सकता है, इस प्रकार यहाँ पर मान लीजिए कि कुछ स्ट्रिंग एस की लंबाई कम से कम 5 है। चूंकि इस उचित वर्णमाला में केवल चार अक्षर हैं, स्ट्रिंग में पहले पांच अक्षरों में से कम से कम दो डुप्लिकेट होने चाहिए। वे अधिकतम तीन वर्णों द्वारा अलग किए गए हैं।
- यदि डुप्लिकेट वर्णों को 0 वर्णों या 1 से अलग किया गया है, तो स्ट्रिंग में अन्य दो वर्णों में से को पंप करें, जो डुप्लिकेट वाले सबस्ट्रिंग को प्रभावित नहीं करेगा।
- यदि डुप्लिकेट वर्णों को 2 या 3 वर्णों से अलग किया गया है, तो उन्हें अलग करने वाले 2 वर्णों को पंप करते हैं। इस प्रकार नीचे या ऊपर पंप करने के कारण इसके आकार 3 की सबस्ट्रिंग का निर्माण होता है, जिसमें 2 डुप्लिकेट वर्ण होते हैं।
- जिसकी दूसरी शर्त निश्चित करता है कि नियमित नहीं है: इस प्रकार स्ट्रिंग पर विचार करें, यहाँ पर यह स्ट्रिंग के अंदर है, जो बिल्कुल होने पर और इसी प्रकार माईहिल-नेरोड प्रमेय द्वारा नियमित नहीं है।
माईहिल-नेरोड प्रमेय परीक्षण प्रदान करता है जो नियमित भाषाओं की सटीक विशेषता को बताता है। यह प्रमाणित करने की सामान्य विधि कि कोई भाषा नियमित है, या तो परिमित स्थिति मशीन या भाषा के लिए नियमित अभिव्यक्ति का निर्माण करना है।
यह भी देखें
- ओग्डेन की लेम्मा
- संदर्भ-मुक्त भाषाओं के लिए लेम्मा में अधिकता करना
- नियमित ट्री भाषाओं के लिए पंपिंग लेम्मा
टिप्पणियाँ
- ↑ Rabin, Michael; Scott, Dana (Apr 1959). "परिमित ऑटोमेटा और उनकी निर्णय समस्याएं" (PDF). IBM Journal of Research and Development. 3 (2): 114–125. doi:10.1147/rd.32.0114. Archived from the original on December 14, 2010.
{{cite journal}}
: CS1 maint: unfit URL (link) Here: Lemma 8, p.119 - ↑ Bar-Hillel, Y.; Perles, M.; Shamir, E. (1961), "On formal properties of simple phrase structure grammars", Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung, 14 (2): 143–172
- ↑ John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman (2003). Introduction to Automata Theory, Languages, and Computation. Addison Wesley. Here: Sect.4.6, p.166
- ↑ Berstel, Jean; Lauve, Aaron; Reutenauer, Christophe; Saliola, Franco V. (2009). शब्दों पर संयोजकता. क्रिस्टोफ़ेल शब्द और शब्दों में दोहराव. CRM Monograph Series. Vol. 27. Providence, RI: American Mathematical Society. p. 86. ISBN 978-0-8218-4480-9. Zbl 1161.68043.
- ↑ Savitch, Walter (1982). सार मशीनें और व्याकरण. p. 49. ISBN 978-0-316-77161-0.
संदर्भ
- Lawson, Mark V. (2004). Finite automata. Chapman and Hall/CRC. ISBN 978-1-58488-255-8. Zbl 1086.68074.
- Sipser, Michael (1997). "1.4: Nonregular Languages". Introduction to the Theory of Computation. PWS Publishing. pp. 77–83. ISBN 978-0-534-94728-6. Zbl 1169.68300.
- Hopcroft, John E.; Ullman, Jeffrey D. (1979). Introduction to Automata Theory, Languages, and Computation. Reading, Massachusetts: Addison-Wesley Publishing. ISBN 978-0-201-02988-8. Zbl 0426.68001. (See chapter 3.)
- Bakhadyr Khoussainov; Anil Nerode (6 December 2012). Automata Theory and its Applications. Springer Science & Business Media. ISBN 978-1-4612-0171-7.