नियमित भाषाओं के लिए पंपिंग लेम्मा

From Vigyanwiki

औपचारिक भाषाओं के सिद्धांत में, नियमित भाषाओं के लिए पंपिंग लेम्मा लेम्मा (गणित) है जो सभी नियमित भाषाओं की आवश्यक संपत्ति का वर्णन करता है। अनौपचारिक रूप से, यह कहता है कि नियमित भाषा में सभी पर्याप्त लंबी स्ट्रिंग (कंप्यूटर विज्ञान) को पंप किया जा सकता है - अर्थात, स्ट्रिंग के मध्य भाग को मनमाने ढंग से कई बार दोहराया जा सकता है - नई स्ट्रिंग का उत्पादन करने के लिए भी। भाषा का हिस्सा.

विशेष रूप से, पंपिंग लेम्मा किसी भी नियमित भाषा के लिए ऐसा कहती है वहाँ स्थिरांक मौजूद है जैसे कि कोई भी स्ट्रिंग में कम से कम लंबाई के साथ तीन सबस्ट्रिंग में विभाजित किया जा सकता है , और (, साथ गैर-रिक्त होना), जैसे कि तार दोहराकर बनाया गया शून्य या अधिक बार अभी भी हैं . दोहराव की इस प्रक्रिया को पंपिंग के रूप में जाना जाता है। इसके अलावा, पंपिंग लेम्मा इसकी लंबाई की गारंटी देता है अधिकतम होगा , तरीकों पर सीमा लगाना विभाजित हो सकता है. परिमित भाषाएँ शून्य सत्य होने से पंपिंग लेम्मा को संतुष्ट करती हैं अधिकतम स्ट्रिंग लंबाई के बराबर मैं भी सहमत हूं।

पंपिंग लेम्मा प्रश्न में किसी विशिष्ट भाषा की नियमितता को अस्वीकार करने के लिए उपयोगी है। इसे पहली बार 1959 में माइकल ओ. राबिन और दाना स्कॉट द्वारा सिद्ध किया गया था,[1] और कुछ ही समय बाद 1961 में येहोशुआ बार-हिलेल, मीका ए. पर्ल्स और शमीर को द्वारा संदर्भ-मुक्त भाषाओं के लिए उनके पंपिंग लेम्मा के सरलीकरण के रूप में फिर से खोजा गया।[2][3]

औपचारिक कथन

होने देना नियमित भाषा बनें. फिर वहाँ पूर्णांक मौजूद है केवल पर निर्भर करता है ऐसे कि हर तार में कम से कम लंबाई का ( पंपिंग लंबाई कहलाती है)[4] के रूप में लिखा जा सकता है (अर्थात।, निम्नलिखित शर्तों को पूरा करते हुए तीन उपस्ट्रिंग्स में विभाजित किया जा सकता है:

वह सबस्ट्रिंग है जिसे कितनी भी बार पंप किया जा सकता है (हटाया या दोहराया जा सकता है, और परिणामी स्ट्रिंग हमेशा अंदर रहती है) ). (1) का अर्थ है लूप पंप किए जाने के लिए कम से कम लंबाई होनी चाहिए; (2) का अर्थ है कि लूप पहले के भीतर होना चाहिए पात्र। से छोटा होना चाहिए ((1) और (2) का निष्कर्ष), लेकिन इसके अलावा, कोई प्रतिबंध नहीं है और .

सरल शब्दों में, किसी भी नियमित भाषा के लिए , कोई भी पर्याप्त लंबी स्ट्रिंग (में ) को 3 भागों में विभाजित किया जा सकता है। अर्थात। , जैसे कि सभी तार के लिए में भी हैं .

नीचे पम्पिंग लेम्मा की औपचारिक अभिव्यक्ति है।

लेम्मा का उपयोग

पंपिंग लेम्मा का उपयोग अक्सर यह साबित करने के लिए किया जाता है कि विशेष भाषा गैर-नियमित है: विरोधाभास के प्रमाण में भाषा में स्ट्रिंग (आवश्यक लंबाई की) प्रदर्शित करना शामिल हो सकता है जिसमें पंपिंग लेम्मा में उल्लिखित संपत्ति का अभाव है।

उदाहरण के लिए, भाषा वर्णमाला के ऊपर निम्नानुसार गैर-नियमित दिखाया जा सकता है:

होने देना , और जैसा कि नियमित भाषाओं के लिए पंपिंग लेम्मा में उपयोग किया जाता है#ऊपर औपचारिक विवरण। मान लीजिए कि कोई स्थिरांक है लेम्मा की आवश्यकता के अनुसार मौजूद है। होने देना में द्वारा दिया जाए , जो कि इससे स्ट्रिंग लंबी है . पंपिंग लेम्मा द्वारा, अपघटन मौजूद होना चाहिए साथ और ऐसा है कि

 में  हरएक के लिए . तब से , डोर  केवल के उदाहरण शामिल हैं . इसके अलावा, क्योंकि , इसमें पत्र का कम से कम उदाहरण शामिल है . हालाँकि,  पत्र के और भी उदाहरण हैं  पत्र की तुलना में , के कुछ उदाहरणों के बाद से  लेकिन कोई नहीं  जोड़ा गया था। इसलिए,  इसमें नहीं है  जो पम्पिंग लेम्मा का खंडन करता है। इसलिए,  नियमित नहीं हो सकता.

इस बात का प्रमाण कि डाइक भाषा|संतुलित (अर्थात, उचित रूप से नेस्टेड) ​​कोष्ठकों की भाषा नियमित नहीं है, उसी विचार का अनुसरण करती है। दिया गया , संतुलित कोष्ठकों की श्रृंखला है जो से अधिक से शुरू होती है कोष्ठक बाएँ, ताकि पूरी तरह से बाएँ कोष्ठक से युक्त होगा। दोहराते हुए , स्ट्रिंग का उत्पादन किया जा सकता है जिसमें बाएँ और दाएँ कोष्ठकों की समान संख्या नहीं है, और इसलिए उन्हें संतुलित नहीं किया जा सकता है।

पंपिंग लेम्मा का प्रमाण

प्रमाण विचार: जब भी पर्याप्त लंबी स्ट्रिंग (औपचारिक भाषाएं) xyz को परिमित ऑटोमेटन#गणितीय मॉडल द्वारा पहचाना जाता है, तो यह किसी स्थिति तक पहुंच गया होगा () दो बार। इसलिए, मध्य भाग को दोहराने (पम्पिंग) के बाद मनमाने ढंग से अक्सर (xyyz, xyyyz, ...) स्ट्रिंग अभी भी पहचानी जाएगी।

प्रत्येक नियमित भाषा के लिए परिमित राज्य ऑटोमेटन (एफएसए) होता है जो भाषा को स्वीकार करता है। ऐसे एफएसए में राज्यों की संख्या की गणना की जाती है और उस गणना का उपयोग पंपिंग लंबाई के रूप में किया जाता है . कम से कम लंबाई की स्ट्रिंग के लिए , होने देना आरंभ अवस्था बनें और जाने दें अगले का क्रम हो स्ट्रिंग उत्सर्जित होने पर राज्यों का दौरा किया जाता है। क्योंकि एफएसए के पास ही है राज्यों, के इस क्रम के भीतर जिन राज्यों का दौरा किया गया वहां कम से कम राज्य अवश्य दोहराया जाना चाहिए। लिखना ऐसे राज्य के लिए. परिवर्तन जो मशीन को राज्य की पहली मुठभेड़ से लेते हैं राज्य की दूसरी मुठभेड़ के लिए कुछ स्ट्रिंग का मिलान करें. इस स्ट्रिंग को कहा जाता है लेम्मा में, और चूंकि मशीन बिना किसी स्ट्रिंग से मेल खाएगी भाग, या स्ट्रिंग के साथ कितनी भी बार दोहराए जाने पर, लेम्मा की शर्तें संतुष्ट हो जाती हैं।

उदाहरण के लिए, निम्न छवि एफएसए दिखाती है।

An automat accepting the language a(bc)*d.svgएफएसए स्ट्रिंग स्वीकार करता है: एबीसीडी। चूंकि इस स्ट्रिंग की लंबाई कम से कम राज्यों की संख्या जितनी बड़ी है, जो कि चार है, पिजनहोल सिद्धांत इंगित करता है कि प्रारंभ राज्य और अगले चार विज़िट किए गए राज्यों के बीच कम से कम दोहराया राज्य होना चाहिए। इस उदाहरण में, केवल बार-बार दोहराई जाने वाली स्थिति है. चूंकि सबस्ट्रिंग बीसी मशीन को उन बदलावों के माध्यम से ले जाती है जो राज्य में शुरू होते हैं और राज्य पर समाप्त होता है , उस हिस्से को दोहराया जा सकता है और एफएसए स्ट्रिंग देते हुए अभी भी स्वीकार करेगा abcbcd. वैकल्पिक रूप से, बीसी भाग को हटाया जा सकता है और एफएसए अभी भी स्ट्रिंग विज्ञापन देना स्वीकार करेगा। पंपिंग लेम्मा के संदर्भ में, स्ट्रिंग एबीसीडी को में तोड़ दिया गया है भाग ए, ए भाग बीसी और ए भाग डी.

एक अतिरिक्त टिप्पणी के रूप में, यह जाँचने की समस्या कि क्या किसी दिए गए स्ट्रिंग को किसी दिए गए गैर-नियतात्मक परिमित ऑटोमेटन द्वारा किसी भी राज्य में बार-बार आए बिना स्वीकार किया जा सकता है, एनपी कठिन है।

नियमित भाषाओं के लिए पंपिंग लेम्मा का सामान्य संस्करण

यदि कोई भाषा नियमित है, तो संख्या मौजूद है (पंपिंग लंबाई) ऐसी कि हर तार में साथ फॉर्म में लिखा जा सकता है

तार के साथ , और ऐसा है कि , और

में है प्रत्येक पूर्णांक के लिए .[5]

इससे, #औपचारिक कथन मानक संस्करण दोनों के साथ विशेष मामले का अनुसरण करता है और खाली स्ट्रिंग होना.

चूँकि सामान्य संस्करण भाषा पर कड़ी आवश्यकताएँ लगाता है, इसका उपयोग कई और भाषाओं की गैर-नियमितता को साबित करने के लिए किया जा सकता है।

लेम्मा का व्युत्क्रम सत्य नहीं

जबकि पंपिंग लेम्मा में कहा गया है कि सभी नियमित भाषाएँ ऊपर वर्णित शर्तों को पूरा करती हैं, इस कथन का विपरीत सत्य नहीं है: भाषा जो इन शर्तों को पूरा करती है वह अभी भी गैर-नियमित हो सकती है। दूसरे शब्दों में, पंपिंग लेम्मा का मूल और सामान्य संस्करण दोनों ही किसी भाषा के नियमित होने के लिए आवश्यक और पर्याप्त स्थिति देते हैं।

उदाहरण के लिए, निम्नलिखित भाषा पर विचार करें:

.

दूसरे शब्दों में, इसमें वर्णमाला के सभी तार शामिल हैं डुप्लिकेट वर्ण सहित लंबाई 3 की सबस्ट्रिंग के साथ, साथ ही इस वर्णमाला की सभी स्ट्रिंग्स जहां स्ट्रिंग के वर्णों का 1/7 भाग 3 है। यह भाषा नियमित नहीं है लेकिन फिर भी इसका उपयोग किया जा सकता है . मान लीजिए कि कुछ स्ट्रिंग एस की लंबाई कम से कम 5 है। फिर, चूंकि वर्णमाला में केवल चार अक्षर हैं, स्ट्रिंग में पहले पांच अक्षरों में से कम से कम दो डुप्लिकेट होने चाहिए। वे अधिकतम तीन वर्णों द्वारा अलग किए गए हैं।

  • यदि डुप्लिकेट वर्णों को 0 वर्णों या 1 से अलग किया गया है, तो स्ट्रिंग में अन्य दो वर्णों में से को पंप करें, जो डुप्लिकेट वाले सबस्ट्रिंग को प्रभावित नहीं करेगा।
  • यदि डुप्लिकेट वर्णों को 2 या 3 वर्णों से अलग किया गया है, तो उन्हें अलग करने वाले 2 वर्णों को पंप करें। नीचे या ऊपर पंप करने से आकार 3 की सबस्ट्रिंग का निर्माण होता है जिसमें 2 डुप्लिकेट वर्ण होते हैं।
  • की दूसरी शर्त निश्चित करता है की नियमित नहीं है: स्ट्रिंग पर विचार करें . यह स्ट्रिंग अंदर है बिल्कुल कब और इस तरह माईहिल-नेरोड प्रमेय द्वारा नियमित नहीं है।

माईहिल-नेरोड प्रमेय परीक्षण प्रदान करता है जो नियमित भाषाओं की सटीक विशेषता बताता है। यह साबित करने की सामान्य विधि कि कोई भाषा नियमित है, या तो परिमित राज्य मशीन या भाषा के लिए नियमित अभिव्यक्ति का निर्माण करना है।

यह भी देखें

  • ओग्डेन की लेम्मा
  • संदर्भ-मुक्त भाषाओं के लिए लेम्मा को बढ़ावा देना
  • नियमित वृक्ष भाषाओं के लिए पंपिंग लेम्मा

टिप्पणियाँ

  1. Rabin, Michael; Scott, Dana (Apr 1959). "परिमित ऑटोमेटा और उनकी निर्णय समस्याएं" (PDF). IBM Journal of Research and Development. 3 (2): 114–125. doi:10.1147/rd.32.0114. Archived from the original on December 14, 2010.{{cite journal}}: CS1 maint: unfit URL (link) Here: Lemma 8, p.119
  2. Bar-Hillel, Y.; Perles, M.; Shamir, E. (1961), "On formal properties of simple phrase structure grammars", Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung, 14 (2): 143–172
  3. John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman (2003). Introduction to Automata Theory, Languages, and Computation. Addison Wesley. Here: Sect.4.6, p.166
  4. Berstel, Jean; Lauve, Aaron; Reutenauer, Christophe; Saliola, Franco V. (2009). शब्दों पर संयोजकता. क्रिस्टोफ़ेल शब्द और शब्दों में दोहराव. CRM Monograph Series. Vol. 27. Providence, RI: American Mathematical Society. p. 86. ISBN 978-0-8218-4480-9. Zbl 1161.68043.
  5. Savitch, Walter (1982). सार मशीनें और व्याकरण. p. 49. ISBN 978-0-316-77161-0.

संदर्भ