नियमित भाषाओं के लिए पंपिंग लेम्मा

From Vigyanwiki

औपचारिक भाषाओं के सिद्धांत में, नियमित भाषाओं के लिए पंपिंग लेम्मा (गणित) का उपयोग किया जाता है, जो सभी नियमित भाषाओं के आवश्यक गुणों का वर्णन करता है। इस प्रकार अनौपचारिक रूप से, यह कहा जाता है कि नियमित भाषा में सभी पर्याप्त लंबी स्ट्रिंग्स (कंप्यूटर विज्ञान) को पंप किया जा सकता है- अर्थात, स्ट्रिंग के मध्य भाग को स्वयं अपनी तरह से कई बार दोहराया जा सकता है- इस प्रकार की नई स्ट्रिंग्स का उत्पादन करने के लिए भी यह इस भाषा का विशेष भाग हैं।

विशेष रूप से, पंपिंग लेम्मा किसी भी नियमित भाषा के लिए यह उचित करती है, जिसमें को यहाँ पर स्थिरांक द्वारा स्थापित किया जाता है, जैसे कि कोई भी स्ट्रिंग में कम से कम लंबाई के साथ तीन सबस्ट्रिंग में विभाजित किया जा सकता है, जिसे , और के लिए , के साथ गैर-रिक्त होना आवश्यक होता हैं, जैसे कि स्ट्रिंग दोहराने के पश्चात बनाया गया हैं। इस कारण शून्य या अधिक बार का मान अभी भी उपस्थित हैं, इसके दोहराव होने के कारण इस प्रक्रिया को पंपिंग के रूप में जाना जाता है। इसके अतिरिक्त, पंपिंग लेम्मा इसकी लंबाई की गारंटी देता है, जिसके लिए का अधिकतम मान होगा, इन विधियों पर उपयुक्त सीमा के लिए द्वारा विभाजित किया जाता है, इस प्रकार किसी परिमित भाषाएँ शून्य सत्य होने से पंपिंग लेम्मा को संतुष्ट करती हैं, इसके आधार पर के अधिकतम मान के लिए स्ट्रिंग की लंबाई के बराबर होती हैं।

पंपिंग लेम्मा प्रश्न में किसी विशिष्ट भाषा की नियमितता को अस्वीकार करने के लिए उपयोगी है। इसे पहली बार 1959 में माइकल ओ. राबिन और डाना स्कॉट द्वारा सिद्ध किया गया था,[1] और कुछ समय बाद 1961 में येहोशुआ बार-हिलेल, मीका ए. पर्ल्स और शमीर को द्वारा संदर्भ-मुक्त भाषाओं के लिए उनके पंपिंग लेम्मा के सरलीकरण के रूप में फिर से खोजा गया था।[2][3]

औपचारिक कथन

इस प्रकार को नियमित भाषा बनाने के लिए पुनः वहाँ पूर्णांक को सम्मिलित किया जाता है, जिसके लिए यह केवल पर निर्भर करता है, इस प्रकार ऐसी हर स्ट्रिंग में कम से कम लंबाई का जहाँ पंपिंग लंबाई कहलाती है,[4] जिसे के रूप में लिखा जा सकता है, अर्थात यहाँ पर को निम्नलिखित शर्तों को पूरा करते हुए तीन सबस्ट्रिंग्स में विभाजित किया जा सकता है:

वह सबस्ट्रिंग है, जिसे कितनी भी बार पंप किया जा सकता है, इस प्रकार इसे यहाँ से हटाया या दोहराया जा सकता है, और परिणामी स्ट्रिंग सदैव के अंदर रहती है, इस प्रकार समीकरण (1) का अर्थ है कि लूप पंप किए जाने के लिए कम से कम लंबाई होनी चाहिए, इसी प्रकार समीकरण (2) का अर्थ है कि लूप पहले के भीतर होना चाहिए, यहाँ पर पात्र के लिए का मान कम होना चाहिए, तथा ((1) और (2) का निष्कर्ष के बाद इसे पुनः इसके अतिरिक्त और के लिए किसी भी प्रकार का प्रतिबंध नहीं रखते है।

सरल शब्दों में, किसी भी नियमित भाषा के लिए , कोई भी पर्याप्त लंबी स्ट्रिंग (में ) को 3 भागों में विभाजित किया जा सकता है। अर्थात , जैसे कि सभी स्ट्रिंग के लिए में भी हैं,

इस प्रकार नीचे पम्पिंग लेम्मा की औपचारिक अभिव्यक्ति है।

लेम्मा का उपयोग

पंपिंग लेम्मा का उपयोग अधिकांशतः यह प्रमाणित करने के लिए किया जाता है कि विशेष भाषा गैर-नियमित है: इसके विरोधाभास के प्रमाण में भाषा में स्ट्रिंग को आवश्यक के अनुसार विशेषतः इस लंबाई के अनुसार प्रदर्शित किया जा सकता हैं जिसमें यह सम्मिलित रहता है, जिसमें पंपिंग लेम्मा में उल्लिखित गुणोंका अभाव है।

उदाहरण के लिए, भाषा वर्णमाला के ऊपर निम्नानुसार गैर-नियमित दिखाया जा सकता है:

इसके आधार पर , और जैसा कि नियमित भाषाओं के लिए पंपिंग लेम्मा में उपयोग किया जाता है, यहाँ पर ऊपर औपचारिक विवरण दिया गया हैं। इस प्रकार मान लीजिए कि कोई स्थिरांक है, जिसके लिए लेम्मा की आवश्यकता के अनुसार इसे सम्मिलित किया जाता है। इसके अनुसार में को द्वारा दिया जाता हैं, जो कि इससे स्ट्रिंग तक लंबी है, इस प्रकार पंपिंग लेम्मा द्वारा अपघटन होने के अतिरिक्त इसका उपस्थित आवश्यक होना चाहिए, जिसके लिए के साथ और का मान प्राप्त होता हैं।

 में  को इसके प्रत्येक मान के लिए  के लिए , समीकरण के आधार पर डोर  तक केवल इस उदाहरण के लिए उपस्थित किया जाता हैं, इस प्रकार  के अतिरिक्त, , के मान के लिए इसमें उचित पत्र के आधार पर इसका कम से कम उदाहरण उपस्थिति होता है, यहाँ पर  का मान चूंकि  के पत्र पर और भी उदाहरण हैं, इसके लिए  पत्र की तुलना में  के कुछ उदाहरणों के बाद इसे  मान के लिए इसे  के मान के लिए इसका कोई भी मान नहीं जोड़ा गया था। इसलिए,  इसमें उपस्थिति नहीं है, इस कारण  जो पम्पिंग लेम्मा का खंडन करता है। इसलिए  को यहाँ पर नियमित रूप से उपयोग नहीं किया जा सकता हैं।

इस बात का प्रमाण हैं कि डाइक भाषा या संतुलित अर्थात, उचित रूप से नेस्टेड ​​कोष्ठकों की भाषा नियमित नहीं है, यह इसी प्रकार उसी विचार का अनुसरण करती है। इस कारण यहाँ पर दिया गया का मान संतुलित कोष्ठकों की श्रृंखला को निरूपित करता है, जो इससे अधिक मान के लिए प्रारंभ होता है, यहाँ पर कोष्ठक को बाएँ ओर जिससे कि को पूर्ण रूप से बाएँ कोष्ठक से युक्त किया जाता हैं। इसे दोहराते हुए , स्ट्रिंग का उत्पादन किया जा सकता है, जिसमें बाएँ और दाएँ कोष्ठकों की समान संख्या नहीं है, और इसलिए उन्हें संतुलित नहीं किया जा सकता है।

पंपिंग लेम्मा का प्रमाण

प्रमाण विचार: जब भी पर्याप्त लंबी स्ट्रिंग (औपचारिक भाषाएं) xyz को परिमित ऑटोमेटन#गणितीय मॉडल द्वारा पहचाना जाता है, तो यह किसी स्थिति तक पहुंच गया होगा () दो बार। इसलिए, मध्य भाग को दोहराने (पम्पिंग) के बाद मनमाने ढंग से अधिकांशतः (xyyz, xyyyz, ...) स्ट्रिंग अभी भी पहचानी जाएगी।

प्रत्येक नियमित भाषा के लिए परिमित स्थिति के लिए ऑटोमेटन के लिए एफएसए होता है जो भाषा को स्वीकार करता है। ऐसे एफएसए में स्थितिों की संख्या की गणना की जाती है और उस गणना का उपयोग पंपिंग लंबाई के रूप में किया जाता है, इसमें कम से कम लंबाई की स्ट्रिंग के लिए , के आधार पर के आरंभिक अवस्था के रूप में निरूपित किया जाता हैं। इस प्रकार के लिए इसके अगले मान के क्रम को स्ट्रिंग द्वारा उत्सर्जित होने पर इस स्थिति को प्राप्त करता है। क्योंकि एफएसए के पास स्थितियाँ ही है, इस प्रकार इसके इस क्रम के भीतर के लिए इन स्थितियों का मान प्राप्त किया गया हैं, इस प्रकार यहां पर कम से कम इस स्थिति के लिए इसे अवश्य ही दोहराया जाना चाहिए। इसे द्वारा लिखा जाता हैं, ऐसी स्थिति के लिए परिवर्तन जो मशीन को इस स्थिति की पहली मुठभेड़ से लेते हैं, जिसके लिए स्थिति का दूसरी स्थिति के लिए को इस प्रकार की स्ट्रिंग से संयोजित करते हैं, इस स्ट्रिंग को लेम्मा कहा जाता है, और चूंकि मशीन बिना किसी स्ट्रिंग से मेल खाएगी, इसलिए भाग या इस स्ट्रिंग के साथ को कितनी भी बार दोहराए जाने पर, लेम्मा की शर्तें संतुष्ट हो जाती हैं।

उदाहरण के लिए, निम्न प्रतिबिंब एफएसए दिखाती है।

An automat accepting the language a(bc)*d.svgएफएसए स्ट्रिंग एबीसीडी को अधिकृत करता है। चूंकि इस स्ट्रिंग की लंबाई कम से कम इन स्थितियों की संख्या के आधार पर जितनी ज्यादा होती है, जिसका मान सामान्यतः चार रहता है, पिजनहोल सिद्धांत इंगित करता है कि प्रारंभ स्थिति और अगले चार विज़िट किए गए स्थितिों के बीच कम से कम दोहराया स्थिति होना चाहिए। इस उदाहरण में, केवल बार-बार दोहराई जाने वाली स्थिति है, चूंकि सबस्ट्रिंग बीसी मशीन को उन बदलावों के माध्यम से ले जाती है, जो स्थिति में प्रारंभ होते हैं, और स्थिति पर समाप्त होता है, इस कारण उस भाग को दोहराया जा सकता है और एफएसए स्ट्रिंग देते हुए अभी भी स्वीकार करेगा, जैसे abcbcd को वैकल्पिक रूप से बीसी के उचित भाग के लिए हटाया जा सकता है, और इस प्रकार एफएसए अभी भी स्ट्रिंग विज्ञापन देना स्वीकार करेगा। इसके आधार पर पंपिंग लेम्मा के संदर्भ में, स्ट्रिंग एबीसीडी को में तोड़ दिया गया है, जिसके लिए भाग a, a भाग bc और a भाग d द्वारा निरूपित करते हैं।

इसके अतिरिक्त टिप्पणी के रूप में यह जाँचने की समस्या कि क्या किसी दिए गए स्ट्रिंग को किसी दिए गए गैर-नियतात्मक परिमित ऑटोमेटन द्वारा किसी भी स्थिति में बार-बार आए बिना स्वीकार किया जा सकता है, यहाँ पर एनपी कठिन है।

नियमित भाषाओं के लिए पंपिंग लेम्मा का सामान्य संस्करण

यदि कोई भाषा पूर्ण रूप से नियमित है, तो संख्या यहाँ पर सम्मिलित रहती है, यहाँ पर पंपिंग लंबाई इस प्रकार हैं कि हर स्ट्रिंग का मान में साथ फॉर्म में लिखा जा सकता है। इस प्रकार उक्त समीकरण प्राप्त होता हैं-

स्ट्रिंग के साथ , और का मान इस प्रकार हैं कि , और

में है प्रत्येक पूर्णांक के लिए मान प्राप्त होता हैं।[5]

इसके लिए औपचारिक कथन मानक संस्करण दोनों के साथ विशेष स्थिति का अनुसरण करता है, जिसके लिए और रिक्त स्ट्रिंग को प्रकट करते हैं।

चूँकि सामान्य संस्करण भाषा पर इसकी अधिक आवश्यकताएँ होती है, इसका उपयोग कई और भाषाओं की गैर-नियमितता को प्रमाणित करने के लिए किया जा सकता है।

लेम्मा का व्युत्क्रम असत्य मान

जबकि पंपिंग लेम्मा में कहा गया है कि सभी नियमित भाषाएँ ऊपर वर्णित शर्तों को पूरा करती हैं, इस कथन का विपरीत मान असत्य होता है, जिसके कारण इस भाषा के अनुसार जो इन शर्तों को पूरा करती है वह अभी भी गैर-नियमित हो सकती है। दूसरे शब्दों में, पंपिंग लेम्मा का मूल और सामान्य संस्करण दोनों ही किसी भाषा के नियमित होने के लिए आवश्यक और पर्याप्त स्थिति देते हैं।

उदाहरण के लिए, निम्नलिखित भाषा पर विचार करें:

.

दूसरे शब्दों में, इसमें वर्णमाला के सभी स्ट्रिंग उपस्थित हैं, जिसके लिए डुप्लिकेट वर्ण सहित लंबाई 3 की सबस्ट्रिंग के साथ ही इस वर्णमाला की सभी स्ट्रिंग्स जहां स्ट्रिंग के वर्णों का 1/7 भाग 3 है। यह भाषा नियमित नहीं है लेकिन फिर भी के लिए इसका उपयोग किया जा सकता है, इस प्रकार यहाँ पर मान लीजिए कि कुछ स्ट्रिंग एस की लंबाई कम से कम 5 है। चूंकि इस उचित वर्णमाला में केवल चार अक्षर हैं, स्ट्रिंग में पहले पांच अक्षरों में से कम से कम दो डुप्लिकेट होने चाहिए। वे अधिकतम तीन वर्णों द्वारा अलग किए गए हैं।

  • यदि डुप्लिकेट वर्णों को 0 वर्णों या 1 से अलग किया गया है, तो स्ट्रिंग में अन्य दो वर्णों में से को पंप करें, जो डुप्लिकेट वाले सबस्ट्रिंग को प्रभावित नहीं करेगा।
  • यदि डुप्लिकेट वर्णों को 2 या 3 वर्णों से अलग किया गया है, तो उन्हें अलग करने वाले 2 वर्णों को पंप करते हैं। इस प्रकार नीचे या ऊपर पंप करने के कारण इसके आकार 3 की सबस्ट्रिंग का निर्माण होता है, जिसमें 2 डुप्लिकेट वर्ण होते हैं।
  • जिसकी दूसरी शर्त निश्चित करता है कि नियमित नहीं है: इस प्रकार स्ट्रिंग पर विचार करें, यहाँ पर यह स्ट्रिंग के अंदर है, जो बिल्कुल होने पर और इसी प्रकार माईहिल-नेरोड प्रमेय द्वारा नियमित नहीं है।

माईहिल-नेरोड प्रमेय परीक्षण प्रदान करता है जो नियमित भाषाओं की सटीक विशेषता को बताता है। यह प्रमाणित करने की सामान्य विधि कि कोई भाषा नियमित है, या तो परिमित स्थिति मशीन या भाषा के लिए नियमित अभिव्यक्ति का निर्माण करना है।

यह भी देखें

  • ओग्डेन की लेम्मा
  • संदर्भ-मुक्त भाषाओं के लिए लेम्मा में अधिकता करना
  • नियमित ट्री भाषाओं के लिए पंपिंग लेम्मा

टिप्पणियाँ

  1. Rabin, Michael; Scott, Dana (Apr 1959). "परिमित ऑटोमेटा और उनकी निर्णय समस्याएं" (PDF). IBM Journal of Research and Development. 3 (2): 114–125. doi:10.1147/rd.32.0114. Archived from the original on December 14, 2010.{{cite journal}}: CS1 maint: unfit URL (link) Here: Lemma 8, p.119
  2. Bar-Hillel, Y.; Perles, M.; Shamir, E. (1961), "On formal properties of simple phrase structure grammars", Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung, 14 (2): 143–172
  3. John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman (2003). Introduction to Automata Theory, Languages, and Computation. Addison Wesley. Here: Sect.4.6, p.166
  4. Berstel, Jean; Lauve, Aaron; Reutenauer, Christophe; Saliola, Franco V. (2009). शब्दों पर संयोजकता. क्रिस्टोफ़ेल शब्द और शब्दों में दोहराव. CRM Monograph Series. Vol. 27. Providence, RI: American Mathematical Society. p. 86. ISBN 978-0-8218-4480-9. Zbl 1161.68043.
  5. Savitch, Walter (1982). सार मशीनें और व्याकरण. p. 49. ISBN 978-0-316-77161-0.

संदर्भ