कांटैक्स्ट फ्री लैंग्वेज
औपचारिक भाषा सिद्धांत में, एक संदर्भ-मुक्त भाषा (सीएफएल) एक संदर्भ-मुक्त व्याकरण (सीएफजी) द्वारा उत्पन्न एक औपचारिक भाषा है।
प्रोग्रामिंग भाषाओं में संदर्भ-मुक्त भाषाओं के कई अनुप्रयोग होते हैं, विशेष रूप से, अधिकांश अंकगणितीय अभिव्यक्तियाँ संदर्भ-मुक्त व्याकरणों द्वारा उत्पन्न होती हैं।
पृष्ठभूमि
संदर्भ-मुक्त व्याकरण
विभिन्न संदर्भ-मुक्त व्याकरण एक ही संदर्भ-मुक्त भाषा उत्पन्न कर सकते हैं। भाषा का वर्णन करने वाले कई व्याकरणों की तुलना करके भाषा के आंतरिक गुणों को किसी विशेष व्याकरण के बाहरी गुणों से अलग किया जा सकता है।
ऑटोमेटा
सभी संदर्भ-मुक्त भाषाओं का सेट पुशडाउन ऑटोमेटा द्वारा स्वीकृत भाषाओं के सेट के समान है, जो इन भाषाओं को पार्सिंग के लिए उत्तरदायी बनाता है। इसके अलावा, किसी दिए गए सीएफजी के लिए, व्याकरण (और इस प्रकार संबंधित भाषा) के लिए एक पुशडाउन ऑटोमेटन का उत्पादन करने का एक सीधा तरीका है, हालांकि दूसरे तरीके से जाना (एक ऑटोमेटन दिए गए व्याकरण का निर्माण करना) उतना सीधा नहीं है।
उदाहरण
संदर्भ-मुक्त भाषा का एक उदाहरण है , सभी गैर-रिक्त सम-लंबाई वाले तारों की भाषा, जिनके पूरे पहले भाग हैं a's, और जिसके पूरे दूसरे भाग हैं b'एस। L व्याकरण द्वारा उत्पन्न होता है . यह भाषा नियमित भाषा नहीं है. इसे पुशडाउन ऑटोमेटन#औपचारिक परिभाषा द्वारा स्वीकार किया जाता है कहाँ को इस प्रकार परिभाषित किया गया है:[note 1]
असंदिग्ध सीएफएल सभी सीएफएल का एक उचित उपसमूह हैं: स्वाभाविक रूप से अस्पष्ट भाषा सीएफएल हैं। स्वाभाविक रूप से अस्पष्ट सीएफएल का एक उदाहरण संघ है साथ . यह सेट संदर्भ-मुक्त है, क्योंकि दो संदर्भ-मुक्त भाषाओं का मिलन हमेशा संदर्भ-मुक्त होता है। लेकिन (गैर-संदर्भ-मुक्त) उपसमुच्चय में स्ट्रिंग्स को स्पष्ट रूप से पार्स करने का कोई तरीका नहीं है जो इन दोनों भाषाओं का प्रतिच्छेदन है।[1]
डाइक भाषा
डाइक भाषा व्याकरण द्वारा उत्पन्न होती है .
गुण
संदर्भ-मुक्त पार्सिंग
भाषा की संदर्भ-मुक्त प्रकृति पुशडाउन ऑटोमेटन के साथ पार्स करना आसान बनाती है।
सदस्यता समस्या का एक उदाहरण निर्धारित करना; यानी एक स्ट्रिंग दी गई है , पता लगाएं कि क्या कहाँ किसी दिए गए व्याकरण द्वारा उत्पन्न भाषा है ; मान्यता के रूप में भी जाना जाता है। चॉम्स्की सामान्य रूप व्याकरण के लिए संदर्भ-मुक्त मान्यता लेस्ली वैलिएंट द्वारा दिखाई गई थी|लेस्ली जी. वैलिएंट को बूलियन मैट्रिक्स गुणन के लिए कम किया जा सकता है, इस प्रकार इसकी जटिलता बिग ओ नोटेशन की ऊपरी सीमा को विरासत में मिली है।2.3728596).[2][note 2] इसके विपरीत, लिलियन ली (कंप्यूटर वैज्ञानिक) ने O(n) दिखाया है3−ε) बूलियन मैट्रिक्स गुणन को O(n) तक कम किया जा सकता है3−3ε) सीएफजी पार्सिंग, इस प्रकार बाद के लिए कुछ प्रकार की निचली सीमा स्थापित करता है।[3] संदर्भ-मुक्त भाषाओं के व्यावहारिक उपयोग के लिए एक व्युत्पत्ति वृक्ष तैयार करने की भी आवश्यकता होती है जो उस संरचना को प्रदर्शित करता है जिसे व्याकरण दिए गए स्ट्रिंग के साथ जोड़ता है। इस पेड़ के उत्पादन की प्रक्रिया को पदच्छेद कहा जाता है। ज्ञात पार्सर्स में समय जटिलता होती है जो पार्स की गई स्ट्रिंग के आकार में घन होती है।
औपचारिक रूप से, सभी संदर्भ-मुक्त भाषाओं का सेट पुशडाउन ऑटोमेटा (पीडीए) द्वारा स्वीकृत भाषाओं के सेट के समान है। संदर्भ-मुक्त भाषाओं के लिए पार्सर एल्गोरिदम में CYK एल्गोरिदम और अर्ली पार्सर|अर्ली CYK एल्गोरिथ्म शामिल हैं।
संदर्भ-मुक्त भाषाओं का एक विशेष उपवर्ग नियतात्मक संदर्भ-मुक्त भाषाएं हैं जिन्हें नियतात्मक पुशडाउन ऑटोमेटन द्वारा स्वीकृत भाषाओं के सेट के रूप में परिभाषित किया गया है और एलआर पार्सर | एलआर (के) पार्सर द्वारा पार्स किया जा सकता है।[4] व्याकरण और पार्सर के वैकल्पिक दृष्टिकोण के रूप में अभिव्यक्ति व्याकरण को पार्स करना भी देखें।
बंद गुण
संदर्भ-मुक्त भाषाओं का वर्ग निम्नलिखित परिचालनों के तहत बंद (गणित) है। अर्थात्, यदि एल और पी संदर्भ-मुक्त भाषाएँ हैं, तो निम्नलिखित भाषाएँ भी संदर्भ-मुक्त हैं:
- संघ (सेट सिद्धांत) एल और पी का[5]
- एल का उलटा होना[6]
- संयोजन एल और पी का[5]
- क्लेन स्टार एल का[5]
- छवि स्ट्रिंग ऑपरेशंस#स्ट्रिंग होमोमोर्फिज्म के तहत एल का [7]
- छवि एक स्ट्रिंग ऑपरेशंस#स्ट्रिंग होमोमोर्फिज्म के तहत एल का [8]
- वृत्ताकार बदलाव#एल (भाषा) के अनुप्रयोग )[9]
- एल का उपसर्ग समापन (एल से स्ट्रिंग के सभी उपसर्ग (कंप्यूटर विज्ञान) का सेट)[10]
- औपचारिक भाषा का भागफल L/R का L द्वारा नियमित भाषा R[11]
प्रतिच्छेदन, पूरक और अंतर के अंतर्गत असंबद्धता
संदर्भ-मुक्त भाषाएँ प्रतिच्छेदन के अंतर्गत बंद नहीं होती हैं। इसे भाषाओं को लेकर देखा जा सकता है और , जो दोनों संदर्भ-मुक्त हैं।[note 3] उनका चौराहा है , जिसे संदर्भ-मुक्त भाषाओं के लिए पंपिंग लेम्मा द्वारा गैर-संदर्भ-मुक्त दिखाया जा सकता है। परिणामस्वरूप, संदर्भ-मुक्त भाषाओं को पूरकता के तहत बंद नहीं किया जा सकता है, क्योंकि किसी भी भाषा ए और बी के लिए, उनके प्रतिच्छेदन को संघ और पूरक द्वारा व्यक्त किया जा सकता है: . विशेष रूप से, संदर्भ-मुक्त भाषा को अंतर के अंतर्गत बंद नहीं किया जा सकता है, क्योंकि पूरक को अंतर द्वारा व्यक्त किया जा सकता है: .[12] हालाँकि, यदि L एक संदर्भ-मुक्त भाषा है और D एक नियमित भाषा है तो दोनों का प्रतिच्छेदन होता है और उनका अंतर संदर्भ-मुक्त भाषाएँ हैं।[13]
निर्णायकता
औपचारिक भाषा सिद्धांत में, नियमित भाषाओं के बारे में प्रश्न आमतौर पर निर्णय लेने योग्य होते हैं, लेकिन संदर्भ-मुक्त भाषाओं के बारे में अक्सर नहीं होते हैं। यह तय करने योग्य है कि क्या ऐसी भाषा सीमित है, लेकिन यह नहीं कि क्या इसमें हर संभव स्ट्रिंग शामिल है, नियमित है, असंदिग्ध है, या एक अलग व्याकरण वाली भाषा के बराबर है।
निम्नलिखित समस्याएँ मनमाने ढंग से दिए गए संदर्भ-मुक्त व्याकरण ए और बी के लिए अनिर्णीत समस्या हैं:
- समतुल्यता: है ?[14]
- असंगति: है ?[15] हालाँकि, एक संदर्भ-मुक्त भाषा और एक नियमित भाषा का प्रतिच्छेदन संदर्भ-मुक्त होता है,[16][17] इसलिए समस्या का वह प्रकार जहां बी एक नियमित व्याकरण है, निर्णय योग्य है (नीचे शून्यता देखें)।
- नियंत्रण: है ?[18] फिर, समस्या का वह प्रकार जहां बी एक नियमित व्याकरण है, निर्णय योग्य है,[citation needed] जबकि जहां ए नियमित है वह आम तौर पर नहीं है।[19]
- सार्वभौमिकता: है ?[20]
- नियमितता: है एक नियमित भाषा?[21]
- अस्पष्टता: प्रत्येक व्याकरण के लिए है अस्पष्ट?[22]
मनमानी संदर्भ-मुक्त भाषाओं के लिए निम्नलिखित समस्याएं निर्णय योग्य हैं:
- शून्यता: एक संदर्भ-मुक्त व्याकरण ए दिया गया है ?[23]
- परिमितता: एक संदर्भ-मुक्त व्याकरण ए दिया गया है परिमित?[24]
- सदस्यता: एक संदर्भ-मुक्त व्याकरण जी, और एक शब्द दिया गया , करता है ? सदस्यता समस्या के लिए कुशल बहुपद-समय एल्गोरिदम CYK एल्गोरिदम और अर्ली पार्सर|अर्ली का एल्गोरिदम हैं।
होपक्रॉफ्ट, मोटवानी, उल्मन (2003) के अनुसार,[25] येहोशुआ बार-हिलेल|बार-हिलेल, पर्ल्स और शमीर के 1961 के पेपर में संदर्भ-मुक्त भाषाओं के कई मौलिक समापन और (अन)निर्णय गुणों को दिखाया गया था।[26]
ऐसी भाषाएँ जो संदर्भ-मुक्त नहीं हैं
सेट एक संदर्भ-संवेदनशील भाषा है, लेकिन इस भाषा को उत्पन्न करने वाला कोई संदर्भ-मुक्त व्याकरण मौजूद नहीं है।[27] इसलिए संदर्भ-संवेदनशील भाषाएँ मौजूद हैं जो संदर्भ-मुक्त नहीं हैं। यह साबित करने के लिए कि कोई दी गई भाषा संदर्भ-मुक्त नहीं है, कोई संदर्भ-मुक्त भाषाओं के लिए पंपिंग लेम्मा का उपयोग कर सकता है[26]या कई अन्य विधियाँ, जैसे ओग्डेन की लेम्मा या पारिख की प्रमेय।[28]
टिप्पणियाँ
- ↑ meaning of 's arguments and results:
- ↑ In Valiant's paper, O(n2.81) was the then-best known upper bound. See Matrix multiplication#Computational complexity for bound improvements since then.
- ↑ A context-free grammar for the language A is given by the following production rules, taking S as the start symbol: S → Sc | aTb | ε; T → aTb | ε. The grammar for B is analogous.
संदर्भ
- ↑ Hopcroft & Ullman 1979, p. 100, Theorem 4.7.
- ↑ Valiant, Leslie G. (April 1975). "घन समय से भी कम समय में सामान्य संदर्भ-मुक्त पहचान". Journal of Computer and System Sciences. 10 (2): 308–315. doi:10.1016/s0022-0000(75)80046-8.
- ↑ Lee, Lillian (January 2002). "तेज़ संदर्भ-मुक्त व्याकरण पार्सिंग के लिए तेज़ बूलियन मैट्रिक्स गुणन की आवश्यकता होती है" (PDF). J ACM. 49 (1): 1–15. arXiv:cs/0112018. doi:10.1145/505241.505242. S2CID 1243491. Archived (PDF) from the original on 2003-04-27.
- ↑ Knuth, D. E. (July 1965). "भाषाओं के बाएँ से दाएँ अनुवाद पर". Information and Control. 8 (6): 607–639. doi:10.1016/S0019-9958(65)90426-2.
- ↑ 5.0 5.1 5.2 Hopcroft & Ullman 1979, p. 131, Corollary of Theorem 6.1.
- ↑ Hopcroft & Ullman 1979, p. 142, Exercise 6.4d.
- ↑ Hopcroft & Ullman 1979, p. 131-132, Corollary of Theorem 6.2.
- ↑ Hopcroft & Ullman 1979, p. 132, Theorem 6.3.
- ↑ Hopcroft & Ullman 1979, p. 142-144, Exercise 6.4c.
- ↑ Hopcroft & Ullman 1979, p. 142, Exercise 6.4b.
- ↑ Hopcroft & Ullman 1979, p. 142, Exercise 6.4a.
- ↑ Stephen Scheinberg (1960). "संदर्भ मुक्त भाषाओं के बूलियन गुणों पर ध्यान दें" (PDF). Information and Control. 3 (4): 372–375. doi:10.1016/s0019-9958(60)90965-7. Archived (PDF) from the original on 2018-11-26.
- ↑ Beigel, Richard; Gasarch, William. "A Proof that if L = L1 ∩ L2 where L1 is CFL and L2 is Regular then L is Context Free Which Does Not use PDA's" (PDF). University of Maryland Department of Computer Science. Archived (PDF) from the original on 2014-12-12. Retrieved June 6, 2020.
- ↑ Hopcroft & Ullman 1979, p. 203, Theorem 8.12(1).
- ↑ Hopcroft & Ullman 1979, p. 202, Theorem 8.10.
- ↑ Salomaa (1973), p. 59, Theorem 6.7
- ↑ Hopcroft & Ullman 1979, p. 135, Theorem 6.5.
- ↑ Hopcroft & Ullman 1979, p. 203, Theorem 8.12(2).
- ↑ Hopcroft & Ullman 1979, p. 203, Theorem 8.12(4).
- ↑ Hopcroft & Ullman 1979, p. 203, Theorem 8.11.
- ↑ Hopcroft & Ullman 1979, p. 205, Theorem 8.15.
- ↑ Hopcroft & Ullman 1979, p. 206, Theorem 8.16.
- ↑ Hopcroft & Ullman 1979, p. 137, Theorem 6.6(a).
- ↑ Hopcroft & Ullman 1979, p. 137, Theorem 6.6(b).
- ↑ John E. Hopcroft; Rajeev Motwani; Jeffrey D. Ullman (2003). ऑटोमेटा सिद्धांत, भाषाएँ और संगणना का परिचय. Addison Wesley. Here: Sect.7.6, p.304, and Sect.9.7, p.411
- ↑ 26.0 26.1 Yehoshua Bar-Hillel; Micha Asher Perles; Eli Shamir (1961). "सरल वाक्यांश-संरचना व्याकरण के औपचारिक गुणों पर". Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung. 14 (2): 143–172.
- ↑ Hopcroft & Ullman 1979.
- ↑ "How to prove that a language is not context-free?".
उद्धृत कार्य
- Hopcroft, John E.; Ullman, Jeffrey D. (1979). ऑटोमेटा सिद्धांत, भाषाएँ और संगणना का परिचय (1st ed.). Addison-Wesley. ISBN 9780201029888.
- Salomaa, Arto (1973). औपचारिक भाषाएँ. ACM Monograph Series.
अग्रिम पठन
- Autebert, Jean-Michel; Berstel, Jean; Boasson, Luc (1997). "Context-Free Languages and Push-Down Automata". In G. Rozenberg; A. Salomaa (eds.). Handbook of Formal Languages (PDF). Vol. 1. Springer-Verlag. pp. 111–174. Archived (PDF) from the original on 2011-05-16.
- Ginsburg, Seymour (1966). The Mathematical Theory of Context-Free Languages. New York, NY, USA: McGraw-Hill.
- Sipser, Michael (1997). "2: Context-Free Languages". Introduction to the Theory of Computation. PWS Publishing. pp. 91–122. ISBN 0-534-94728-X.