अस्पष्ट व्याकरण: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Type of a context-free grammar}} | {{Short description|Type of a context-free grammar}} | ||
[[कंप्यूटर विज्ञान]] में, अस्पष्ट व्याकरण | [[कंप्यूटर विज्ञान]] में, अस्पष्ट व्याकरण [[संदर्भ-मुक्त व्याकरण]] है जिसके लिए [[स्ट्रिंग (कंप्यूटर विज्ञान)]] मौजूद है जिसमें से अधिक बाईं ओर व्युत्पत्ति या [[पार्स वृक्ष]] हो सकते हैं।<ref name="Levelt2008">{{cite book|author=Willem J. M. Levelt|title=औपचारिक भाषाओं और ऑटोमेटा के सिद्धांत का एक परिचय|url=https://books.google.com/books?id=tFvtwGYNe7kC&q=%22leftmost+derivation%22+%22ambiguous%22|year=2008|publisher=John Benjamins Publishing|isbn=978-90-272-3250-2}}</ref> प्रत्येक गैर-रिक्त [[संदर्भ-मुक्त भाषा]] उदाहरण के द्वारा अस्पष्ट व्याकरण को स्वीकार करती है। डुप्लिकेट नियम. वह भाषा जो केवल अस्पष्ट व्याकरणों को स्वीकार करती है, #स्वाभाविक रूप से अस्पष्ट भाषा कहलाती है। [[नियतिवादी संदर्भ-मुक्त व्याकरण]] हमेशा असंदिग्ध होते हैं, और असंदिग्ध व्याकरणों का महत्वपूर्ण उपवर्ग हैं; हालाँकि, गैर-नियतात्मक स्पष्ट व्याकरण हैं। | ||
कंप्यूटर [[प्रोग्रामिंग भाषा]]ओं के लिए, लटकती अन्य समस्या जैसे मुद्दों के कारण संदर्भ व्याकरण अक्सर अस्पष्ट होता है। यदि मौजूद है, तो इन अस्पष्टताओं को आम तौर पर प्राथमिकता नियमों या अन्य [[संदर्भ-संवेदनशील व्याकरण]]|संदर्भ-संवेदनशील पार्सिंग नियमों को जोड़कर हल किया जाता है, इसलिए समग्र वाक्यांश व्याकरण स्पष्ट है। कुछ पार्सिंग एल्गोरिदम (जैसे कि ([[अर्ली पार्सर]])।<ref>{{cite journal|last1=Scott|first1=Elizabeth|title=प्रारंभिक पहचानकर्ताओं से एसपीपीएफ-शैली पार्सिंग|journal=Electronic Notes in Theoretical Computer Science|date=April 1, 2008|volume=203|issue=2|pages=53–67|doi=10.1016/j.entcs.2008.03.044|doi-access=free}}</ref> या [[सामान्यीकृत एलआर पार्सर]] पार्सर्स) उन स्ट्रिंग्स से पार्स ट्री (या पार्स फ़ॉरेस्ट) के सेट उत्पन्न कर सकते हैं जो [[वाक्यात्मक रूप से अस्पष्ट]] हैं।<ref>Tomita, Masaru. "[http://anthology.aclweb.org/J/J87/J87-1004.pdf An efficient augmented-context-free parsing algorithm]." Computational linguistics 13.1-2 (1987): 31-46.</ref> | कंप्यूटर [[प्रोग्रामिंग भाषा]]ओं के लिए, लटकती अन्य समस्या जैसे मुद्दों के कारण संदर्भ व्याकरण अक्सर अस्पष्ट होता है। यदि मौजूद है, तो इन अस्पष्टताओं को आम तौर पर प्राथमिकता नियमों या अन्य [[संदर्भ-संवेदनशील व्याकरण]]|संदर्भ-संवेदनशील पार्सिंग नियमों को जोड़कर हल किया जाता है, इसलिए समग्र वाक्यांश व्याकरण स्पष्ट है। कुछ पार्सिंग एल्गोरिदम (जैसे कि ([[अर्ली पार्सर]])।<ref>{{cite journal|last1=Scott|first1=Elizabeth|title=प्रारंभिक पहचानकर्ताओं से एसपीपीएफ-शैली पार्सिंग|journal=Electronic Notes in Theoretical Computer Science|date=April 1, 2008|volume=203|issue=2|pages=53–67|doi=10.1016/j.entcs.2008.03.044|doi-access=free}}</ref> या [[सामान्यीकृत एलआर पार्सर]] पार्सर्स) उन स्ट्रिंग्स से पार्स ट्री (या पार्स फ़ॉरेस्ट) के सेट उत्पन्न कर सकते हैं जो [[वाक्यात्मक रूप से अस्पष्ट]] हैं।<ref>Tomita, Masaru. "[http://anthology.aclweb.org/J/J87/J87-1004.pdf An efficient augmented-context-free parsing algorithm]." Computational linguistics 13.1-2 (1987): 31-46.</ref> | ||
Line 12: | Line 12: | ||
...जिसका अर्थ यह है कि नॉनटर्मिनल ए को या तो खुद से, या खाली स्ट्रिंग से प्राप्त किया जा सकता है। इस प्रकार खाली स्ट्रिंग में लंबाई 1, 2, 3 और वास्तव में किसी भी लंबाई की सबसे बाईं व्युत्पत्ति होती है, यह इस पर निर्भर करता है कि नियम ए → ए का कितनी बार उपयोग किया जाता है। | ...जिसका अर्थ यह है कि नॉनटर्मिनल ए को या तो खुद से, या खाली स्ट्रिंग से प्राप्त किया जा सकता है। इस प्रकार खाली स्ट्रिंग में लंबाई 1, 2, 3 और वास्तव में किसी भी लंबाई की सबसे बाईं व्युत्पत्ति होती है, यह इस पर निर्भर करता है कि नियम ए → ए का कितनी बार उपयोग किया जाता है। | ||
इस भाषा में | इस भाषा में स्पष्ट व्याकरण भी है, जिसमें एकल [[उत्पादन नियम (औपचारिक भाषाएँ)]] शामिल हैं: | ||
:ए → ε | :ए → ε | ||
...मतलब कि अद्वितीय उत्पादन केवल खाली स्ट्रिंग का उत्पादन कर सकता है, जो भाषा में अद्वितीय स्ट्रिंग है। | ...मतलब कि अद्वितीय उत्पादन केवल खाली स्ट्रिंग का उत्पादन कर सकता है, जो भाषा में अद्वितीय स्ट्रिंग है। | ||
Line 23: | Line 23: | ||
...लेकिन इसमें अस्पष्ट व्याकरण भी है: | ...लेकिन इसमें अस्पष्ट व्याकरण भी है: | ||
:ए → एए | आ | ε | :ए → एए | आ | ε | ||
ये | ये दाएँ-साहचर्य वृक्ष (स्पष्ट व्याकरण के लिए) का निर्माण करने या बाएँ और दाएँ-दोनों-सहयोग की अनुमति देने के अनुरूप हैं। इसका विवरण नीचे दिया गया है। | ||
===जोड़ और घटाव=== | ===जोड़ और घटाव=== | ||
Line 53: | Line 53: | ||
|} | |} | ||
एक अन्य उदाहरण के रूप में, व्याकरण अस्पष्ट है क्योंकि स्ट्रिंग ए + ए - ए के लिए दो पार्स ट्री हैं: | एक अन्य उदाहरण के रूप में, व्याकरण अस्पष्ट है क्योंकि स्ट्रिंग ए + ए - ए के लिए दो पार्स ट्री हैं: | ||
:[[Image:Leftmostderivations jaredwf.svg|Leftmostderivations jaredwf.svg|400px]]हालाँकि, यह जो भाषा उत्पन्न करता है, वह स्वाभाविक रूप से अस्पष्ट नहीं है; निम्नलिखित | :[[Image:Leftmostderivations jaredwf.svg|Leftmostderivations jaredwf.svg|400px]]हालाँकि, यह जो भाषा उत्पन्न करता है, वह स्वाभाविक रूप से अस्पष्ट नहीं है; निम्नलिखित गैर-अस्पष्ट व्याकरण है जो समान भाषा उत्पन्न करता है: | ||
:ए → ए + ए | ए - ए | ए | :ए → ए + ए | ए - ए | ए | ||
===लटकना अन्यथा=== | ===लटकना अन्यथा=== | ||
{{main|Dangling else}} | {{main|Dangling else}} | ||
कंप्यूटर प्रोग्रामिंग भाषाओं में अस्पष्टता का | कंप्यूटर प्रोग्रामिंग भाषाओं में अस्पष्टता का सामान्य उदाहरण लटकती हुई अन्य समस्या है। कई भाषाओं में, <code>else</code> कंडीशनल (कंप्यूटर प्रोग्रामिंग) में #If–then(–else)|If–then(–else) स्टेटमेंट वैकल्पिक है, जिसके परिणामस्वरूप नेस्टेड कंडीशनल को संदर्भ-मुक्त व्याकरण के संदर्भ में पहचाने जाने के कई तरीके होते हैं। | ||
सीधे तौर पर, कई भाषाओं में कोई सशर्त को दो वैध रूपों में लिख सकता है: यदि-तब रूप, और यदि-तब-और रूप - वास्तव में, अन्य खंड को वैकल्पिक बनाता है:<ref group=note>The following example uses [[Pascal (programming language)|Pascal]] syntax</ref> | सीधे तौर पर, कई भाषाओं में कोई सशर्त को दो वैध रूपों में लिख सकता है: यदि-तब रूप, और यदि-तब-और रूप - वास्तव में, अन्य खंड को वैकल्पिक बनाता है:<ref group=note>The following example uses [[Pascal (programming language)|Pascal]] syntax</ref> | ||
Line 78: | Line 78: | ||
इसे विभिन्न भाषाओं में विभिन्न तरीकों से हल किया जाता है। कभी-कभी व्याकरण को संशोधित किया जाता है ताकि यह स्पष्ट हो, जैसे कि इसकी आवश्यकता होती है <code>endif</code> कथन या कथन करना <code>else</code> अनिवार्य। अन्य मामलों में व्याकरण को अस्पष्ट छोड़ दिया जाता है, लेकिन समग्र वाक्यांश व्याकरण को संदर्भ-संवेदनशील बनाकर अस्पष्टता का समाधान किया जाता है, जैसे कि किसी को संबद्ध करके <code>else</code> निकटतम के साथ <code>if</code>. इस बाद वाले मामले में व्याकरण अस्पष्ट है, लेकिन संदर्भ-मुक्त व्याकरण अस्पष्ट है। | इसे विभिन्न भाषाओं में विभिन्न तरीकों से हल किया जाता है। कभी-कभी व्याकरण को संशोधित किया जाता है ताकि यह स्पष्ट हो, जैसे कि इसकी आवश्यकता होती है <code>endif</code> कथन या कथन करना <code>else</code> अनिवार्य। अन्य मामलों में व्याकरण को अस्पष्ट छोड़ दिया जाता है, लेकिन समग्र वाक्यांश व्याकरण को संदर्भ-संवेदनशील बनाकर अस्पष्टता का समाधान किया जाता है, जैसे कि किसी को संबद्ध करके <code>else</code> निकटतम के साथ <code>if</code>. इस बाद वाले मामले में व्याकरण अस्पष्ट है, लेकिन संदर्भ-मुक्त व्याकरण अस्पष्ट है। | ||
===अनेक व्युत्पत्तियों वाला | ===अनेक व्युत्पत्तियों वाला स्पष्ट व्याकरण=== | ||
एक ही स्ट्रिंग की एकाधिक व्युत्पत्तियों का अस्तित्व यह इंगित करने के लिए पर्याप्त नहीं है कि व्याकरण अस्पष्ट है; केवल एकाधिक बाईं ओर की व्युत्पत्तियाँ (या, समकक्ष, एकाधिक पार्स वृक्ष) अस्पष्टता का संकेत देती हैं। | एक ही स्ट्रिंग की एकाधिक व्युत्पत्तियों का अस्तित्व यह इंगित करने के लिए पर्याप्त नहीं है कि व्याकरण अस्पष्ट है; केवल एकाधिक बाईं ओर की व्युत्पत्तियाँ (या, समकक्ष, एकाधिक पार्स वृक्ष) अस्पष्टता का संकेत देती हैं। | ||
Line 84: | Line 84: | ||
एस → ए + ए | एस → ए + ए | ||
ए → 0 | 1 | ए → 0 | 1 | ||
भाषा के लिए | भाषा के लिए स्पष्ट व्याकरण है { 0+0, 0+1, 1+0, 1+1 }। हालाँकि इन चार तारों में से प्रत्येक में केवल बाईं ओर की व्युत्पत्ति है, उदाहरण के लिए, इसकी दो अलग-अलग व्युत्पत्तियाँ हैं | ||
एस संदर्भ-मुक्त व्याकरण#नियम अनुप्रयोग|⇒ ए + ए ⇒ 0 + ए ⇒ 0 + 0 | एस संदर्भ-मुक्त व्याकरण#नियम अनुप्रयोग|⇒ ए + ए ⇒ 0 + ए ⇒ 0 + 0 | ||
और | और | ||
Line 92: | Line 92: | ||
==अस्पष्ट व्याकरणों को पहचानना== | ==अस्पष्ट व्याकरणों को पहचानना== | ||
एक मनमाना व्याकरण अस्पष्ट है या नहीं इसकी [[निर्णय समस्या]] [[अनिर्णीत समस्या]] है क्योंकि यह दिखाया जा सकता है कि यह [[पोस्ट पत्राचार समस्या]] के बराबर है।<ref>{{cite book |last1=Hopcroft |first1=John |authorlink1=John Hopcroft |last2=Motwani |first2=Rajeev |authorlink2=Rajeev Motwani |last3=Ullman |first3=Jeffrey |authorlink3=Jeffrey Ullman |title=[[Introduction to automata theory, languages, and computation]] |edition=2nd |date=2001 |publisher=Addison-Wesley |isbn = 0-201-44124-1 | at = Theorem 9.20, pp. 405–406}}</ref> कम से कम, संदर्भ-मुक्त व्याकरणों की अस्पष्टता का पता लगाने के लिए कुछ अर्ध-निर्णायक | अर्ध-निर्णय प्रक्रिया को लागू करने वाले उपकरण मौजूद हैं।<ref>{{cite conference | last1 = Axelsson | first1 = Roland | last2 = Heljanko | first2 = Keijo | last3 = Lange | first3 = Martin | year = 2008 | title = वृद्धिशील SAT सॉल्वर का उपयोग करके संदर्भ-मुक्त व्याकरण का विश्लेषण| book-title = Proceedings of the 35th [[International Colloquium on Automata, Languages and Programming]] (ICALP'08), Reykjavik, Iceland | series = [[Lecture Notes in Computer Science]] | volume = 5126 | pages = 410–422 | publisher = Springer-Verlag | doi = 10.1007/978-3-540-70583-3_34 | isbn = 978-3-540-70582-6 | url = http://www.tcs.hut.fi/~kepa/publications/AxelssonHeljankoLange-ICALP08.pdf }}</ref> | एक मनमाना व्याकरण अस्पष्ट है या नहीं इसकी [[निर्णय समस्या]] [[अनिर्णीत समस्या]] है क्योंकि यह दिखाया जा सकता है कि यह [[पोस्ट पत्राचार समस्या]] के बराबर है।<ref>{{cite book |last1=Hopcroft |first1=John |authorlink1=John Hopcroft |last2=Motwani |first2=Rajeev |authorlink2=Rajeev Motwani |last3=Ullman |first3=Jeffrey |authorlink3=Jeffrey Ullman |title=[[Introduction to automata theory, languages, and computation]] |edition=2nd |date=2001 |publisher=Addison-Wesley |isbn = 0-201-44124-1 | at = Theorem 9.20, pp. 405–406}}</ref> कम से कम, संदर्भ-मुक्त व्याकरणों की अस्पष्टता का पता लगाने के लिए कुछ अर्ध-निर्णायक | अर्ध-निर्णय प्रक्रिया को लागू करने वाले उपकरण मौजूद हैं।<ref>{{cite conference | last1 = Axelsson | first1 = Roland | last2 = Heljanko | first2 = Keijo | last3 = Lange | first3 = Martin | year = 2008 | title = वृद्धिशील SAT सॉल्वर का उपयोग करके संदर्भ-मुक्त व्याकरण का विश्लेषण| book-title = Proceedings of the 35th [[International Colloquium on Automata, Languages and Programming]] (ICALP'08), Reykjavik, Iceland | series = [[Lecture Notes in Computer Science]] | volume = 5126 | pages = 410–422 | publisher = Springer-Verlag | doi = 10.1007/978-3-540-70583-3_34 | isbn = 978-3-540-70582-6 | url = http://www.tcs.hut.fi/~kepa/publications/AxelssonHeljankoLange-ICALP08.pdf }}</ref> | ||
संदर्भ-मुक्त व्याकरण को पार्स करने की दक्षता इसे स्वीकार करने वाले ऑटोमेटन द्वारा निर्धारित की जाती है। नियतात्मक संदर्भ-मुक्त व्याकरण [[नियतात्मक पुशडाउन ऑटोमेटा]] द्वारा स्वीकार किए जाते हैं और इन्हें रैखिक समय में पार्स किया जा सकता है, उदाहरण के लिए [[एलआर पार्सर]] द्वारा।<ref>{{Cite journal | last1 = Knuth | first1 = D. E. | authorlink = Donald Knuth | title = भाषाओं के बाएँ से दाएँ अनुवाद पर| doi = 10.1016/S0019-9958(65)90426-2 | journal = Information and Control | volume = 8 | issue = 6 | pages = 607–639 | date = July 1965 | doi-access = free }}</ref> वे [[संदर्भ-मुक्त व्याकरण]]ों का | संदर्भ-मुक्त व्याकरण को पार्स करने की दक्षता इसे स्वीकार करने वाले ऑटोमेटन द्वारा निर्धारित की जाती है। नियतात्मक संदर्भ-मुक्त व्याकरण [[नियतात्मक पुशडाउन ऑटोमेटा]] द्वारा स्वीकार किए जाते हैं और इन्हें रैखिक समय में पार्स किया जा सकता है, उदाहरण के लिए [[एलआर पार्सर]] द्वारा।<ref>{{Cite journal | last1 = Knuth | first1 = D. E. | authorlink = Donald Knuth | title = भाषाओं के बाएँ से दाएँ अनुवाद पर| doi = 10.1016/S0019-9958(65)90426-2 | journal = Information and Control | volume = 8 | issue = 6 | pages = 607–639 | date = July 1965 | doi-access = free }}</ref> वे [[संदर्भ-मुक्त व्याकरण]]ों का सख्त उपसमूह हैं, जिन्हें [[पुशडाउन ऑटोमेटा]] द्वारा स्वीकार किया जाता है और बहुपद समय में पार्स किया जा सकता है, उदाहरण के लिए CYK एल्गोरिदम द्वारा। | ||
असंदिग्ध संदर्भ-मुक्त व्याकरण गैर-नियतात्मक हो सकते हैं। उदाहरण के लिए, 0 और 1 की वर्णमाला पर सम-लंबाई वाले [[विलोमपद]] की भाषा में स्पष्ट संदर्भ-मुक्त व्याकरण S → 0S0 | 1एस1 | ε. इस भाषा की | असंदिग्ध संदर्भ-मुक्त व्याकरण गैर-नियतात्मक हो सकते हैं। उदाहरण के लिए, 0 और 1 की वर्णमाला पर सम-लंबाई वाले [[विलोमपद]] की भाषा में स्पष्ट संदर्भ-मुक्त व्याकरण S → 0S0 | 1एस1 | ε. इस भाषा की मनमानी स्ट्रिंग को पहले उसके सभी प्रतीकों को पढ़े बिना पार्स नहीं किया जा सकता है, जिसका अर्थ है कि पुशडाउन ऑटोमेटन को अर्ध-पार्स की गई स्ट्रिंग की विभिन्न संभावित लंबाई को समायोजित करने के लिए वैकल्पिक राज्य परिवर्तनों का प्रयास करना होगा।<ref>{{cite book |last1=Hopcroft |first1=John |authorlink1=John Hopcroft |last2=Motwani |first2=Rajeev |authorlink2=Rajeev Motwani |last3=Ullman |first3=Jeffrey |authorlink3=Jeffrey Ullman |title=[[Introduction to automata theory, languages, and computation]] |edition=2nd |date=2001 |publisher=Addison-Wesley |isbn = 0-201-44124-1 |pages=249–253}}</ref> फिर भी, व्[[ YACC ]]रण की अस्पष्टता को दूर करने से नियतात्मक संदर्भ-मुक्त व्याकरण उत्पन्न हो सकता है और इस प्रकार अधिक कुशल पार्सिंग की अनुमति मिल सकती है। वाईएसीसी जैसे कंपाइलर जनरेटर में कुछ प्रकार की अस्पष्टता को हल करने की विशेषताएं शामिल हैं, जैसे कि प्राथमिकता और सहयोगीता बाधाओं का उपयोग करना। | ||
==स्वाभाविक रूप से अस्पष्ट भाषाएँ== | ==स्वाभाविक रूप से अस्पष्ट भाषाएँ== | ||
Line 104: | Line 104: | ||
का संघ <math>\{a^n b^m c^m d^n \mid n, m > 0\}</math> साथ <math>\{a^n b^n c^m d^m \mid n, m > 0\}</math> स्वाभाविक रूप से अस्पष्ट है. यह सेट संदर्भ-मुक्त है, क्योंकि दो संदर्भ-मुक्त भाषाओं का मिलन हमेशा संदर्भ-मुक्त होता है। लेकिन {{harvtxt|Hopcroft|Ullman|1979}} इस बात का प्रमाण दें कि इस संघ भाषा के लिए कोई भी संदर्भ-मुक्त व्याकरण रूप के तारों को स्पष्ट रूप से पार्स नहीं कर सकता है <math>a^n b^n c^n d^n, (n > 0)</math>.<ref>p.99-103, Sect.4.7</ref> | का संघ <math>\{a^n b^m c^m d^n \mid n, m > 0\}</math> साथ <math>\{a^n b^n c^m d^m \mid n, m > 0\}</math> स्वाभाविक रूप से अस्पष्ट है. यह सेट संदर्भ-मुक्त है, क्योंकि दो संदर्भ-मुक्त भाषाओं का मिलन हमेशा संदर्भ-मुक्त होता है। लेकिन {{harvtxt|Hopcroft|Ullman|1979}} इस बात का प्रमाण दें कि इस संघ भाषा के लिए कोई भी संदर्भ-मुक्त व्याकरण रूप के तारों को स्पष्ट रूप से पार्स नहीं कर सकता है <math>a^n b^n c^n d^n, (n > 0)</math>.<ref>p.99-103, Sect.4.7</ref> | ||
अधिक उदाहरण, और संदर्भ-मुक्त भाषाओं की अंतर्निहित अस्पष्टता को साबित करने के लिए तकनीकों की | अधिक उदाहरण, और संदर्भ-मुक्त भाषाओं की अंतर्निहित अस्पष्टता को साबित करने के लिए तकनीकों की सामान्य समीक्षा, बैसिनो और निकौड (2011) द्वारा दी गई है।<ref>{{Cite web |author=Fredérique Bassino and Cyril Nicaud |date=December 16, 2011 |title=Philippe Flajolet & Analytic Combinatorics: Inherent Ambiguity of Context-Free Languages |url=https://algo.inria.fr/pfac/PFAC/Program_files/nicaud.pdf |url-status=live |archive-url=https://web.archive.org/web/20220925135141/http://algo.inria.fr/pfac/PFAC/Program_files/nicaud.pdf |archive-date=2022-09-25}}</ref> | ||
==यह भी देखें== | ==यह भी देखें== | ||
*[[जीएलआर पार्सर]], अस्पष्ट और गैर-नियतात्मक व्याकरणों के लिए | *[[जीएलआर पार्सर]], अस्पष्ट और गैर-नियतात्मक व्याकरणों के लिए प्रकार का पार्सर | ||
*[[चार्ट पार्सर]], अस्पष्ट व्याकरण के लिए | *[[चार्ट पार्सर]], अस्पष्ट व्याकरण के लिए अन्य प्रकार का पार्सर | ||
* [[वाक्यात्मक अस्पष्टता]] | * [[वाक्यात्मक अस्पष्टता]] | ||
Revision as of 08:49, 4 August 2023
कंप्यूटर विज्ञान में, अस्पष्ट व्याकरण संदर्भ-मुक्त व्याकरण है जिसके लिए स्ट्रिंग (कंप्यूटर विज्ञान) मौजूद है जिसमें से अधिक बाईं ओर व्युत्पत्ति या पार्स वृक्ष हो सकते हैं।[1] प्रत्येक गैर-रिक्त संदर्भ-मुक्त भाषा उदाहरण के द्वारा अस्पष्ट व्याकरण को स्वीकार करती है। डुप्लिकेट नियम. वह भाषा जो केवल अस्पष्ट व्याकरणों को स्वीकार करती है, #स्वाभाविक रूप से अस्पष्ट भाषा कहलाती है। नियतिवादी संदर्भ-मुक्त व्याकरण हमेशा असंदिग्ध होते हैं, और असंदिग्ध व्याकरणों का महत्वपूर्ण उपवर्ग हैं; हालाँकि, गैर-नियतात्मक स्पष्ट व्याकरण हैं।
कंप्यूटर प्रोग्रामिंग भाषाओं के लिए, लटकती अन्य समस्या जैसे मुद्दों के कारण संदर्भ व्याकरण अक्सर अस्पष्ट होता है। यदि मौजूद है, तो इन अस्पष्टताओं को आम तौर पर प्राथमिकता नियमों या अन्य संदर्भ-संवेदनशील व्याकरण|संदर्भ-संवेदनशील पार्सिंग नियमों को जोड़कर हल किया जाता है, इसलिए समग्र वाक्यांश व्याकरण स्पष्ट है। कुछ पार्सिंग एल्गोरिदम (जैसे कि (अर्ली पार्सर)।[2] या सामान्यीकृत एलआर पार्सर पार्सर्स) उन स्ट्रिंग्स से पार्स ट्री (या पार्स फ़ॉरेस्ट) के सेट उत्पन्न कर सकते हैं जो वाक्यात्मक रूप से अस्पष्ट हैं।[3]
उदाहरण
तुच्छ भाषा
सबसे सरल उदाहरण उस तुच्छ भाषा के लिए निम्नलिखित अस्पष्ट व्याकरण (प्रारंभ प्रतीक ए के साथ) है जिसमें केवल खाली स्ट्रिंग शामिल है:
- ए → ए | ε
...जिसका अर्थ यह है कि नॉनटर्मिनल ए को या तो खुद से, या खाली स्ट्रिंग से प्राप्त किया जा सकता है। इस प्रकार खाली स्ट्रिंग में लंबाई 1, 2, 3 और वास्तव में किसी भी लंबाई की सबसे बाईं व्युत्पत्ति होती है, यह इस पर निर्भर करता है कि नियम ए → ए का कितनी बार उपयोग किया जाता है।
इस भाषा में स्पष्ट व्याकरण भी है, जिसमें एकल उत्पादन नियम (औपचारिक भाषाएँ) शामिल हैं:
- ए → ε
...मतलब कि अद्वितीय उत्पादन केवल खाली स्ट्रिंग का उत्पादन कर सकता है, जो भाषा में अद्वितीय स्ट्रिंग है।
उसी तरह, किसी गैर-रिक्त भाषा के लिए किसी भी व्याकरण को डुप्लिकेट जोड़कर अस्पष्ट बनाया जा सकता है।
यूनरी स्ट्रिंग
किसी दिए गए वर्ण की यूनरी स्ट्रिंग्स की नियमित भाषा, कहें 'a'
(नियमित अभिव्यक्ति a*
), स्पष्ट व्याकरण है:
- ए → एए | ε
...लेकिन इसमें अस्पष्ट व्याकरण भी है:
- ए → एए | आ | ε
ये दाएँ-साहचर्य वृक्ष (स्पष्ट व्याकरण के लिए) का निर्माण करने या बाएँ और दाएँ-दोनों-सहयोग की अनुमति देने के अनुरूप हैं। इसका विवरण नीचे दिया गया है।
जोड़ और घटाव
प्रसंग मुक्त व्याकरण
- ए → ए + ए | ए - ए | ए
यह अस्पष्ट है क्योंकि स्ट्रिंग a + a + a के लिए दो सबसे बाईं व्युत्पत्तियाँ हैं:
A | → A + A | A | → A + A | ||
→ a + A | → A + A + A (First A is replaced by A+A. Replacement of the second A would yield a similar derivation) | ||||
→ a + A + A | → a + A + A | ||||
→ a + a + A | → a + a + A | ||||
→ a + a + a | → a + a + a |
एक अन्य उदाहरण के रूप में, व्याकरण अस्पष्ट है क्योंकि स्ट्रिंग ए + ए - ए के लिए दो पार्स ट्री हैं:
- हालाँकि, यह जो भाषा उत्पन्न करता है, वह स्वाभाविक रूप से अस्पष्ट नहीं है; निम्नलिखित गैर-अस्पष्ट व्याकरण है जो समान भाषा उत्पन्न करता है:
- ए → ए + ए | ए - ए | ए
लटकना अन्यथा
कंप्यूटर प्रोग्रामिंग भाषाओं में अस्पष्टता का सामान्य उदाहरण लटकती हुई अन्य समस्या है। कई भाषाओं में, else
कंडीशनल (कंप्यूटर प्रोग्रामिंग) में #If–then(–else)|If–then(–else) स्टेटमेंट वैकल्पिक है, जिसके परिणामस्वरूप नेस्टेड कंडीशनल को संदर्भ-मुक्त व्याकरण के संदर्भ में पहचाने जाने के कई तरीके होते हैं।
सीधे तौर पर, कई भाषाओं में कोई सशर्त को दो वैध रूपों में लिख सकता है: यदि-तब रूप, और यदि-तब-और रूप - वास्तव में, अन्य खंड को वैकल्पिक बनाता है:[note 1] नियमों से युक्त व्याकरण में
कथन → यदि शर्त है तो कथन | यदि शर्त है तो कथन अन्यथा कथन | ... शर्त → ...
कुछ अस्पष्ट वाक्यांश संरचनाएँ प्रकट हो सकती हैं। इजहार
यदि a तो यदि b तो s अन्य s2
किसी भी रूप में पार्स किया जा सकता है
यदि a है तो आरंभ करें यदि b है तो s समाप्त करें अन्यथा s2
या जैसे
यदि a तो आरंभ यदि b तो s अन्यथा s2 समाप्त
इस पर निर्भर करता है कि क्या else
पहले से जुड़ा है if
या दूसरा if
.
इसे विभिन्न भाषाओं में विभिन्न तरीकों से हल किया जाता है। कभी-कभी व्याकरण को संशोधित किया जाता है ताकि यह स्पष्ट हो, जैसे कि इसकी आवश्यकता होती है endif
कथन या कथन करना else
अनिवार्य। अन्य मामलों में व्याकरण को अस्पष्ट छोड़ दिया जाता है, लेकिन समग्र वाक्यांश व्याकरण को संदर्भ-संवेदनशील बनाकर अस्पष्टता का समाधान किया जाता है, जैसे कि किसी को संबद्ध करके else
निकटतम के साथ if
. इस बाद वाले मामले में व्याकरण अस्पष्ट है, लेकिन संदर्भ-मुक्त व्याकरण अस्पष्ट है।
अनेक व्युत्पत्तियों वाला स्पष्ट व्याकरण
एक ही स्ट्रिंग की एकाधिक व्युत्पत्तियों का अस्तित्व यह इंगित करने के लिए पर्याप्त नहीं है कि व्याकरण अस्पष्ट है; केवल एकाधिक बाईं ओर की व्युत्पत्तियाँ (या, समकक्ष, एकाधिक पार्स वृक्ष) अस्पष्टता का संकेत देती हैं।
उदाहरण के लिए, सरल व्याकरण
एस → ए + ए ए → 0 | 1
भाषा के लिए स्पष्ट व्याकरण है { 0+0, 0+1, 1+0, 1+1 }। हालाँकि इन चार तारों में से प्रत्येक में केवल बाईं ओर की व्युत्पत्ति है, उदाहरण के लिए, इसकी दो अलग-अलग व्युत्पत्तियाँ हैं
एस संदर्भ-मुक्त व्याकरण#नियम अनुप्रयोग|⇒ ए + ए ⇒ 0 + ए ⇒ 0 + 0
और
एस ⇒ ए + ए ⇒ ए + 0 ⇒ 0 + 0
केवल पूर्व व्युत्पत्ति ही सबसे बाईं ओर है।
अस्पष्ट व्याकरणों को पहचानना
एक मनमाना व्याकरण अस्पष्ट है या नहीं इसकी निर्णय समस्या अनिर्णीत समस्या है क्योंकि यह दिखाया जा सकता है कि यह पोस्ट पत्राचार समस्या के बराबर है।[4] कम से कम, संदर्भ-मुक्त व्याकरणों की अस्पष्टता का पता लगाने के लिए कुछ अर्ध-निर्णायक | अर्ध-निर्णय प्रक्रिया को लागू करने वाले उपकरण मौजूद हैं।[5] संदर्भ-मुक्त व्याकरण को पार्स करने की दक्षता इसे स्वीकार करने वाले ऑटोमेटन द्वारा निर्धारित की जाती है। नियतात्मक संदर्भ-मुक्त व्याकरण नियतात्मक पुशडाउन ऑटोमेटा द्वारा स्वीकार किए जाते हैं और इन्हें रैखिक समय में पार्स किया जा सकता है, उदाहरण के लिए एलआर पार्सर द्वारा।[6] वे संदर्भ-मुक्त व्याकरणों का सख्त उपसमूह हैं, जिन्हें पुशडाउन ऑटोमेटा द्वारा स्वीकार किया जाता है और बहुपद समय में पार्स किया जा सकता है, उदाहरण के लिए CYK एल्गोरिदम द्वारा।
असंदिग्ध संदर्भ-मुक्त व्याकरण गैर-नियतात्मक हो सकते हैं। उदाहरण के लिए, 0 और 1 की वर्णमाला पर सम-लंबाई वाले विलोमपद की भाषा में स्पष्ट संदर्भ-मुक्त व्याकरण S → 0S0 | 1एस1 | ε. इस भाषा की मनमानी स्ट्रिंग को पहले उसके सभी प्रतीकों को पढ़े बिना पार्स नहीं किया जा सकता है, जिसका अर्थ है कि पुशडाउन ऑटोमेटन को अर्ध-पार्स की गई स्ट्रिंग की विभिन्न संभावित लंबाई को समायोजित करने के लिए वैकल्पिक राज्य परिवर्तनों का प्रयास करना होगा।[7] फिर भी, व्YACC रण की अस्पष्टता को दूर करने से नियतात्मक संदर्भ-मुक्त व्याकरण उत्पन्न हो सकता है और इस प्रकार अधिक कुशल पार्सिंग की अनुमति मिल सकती है। वाईएसीसी जैसे कंपाइलर जनरेटर में कुछ प्रकार की अस्पष्टता को हल करने की विशेषताएं शामिल हैं, जैसे कि प्राथमिकता और सहयोगीता बाधाओं का उपयोग करना।
स्वाभाविक रूप से अस्पष्ट भाषाएँ
जबकि कुछ संदर्भ-मुक्त भाषाएँ (स्ट्रिंग का सेट जो व्याकरण द्वारा उत्पन्न किया जा सकता है) में अस्पष्ट और स्पष्ट व्याकरण दोनों होते हैं, वहीं संदर्भ-मुक्त भाषाएँ मौजूद होती हैं जिनके लिए कोई भी स्पष्ट संदर्भ-मुक्त व्याकरण मौजूद नहीं हो सकता है। ऐसी भाषाओं को स्वाभाविक रूप से अस्पष्ट कहा जाता है।
कोई स्वाभाविक रूप से अस्पष्ट नियमित भाषाएँ नहीं हैं।[8][9] स्वाभाविक रूप से अस्पष्ट संदर्भ-मुक्त भाषाओं का अस्तित्व 1961 में रोहित जीवणलाल पारीख द्वारा एमआईटी शोध रिपोर्ट में पारिख के प्रमेय के साथ सिद्ध किया गया था।[10] भाषा स्वाभाविक रूप से अस्पष्ट है.[11] ओग्डेन की लेम्मा[12] यह साबित करने के लिए इस्तेमाल किया जा सकता है कि कुछ संदर्भ-मुक्त भाषाएँ, जैसे , स्वाभाविक रूप से अस्पष्ट हैं। प्रमाण के लिए ओग्डेन की लेम्मा#अंतर्निहित अस्पष्टता देखें।
का संघ साथ स्वाभाविक रूप से अस्पष्ट है. यह सेट संदर्भ-मुक्त है, क्योंकि दो संदर्भ-मुक्त भाषाओं का मिलन हमेशा संदर्भ-मुक्त होता है। लेकिन Hopcroft & Ullman (1979) इस बात का प्रमाण दें कि इस संघ भाषा के लिए कोई भी संदर्भ-मुक्त व्याकरण रूप के तारों को स्पष्ट रूप से पार्स नहीं कर सकता है .[13] अधिक उदाहरण, और संदर्भ-मुक्त भाषाओं की अंतर्निहित अस्पष्टता को साबित करने के लिए तकनीकों की सामान्य समीक्षा, बैसिनो और निकौड (2011) द्वारा दी गई है।[14]
यह भी देखें
- जीएलआर पार्सर, अस्पष्ट और गैर-नियतात्मक व्याकरणों के लिए प्रकार का पार्सर
- चार्ट पार्सर, अस्पष्ट व्याकरण के लिए अन्य प्रकार का पार्सर
- वाक्यात्मक अस्पष्टता
संदर्भ
- ↑ Willem J. M. Levelt (2008). औपचारिक भाषाओं और ऑटोमेटा के सिद्धांत का एक परिचय. John Benjamins Publishing. ISBN 978-90-272-3250-2.
- ↑ Scott, Elizabeth (April 1, 2008). "प्रारंभिक पहचानकर्ताओं से एसपीपीएफ-शैली पार्सिंग". Electronic Notes in Theoretical Computer Science. 203 (2): 53–67. doi:10.1016/j.entcs.2008.03.044.
- ↑ Tomita, Masaru. "An efficient augmented-context-free parsing algorithm." Computational linguistics 13.1-2 (1987): 31-46.
- ↑ Hopcroft, John; Motwani, Rajeev; Ullman, Jeffrey (2001). Introduction to automata theory, languages, and computation (2nd ed.). Addison-Wesley. Theorem 9.20, pp. 405–406. ISBN 0-201-44124-1.
- ↑ Axelsson, Roland; Heljanko, Keijo; Lange, Martin (2008). "वृद्धिशील SAT सॉल्वर का उपयोग करके संदर्भ-मुक्त व्याकरण का विश्लेषण" (PDF). Proceedings of the 35th International Colloquium on Automata, Languages and Programming (ICALP'08), Reykjavik, Iceland. Lecture Notes in Computer Science. Vol. 5126. Springer-Verlag. pp. 410–422. doi:10.1007/978-3-540-70583-3_34. ISBN 978-3-540-70582-6.
- ↑ Knuth, D. E. (July 1965). "भाषाओं के बाएँ से दाएँ अनुवाद पर". Information and Control. 8 (6): 607–639. doi:10.1016/S0019-9958(65)90426-2.
- ↑ Hopcroft, John; Motwani, Rajeev; Ullman, Jeffrey (2001). Introduction to automata theory, languages, and computation (2nd ed.). Addison-Wesley. pp. 249–253. ISBN 0-201-44124-1.
- ↑ Book, R.; Even, S.; Greibach, S.; Ott, G. (Feb 1971). "रेखांकन और अभिव्यक्ति में अस्पष्टता". IEEE Transactions on Computers. C-20 (2): 149–153. doi:10.1109/t-c.1971.223204. ISSN 0018-9340. S2CID 20676251.
- ↑ "formal languages - Can regular expressions be made unambiguous?". MathOverflow (in English). Retrieved 2023-02-23.
- ↑ Parikh, Rohit (January 1961). भाषा उत्पन्न करने वाले उपकरण. Quarterly Progress Report, Research Laboratory of Electronics, MIT.
- ↑ Parikh, Rohit J. (1966-10-01). "प्रसंग-मुक्त भाषाओं पर". Journal of the ACM. 13 (4): 570–581. doi:10.1145/321356.321364. ISSN 0004-5411. S2CID 12263468. Here: Theorem 3.
- ↑ Ogden, William (Sep 1968). "अंतर्निहित अस्पष्टता साबित करने के लिए एक उपयोगी परिणाम". Mathematical Systems Theory. 2 (3): 191–194. doi:10.1007/bf01694004. ISSN 0025-5661. S2CID 13197551.
- ↑ p.99-103, Sect.4.7
- ↑ Fredérique Bassino and Cyril Nicaud (December 16, 2011). "Philippe Flajolet & Analytic Combinatorics: Inherent Ambiguity of Context-Free Languages" (PDF). Archived (PDF) from the original on 2022-09-25.
- Gross, Maurice (September 1964). "Inherent ambiguity of minimal linear grammars". Information and Control. 7 (3): 366–368. doi:10.1016/S0019-9958(64)90422-X.
- Michael, Harrison (1978). Introduction to Formal Language Theory. Addison-Wesley. ISBN 0201029553.
- Hopcroft, John E.; Ullman, Jeffrey D. (1979). Introduction to Automata Theory, Languages, and Computation (1st ed.). Addison-Wesley. ISBN 9780201029888.
- Hopcroft, John; Motwani, Rajeev; Ullman, Jeffrey (2001). Introduction to Automata Theory, Languages and Computation (2nd ed.). Addison Wesley. pp. 217. ISBN 9780201441246.
- Brabrand, Claus; Giegerich, Robert; Møller, Anders (March 2010). "Analyzing Ambiguity of Context-Free Grammars". Science of Computer Programming. Elsevier. 75 (3): 176–191. CiteSeerX 10.1.1.86.3118. doi:10.1016/j.scico.2009.11.002.
टिप्पणियाँ
बाहरी संबंध
- dk.brics.grammar - a grammar ambiguity analyzer.
- CFGAnalyzer - tool for analyzing context-free grammars with respect to language universality, ambiguity, and similar properties.