लेक्स (सॉफ्टवेयर)
Original author(s) | Mike Lesk, Eric Schmidt |
---|---|
Initial release | 1975 |
Written in | C |
Operating system | Unix, Unix-like, Plan 9 |
Platform | Cross-platform |
Type | Command |
License | Plan 9: MIT License |
लेक्स एक कंप्यूटर प्रोग्राम है जो लेक्सिकल विश्लेषण उत्पन्न करता है
लेक्स सामान्यतः याक पार्सर जनरेटर के साथ उपयोग किया जाता है।[1] लेक्स, माइक लेस्क और एरिक श्मिट द्वारा पहले लिखा गया था और 1975 में वर्णित किया गया था। यह कई यूनिक्स सिस्टमों पर मानक शब्दिक विश्लेषक जेनरेटर है, और पॉज़िक्स मानक का हिस्सा के रूप में एक समकक्ष उपकरण निर्दिष्ट किया गया है।[2][3] लेक्स एक इनपुट स्ट्रीम को पढ़ता है जिसमें शब्दिक विश्लेषक को निर्दिष्ट किया गया होता है और सी प्रोग्रामिंग भाषा में शब्दिक विश्लेषक को कार्यान्वित करने वाला स्रोत कोड लिखता है।
[4]कुछ पुराने संस्करणों में लेक्स रैटफोर में भी शब्दिक विश्लेषक उत्पन्न कर सकता था।
खुला स्रोत
हालांकि मूल रूप से मालिकाना सॉफ्टवेयर के रूप में वितरित किया गया, लेक्स के कुछ संस्करण अब खुला स्रोत सॉफ्टवेयर | ओपन-सोर्स हैं। मूल मालिकाना कोड के आधार पर लेक्स के ओपन-सोर्स संस्करण अब ओपन-सोर्स ऑपरेटिंग सिस्टम जैसे ओपनसोलर और बेल लैब्स से प्लान 9 के साथ वितरित किए जाते हैं। लेक्स का एक लोकप्रिय ओपन-सोर्स संस्करण, जिसे फ्लेक्स लेक्सिकल विश्लेषक या फास्ट लेक्सिकल एनालाइजर कहा जाता है, मालिकाना कोडिंग से नहीं लिया गया है।
एक लेक्स फ़ाइल की संरचना
एक लेक्स फ़ाइल की संरचना जानबूझकर एक याक फ़ाइल के समान होती है: फ़ाइलों को तीन खंडों में विभाजित किया जाता है, जो लाइनों से अलग होते हैं जिनमें केवल दो प्रतिशत संकेत होते हैं:
- परिभाषा अनुभाग मैक्रो (कंप्यूटर विज्ञान) को परिभाषित करता है और सी (प्रोग्रामिंग भाषा) में लिखी गई हेडर फाइल को आयात करता है। यहां किसी भी सी कोड को लिखना भी संभव है, जिसे उत्पन्न स्रोत फ़ाइल में शब्दशः कॉपी किया जाएगा।
- नियम अनुभाग नियमित अभिव्यक्ति पैटर्न को C बयान (प्रोग्रामिंग) से जोड़ता है। जब लेक्सर किसी दिए गए पैटर्न से मेल खाते इनपुट में टेक्स्ट देखता है, तो यह संबंधित सी कोड को निष्पादित करेगा।
- C कोड सेक्शन में C स्टेटमेंट और समारोह (प्रोग्रामिंग) होते हैं जिन्हें उत्पन्न स्रोत फ़ाइल में शब्दशः कॉपी किया जाता है। इन बयानों में संभावित रूप से नियम अनुभाग में नियमों द्वारा बुलाए गए कोड होते हैं। बड़े कार्यक्रमों में इस कोड को संकलक समय में लिंक की गई एक अलग फ़ाइल में रखना अधिक सुविधाजनक होता है।
एक लेक्स फ़ाइल का उदाहरण
निम्नलिखित लेक्स के फ्लेक्स लेक्सिकल एनालाइज़र संस्करण के लिए एक उदाहरण लेक्स फ़ाइल है। यह इनपुट में संख्याओं (सकारात्मक पूर्णांक) के तार को पहचानता है, और बस उन्हें प्रिंट करता है।
/*** Definition section ***/
%{
/* C code to be copied verbatim */
#include <stdio.h>
%}
%%
/*** Rules section ***/
/* [0-9]+ matches a string of one or more digits */
[0-9]+ {
/* yytext is a string containing the matched text. */
printf("Saw an integer: %s\n", yytext);
}
.|\n { /* Ignore all other characters. */ }
%%
/*** C Code section ***/
int main(void)
{
/* Call the lexer, then quit. */
yylex();
return 0;
}
अगर यह इनपुट दिया जाता है flex
, यह एक सी फाइल में परिवर्तित हो जाएगा, lex.yy.c
. इसे निष्पादन योग्य में संकलित किया जा सकता है जो पूर्णांक के तारों से मेल खाता है और आउटपुट करता है। उदाहरण के लिए, इनपुट दिया गया:
abc123z.!&*2gj6
कार्यक्रम प्रिंट करेगा:
एक पूर्णांक देखा: 123 एक पूर्णांक देखा: 2 एक पूर्णांक देखा: 6
अन्य प्रोग्रामिंग टूल्स के साथ लेक्स का उपयोग करना
पार्सर जेनरेटर के साथ लेक्स का उपयोग करना
लेक्स और पार्सर जनरेटर, जैसे Yacc या GNU बायसन, आमतौर पर एक साथ उपयोग किए जाते हैं। पार्सर जेनरेटर एक इनपुट स्ट्रीम को पार्स करने के लिए एक औपचारिक व्याकरण का उपयोग करते हैं, कुछ ऐसा जो लेक्स सरल नियमित अभिव्यक्तियों का उपयोग करके नहीं कर सकता, क्योंकि लेक्स सरल परिमित राज्य मशीन तक सीमित है।[clarification needed]
आमतौर पर एक पार्सर होना बेहतर होता है, उदाहरण के लिए Yacc द्वारा उत्पन्न एक, टोकन की एक धारा (एक टोकन-स्ट्रीम) को इनपुट के रूप में स्वीकार करता है, बजाय सीधे वर्णों की एक धारा (एक वर्ण-धारा) को संसाधित करने के लिए। इस तरह के टोकन-स्ट्रीम का उत्पादन करने के लिए अक्सर लेक्स का उपयोग किया जाता है।
स्कैनर रहित पार्सिंग एक अलग लेक्सर के बिना सीधे इनपुट कैरेक्टर-स्ट्रीम को पार्स करने के लिए संदर्भित करता है।
लेक्स और बनाओ
बनाओ (सॉफ्टवेयर) एक उपयोगिता है जिसका उपयोग लेक्स से जुड़े कार्यक्रमों को बनाए रखने के लिए किया जा सकता है। मान लें कि एक फ़ाइल जिसका एक्सटेंशन है .l
एक लेक्स स्रोत फ़ाइल है। आंतरिक मैक्रो बनाएं LFLAGS
मेक द्वारा स्वचालित रूप से लागू किए जाने वाले लेक्स विकल्पों को निर्दिष्ट करने के लिए उपयोग किया जा सकता है।[5]
यह भी देखें
- फ्लेक्स लेक्सिकल एनालाइजर
- हाँ
- रागल
- प्लाई (पायथन लेक्स-वाईएसीसी)
- पार्सर जेनरेटर की तुलना
संदर्भ
- ↑ Levine, John R.; Mason, Tony; Brown, Doug (1992). लेक्स और याक (2 ed.). O'Reilly. pp. 1–2. ISBN 1-56592-000-7.
- ↑ Levine, John (August 2009). फ्लेक्स और बाइसन. O'Reilly Media. p. 304. ISBN 978-0-596-15597-1.
- ↑ The Open Group Base Specifications Issue 7, 2018 edition § Shell & Utilities § Utilities § lex
- ↑ John R. Levine; John Mason; Doug Brown (1992). लेक्स और Yacc. O'Reilly.
- ↑ "make". The Open Group Base Specifications. The IEEE and The Open Group (6). 2004. IEEE Std 1003.1, 2004 Edition.
बाहरी संबंध
- Using Flex and Bison at Macworld.com
- Solaris 10 User Commands Reference Manual –
- Plan 9 Programmer's Manual, Volume 1 –