प्रतीक तालिका
कंप्यूटर विज्ञान में, एक प्रतीक तालिका एक भाषा अनुवादक द्वारा उपयोग की जाने वाली डेटा संरचना है जैसे कि एक संकलक या दुभाषिया, जहां प्रत्येक पहचानकर्ता (या प्रतीक), स्थिरांक, प्रक्रिया और कार्यक्रम के स्रोत कोड में कार्य इसकी घोषणा से संबंधित जानकारी से जुड़ा होता है या स्रोत में उपस्थिति। दूसरे शब्दों में, एक प्रतीक तालिका की प्रविष्टियाँ प्रविष्टि के संबंधित प्रतीक से संबंधित जानकारी को संग्रहीत करती हैं। [1]
पृष्ठभूमि
एक प्रतीक तालिका केवल अनुवाद प्रक्रिया के दौरान स्मृति में उपस्थित हो सकती है, या इसे अनुवाद के आउटपुट में सन्निहित किया जा सकता है, जैसे बाद में उपयोग के लिए अनुप्रयोग बाइनरी अंतरपृष्ठ वस्तु फ़ाइल में। उदाहरण के लिए, इसका उपयोग पारस्परिक डिबगर के दौरान या किसी प्रोग्राम के निष्पादन (कंप्यूटर) के दौरान या उसके बाद निदानकारी रिपोर्ट को प्रारूपित करने के लिए एक संसाधन के रूप में किया जा सकता है।[1]
विवरण
एक अनुवादक और मध्यवर्ती प्रतिनिधित्व (आईआर) द्वारा उपयोग की जाने वाली प्रतीक तालिका में निहित न्यूनतम जानकारी में प्रतीक का नाम और उसका स्थान या पता सम्मिलित है। रीलोकेटेबिलिटी की अवधारणा के साथ एक प्लेटफॉर्म को लक्षित करने वाले अनुभाषक के लिए, इसमें रीलोकैटेबिलिटी विशेषता (पूर्ण, स्थानांतरित करने योग्य, आदि) और रिलोकेटेबल प्रतीकों के लिए आवश्यक स्थानांतरण जानकारी भी सम्मिलित होगी। उच्च-स्तरीय प्रोग्रामिंग भाषाओं के लिए प्रतीक सारणी प्रतीक के प्रकार को संग्रहीत कर सकती हैं: स्ट्रिंग, पूर्णांक, फ़्लोटिंग-पॉइंट इत्यादि, इसका आकार, और इसके आयाम और इसकी सीमाएं। यह सारी जानकारी आउटपुट फ़ाइल में सम्मिलित नहीं है, लेकिन डिबगिंग में उपयोग के लिए प्रदान की जा सकती है। कई मामलों में, प्रतीक की प्रति-संदर्भ जानकारी प्रतीक तालिका के साथ संग्रहीत या उससे जुड़ी होती है। अधिकांश अनुभाषक इस जानकारी के कुछ या सभी को अनुवाद के अंत में प्रतीक तालिका और प्रति संदर्भ लिस्टिंग में प्रिंट करते हैं।[2]
कार्यान्वयन
तालिकाओं को लागू करने के लिए कई डेटा संरचनाएँ उपलब्ध हैं। प्रतीक तालिका को लागू करने के लिए ट्री, लीनियर लिस्ट और स्व-आयोजन सूची का इस्तेमाल किया जा सकता है। एक अनुभाषक के अधिकांश चरणों में प्रतीक तालिका का उपयोग किया जाता है, लेक्सिकल विश्लेषण से शुरू होता है, और अनुकूलन के माध्यम से जारी रहता है।
एक अनुभाषक सभी प्रतीकों के लिए एक बड़ी प्रतीक तालिका का उपयोग कर सकता है या अलग-अलग कार्यक्षेत्र(प्रोग्रामिंग) के लिए अलग-अलग, श्रेणीबद्ध प्रतीक तालिकाओं का उपयोग कर सकता है। उदाहरण के लिए, अल्गोल या पीएल/आई जैसी एक दायरे वाली भाषा में एक प्रतीक p को अलग-अलग प्रक्रियाओं में अलग-अलग घोषित किया जा सकता है, शायद अलग-अलग विशेषताओं के साथ। प्रत्येक घोषणा का दायरा कार्यक्रम का वह भाग है जिसमें p के संदर्भ उस घोषणा को हल करते हैं। प्रत्येक घोषणा एक विशिष्ट पहचानकर्ता p का प्रतिनिधित्व करती है। प्रतीक तालिका में भिन्न p s के संदर्भों को विभेदित करने के कुछ साधन होने चाहिए।
प्रतीक तालिकाओं को लागू करने के लिए उपयोग की जाने वाली एक सामान्य डेटा संरचना हैश तालिका है। हैश तालिका में खोज का समय तालिका में संग्रहीत तत्वों की संख्या से स्वतंत्र है, इसलिए यह बड़ी संख्या में तत्वों के लिए कुशल है। यह हैश कुंजी की गणना में वर्गीकरण को सम्मिलित करके सारणीबद्ध प्रारूप में शाब्दिक वर्गीकरण को भी सरल करता है।[3]
जैसा कि लेक्सिकल एनालाइजर अपने समय का एक बड़ा हिस्सा प्रतीक तालिका को देखने में खर्च करता है, इस गतिविधि का अनुभाषक की समग्र गति पर महत्वपूर्ण प्रभाव पड़ता है। एक प्रतीक तालिका को इस तरह व्यवस्थित किया जाना चाहिए कि प्रविष्टियों को जितनी जल्दी हो सके पाया जा सके। हैश तालिका का उपयोग आमतौर पर एक प्रतीक तालिका को व्यवस्थित करने के लिए किया जाता है, जहां सरणी सबस्क्रिप्ट बनाने के लिए कीवर्ड या पहचानकर्ता 'हैश' होता है। कंपाइलर्स में मौलिक बिल्डिंग ब्लॉक्स होते हैं जो कोड की शुद्धता, निष्पादन, संसाधनों के आवंटन और ऐसे कई अन्य कार्यों की जांच करने में मदद करते हैं। प्रतीक तालिका एक डेटा संरचना है जिसका उपयोग अनुभाषक डिज़ाइन में किया जाता है। संकलक प्रतीक तालिका में चर नाम, फ़ंक्शन नाम, ऑब्जेक्ट, क्लास और इंटरफ़ेस सहित विभिन्न संस्थाओं की घटना का ट्रैक रखते हैं। एक संकलक की प्रतीक तालिका का उपयोग विश्लेषण और संश्लेषण प्रक्रियाओं के लिए किया जाता है। हैश टकराव एक हैश तालिका में अपरिहार्य हैं, और उन्हें संभालने का एक सामान्य तरीका तालिका में अगले उपलब्ध खाली स्थान में समानार्थी को स्टोर करना है। एक संकलक को केवल थोड़ी मात्रा में डेटा को संसाधित करने की आवश्यकता होती है, प्रतीक तालिका को एक अनियंत्रित सूची के रूप में लागू किया जा सकता है, जो कोड के लिए सरल है लेकिन केवल छोटी तालिकाओं के लिए काम करता है। प्रतीक तालिका बनाने के लिए निम्नलिखित विधियों का उपयोग किया जा सकता है।
अनुप्रयोग
एक ऑब्जेक्ट फ़ाइल में उन पहचानकर्ताओं की एक प्रतीक तालिका होगी जो इसमें सम्मिलित हैं जो बाहरी रूप से दिखाई दे रहे हैं। विभिन्न ऑब्जेक्ट फ़ाइलों को जोड़ने के दौरान, एक लिंकर (कंप्यूटिंग) इन प्रतीक संदर्भों की पहचान करेगा और उनका समाधान करेगा। आमतौर पर सभी अपरिभाषित बाहरी प्रतीकों को एक या अधिक पुस्तकालय (कम्प्यूटिंग) में खोजा जाएगा। यदि कोई मॉड्यूल पाया जाता है जो उस प्रतीक को परिभाषित करता है तो यह पहली ऑब्जेक्ट फ़ाइल के साथ जुड़ा हुआ है, और किसी भी अपरिभाषित बाहरी पहचानकर्ता को पहचानकर्ताओं की सूची में जोड़ा जाता है। यह प्रक्रिया तब तक जारी रहती है जब तक कि सभी बाहरी संदर्भ हल नहीं हो जाते। यदि प्रक्रिया के अंत में एक या अधिक अनसुलझे रहते हैं तो यह एक त्रुटि है।
जबकि रिवर्स इंजीनियरिंग एक निष्पादन योग्य है, कई उपकरण वैश्विक चर और ज्ञात कार्यों के लिए कौन से पते निर्दिष्ट किए गए हैं, यह जांचने के लिए प्रतीक तालिका का संदर्भ लेते हैं। यदि प्रतीक तालिका को पट्टी(यूनिक्स) कर दिया गया है या निष्पादन योग्य में परिवर्तित होने से पहले साफ कर दिया गया है, तो टूल को पते निर्धारित करने या प्रोग्राम के बारे में कुछ भी समझने में कठिनाई होगी।
उदाहरण
C (प्रोग्रामिंग भाषा ) में लिखे गए निम्नलिखित प्रोग्राम पर विचार करें:
// Declare an external function
extern double bar(double x);
// Define a public function
double foo(int count)
{
double sum = 0.0;
// Sum all the values bar(1) to bar(count)
for (int i = 1; i <= count; i++)
sum += bar((double) i);
return sum;
}
एसी अनुभाषक जो इस code को पार्स करता है उसमें कम से कम निम्न प्रतीक तालिका प्रविष्टियां होंगी:
प्रतीक नाम | प्रकार | क्षेत्र |
---|---|---|
bar |
function, double | extern |
x |
double | function parameter |
foo |
function, double | global |
count |
int | function parameter |
sum |
double | block local |
i |
int | for-loop statement |
इसके अतिरिक्त, प्रतीक तालिका में मध्यवर्ती अभिव्यक्ति मूल्यों के लिए संकलक द्वारा उत्पन्न प्रविष्टियाँ भी हो सकती हैं (उदाहरण के लिए, वह अभिव्यक्ति जो i
लूप वेरिएबल में a double
, और कार्य करने के लिए कॉल का वापसी मान bar()
), कथन लेबल, इत्यादि।
उदाहरण:एसआईएसवी एबीआई
पता | प्रकार | नाम |
---|---|---|
00000020 | a | T_BIT |
00000040 | a | F_BIT |
00000080 | a | I_BIT |
20000004 | t | irqvec |
20000008 | t | fiqvec |
2000000c | t | InitReset |
20000018 | T | _main |
20000024 | t | End |
20000030 | T | AT91F_US3_CfgPIO_useB |
2000005c | t | AT91F_PIO_CfgPeriph |
200000b0 | T | main |
20000120 | T | AT91F_DBGU_Printk |
20000190 | t | AT91F_US_TxReady |
200001c0 | t | AT91F_US_PutChar |
200001f8 | T | AT91F_SpuriousHandler |
20000214 | T | AT91F_DataAbort |
20000230 | T | AT91F_FetchAbort |
2000024c | T | AT91F_Undef |
20000268 | T | AT91F_UndefHandler |
20000284 | T | AT91F_LowLevelInit |
200002e0 | t | AT91F_DBGU_CfgPIO |
2000030c | t | AT91F_PIO_CfgPeriph |
20000360 | t | AT91F_US_Configure |
200003dc | t | AT91F_US_SetBaudrate |
2000041c | t | AT91F_US_Baudrate |
200004ec | t | AT91F_US_SetTimeguard |
2000051c | t | AT91F_PDC_Open |
2000059c | t | AT91F_PDC_DisableRx |
200005c8 | t | AT91F_PDC_DisableTx |
200005f4 | t | AT91F_PDC_SetNextTx |
20000638 | t | AT91F_PDC_SetNextRx |
2000067c | t | AT91F_PDC_SetTx |
200006c0 | t | AT91F_PDC_SetRx |
20000704 | t | AT91F_PDC_EnableRx |
20000730 | t | AT91F_PDC_EnableTx |
2000075c | t | AT91F_US_EnableTx |
20000788 | T | __aeabi_uidiv |
20000788 | T | __udivsi3 |
20000884 | T | __aeabi_uidivmod |
2000089c | T | __aeabi_idiv0 |
2000089c | T | __aeabi_ldiv0 |
2000089c | T | __div0 |
200009a0 | D | _data |
200009a0 | A | _etext |
200009a4 | A | __bss_end__ |
200009a4 | A | __bss_start |
200009a4 | A | __bss_start__ |
200009a4 | A | _edata |
200009a4 | A | _end |
एसआईएसवी एप्लिकेशन बाइनरी अंतरपृष्ठ (एबीआई) विनिर्देश में प्रतीक तालिका का एक उदाहरण पाया जा सकता है, जो यह अनिवार्य करता है कि प्रतीक (प्रोग्रामिंग) को बाइनरी फ़ाइल में कैसे रखा जाए, ताकि विभिन्न अनुवादक, लिंकर और लोडर सभी लगातार खोज सकें और संकलित वस्तु में प्रतीकों के साथ काम करें।
SysV एबीआई को जीएनयू बाइनरी यूटिलिटीज|जीएनयू बिनुटिल्स एनएम (यूनिक्स) यूटिलिटी में लागू किया गया है। यह प्रारूप एक क्रमबद्ध स्मृति पता फ़ील्ड, एक प्रतीक प्रकार फ़ील्ड और एक प्रतीक पहचानकर्ता (जिसे नाम कहा जाता है) का उपयोग करता है।[4]
SysV एबीआई (और nm के आउटपुट) में प्रतीक प्रकार प्रतीक तालिका में प्रत्येक प्रविष्टि की प्रकृति को इंगित करते हैं। प्रत्येक प्रतीक प्रकार को एक वर्ण द्वारा दर्शाया जाता है। उदाहरण के लिए, आरंभिक डेटा का प्रतिनिधित्व करने वाली प्रतीक तालिका प्रविष्टियाँ वर्ण d द्वारा निरूपित की जाती हैं और फ़ंक्शंस के लिए प्रतीक तालिका प्रविष्टियों में प्रतीक प्रकार t होता है (क्योंकि निष्पादन योग्य कोड किसी ऑब्जेक्ट फ़ाइल के पाठ अनुभाग में स्थित होता है)। इसके अतिरिक्त, प्रतीक प्रकार का पूंजीकरण लिंकेज के प्रकार को इंगित करता है: लोअर-केस अक्षरों से संकेत मिलता है कि प्रतीक स्थानीय है और अपर-केस बाहरी (वैश्विक) लिंकेज को इंगित करता है।
उदाहरण: पायथन प्रतीक तालिका
पायथन (प्रोग्रामिंग भाषा ) प्रोग्रामिंग भाषा में प्रतीक तालिका बनाने और युक्तियोजित करने के लिए व्यापक समर्थन सम्मिलित है।[5] जिन गुणों की पूछताछ की जा सकती है उनमें सम्मिलित है कि क्या दिया गया प्रतीक एक मुक्त चर या बाध्य चर है, चाहे वह ब्लॉक स्कोप या वैश्विक कार्यक्षेत्र है, चाहे वह आयात किया गया हो, और यह किस नामस्थान से संबंधित है।
उदाहरण: गतिशील प्रतीक सारणी
कुछ प्रोग्रामिंग भाषा प्रतीक तालिका को रन-टाइम में युक्तियोजित करने की अनुमति देती हैं, ताकि प्रतीक को किसी भी समय जोड़ा जा सके। रैकेट(प्रोग्रामिंग भाषा) ऐसी भाषा का एक उदाहरण है।[6]
एलआईएसपी और स्कीम (प्रोग्रामिंग भाषा ) प्रोग्रामिंग भाषा दोनों ही प्रत्येक प्रतीक के साथ मनमाने, सामान्य गुणों को जोड़ने की अनुमति देती हैं।[7]
प्रोलॉग प्रोग्रामिंग भाषा अनिवार्य रूप से एक प्रतीक-तालिका हेरफेर भाषा है; प्रतीकों को परमाणु कहा जाता है, और प्रतीकों के बीच संबंधों पर तर्क दिया जा सकता है। इसी तरह, OpenCog एक गतिशील प्रतीक तालिका प्रदान करता है, जिसे एटमस्पेस कहा जाता है, जिसका उपयोग ज्ञान प्रतिनिधित्व के लिए किया जाता है।
यह भी देखें
संदर्भ
- ↑ Nguyen, Binh (2004). Linux Dictionary. p. 1482. Retrieved Apr 14, 2018.
- ↑ Copper & Torczon 2011, p. 253.
- ↑ Copper & Torczon 2011, p. 254.
- ↑ "nm". sourceware.org. Retrieved May 30, 2020.
- ↑ symtable — Python documentation
- ↑ Symbols - Racket Documentation
- ↑ Symbols - Guile Documentation
ग्रन्थसूची
- Copper, Keith D.; Torczon, Linda (18 January 2011). Engineering a Compiler (2 ed.). Houston, Texas: Elsevier, Rice University. doi:10.1016/C2009-0-27982-7. ISBN 978-0-12-088478-0. S2CID 40425497.