बाईटकोड
कार्यक्रम निष्पादन |
---|
सामान्य अवधारणाएँ |
कोड के प्रकार |
संकलन रणनीतियाँ |
उल्लेखनीय रनटाइम्स |
|
उल्लेखनीय संकलक और टूलचेन |
|
बाइटकोड (जिसे पोर्टेबल कोड या पी-कोड भी कहा जाता है[citation needed]) एक सॉफ्टवेयर इंटरप्रेटर (कंप्यूटिंग) द्वारा कुशल निष्पादन के लिए डिज़ाइन किए गए निर्देश सेट का एक रूप है। मानव-पठनीय कोड [1]स्रोत कोड के विपरीत, बाइटकोड संक्षिप्त संख्यात्मक कोड, स्थिरांक और संदर्भ (सामान्य रूप से संख्यात्मक व्याख्यान) होते हैं जो प्रोग्राम वस्तुओ के प्रकार, स्कोप और नेस्टिंग डेप्थ जैसी चीजों का शब्दार्थ विश्लेषण (संकलक) करते हैं।
बायटेकोड नाम निर्देश सेट से उत्पन्न होता है जिसमें एक-बाइट ऑपकोड होता है जिसके बाद वैकल्पिक पैरामीटर होते हैं। दुभाषिया (कंप्यूटर सॉफ्टवेयर) को आसान बनाने के लिए प्रोग्रामिंग भाषा कार्यान्वयन द्वारा इंटरमीडिएट प्रतिनिधित्व जैसे बायटेकोड आउटपुट हो सकता है, या इसका उपयोग विभिन्न उपकरणों पर समान कोड को क्रॉस-प्लेटफ़ॉर्म चलाने की अनुमति देकर हार्डवेयर और ऑपरेटिंग सिस्टम निर्भरता को कम करने के लिए किया जा सकता है। बायटेकोड को अधिकांशतः या तो सीधे एक आभासी मशीन (एक पी-कोड मशीन, यानी, दुभाषिया) पर निष्पादित किया जा सकता है, या इसे बेहतर प्रदर्शन के लिए मशीन कोड में आगे संकलित किया जा सकता है।
चूंकि बायटेकोड निर्देश सॉफ्टवेयर द्वारा संसाधित किए जाते हैं, वे मनमाने ढंग से जटिल हो सकते हैं, परंतु फिर भी अधिकांशतः पारंपरिक हार्डवेयर निर्देशों के समान होते हैं: वर्चुअल स्टैक मशीनें सबसे साधारण हैं, परंतु वर्चुअल रजिस्टर मशीनें भी बनाई गई हैं।[2][3] अभिलक्ष्य प्रतिरूपक के समान, अलग-अलग खंडों को अधिकांशतः अलग-अलग फ़ाइलों में संग्रहीत किया जा सकता है, परंतु निष्पादन के समय गतिशील रूप से लोड किया जाता है।
निष्पादन
एक बायटेकोड प्रोग्राम को एक बार में एक निर्देश को पदव्याख्या करके और सीधे निष्पादित किया जा सकता है। इस प्रकार का बाइटकोड दुभाषिया बहुत पोर्टेबल है। कुछ प्रणालियाँ, जिन्हें डायनेमिक ट्रांसलेटर या जस्ट-इन-टाइम (JIT) कंपाइलर कहा जाता है, रनटाइम पर आवश्यकतानुसार मशीन कोड में बायटेकोड का अनुवाद करती हैं। वर्चुअल मशीन को हार्डवेयर-विशिष्ट बनाता है मं बायटेकोड की पोर्टेबिलिटी को नहीं खोता है। उदाहरण के लिए, जावा (प्रोग्रामिंग भाषा) और स्मॉलटाक कोड को सामान्यतः जेआईटी को निष्पादन से पहले बाइटकोड को मशीन कोड में अनुवाद करने के लिए संकलित किया जाता है। यह एक प्रोग्राम चलाने से पहले देरी का परिचय देता है, जब बायटेकोड को देशी मशीन कोड में संकलित किया जाता है, परंतु सीधे स्रोत कोड की व्याख्या करने की तुलना में निष्पादन की गति में पर्याप्त संशोधन होता है, सामान्य रूप से परिमाण के एक क्रम (10x) के आसपास होता है। [4]
इसके प्रदर्शन लाभ के कारण, आज कई भाषा कार्यान्वयन प्रोग्राम को दो चरणों में निष्पादित करते हैं, पहले स्रोत कोड को बायटेकोड में संकलित करते हैं, और फिर बायटेकोड को वर्चुअल मशीन में पास करते हैं। जावा (प्रोग्रामिंग लैंग्वेज), राकू (प्रोग्रामिंग भाषा), पायथन (प्रोग्रामिंग लैंग्वेज), PHP, के लिए इस तरह की बायटेकोड आधारित वर्चुअल मशीनें हैं।[lower-alpha 1] Tcl, AWK और Forth (प्रोग्रामिंग लैंग्वेज) के लिए इस प्रकार की बायटेकोड आधारित वर्चुअल मशीनें हैं (चूंकि, फोर्थ को संभवतया ही कभी इस तरह से बायटेकोड के माध्यम से संकलित किया जाता है, और इसकी वर्चुअल मशीन इसके अतिरिक्त अधिक सामान्य है)। पर्ल और रूबी (प्रोग्रामिंग भाषा) 1.8 का कार्यान्वयन इसके अतिरिक्त स्रोत कोड से प्राप्त एक अमूर्त सिंटैक्स ट्री प्रतिनिधित्व को चलाकर काम करता है।
हाल ही में, V8 (जावास्क्रिप्ट इंजन)[1]और डार्ट (प्रोग्रामिंग भाषा)[7]के लेखकों ने इस धारणा को चुनौती दी है कि तेजी से और कुशल वीएम कार्यान्वयन के लिए इंटरमीडिएट बायटेकोड की आवश्यकता है। ये दोनों भाषा कार्यान्वयन वर्तमान में JIT संकलन को स्रोत कोड से मशीन कोड तक बिना किसी बायटेकोड मध्यस्थ के करते हैं।[8]
उदाहरण
- एक्शन स्क्रिप्ट वर्चुअल मशीन (एवीएम) में निष्पादित होता है, जो फ्लैश प्लेयर और अडोबे एयर का हिस्सा है। एक्शनस्क्रिप्ट कोड सामान्यतः एक कंपाइलर द्वारा बायटेकोड प्रारूप में बदल दिया जाता है। संकलक के उदाहरणों में एक एडोब फ्लैश प्रोफेशनल में निर्मित और एक एडोब फ्लैश बिल्डर में निर्मित और एडोब फ्लेक्स एसडीके में उपलब्ध है।
- एडोब फ्लैश ऑब्जेक्ट्स
BANCStar प्रोग्रामिंग भाषा लैंग्वेज, मूल रूप से एक इंटरफेस-बिल्डिंग टूल के लिए बायटेकोड लेकिन एक भाषा के रूप में भी इस्तेमाल किया जाता है
- बर्कले पैकेट फ़िल्टर
- बर्कले पास्कल[9]
- बाइट कोड इंजीनियरिंग लाइब्रेरी
- सी टू जावा वर्चुअल मशीन कंपाइलर
- [[सामान्य CLISP]] का सीएलआईएसपी कार्यान्वयन कई वर्षों तक केवल बाईटेकोड में संकलन करता था; हालाँकि, अब यह GNU लाइटनिंग की मदद से देशी कोड के संकलन का भी समर्थन करता है
- कॉमन लिस्प के सीएमयूसीएल और साइनीर कॉमन लिस्प कार्यान्वयन या तो मूल कोड या बायटेकोड के लिए संकलित कर सकते हैं, जो कहीं अधिक कॉम्पैक्ट है
- सामान्य मध्यवर्ती भाषा को सामान्य भाषा रनटाइम द्वारा निष्पादित किया जाता है, जिसका उपयोग .NET भाषाओं जैसे C Sharp (प्रोग्रामिंग लैंग्वेज) द्वारा किया जाता है। C#
- Dalvik (सॉफ़्टवेयर) बायटेकोड, जिसे Android (ऑपरेटिंग सिस्टम) प्लेटफ़ॉर्म के लिए डिज़ाइन किया गया है, Dalvik (सॉफ़्टवेयर) द्वारा निष्पादित किया जाता है
- इनफर्नो (ऑपरेटिंग सिस्टम) के लिए डिज़ाइन किया गया डिस बायटेकोड, डिस वर्चुअल मशीन द्वारा निष्पादित किया जाता है
- एफिल (प्रोग्रामिंग भाषा) प्रोग्रामिंग भाषा के लिए एफिलस्टूडियो
- EM, एम्स्टर्डम संकलक किट वर्चुअल मशीन का उपयोग मध्यवर्ती संकलन भाषा और आधुनिक बायटेकोड भाषा के रूप में किया जाता है
- Emacs एक टेक्स्ट एडिटर है, जिसके अधिकांश कार्य Emacs Lisp द्वारा कार्यान्वित किए जाते हैं, इसकी लिस्प (प्रोग्रामिंग भाषा) की अंतर्निहित बोली है। इन सुविधाओं को बायटेकोड में संकलित किया गया है। यह आर्किटेक्चर उपयोगकर्ताओं को उच्च स्तरीय भाषा के साथ संपादक को अनुकूलित करने की अनुमति देता है, जो बायटेकोड में संकलित करने के बाद उचित प्रदर्शन देता है।
- कॉमन लिस्प का एम्बेड करने योग्य सामान्य लिस्प इम्प्लीमेंटेशन बायटेकोड या सी कोड को कंपाइल कर सकता है
- कॉमन लिस्प प्रदान करता है a
disassemble
समारोह[10] जो किसी निर्दिष्ट फ़ंक्शन के अंतर्निहित कोड को मानक आउटपुट पर प्रिंट करता है। नतीजा कार्यान्वयन-निर्भर है और बाइटकोड को हल कर सकता है या नहीं भी कर सकता है। इसका निरीक्षण डिबगिंग और अनुकूलन उद्देश्यों के लिए उपयोग किया जा सकता है।[11] स्टील बैंक कॉमन लिस्प, उदाहरण के लिए, उत्पादन करता है:
<वाक्यविन्यास प्रकाश लैंग = लिस्प> (अलग करना '(लैम्ब्डा (एक्स) (प्रिंट एक्स)))
- (लैम्ब्डा (एक्स)) के लिए disassembly
- 2436F6DF
- 850500000F22 टेस्ट EAX, [#x220F0000]; नो-आर्ग-पार्सिंग प्रवेश बिंदु
- E5
- 8BD6 MOV EDX, ESI
- E7
- 8B05A8F63624 MOV EAX, [#x2436F6A8]; #<प्रिंट के लिए FDEFINITION वस्तु>
- ईडी
- B904000000 MOV ECX, 4
- F2
- FF7504 पुश DWORD PTR [EBP+4]
- F5
- FF6005 JMP DWORD PTR [EAX+5]
- F8
- CC0A BREAK 10; त्रुटि जाल
- एफए
- 02 बाइट #X02
- एफबी
- 18 बाइट #X18; अमान्य-आर्ग-गणना-त्रुटि
- एफसी
- 4F बाइट #X4F ; ईसीएक्स
</वाक्यविन्यास हाइलाइट>
- एरलैंग (प्रोग्रामिंग भाषा) का एरिक्सन कार्यान्वयन बीईएएम बाइटकोड का उपयोग करता है
- Ethereum की वर्चुअल मशीन (ईवीएम) एथेरियम (स्मार्ट कॉन्ट्रैक्ट्स) में लेनदेन निष्पादन के लिए अपने स्वयं के बायटेकोड का उपयोग करते हुए रनटाइम वातावरण है।
- चिह्न (प्रोग्रामिंग भाषा)[12]और यूनिकॉन (प्रोग्रामिंग भाषा)[13]प्रोग्रामिंग भाषा
- इन्फोकॉम ने अपने सॉफ्टवेयर अनुप्रयोगों को और अधिक पोर्टेबल बनाने के लिए जेड-मशीन का इस्तेमाल किया
- जावा बाइटकोड, जिसे जावा वर्चुअल मशीन द्वारा निष्पादित किया जाता है
- ऑब्जेक्टवेब एएसएम
- बीसीईएल
- जावसवादी
- कीको बायटेकोड का उपयोग ओबेरोन -2 प्रोग्रामिंग भाषा द्वारा इसे और ओबेरॉन ऑपरेटिंग सिस्टम को और अधिक पोर्टेबल बनाने के लिए किया गया।
- कीबी (कमांड), एमएस-डॉस/पीसी डॉस कीबोर्ड ड्राइवर अपनी संसाधन फ़ाइल के साथ कीबोर्ड.एसवाईएस जिसमें लेआउट जानकारी और शॉर्ट पी-कोड मशीन|पी-कोड अनुक्रम निवासी ड्राइवर के अंदर एक दुभाषिया द्वारा निष्पादित होता है।[14][15]* एलएलवीएम और
- LSL, आभासी दुनिया में उपयोग की जाने वाली एक स्क्रिप्टिंग भाषा वर्चुअल मशीन पर चलने वाले बायटेकोड में संकलित होती है। सेकंड लाइफ का मूल मोनो संस्करण है, Inworldz ने Phlox संस्करण विकसित किया है।
- लुआ (प्रोग्रामिंग भाषा) भाषा एक रजिस्टर-आधारित बायटेकोड वर्चुअल मशीन का उपयोग करती है
- MATLAB भाषा का एम-कोड[16]*Malbolge त्रिगुट आभासी मशीन के लिए एक गूढ़ प्रोग्रामिंग भाषा मशीन भाषा है।
- पी-कोड मशीन#माइक्रोसॉफ्ट पी-कोड|विजुअल सी ++ और विजुअल बेसिक (क्लासिक) में प्रयुक्त माइक्रोसॉफ्ट पी-कोड
- मल्टीप्लान[17]* बीसीपीएल प्रोग्रामिंग भाषा का ओ-कोड
- OCaml भाषा वैकल्पिक रूप से कॉम्पैक्ट बायटेकोड फॉर्म में संकलित होती है
- पी-कोड मशीन | पास्कल (प्रोग्रामिंग भाषा) भाषा के यूसीएसडी पास्कल कार्यान्वयन का पी-कोड
- तोता आभासी मशीन
- ऑपरेटिंग सिस्टम चुनें को डेटा बेसिक या मल्टीवैल्यू#मल्टीवैल्यू डेटाबेसिक भी कहा जाता है
- आआर (प्रोग्रामिंग भाषा) कंपाइलर पैकेज के माध्यम से एक बायटेकोड कंपाइलर प्रदान करता है, जो अब आर संस्करण 2.13.0 के साथ मानक है। R के इस संस्करण को संकलित करना संभव है ताकि आधार और अनुशंसित पैकेज इसका फायदा उठा सकें।[18]* पिरामिड 2000 साहसिक खेल
- पायथन (प्रोग्रामिंग लैंग्वेज) स्क्रिप्ट्स को पाइथन की बायटेकोड लैंग्वेज के निष्पादन पर संकलित किया जा रहा है, और संकलित फाइलों (.pyc) को स्क्रिप्ट के फोल्डर के अंदर कैश किया जाता है।
निम्न-स्तरीय बायटेकोड को डिबग करने के लिए एक अंतर्निहित टूल का उपयोग करके संकलित कोड का विश्लेषण और जांच की जा सकती है। टूल को शेल से इनिशियलाइज़ किया जा सकता है, उदाहरण के लिए: <वाक्यविन्यास लैंग = पिकॉन> >>> इम्पोर्ट डिस # डिस - पायथन बाइट कोड के डिस्सेम्बलर को मेमोनिक्स में। >>> डिस.डिस ('प्रिंट (हैलो, वर्ल्ड!)')
1 0 LOAD_NAME 0 (प्रिंट) 2 LOAD_CONST 0 ('हैलो, वर्ल्ड!') 4 कॉल_फंक्शन 1 6 RETURN_VALUE
</वाक्यविन्यास हाइलाइट>
- योजना 48 बायटेकोड दुभाषिया का उपयोग करके योजना का कार्यान्वयन
- स्मॉलटाक भाषा के कई कार्यान्वयनों के बायटेकोड
- पैरलैक्स प्रोपेलर#बिल्ट इन स्पिन बायटेकोड इंटरप्रेटर पैरालैक्स, इंक. (कंपनी) प्रोपेलर microcontroller में निर्मित
- SQLite डेटाबेस इंजन SQL कथनों को पहले से आरक्षित बाइट-कोड प्रारूप में अनुवादित करता है।[19]*एप्पल स्वीट 16
- टीसीएल
- IBM i#TIMI का उपयोग IBM i प्लेटफ़ॉर्म पर कंपाइलर्स द्वारा किया जाता है।
- टाइनी बेसिक#वर्चुअल मशीन में कार्यान्वयन
- विजुअल फॉक्सप्रो बायटेकोड में संकलित करता है
- Webविधानसभा
- YARV और Rubinius रूबी के लिए (प्रोग्रामिंग भाषा)
- ZCODE
यह भी देखें
- मध्यम प्रतिनिधित्व
- प्लेटफ़ॉर्म (कंप्यूटिंग)
- रनटाइम सिस्टम
टिप्पणियाँ
- ↑ PHP has just-in-time compilation in PHP 8,[5][6] and before while not on in the default version, had options like HHVM. For older versions of PHP: Although PHP opcodes are generated each time the program is launched, and are always interpreted and not just-in-time compiled.
संदर्भ
- ↑ 1.0 1.1 "Dynamic Machine Code Generation". Google Inc.
- ↑ "The Implementation of Lua 5.0". (NB. This involves a register-based virtual machine.)
- ↑ "Dalvik VM". Archived from the original on 2013-05-18. Retrieved 2012-10-29. (NB. This VM is register based.)
- ↑ "Byte Code Vs Machine Code". www.allaboutcomputing.net. Retrieved 2017-10-23.
- ↑ O’Phinney, Matthew Weier. "Exploring the New PHP JIT Compiler". Zend by Perforce (in English). Retrieved 2021-02-19.
- ↑ "PHP 8: The JIT - stitcher.io". stitcher.io (in English). Retrieved 2021-02-19.
- ↑ Loitsch, Florian. "Why Not a Bytecode VM?". Google. Archived from the original on 2013-05-12.
- ↑ "JavaScript myth: JavaScript needs a standard bytecode". 2ality.com.
- ↑ G., Adam Y. (2022-07-11). "बर्कले पास्कल". GitHub. Retrieved 2022-01-08.
- ↑ "सीएलएचएस: फंक्शन डिस्सेम्बल". www.lispworks.com.
- ↑ "प्रदर्शन ट्यूनिंग और टिप्स". lispcookbook.github.io.
- ↑ "The Implementation of the Icon Programming Language" (PDF). Archived from the original (PDF) on 2016-03-05. Retrieved 2011-09-09.
- ↑ "The Implementation of Icon and Unicon a Compendium" (PDF). Archived (PDF) from the original on 2022-10-09.
- ↑ Paul, Matthias R. (2001-12-30). "KEYBOARD.SYS internal structure". Newsgroup: comp.os.msdos.programmer. Archived from the original on 2017-09-09. Retrieved 2016-09-17.
[…] In fact, the format is basically the same in MS-DOS 3.3 - 8.0, PC DOS 3.3 - 2000, including Russian, Lithuanian, Chinese and Japanese issues, as well as in Windows NT, 2000, and XP […]. There are minor differences and incompatibilities, but the general format has not changed over the years. […] Some of the data entries contain normal tables […] However, most entries contain executable code interpreted by some kind of p-code interpreter at *runtime*, including conditional branches and the like. This is why the KEYB driver has such a huge memory footprint compared to table-driven keyboard drivers which can be done in 3 - 4 Kb getting the same level of function except for the interpreter. […]
- ↑ Mendelson, Edward (2001-07-20). "How to Display the Euro in MS-DOS and Windows DOS". Display the euro symbol in full-screen MS-DOS (including Windows 95 or Windows 98 full-screen DOS). Archived from the original on 2016-09-17. Retrieved 2016-09-17.
[…] Matthias [R.] Paul […] warns that the IBM PC DOS version of the keyboard driver uses some internal procedures that are not recognized by the Microsoft driver, so, if possible, you should use the IBM versions of both KEYB.COM and KEYBOARD.SYS instead of mixing Microsoft and IBM versions […]
(NB. What is meant by "procedures" here are some additional bytecodes in the IBM KEYBOARD.SYS file not supported by the Microsoft version of the KEYB driver.) - ↑ "United States Patent 6,973,644".
- ↑ Microsoft C Pcode Specifications. p. 13.
Multiplan wasn't compiled to machine code, but to a kind of byte-code which was run by an interpreter, in order to make Multiplan portable across the widely varying hardware of the time. This byte-code distinguished between the machine-specific floating point format to calculate on, and an external (standard) format, which was binary coded decimal (BCD). The PACK and UNPACK instructions converted between the two.
- ↑ "R Installation and Administration". cran.r-project.org.
- ↑ "The SQLite Bytecode Engine". Archived from the original on 2017-04-14. Retrieved 2016-08-29.