बूटस्ट्रैपिंग (संकलक): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{Short description|Process of writing a self-compiling compiler}}
{{Short description|Process of writing a self-compiling compiler}}
[[कंप्यूटर विज्ञान]] में, बूटस्ट्रैपिंग एक [[स्व-होस्टिंग ([[संकलक]])]]संकलक) बनाने की तकनीक है। सेल्फ-कंपाइलिंग संकलक - यानी, एक संकलक (या असेंबली भाषा#असेंबलर) जिसे सोर्स [[प्रोग्रामिंग भाषा]] में लिखा जाता है जिसे वह कंपाइल करना चाहता है। संकलक का प्रारंभिक कोर संस्करण ("बूटस्ट्रैप संकलक") एक अलग भाषा में उत्पन्न होता है (जो असेंबली भाषा हो सकती है); भाषा के इस न्यूनतम उपसमुच्चय का उपयोग करके संकलक के क्रमिक विस्तारित संस्करण विकसित किए गए हैं। स्व-संकलन संकलक को संकलित करने की समस्या को संकलक डिजाइन में [[मुर्गी या अंडा]]|चिकन-या-अंडे की समस्या कहा गया है, और बूटस्ट्रैपिंग इस समस्या का समाधान है।<ref>{{cite journal|last=Reynolds|first=John H.|date=December 2003|department=CCSC: Eastern Conference|issue=2|journal=Journal of Computing Sciences in Colleges|pages=175–181|title=Bootstrapping a self-compiling compiler from machine X to machine Y|url=https://dl.acm.org/doi/10.5555/948785.948811|volume=19|quote=The idea of a compiler written in the language it compiles stirs up the old 'chicken-or-the-egg' conundrum: Where does the first one come from?}}</ref><ref>{{cite conference|last=Glück|first=Robert|editor1-last=Clarke|editor1-first=Edmund|editor2-last=Virbitskaite|editor2-first=Irina|editor3-last=Voronkov|editor3-first=Andrei|contribution=Bootstrapping compiler generators from partial evaluators|doi=10.1007/978-3-642-29709-0_13|pages=125–141|publisher=Springer|series=Lecture Notes in Computer Science|title=Perspectives of Systems Informatics: 8th International Andrei Ershov Memorial Conference, PSI 2011, Novosibirsk, Russia, June 27 – July 1, 2011, Revised Selected Papers|volume=7162|year=2012|quote=Getting started presents the chicken-and-egg problem familiar from compiler construction: one needs a compiler to bootstrap a compiler, and bootstrapping compiler generators is no exception.}}</ref>
[[कंप्यूटर विज्ञान]] में '''बूटस्ट्रैपिंग''', स्व-होस्टिंग [[संकलक]] बनाने की तकनीक है। सेल्फ-संकलकिंग संकलक - यानी, संकलक विधानसभा भाषा कोडांतरक) जिसे स्रोत [[प्रोग्रामिंग भाषा]] में लिखा जाता है जिसे वह संकलक करना चाहता है। संकलक का प्रारंभिक कोर संस्करण ("बूटस्ट्रैप संकलक") अलग भाषा में उत्पन्न होता है (जो विधानसभा भाषा हो सकती है); भाषा के इस न्यूनतम उपसमुच्चय का उपयोग करके संकलक के क्रमिक विस्तारित संस्करण विकसित किए गए हैं। स्व-संकलन संकलक को संकलित करने की समस्या को संकलक डिजाइन में [[मुर्गी या अंडा]]|चिकन-या-अंडे की समस्या कहा गया है, और बूटस्ट्रैपिंग इस समस्या का समाधान है।<ref>{{cite journal|last=Reynolds|first=John H.|date=December 2003|department=CCSC: Eastern Conference|issue=2|journal=Journal of Computing Sciences in Colleges|pages=175–181|title=Bootstrapping a self-compiling compiler from machine X to machine Y|url=https://dl.acm.org/doi/10.5555/948785.948811|volume=19|quote=The idea of a compiler written in the language it compiles stirs up the old 'chicken-or-the-egg' conundrum: Where does the first one come from?}}</ref><ref>{{cite conference|last=Glück|first=Robert|editor1-last=Clarke|editor1-first=Edmund|editor2-last=Virbitskaite|editor2-first=Irina|editor3-last=Voronkov|editor3-first=Andrei|contribution=Bootstrapping compiler generators from partial evaluators|doi=10.1007/978-3-642-29709-0_13|pages=125–141|publisher=Springer|series=Lecture Notes in Computer Science|title=Perspectives of Systems Informatics: 8th International Andrei Ershov Memorial Conference, PSI 2011, Novosibirsk, Russia, June 27 – July 1, 2011, Revised Selected Papers|volume=7162|year=2012|quote=Getting started presents the chicken-and-egg problem familiar from compiler construction: one needs a compiler to bootstrap a compiler, and bootstrapping compiler generators is no exception.}}</ref>
[[बुनियादी]], [[ALGOL|ऐल्गॉल]], C (प्रोग्रामिंग भाषा), C Sharp (प्रोग्रामिंग भाषा) | C, D (प्रोग्रामिंग भाषा), [[पास्कल (प्रोग्रामिंग भाषा)]], PL/I, [[हास्केल]], मोडुला के लिए संकलक सहित कई प्रोग्रामिंग भाषा के लिए कई संकलक बूटस्ट्रैप्ड हैं। -2, [[ओबेरॉन (प्रोग्रामिंग भाषा)]], [[OCaml]], [[सामान्य लिस्प]], स्कीम (प्रोग्रामिंग भाषा), [[जाओ (प्रोग्रामिंग भाषा)]], [[जावा (प्रोग्रामिंग भाषा)]], [[अमृत ​​​​(प्रोग्रामिंग भाषा)]], [[जंग (प्रोग्रामिंग भाषा)]], पायथन (प्रोग्रामिंग भाषा), [[स्काला (प्रोग्रामिंग भाषा)]], [[निम (प्रोग्रामिंग भाषा)]], एफिल (प्रोग्रामिंग भाषा), [[टाइपप्रति]], [[वाला (प्रोग्रामिंग लैंग्वेज)|वाला (प्रोग्रामिंग भाषा)]], [[ज़िग (प्रोग्रामिंग भाषा)]] और बहुत कुछ।
[[बुनियादी]], [[ALGOL|ऐल्गॉल]], सी (प्रोग्रामिंग भाषा), सी Sharp (प्रोग्रामिंग भाषा) | सी, D (प्रोग्रामिंग भाषा), [[पास्कल (प्रोग्रामिंग भाषा)]], PL/I, [[हास्केल]], मोडुला के लिए संकलक सहित कई प्रोग्रामिंग भाषा के लिए कई संकलक बूटस्ट्रैप्ड हैं। -2, [[ओबेरॉन (प्रोग्रामिंग भाषा)]], [[OCaml|Oसीaml]], [[सामान्य लिस्प]], स्कीम (प्रोग्रामिंग भाषा), [[जाओ (प्रोग्रामिंग भाषा)]], [[जावा (प्रोग्रामिंग भाषा)]], [[अमृत ​​​​(प्रोग्रामिंग भाषा)]], [[जंग (प्रोग्रामिंग भाषा)]], पायथन (प्रोग्रामिंग भाषा), [[स्काला (प्रोग्रामिंग भाषा)]], [[निम (प्रोग्रामिंग भाषा)]], एफिल (प्रोग्रामिंग भाषा), [[टाइपप्रति]], [[वाला (प्रोग्रामिंग लैंग्वेज)|वाला (प्रोग्रामिंग भाषा)]], [[ज़िग (प्रोग्रामिंग भाषा)]] और बहुत कुछ।


== प्रक्रिया ==
== प्रक्रिया ==
एक विशिष्ट बूटस्ट्रैप प्रक्रिया तीन या चार चरणों में काम करती है:<ref name=gcc>{{cite web |title=Installing GCC: Building |url=https://gcc.gnu.org/install/build.html |website=GNU Project - Free Software Foundation (FSF)}}</ref><ref>{{cite web |title=rust-lang/rust: bootstrap |url=https://github.com/rust-lang/rust/tree/master/src/bootstrap |website=GitHub |language=en}}</ref><ref>{{cite web |title=Advanced Build Configurations — LLVM 10 documentation |url=https://llvm.org/docs/AdvancedBuilds.html#stage-non-determinism |website=llvm.org}}</ref>
विशिष्ट बूटस्ट्रैप प्रक्रिया तीन या चार चरणों में काम करती है:<ref name=gcc>{{cite web |title=Installing GCC: Building |url=https://gcc.gnu.org/install/build.html |website=GNU Project - Free Software Foundation (FSF)}}</ref><ref>{{cite web |title=rust-lang/rust: bootstrap |url=https://github.com/rust-lang/rust/tree/master/src/bootstrap |website=GitHub |language=en}}</ref><ref>{{cite web |title=Advanced Build Configurations — LLVM 10 documentation |url=https://llvm.org/docs/AdvancedBuilds.html#stage-non-determinism |website=llvm.org}}</ref>
* स्टेज 0: बूटस्ट्रैप संकलक के साथ काम करने के लिए एक वातावरण तैयार करना। यहीं पर बूटस्ट्रैप संकलक की सोर्स भाषा और आउटपुट भाषा को चुना जाता है। एक [[नंगे मशीन]] के मामले में (जहां किसी भी भाषा के लिए कोई संकलक मौजूद नहीं है) स्रोत और आउटपुट को बाइनरी [[मशीन कोड]] के रूप में लिखा जाता है, या लक्ष्य के अलावा किसी अन्य मशीन पर [[क्रॉस कंपाइलर|क्रॉस संकलक]] द्वारा बनाया जा सकता है। अन्यथा, बूटस्ट्रैप संकलक को प्रोग्रामिंग भाषाओं में से एक में लिखा जाना है जो लक्ष्य मशीन पर मौजूद है, और वह संकलक कुछ ऐसा उत्पन्न करेगा जो लक्ष्य पर निष्पादित हो सकता है, जिसमें [[उच्च स्तरीय प्रोग्रामिंग भाषा]], एक असेंबली भाषा, एक वस्तु शामिल है। फ़ाइल, या मशीन कोड भी।
* स्टेज 0: बूटस्ट्रैप संकलक के साथ काम करने के लिए वातावरण तैयार करना। यहीं पर बूटस्ट्रैप संकलक की स्रोत भाषा और आउटपुट भाषा को चुना जाता है। [[नंगे मशीन]] के मामले में (जहां किसी भी भाषा के लिए कोई संकलक मौजूद नहीं है) स्रोत और आउटपुट को बाइनरी [[मशीन कोड]] के रूप में लिखा जाता है, या लक्ष्य के अलावा किसी अन्य मशीन पर [[क्रॉस कंपाइलर|क्रॉस संकलक]] द्वारा बनाया जा सकता है। अन्यथा, बूटस्ट्रैप संकलक को प्रोग्रामिंग भाषाओं में से में लिखा जाना है जो लक्ष्य मशीन पर मौजूद है, और वह संकलक कुछ ऐसा उत्पन्न करेगा जो लक्ष्य पर निष्पादित हो सकता है, जिसमें [[उच्च स्तरीय प्रोग्रामिंग भाषा]], विधानसभा भाषा, वस्तु शामिल है। फ़ाइल, या मशीन कोड भी।
* स्टेज 1: बूटस्ट्रैप संकलक तैयार किया जाता है। यह संकलक अपने स्रोत को एक प्रोग्राम में अनुवाद करने के लिए पर्याप्त है जिसे लक्षित मशीन पर निष्पादित किया जा सकता है। इस बिंदु पर, बूटस्ट्रैप संकलक द्वारा परिभाषित भाषा का उपयोग करके आगे का विकास किया जाता है, और चरण 2 शुरू होता है।
* स्टेज 1: बूटस्ट्रैप संकलक तैयार किया जाता है। यह संकलक अपने स्रोत को प्रोग्राम में अनुवाद करने के लिए पर्याप्त है जिसे लक्षित मशीन पर निष्पादित किया जा सकता है। इस बिंदु पर, बूटस्ट्रैप संकलक द्वारा परिभाषित भाषा का उपयोग करके आगे का विकास किया जाता है, और चरण 2 शुरू होता है।
* स्टेज 2: बूटस्ट्रैप संकलक द्वारा एक पूर्ण संकलक तैयार किया जाता है। यह आमतौर पर आवश्यकतानुसार चरणों में किया जाता है, उदा। भाषा के संस्करण X के लिए संकलक, संस्करण X+1 से सुविधाओं को संकलित करने में सक्षम होगा, लेकिन वह संकलक वास्तव में उन सुविधाओं का उपयोग नहीं करता है। एक बार इस संकलक का परीक्षण हो जाने के बाद और खुद को संकलित कर सकता है, अब संस्करण X + 1 सुविधाओं का उपयोग संकलक के बाद के रिलीज द्वारा किया जा सकता है।
* स्टेज 2: बूटस्ट्रैप संकलक द्वारा पूर्ण संकलक तैयार किया जाता है। यह आमतौर पर आवश्यकतानुसार चरणों में किया जाता है, उदा। भाषा के संस्करण X के लिए संकलक, संस्करण X+1 से सुविधाओं को संकलित करने में सक्षम होगा, लेकिन वह संकलक वास्तव में उन सुविधाओं का उपयोग नहीं करता है। बार इस संकलक का परीक्षण हो जाने के बाद और खुद को संकलित कर सकता है, अब संस्करण X + 1 सुविधाओं का उपयोग संकलक के बाद के रिलीज द्वारा किया जा सकता है।
* स्टेज 3: एक फुल संकलक स्टेज 2 फुल संकलक द्वारा तैयार किया जाता है। यदि अधिक सुविधाओं को जोड़ा जाना है, तो बूटस्ट्रैप संकलक की जगह वर्तमान चरण 3 पूर्ण संकलक के साथ, चरण 2 पर काम फिर से शुरू होता है।
* स्टेज 3: फुल संकलक स्टेज 2 फुल संकलक द्वारा तैयार किया जाता है। यदि अधिक सुविधाओं को जोड़ा जाना है, तो बूटस्ट्रैप संकलक की जगह वर्तमान चरण 3 पूर्ण संकलक के साथ, चरण 2 पर काम फिर से शुरू होता है।


दो चरणों के आउटपुट की तुलना करने के लिए पूर्ण संकलक दो बार बनाया गया है। यदि वे भिन्न हैं, तो या तो बूटस्ट्रैप या पूर्ण संकलक में एक बग है।<ref name=gcc/>
दो चरणों के आउटपुट की तुलना करने के लिए पूर्ण संकलक दो बार बनाया गया है। यदि वे भिन्न हैं, तो या तो बूटस्ट्रैप या पूर्ण संकलक में बग है।<ref name=gcc/>




== लाभ ==
== लाभ ==
संकलक को बूटस्ट्रैप करने के निम्नलिखित फायदे हैं:<ref>Compilers and Compiler Generators: An Introduction With C++.  Patrick D. Terry 1997. International Thomson Computer Press. {{ISBN|1-85032-298-8}}</ref><ref name="terry">"Compiler Construction and Bootstrapping" by P.D.Terry 2000. [http://www.oopweb.com/Compilers/Documents/Compilers/Volume/cha03s.htm HTML] {{webarchive|url=https://web.archive.org/web/20091123154911/http://www.oopweb.com/Compilers/Documents/Compilers/Volume/cha03s.htm |date=2009-11-23 }}. [http://webster.cs.ucr.edu/AsmTools/RollYourOwn/CompilerBook/CHAP03.PDF PDF]  {{webarchive|url=https://web.archive.org/web/20101214135219/http://webster.cs.ucr.edu/AsmTools/RollYourOwn/CompilerBook/CHAP03.PDF |date=December 14, 2010 }}.</ref>
संकलक को बूटस्ट्रैप करने के निम्नलिखित फायदे हैं:<ref>Compilers and Compiler Generators: An Introduction With C++.  Patrick D. Terry 1997. International Thomson Computer Press. {{ISBN|1-85032-298-8}}</ref><ref name="terry">"Compiler Construction and Bootstrapping" by P.D.Terry 2000. [http://www.oopweb.com/Compilers/Documents/Compilers/Volume/cha03s.htm HTML] {{webarchive|url=https://web.archive.org/web/20091123154911/http://www.oopweb.com/Compilers/Documents/Compilers/Volume/cha03s.htm |date=2009-11-23 }}. [http://webster.cs.ucr.edu/AsmTools/RollYourOwn/CompilerBook/CHAP03.PDF PDF]  {{webarchive|url=https://web.archive.org/web/20101214135219/http://webster.cs.ucr.edu/AsmTools/RollYourOwn/CompilerBook/CHAP03.PDF |date=December 14, 2010 }}.</ref>
* यह संकलित की जा रही भाषा का एक गैर-तुच्छ परीक्षण है, और यह अपने कुत्ते के भोजन को खाने का एक रूप है।
* यह संकलित की जा रही भाषा का गैर-तुच्छ परीक्षण है, और यह अपने कुत्ते के भोजन को खाने का रूप है।
* संकलक डेवलपर्स और बग रिपोर्टर्स को केवल संकलित की जा रही भाषा जानने की जरूरत है।
* संकलक डेवलपर्स और बग रिपोर्टर्स को केवल संकलित की जा रही भाषा जानने की जरूरत है।
* संकलित की जा रही उच्च-स्तरीय भाषा में संकलक विकास किया जा सकता है।
* संकलित की जा रही उच्च-स्तरीय भाषा में संकलक विकास किया जा सकता है।
* संकलक के बैक-एंड में सुधार न केवल सामान्य-उद्देश्य वाले कार्यक्रमों में बल्कि स्वयं संकलक में भी सुधार करता है।
* संकलक के बैक-एंड में सुधार न केवल सामान्य-उद्देश्य वाले कार्यक्रमों में बल्कि स्वयं संकलक में भी सुधार करता है।
* यह एक व्यापक स्थिरता जाँच है क्योंकि इसे अपने स्वयं के ऑब्जेक्ट कोड को पुन: पेश करने में सक्षम होना चाहिए।
* यह व्यापक स्थिरता जाँच है क्योंकि इसे अपने स्वयं के ऑब्जेक्ट कोड को पुन: पेश करने में सक्षम होना चाहिए।


ध्यान दें कि इनमें से कुछ बिंदु मानते हैं कि भाषा [[रनटाइम सिस्टम]] भी उसी भाषा में लिखा गया है।
ध्यान दें कि इनमें से कुछ बिंदु मानते हैं कि भाषा [[रनटाइम सिस्टम]] भी उसी भाषा में लिखा गया है।


== तरीके ==
== तरीके ==
यदि किसी को भाषा X में लिखी गई भाषा X के लिए एक संकलक को संकलित करने की आवश्यकता है, तो यह मुद्दा है कि पहले संकलक को कैसे संकलित किया जा सकता है। अभ्यास में उपयोग की जाने वाली विभिन्न विधियों में शामिल हैं:
यदि किसी को भाषा X में लिखी गई भाषा X के लिए संकलक को संकलित करने की आवश्यकता है, तो यह मुद्दा है कि पहले संकलक को कैसे संकलित किया जा सकता है। अभ्यास में उपयोग की जाने वाली विभिन्न विधियों में शामिल हैं:


* भाषा X के लिए भाषा Y में एक [[दुभाषिया (कंप्यूटिंग)]] या संकलक को लागू करना। [[निकोलस विर्थ]] ने बताया कि उन्होंने [[फोरट्रान]] में पहला [[पास्कल प्रोग्रामिंग भाषा]] संकलक लिखा था।<ref>Niklaus Wirth. 2021. 50 years of Pascal. Commun. ACM 64, 3 (March 2021), 39–41. DOI:https://doi.org/10.1145/3447525</ref>
* भाषा X के लिए भाषा Y में [[दुभाषिया (कंप्यूटिंग)]] या संकलक को लागू करना। [[निकोलस विर्थ]] ने बताया कि उन्होंने [[फोरट्रान]] में पहला [[पास्कल प्रोग्रामिंग भाषा]] संकलक लिखा था।<ref>Niklaus Wirth. 2021. 50 years of Pascal. Commun. ACM 64, 3 (March 2021), 39–41. DOI:https://doi.org/10.1145/3447525</ref>
* X के लिए एक अन्य दुभाषिया या संकलक पहले से ही दूसरी भाषा Y में लिखा जा चुका है; इस प्रकार योजना (प्रोग्रामिंग भाषा) को अक्सर बूटस्ट्रैप किया जाता है।
* X के लिए अन्य दुभाषिया या संकलक पहले से ही दूसरी भाषा Y में लिखा जा चुका है; इस प्रकार योजना (प्रोग्रामिंग भाषा) को अक्सर बूटस्ट्रैप किया जाता है।
* संकलक के पहले के संस्करण X के एक सबसेट में लिखे गए थे जिसके लिए कुछ अन्य संकलक मौजूद थे; इस प्रकार जावा (प्रोग्रामिंग भाषा), [[हास्केल (प्रोग्रामिंग भाषा)]] के कुछ सुपरसेट, और शुरुआती [[फ़्री पास्कल]] संकलक बूटस्ट्रैप किए गए हैं।
* संकलक के पहले के संस्करण X के सबसेट में लिखे गए थे जिसके लिए कुछ अन्य संकलक मौजूद थे; इस प्रकार जावा (प्रोग्रामिंग भाषा), [[हास्केल (प्रोग्रामिंग भाषा)]] के कुछ सुपरसेट, और शुरुआती [[फ़्री पास्कल]] संकलक बूटस्ट्रैप किए गए हैं।
* गैर-मानक भाषा एक्सटेंशन या वैकल्पिक भाषा सुविधाओं का समर्थन करने वाला एक संकलक उन एक्सटेंशन और सुविधाओं का उपयोग किए बिना लिखा जा सकता है, ताकि इसे उसी आधार भाषा का समर्थन करने वाले दूसरे संकलक के साथ संकलित किया जा सके, लेकिन एक्सटेंशन और सुविधाओं का एक अलग सेट। [[C++]] संकलक [[बजना]] के मुख्य भाग C++ के एक सबसेट में लिखे गए थे जिन्हें [[g++]] और [[Microsoft Visual C++]] दोनों द्वारा संकलित किया जा सकता है। कुछ GCC एक्सटेंशन के साथ उन्नत सुविधाएँ लिखी गई हैं।
* गैर-मानक भाषा एक्सटेंशन या वैकल्पिक भाषा सुविधाओं का समर्थन करने वाला संकलक उन एक्सटेंशन और सुविधाओं का उपयोग किए बिना लिखा जा सकता है, ताकि इसे उसी आधार भाषा का समर्थन करने वाले दूसरे संकलक के साथ संकलित किया जा सके, लेकिन एक्सटेंशन और सुविधाओं का अलग सेट। [[C++|सी++]] संकलक [[बजना]] के मुख्य भाग सी++ के सबसेट में लिखे गए थे जिन्हें [[g++]] और [[Microsoft Visual C++|माइक्रोसॉफ्ट विजुअल सी++]] दोनों द्वारा संकलित किया जा सकता है। कुछ Gसीसी एक्सटेंशन के साथ उन्नत सुविधाएँ लिखी गई हैं।
* एक्स के लिए संकलक किसी अन्य आर्किटेक्चर से क्रॉस-संकलन है जहां एक्स के लिए एक संकलक मौजूद है; इस प्रकार सी (प्रोग्रामिंग भाषा) के लिए संकलक आमतौर पर अन्य प्लेटफॉर्म पर पोर्ट किए जाते हैं। प्रारंभिक बूटस्ट्रैप के बाद फ्री पास्कल के लिए भी यही तरीका इस्तेमाल किया जाता है।
* एक्स के लिए संकलक किसी अन्य आर्किटेक्चर से क्रॉस-संकलन है जहां एक्स के लिए संकलक मौजूद है; इस प्रकार सी (प्रोग्रामिंग भाषा) के लिए संकलक आमतौर पर अन्य प्लेटफॉर्म पर पोर्ट किए जाते हैं। प्रारंभिक बूटस्ट्रैप के बाद फ्री पास्कल के लिए भी यही तरीका इस्तेमाल किया जाता है।
* एक्स में संकलक लिखना; फिर इसे स्रोत से हाथ से संकलित करना (संभवतः एक गैर-अनुकूलित तरीके से) और अनुकूलित संकलक प्राप्त करने के लिए कोड पर चल रहा है। [[डोनाल्ड नुथ]] ने इसका इस्तेमाल अपने [[WEB]] [[साक्षर प्रोग्रामिंग]] सिस्टम के लिए किया।
* एक्स में संकलक लिखना; फिर इसे स्रोत से हाथ से संकलित करना (संभवतः गैर-अनुकूलित तरीके से) और अनुकूलित संकलक प्राप्त करने के लिए कोड पर चल रहा है। [[डोनाल्ड नुथ]] ने इसका इस्तेमाल अपने [[WEB]] [[साक्षर प्रोग्रामिंग]] सिस्टम के लिए किया।


स्रोत कोड में संकलक्स को वितरित करने के तरीकों में संकलक का एक पोर्टेबल [[बाईटकोड]] संस्करण प्रदान करना शामिल है, ताकि संकलक को अपने साथ संकलित करने की प्रक्रिया को बूटस्ट्रैप किया जा सके। टी-आरेख इन संकलक बूटस्ट्रैप तकनीकों को समझाने के लिए उपयोग किया जाने वाला एक संकेतन है।<ref name="terry"/>कुछ मामलों में, एक सिस्टम पर चलने वाले एक जटिल संकलक को प्राप्त करने का सबसे सुविधाजनक तरीका जिसमें बहुत कम या कोई सॉफ़्टवेयर नहीं है, इसमें कभी अधिक परिष्कृत असेंबलरों और संकलक्स की एक श्रृंखला शामिल होती है।<ref>
स्रोत कोड में संकलक्स को वितरित करने के तरीकों में संकलक का पोर्टेबल [[बाईटकोड]] संस्करण प्रदान करना शामिल है, ताकि संकलक को अपने साथ संकलित करने की प्रक्रिया को बूटस्ट्रैप किया जा सके। टी-आरेख इन संकलक बूटस्ट्रैप तकनीकों को समझाने के लिए उपयोग किया जाने वाला संकेतन है।<ref name="terry"/>कुछ मामलों में, सिस्टम पर चलने वाले जटिल संकलक को प्राप्त करने का सबसे सुविधाजनक तरीका जिसमें बहुत कम या कोई सॉफ़्टवेयर नहीं है, इसमें कभी अधिक परिष्कृत कोडांतरकों और संकलक्स की श्रृंखला शामिल होती है।<ref>
[http://homepage.ntlworld.com/edmund.grimley-evans/bcompiler.html "Bootstrapping a simple compiler from nothing"] {{webarchive |url=https://web.archive.org/web/20100303235322/http://homepage.ntlworld.com/edmund.grimley-evans/bcompiler.html |date=March 3, 2010 }}
[http://homepage.ntlworld.com/edmund.grimley-evans/bcompiler.html "Bootstrapping a simple compiler from nothing"] {{webarchive |url=https://web.archive.org/web/20100303235322/http://homepage.ntlworld.com/edmund.grimley-evans/bcompiler.html |date=March 3, 2010 }}
by Edmund GRIMLEY EVANS 2001</ref>
by Edmund GRIMLEY EVANS 2001</ref>
Line 40: Line 40:
== इतिहास ==
== इतिहास ==
{{Main|संकलक निर्माण का इतिहास}}
{{Main|संकलक निर्माण का इतिहास}}
असेंबलर खुद को बूटस्ट्रैप करने वाले पहले भाषा उपकरण थे।
कोडांतरक खुद को बूटस्ट्रैप करने वाले पहले भाषा उपकरण थे।


ऐसा बूटस्ट्रैप प्रदान करने वाली पहली उच्च-स्तरीय भाषा 1958 में [[NELIAC]] थी। ऐसा करने वाली पहली व्यापक रूप से इस्तेमाल की जाने वाली भाषाएं 1961 में [[बरोज़ B5000]] अल्गोल और 1962 में [[लिस्प प्रोग्रामिंग भाषा]] थीं।
ऐसा बूटस्ट्रैप प्रदान करने वाली पहली उच्च-स्तरीय भाषा 1958 में [[NELIAC|NELIAसी]] थी। ऐसा करने वाली पहली व्यापक रूप से इस्तेमाल की जाने वाली भाषाएं 1961 में [[बरोज़ B5000]] अल्गोल और 1962 में [[लिस्प प्रोग्रामिंग भाषा]] थीं।


हार्ट और लेविन ने 1962 में एमआईटी में एलआईएसपी में एक एलआईएसपी संकलक लिखा, एक मौजूदा एलआईएसपी दुभाषिया के अंदर इसका परीक्षण किया। एक बार जब उन्होंने संकलक को उस बिंदु तक सुधार लिया था जहां वह अपने स्वयं के स्रोत कोड को संकलित कर सकता था, तो यह स्व-होस्टिंग था।<ref name="LEVIN"/>
हार्ट और लेविन ने 1962 में एमआईटी में एलआईएसपी में एलआईएसपी संकलक लिखा, मौजूदा एलआईएसपी दुभाषिया के अंदर इसका परीक्षण किया। बार जब उन्होंने संकलक को उस बिंदु तक सुधार लिया था जहां वह अपने स्वयं के स्रोत कोड को संकलित कर सकता था, तो यह स्व-होस्टिंग था।<ref name="LEVIN"/>


{{blockquote|The compiler as it exists on the standard compiler tape is a machine language program that was obtained by having the [[S-expression]] definition of the compiler work on itself through the interpreter.|AI Memo 39<ref name="LEVIN">{{Cite web| title=AI Memo 39-The new compiler| author=Tim Hart and Mike Levin| url=ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-039.pdf| archive-url=https://web.archive.org/web/20201213195043/ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-039.pdf| url-status=dead| archive-date=2020-12-13| accessdate=2008-05-23}}</ref>}}
{{blockquote|कंपाइलर जैसा कि यह मानक कंपाइलर टेप पर मौजूद है, एक मशीनी भाषा का प्रोग्राम है, जिसे इंटरप्रेटर के माध्यम से कंपाइलर की [[S-एक्सप्रेशन]] परिभाषा द्वारा प्राप्त किया गया था।|एआई मेमो 39<ref name="LEVIN">{{साइट वेब| शीर्षक = एआई मेमो 39-नया संकलक | लेखक = टिम हार्ट और माइक लेविन | url=ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-039.pdf| संग्रह-url=https://web.archive.org/web/20201213195043/ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-039.pdf| यूआरएल-स्थिति = मृत | संग्रह-तारीख=2020-12-13| एक्सेसडेट=2008-05-23}}</ref>}}
यह तकनीक तभी संभव है जब एक दुभाषिया पहले से ही उसी भाषा के लिए मौजूद हो जिसे संकलित किया जाना है। यह इनपुट के रूप में अपने आप में एक प्रोग्राम चलाने की धारणा से सीधे उधार लेता है, जिसका उपयोग [[सैद्धांतिक कंप्यूटर विज्ञान]] में विभिन्न प्रमाणों में भी किया जाता है, जैसे कि सबूत की भिन्नता कि हॉल्टिंग समस्या अनिर्णीत है जो राइस के प्रमेय का उपयोग करती है।
 
यह तकनीक तभी संभव है जब दुभाषिया पहले से ही उसी भाषा के लिए मौजूद हो जिसे संकलित किया जाना है। यह इनपुट के रूप में अपने आप में प्रोग्राम चलाने की धारणा से सीधे उधार लेता है, जिसका उपयोग [[सैद्धांतिक कंप्यूटर विज्ञान]] में विभिन्न प्रमाणों में भी किया जाता है, जैसे कि सबूत की भिन्नता कि हॉल्टिंग समस्या अनिर्णीत है जो राइस के प्रमेय का उपयोग करती है।


== वर्तमान प्रयास ==
== वर्तमान प्रयास ==

Revision as of 01:53, 24 February 2023

कंप्यूटर विज्ञान में बूटस्ट्रैपिंग, स्व-होस्टिंग संकलक बनाने की तकनीक है। सेल्फ-संकलकिंग संकलक - यानी, संकलक विधानसभा भाषा कोडांतरक) जिसे स्रोत प्रोग्रामिंग भाषा में लिखा जाता है जिसे वह संकलक करना चाहता है। संकलक का प्रारंभिक कोर संस्करण ("बूटस्ट्रैप संकलक") अलग भाषा में उत्पन्न होता है (जो विधानसभा भाषा हो सकती है); भाषा के इस न्यूनतम उपसमुच्चय का उपयोग करके संकलक के क्रमिक विस्तारित संस्करण विकसित किए गए हैं। स्व-संकलन संकलक को संकलित करने की समस्या को संकलक डिजाइन में मुर्गी या अंडा|चिकन-या-अंडे की समस्या कहा गया है, और बूटस्ट्रैपिंग इस समस्या का समाधान है।[1][2] बुनियादी, ऐल्गॉल, सी (प्रोग्रामिंग भाषा), सी Sharp (प्रोग्रामिंग भाषा) | सी, D (प्रोग्रामिंग भाषा), पास्कल (प्रोग्रामिंग भाषा), PL/I, हास्केल, मोडुला के लिए संकलक सहित कई प्रोग्रामिंग भाषा के लिए कई संकलक बूटस्ट्रैप्ड हैं। -2, ओबेरॉन (प्रोग्रामिंग भाषा), Oसीaml, सामान्य लिस्प, स्कीम (प्रोग्रामिंग भाषा), जाओ (प्रोग्रामिंग भाषा), जावा (प्रोग्रामिंग भाषा), अमृत ​​​​(प्रोग्रामिंग भाषा), जंग (प्रोग्रामिंग भाषा), पायथन (प्रोग्रामिंग भाषा), स्काला (प्रोग्रामिंग भाषा), निम (प्रोग्रामिंग भाषा), एफिल (प्रोग्रामिंग भाषा), टाइपप्रति, वाला (प्रोग्रामिंग भाषा), ज़िग (प्रोग्रामिंग भाषा) और बहुत कुछ।

प्रक्रिया

विशिष्ट बूटस्ट्रैप प्रक्रिया तीन या चार चरणों में काम करती है:[3][4][5]

  • स्टेज 0: बूटस्ट्रैप संकलक के साथ काम करने के लिए वातावरण तैयार करना। यहीं पर बूटस्ट्रैप संकलक की स्रोत भाषा और आउटपुट भाषा को चुना जाता है। नंगे मशीन के मामले में (जहां किसी भी भाषा के लिए कोई संकलक मौजूद नहीं है) स्रोत और आउटपुट को बाइनरी मशीन कोड के रूप में लिखा जाता है, या लक्ष्य के अलावा किसी अन्य मशीन पर क्रॉस संकलक द्वारा बनाया जा सकता है। अन्यथा, बूटस्ट्रैप संकलक को प्रोग्रामिंग भाषाओं में से में लिखा जाना है जो लक्ष्य मशीन पर मौजूद है, और वह संकलक कुछ ऐसा उत्पन्न करेगा जो लक्ष्य पर निष्पादित हो सकता है, जिसमें उच्च स्तरीय प्रोग्रामिंग भाषा, विधानसभा भाषा, वस्तु शामिल है। फ़ाइल, या मशीन कोड भी।
  • स्टेज 1: बूटस्ट्रैप संकलक तैयार किया जाता है। यह संकलक अपने स्रोत को प्रोग्राम में अनुवाद करने के लिए पर्याप्त है जिसे लक्षित मशीन पर निष्पादित किया जा सकता है। इस बिंदु पर, बूटस्ट्रैप संकलक द्वारा परिभाषित भाषा का उपयोग करके आगे का विकास किया जाता है, और चरण 2 शुरू होता है।
  • स्टेज 2: बूटस्ट्रैप संकलक द्वारा पूर्ण संकलक तैयार किया जाता है। यह आमतौर पर आवश्यकतानुसार चरणों में किया जाता है, उदा। भाषा के संस्करण X के लिए संकलक, संस्करण X+1 से सुविधाओं को संकलित करने में सक्षम होगा, लेकिन वह संकलक वास्तव में उन सुविधाओं का उपयोग नहीं करता है। बार इस संकलक का परीक्षण हो जाने के बाद और खुद को संकलित कर सकता है, अब संस्करण X + 1 सुविधाओं का उपयोग संकलक के बाद के रिलीज द्वारा किया जा सकता है।
  • स्टेज 3: फुल संकलक स्टेज 2 फुल संकलक द्वारा तैयार किया जाता है। यदि अधिक सुविधाओं को जोड़ा जाना है, तो बूटस्ट्रैप संकलक की जगह वर्तमान चरण 3 पूर्ण संकलक के साथ, चरण 2 पर काम फिर से शुरू होता है।

दो चरणों के आउटपुट की तुलना करने के लिए पूर्ण संकलक दो बार बनाया गया है। यदि वे भिन्न हैं, तो या तो बूटस्ट्रैप या पूर्ण संकलक में बग है।[3]


लाभ

संकलक को बूटस्ट्रैप करने के निम्नलिखित फायदे हैं:[6][7]

  • यह संकलित की जा रही भाषा का गैर-तुच्छ परीक्षण है, और यह अपने कुत्ते के भोजन को खाने का रूप है।
  • संकलक डेवलपर्स और बग रिपोर्टर्स को केवल संकलित की जा रही भाषा जानने की जरूरत है।
  • संकलित की जा रही उच्च-स्तरीय भाषा में संकलक विकास किया जा सकता है।
  • संकलक के बैक-एंड में सुधार न केवल सामान्य-उद्देश्य वाले कार्यक्रमों में बल्कि स्वयं संकलक में भी सुधार करता है।
  • यह व्यापक स्थिरता जाँच है क्योंकि इसे अपने स्वयं के ऑब्जेक्ट कोड को पुन: पेश करने में सक्षम होना चाहिए।

ध्यान दें कि इनमें से कुछ बिंदु मानते हैं कि भाषा रनटाइम सिस्टम भी उसी भाषा में लिखा गया है।

तरीके

यदि किसी को भाषा X में लिखी गई भाषा X के लिए संकलक को संकलित करने की आवश्यकता है, तो यह मुद्दा है कि पहले संकलक को कैसे संकलित किया जा सकता है। अभ्यास में उपयोग की जाने वाली विभिन्न विधियों में शामिल हैं:

  • भाषा X के लिए भाषा Y में दुभाषिया (कंप्यूटिंग) या संकलक को लागू करना। निकोलस विर्थ ने बताया कि उन्होंने फोरट्रान में पहला पास्कल प्रोग्रामिंग भाषा संकलक लिखा था।[8]
  • X के लिए अन्य दुभाषिया या संकलक पहले से ही दूसरी भाषा Y में लिखा जा चुका है; इस प्रकार योजना (प्रोग्रामिंग भाषा) को अक्सर बूटस्ट्रैप किया जाता है।
  • संकलक के पहले के संस्करण X के सबसेट में लिखे गए थे जिसके लिए कुछ अन्य संकलक मौजूद थे; इस प्रकार जावा (प्रोग्रामिंग भाषा), हास्केल (प्रोग्रामिंग भाषा) के कुछ सुपरसेट, और शुरुआती फ़्री पास्कल संकलक बूटस्ट्रैप किए गए हैं।
  • गैर-मानक भाषा एक्सटेंशन या वैकल्पिक भाषा सुविधाओं का समर्थन करने वाला संकलक उन एक्सटेंशन और सुविधाओं का उपयोग किए बिना लिखा जा सकता है, ताकि इसे उसी आधार भाषा का समर्थन करने वाले दूसरे संकलक के साथ संकलित किया जा सके, लेकिन एक्सटेंशन और सुविधाओं का अलग सेट। सी++ संकलक बजना के मुख्य भाग सी++ के सबसेट में लिखे गए थे जिन्हें g++ और माइक्रोसॉफ्ट विजुअल सी++ दोनों द्वारा संकलित किया जा सकता है। कुछ Gसीसी एक्सटेंशन के साथ उन्नत सुविधाएँ लिखी गई हैं।
  • एक्स के लिए संकलक किसी अन्य आर्किटेक्चर से क्रॉस-संकलन है जहां एक्स के लिए संकलक मौजूद है; इस प्रकार सी (प्रोग्रामिंग भाषा) के लिए संकलक आमतौर पर अन्य प्लेटफॉर्म पर पोर्ट किए जाते हैं। प्रारंभिक बूटस्ट्रैप के बाद फ्री पास्कल के लिए भी यही तरीका इस्तेमाल किया जाता है।
  • एक्स में संकलक लिखना; फिर इसे स्रोत से हाथ से संकलित करना (संभवतः गैर-अनुकूलित तरीके से) और अनुकूलित संकलक प्राप्त करने के लिए कोड पर चल रहा है। डोनाल्ड नुथ ने इसका इस्तेमाल अपने WEB साक्षर प्रोग्रामिंग सिस्टम के लिए किया।

स्रोत कोड में संकलक्स को वितरित करने के तरीकों में संकलक का पोर्टेबल बाईटकोड संस्करण प्रदान करना शामिल है, ताकि संकलक को अपने साथ संकलित करने की प्रक्रिया को बूटस्ट्रैप किया जा सके। टी-आरेख इन संकलक बूटस्ट्रैप तकनीकों को समझाने के लिए उपयोग किया जाने वाला संकेतन है।[7]कुछ मामलों में, सिस्टम पर चलने वाले जटिल संकलक को प्राप्त करने का सबसे सुविधाजनक तरीका जिसमें बहुत कम या कोई सॉफ़्टवेयर नहीं है, इसमें कभी अधिक परिष्कृत कोडांतरकों और संकलक्स की श्रृंखला शामिल होती है।[9]


इतिहास

कोडांतरक खुद को बूटस्ट्रैप करने वाले पहले भाषा उपकरण थे।

ऐसा बूटस्ट्रैप प्रदान करने वाली पहली उच्च-स्तरीय भाषा 1958 में NELIAसी थी। ऐसा करने वाली पहली व्यापक रूप से इस्तेमाल की जाने वाली भाषाएं 1961 में बरोज़ B5000 अल्गोल और 1962 में लिस्प प्रोग्रामिंग भाषा थीं।

हार्ट और लेविन ने 1962 में एमआईटी में एलआईएसपी में एलआईएसपी संकलक लिखा, मौजूदा एलआईएसपी दुभाषिया के अंदर इसका परीक्षण किया। बार जब उन्होंने संकलक को उस बिंदु तक सुधार लिया था जहां वह अपने स्वयं के स्रोत कोड को संकलित कर सकता था, तो यह स्व-होस्टिंग था।[10]

कंपाइलर जैसा कि यह मानक कंपाइलर टेप पर मौजूद है, एक मशीनी भाषा का प्रोग्राम है, जिसे इंटरप्रेटर के माध्यम से कंपाइलर की S-एक्सप्रेशन परिभाषा द्वारा प्राप्त किया गया था।

— एआई मेमो 39[10]

यह तकनीक तभी संभव है जब दुभाषिया पहले से ही उसी भाषा के लिए मौजूद हो जिसे संकलित किया जाना है। यह इनपुट के रूप में अपने आप में प्रोग्राम चलाने की धारणा से सीधे उधार लेता है, जिसका उपयोग सैद्धांतिक कंप्यूटर विज्ञान में विभिन्न प्रमाणों में भी किया जाता है, जैसे कि सबूत की भिन्नता कि हॉल्टिंग समस्या अनिर्णीत है जो राइस के प्रमेय का उपयोग करती है।

वर्तमान प्रयास

भरोसे का भरोसा और बाइनरी ट्रस्टवर्थनेस के खिलाफ विभिन्न हमलों के संबंध में सुरक्षा चिंताओं के कारण, कई परियोजनाएं न केवल स्रोत से बूटस्ट्रैपिंग के प्रयास को कम करने के लिए काम कर रही हैं बल्कि सभी को उस स्रोत और निष्पादन योग्य अनुरूप को सत्यापित करने की अनुमति भी दे रही हैं। इनमें बूटस्ट्रैपेबल बिल्ड प्रोजेक्ट शामिल है[11] और प्रतिलिपि प्रस्तुत करने योग्य परियोजना बनाता है।[12]


यह भी देखें

संदर्भ

  1. Reynolds, John H. (December 2003). "Bootstrapping a self-compiling compiler from machine X to machine Y". CCSC: Eastern Conference. Journal of Computing Sciences in Colleges. 19 (2): 175–181. The idea of a compiler written in the language it compiles stirs up the old 'chicken-or-the-egg' conundrum: Where does the first one come from?
  2. Glück, Robert (2012). "Bootstrapping compiler generators from partial evaluators". In Clarke, Edmund; Virbitskaite, Irina; Voronkov, Andrei (eds.). Perspectives of Systems Informatics: 8th International Andrei Ershov Memorial Conference, PSI 2011, Novosibirsk, Russia, June 27 – July 1, 2011, Revised Selected Papers. Lecture Notes in Computer Science. Vol. 7162. Springer. pp. 125–141. doi:10.1007/978-3-642-29709-0_13. Getting started presents the chicken-and-egg problem familiar from compiler construction: one needs a compiler to bootstrap a compiler, and bootstrapping compiler generators is no exception.
  3. 3.0 3.1 "Installing GCC: Building". GNU Project - Free Software Foundation (FSF).
  4. "rust-lang/rust: bootstrap". GitHub (in English).
  5. "Advanced Build Configurations — LLVM 10 documentation". llvm.org.
  6. Compilers and Compiler Generators: An Introduction With C++. Patrick D. Terry 1997. International Thomson Computer Press. ISBN 1-85032-298-8
  7. 7.0 7.1 "Compiler Construction and Bootstrapping" by P.D.Terry 2000. HTML Archived 2009-11-23 at the Wayback Machine. PDF Archived December 14, 2010, at the Wayback Machine.
  8. Niklaus Wirth. 2021. 50 years of Pascal. Commun. ACM 64, 3 (March 2021), 39–41. DOI:https://doi.org/10.1145/3447525
  9. "Bootstrapping a simple compiler from nothing" Archived March 3, 2010, at the Wayback Machine by Edmund GRIMLEY EVANS 2001
  10. 10.0 10.1 Template:साइट वेब
  11. "Bootstrappable builds". bootstrappable.org.
  12. "Reproducible Builds — a set of software development practices that create an independently-verifiable path from source to binary code". reproducible-builds.org.