इनलाइन विस्तार: Difference between revisions
(Created page with "{{Short description|Optimization replacing a function call with that function's source code}} {{Use American English|date = March 2019}} कम्प्यूटिंग...") |
No edit summary |
||
Line 63: | Line 63: | ||
इंट प्री (इंट एक्स) | इंट प्री (इंट एक्स) | ||
{ | { | ||
अगर (एक्स == 0) | |||
वापसी 0; | |||
अन्य | |||
वापसी एक्स - 1; | |||
} | } | ||
</वाक्यविन्यास हाइलाइट> | </वाक्यविन्यास हाइलाइट> | ||
Line 74: | Line 74: | ||
इंट फंक (इंट वाई) | इंट फंक (इंट वाई) | ||
{ | { | ||
पूर्व वापसी (वाई) + पूर्व (0) + पूर्व (वाई + 1); | |||
} | } | ||
</वाक्यविन्यास हाइलाइट> | </वाक्यविन्यास हाइलाइट> | ||
Line 82: | Line 82: | ||
इंट फंक (इंट वाई) | इंट फंक (इंट वाई) | ||
{ | { | ||
इंट टीएमपी; | |||
अगर (वाई == 0) टीएमपी = 0; और टीएमपी = वाई - 1; /* (1) */ | |||
अगर (0 == 0) टीएमपी + = 0; और टीएमपी + = 0 - 1; /* (2) */ | |||
अगर (वाई + 1 == 0) टीएमपी + = 0; और टीएमपी + = (वाई + 1) - 1; /* (3) */ | |||
वापसी टीएमपी; | |||
} | } | ||
</वाक्यविन्यास हाइलाइट> | </वाक्यविन्यास हाइलाइट> | ||
Line 121: | Line 121: | ||
इंट फंक (इंट वाई) | इंट फंक (इंट वाई) | ||
{ | { | ||
अगर (वाई == 0) | |||
वापसी 0; | |||
अगर (वाई == -1) | |||
वापसी -2; | |||
वापसी 2*y - 1; | |||
} | } | ||
</वाक्यविन्यास हाइलाइट> | </वाक्यविन्यास हाइलाइट> | ||
Line 155: | Line 155: | ||
(अस्वीकरण (इनलाइन प्रेषण)) | (अस्वीकरण (इनलाइन प्रेषण)) | ||
(डिफ्यूज डिस्पैच (x) | (डिफ्यूज डिस्पैच (x) | ||
(फंककॉल | |||
(प्राप्त करें (कार x) 'प्रेषण) x)) | |||
</वाक्यविन्यास हाइलाइट> | </वाक्यविन्यास हाइलाइट> | ||
Line 166: | Line 166: | ||
=== सी और सी ++ === | === सी और सी ++ === | ||
{{main article| | {{main article|इनलाइन फ़ंक्शन}} | ||
C (कंप्यूटर भाषा) और [[C++]] में एक है <code>inline</code> कीवर्ड, जो संकलक निर्देश दोनों के रूप में कार्य करता है - निर्दिष्ट करता है कि इनलाइनिंग वांछित है लेकिन आवश्यक नहीं है - और दृश्यता और लिंकिंग व्यवहार को भी बदलता है। फ़ंक्शन को मानक सी टूलचैन के माध्यम से इनलाइन करने की अनुमति देने के लिए दृश्यता परिवर्तन आवश्यक है, जहां अलग-अलग फाइलों का संकलन (बल्कि, [[अनुवाद इकाई (प्रोग्रामिंग)]]) लिंकिंग के बाद होता है: लिंकर इनलाइन कार्यों में सक्षम होने के लिए, उन्हें होना चाहिए हेडर में निर्दिष्ट (दिखाई देने के लिए) और चिह्नित <code>inline</code> (कई परिभाषाओं से अस्पष्टता से बचने के लिए)। | C (कंप्यूटर भाषा) और [[C++]] में एक है <code>inline</code> कीवर्ड, जो संकलक निर्देश दोनों के रूप में कार्य करता है - निर्दिष्ट करता है कि इनलाइनिंग वांछित है लेकिन आवश्यक नहीं है - और दृश्यता और लिंकिंग व्यवहार को भी बदलता है। फ़ंक्शन को मानक सी टूलचैन के माध्यम से इनलाइन करने की अनुमति देने के लिए दृश्यता परिवर्तन आवश्यक है, जहां अलग-अलग फाइलों का संकलन (बल्कि, [[अनुवाद इकाई (प्रोग्रामिंग)]]) लिंकिंग के बाद होता है: लिंकर इनलाइन कार्यों में सक्षम होने के लिए, उन्हें होना चाहिए हेडर में निर्दिष्ट (दिखाई देने के लिए) और चिह्नित <code>inline</code> (कई परिभाषाओं से अस्पष्टता से बचने के लिए)। | ||
Line 182: | Line 181: | ||
== संदर्भ == | == संदर्भ == | ||
{{reflist}} | {{reflist}} | ||
{{refbegin}} | {{refbegin}} | ||
Line 191: | Line 189: | ||
== बाहरी संबंध == | == बाहरी संबंध == | ||
*"[http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.114.1036 Eliminating Virtual Function Calls in C++ Programs]" by [[Gerald Aigner]] and [[Urs Hölzle]] | *"[http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.114.1036 Eliminating Virtual Function Calls in C++ Programs]" by [[Gerald Aigner]] and [[Urs Hölzle]] | ||
*"[http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.187.7208 Reducing Indirect Function Call Overhead In C++ Programs]" by [[Brad Calder]] and [[Dirk Grumwald]] | *"[http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.187.7208 Reducing Indirect Function Call Overhead In C++ Programs]" by [[Brad Calder]] and [[Dirk Grumwald]] | ||
Line 197: | Line 194: | ||
*"[https://web.archive.org/web/20160303171839/http://www.iecc.com/linker/linker11.html Advanced techniques]" by [[John R. Levine]] | *"[https://web.archive.org/web/20160303171839/http://www.iecc.com/linker/linker11.html Advanced techniques]" by [[John R. Levine]] | ||
*"[https://web.archive.org/web/20041010124209/http://www.codeproject.com/tips/gloption.asp Whole Program Optimization with Visual C++ .NET]" by [[Brandon Bray]] | *"[https://web.archive.org/web/20041010124209/http://www.codeproject.com/tips/gloption.asp Whole Program Optimization with Visual C++ .NET]" by [[Brandon Bray]] | ||
{{DEFAULTSORT:Inline Expansion}}[[Category: संकलक अनुकूलन]] [[Category: उदाहरण सी कोड वाले लेख]] [[Category: सबरूटीन्स]] [[Category: लिस्प (प्रोग्रामिंग भाषा) कोड के उदाहरण वाले लेख]] [[Category: उदाहरण हास्केल कोड वाले लेख]] | {{DEFAULTSORT:Inline Expansion}}[[Category: संकलक अनुकूलन]] [[Category: उदाहरण सी कोड वाले लेख]] [[Category: सबरूटीन्स]] [[Category: लिस्प (प्रोग्रामिंग भाषा) कोड के उदाहरण वाले लेख]] [[Category: उदाहरण हास्केल कोड वाले लेख]] |
Revision as of 14:27, 18 February 2023
कम्प्यूटिंग में, इनलाइन विस्तार, या इनलाइनिंग, एक मैनुअल या संकलक अनुकूलन है जो फ़ंक्शन कॉल साइट को कॉल किए गए फ़ंक्शन के शरीर के साथ बदल देता है। इनलाइन विस्तार मैक्रो विस्तार के समान है, लेकिन संकलन के दौरान होता है, स्रोत कोड (पाठ) को बदलने के बिना, जबकि मैक्रो विस्तार संकलन से पहले होता है, और इसके परिणामस्वरूप अलग-अलग पाठ होता है जिसे संकलक द्वारा संसाधित किया जाता है।
इनलाइनिंग एक महत्वपूर्ण अनुकूलन है, लेकिन इसका प्रदर्शन पर जटिल प्रभाव पड़ता है।[1] अंगूठे के एक नियम के रूप में, कुछ इनलाइनिंग अंतरिक्ष की बहुत कम लागत पर गति में सुधार करेगी, लेकिन इनलाइनिंग की अधिकता गति को नुकसान पहुंचाएगी, क्योंकि इनलाइन कोड बहुत अधिक निर्देश कैश का उपभोग करता है, और महत्वपूर्ण स्थान भी खर्च करता है। 1980 और 1990 के दशक से इनलाइनिंग पर मामूली अकादमिक साहित्य का एक सर्वेक्षण पीटन जोन्स एंड मार्लो 1999 में दिया गया है।[2]
सिंहावलोकन
इनलाइन विस्तार मैक्रो विस्तार के समान है क्योंकि संकलक प्रत्येक स्थान पर फ़ंक्शन की एक नई प्रति रखता है जिसे इसे कहा जाता है। इनलाइन फ़ंक्शंस सामान्य फ़ंक्शंस की तुलना में थोड़ी तेज़ी से चलते हैं क्योंकि फ़ंक्शन-कॉलिंग-ओवरहेड सहेजे जाते हैं, हालाँकि, मेमोरी पेनल्टी होती है। यदि किसी फ़ंक्शन को 10 बार इनलाइन किया जाता है, तो कोड में डाले गए फ़ंक्शन की 10 प्रतियां होंगी। इसलिए छोटे कार्यों के लिए इनलाइनिंग सबसे अच्छा है जिन्हें अक्सर कहा जाता है। C++ में वर्ग के सदस्य कार्य, यदि वर्ग परिभाषा के भीतर परिभाषित किए गए हैं, तो डिफ़ॉल्ट रूप से इनलाइन होते हैं (इनलाइन कीवर्ड का उपयोग करने की कोई आवश्यकता नहीं है); अन्यथा, कीवर्ड की आवश्यकता है। संकलक किसी फ़ंक्शन को इनलाइन करने के प्रोग्रामर के प्रयास को अनदेखा कर सकता है, मुख्यतः यदि यह विशेष रूप से बड़ा है।
इनलाइन विस्तार का उपयोग किसी फ़ंक्शन को बुलाए जाने पर समय के ऊपर (अतिरिक्त समय) को खत्म करने के लिए किया जाता है। यह आमतौर पर उन कार्यों के लिए उपयोग किया जाता है जो अक्सर निष्पादित होते हैं। इसमें बहुत छोटे कार्यों के लिए एक स्थान लाभ भी है, और यह अन्य अनुकूलन (कंप्यूटर विज्ञान) के लिए एक सक्षम परिवर्तन है।
इनलाइन फ़ंक्शंस के बिना, कंपाइलर यह तय करता है कि कौन से फ़ंक्शंस इनलाइन करें। प्रोग्रामर का बहुत कम या कोई नियंत्रण नहीं होता है कि कौन से कार्य इनलाइन हैं और कौन से नहीं हैं। प्रोग्रामर को इस डिग्री का नियंत्रण देने से इनलाइन कार्यों को चुनने में एप्लिकेशन-विशिष्ट ज्ञान के उपयोग की अनुमति मिलती है।
आमतौर पर, जब किसी फ़ंक्शन का आह्वान किया जाता है, तो नियंत्रण प्रवाह को इसकी परिभाषा में एक शाखा (कंप्यूटर विज्ञान) या कॉल निर्देश द्वारा स्थानांतरित किया जाता है। इनलाइनिंग के साथ, शाखा या कॉल निर्देश के बिना, फ़ंक्शन के लिए सीधे कोड के माध्यम से नियंत्रण गिरता है।
कंपाइलर आमतौर पर इनलाइनिंग के साथ स्टेटमेंट (कंप्यूटर साइंस) को लागू करते हैं। लूप की स्थिति और लूप बॉडी को आलसी मूल्यांकन की आवश्यकता होती है। यह संपत्ति तब पूरी होती है जब लूप की स्थिति और लूप बॉडी की गणना करने वाला कोड इनलाइन होता है। प्रदर्शन के विचार इनलाइन बयानों का एक और कारण हैं।
कार्यात्मक प्रोग्रामिंग भाषाओं के संदर्भ में, इनलाइन विस्तार आमतौर पर लैम्ब्डा कैलकुलस#.CE.B2-reduction|बीटा-कमी परिवर्तन के बाद होता है।
एक प्रोग्रामर स्रोत कोड पर एक बार के ऑपरेशन के रूप में कॉपी और पेस्ट प्रोग्रामिंग के माध्यम से मैन्युअल रूप से एक फ़ंक्शन को इनलाइन कर सकता है। हालांकि, इनलाइनिंग को नियंत्रित करने के अन्य तरीके (नीचे देखें) बेहतर हैं, क्योंकि इनलाइन फ़ंक्शन में बग को ठीक करते समय प्रोग्रामर मूल फ़ंक्शन बॉडी के एक (संभावित रूप से संशोधित) डुप्लिकेट किए गए संस्करण को अनदेखा करते समय उत्पन्न होने वाली बगों को दूर नहीं करते हैं।
प्रदर्शन पर प्रभाव
इस अनुकूलन का सीधा प्रभाव समय के प्रदर्शन में सुधार करना है (कॉल ओवरहेड को समाप्त करके), बिगड़ती जगह के उपयोग की कीमत पर[lower-alpha 1] (कोड दोहराव के कारण फ़ंक्शन बॉडी)। साधारण मामलों को छोड़कर, फ़ंक्शन बॉडी को डुप्लिकेट करने के कारण कोड विस्तार हावी है,[lower-alpha 2] और इस प्रकार इनलाइन विस्तार का सीधा प्रभाव स्थान की कीमत पर समय में सुधार करना है।
हालांकि, इनलाइन विस्तार का प्राथमिक लाभ फ़ंक्शन बॉडी के आकार में वृद्धि के कारण आगे के अनुकूलन और बेहतर शेड्यूलिंग की अनुमति देना है, क्योंकि बड़े कार्यों पर बेहतर अनुकूलन संभव है।[3] मेमोरी सिस्टम (मुख्य रूप से निर्देश कैश) के प्रदर्शन पर कई प्रभावों के कारण गति पर इनलाइन विस्तार का अंतिम प्रभाव जटिल है, जो आधुनिक प्रोसेसर पर प्रदर्शन पर हावी है: विशिष्ट प्रोग्राम और कैश के आधार पर, विशेष कार्यों को इनलाइन करना प्रदर्शन को बढ़ा या घटा सकता है। .[1] इनलाइनिंग का प्रभाव प्रोग्रामिंग लैंग्वेज और प्रोग्राम के अनुसार अलग-अलग डिग्री के एब्सट्रैक्शन के कारण भिन्न होता है। सी और फोरट्रान जैसी निचले स्तर की अनिवार्य भाषाओं में यह आमतौर पर कोड आकार पर मामूली प्रभाव के साथ 10-20% की गति को बढ़ावा देता है, जबकि अधिक सार भाषाओं में यह काफी अधिक महत्वपूर्ण हो सकता है, परतों की संख्या को हटाने के कारण, स्व (प्रोग्रामिंग लैंग्वेज) होने के चरम उदाहरण के साथ, जहां एक कंपाइलर ने इनलाइनिंग द्वारा 4 से 55 के सुधार कारक देखे।[2] समारोह कॉल को समाप्त करने के प्रत्यक्ष लाभ हैं:
- यह कॉलिंग फ़ंक्शन और कैली दोनों में फ़ंक्शन कॉल के लिए आवश्यक निर्देशों को समाप्त करता है: स्टैक या रजिस्टरों में तर्कों को रखकर, फ़ंक्शन स्वयं कॉल करता है, फ़ंक्शन प्रस्तावना, फिर फ़ंक्शन उपसंहार, वापसी कथन, और फिर वापसी मूल्य वापस प्राप्त करना, और ढेर से तर्कों को हटाना और रजिस्टरों को बहाल करना (यदि आवश्यक हो)।
- तर्क पारित करने के लिए रजिस्टरों की आवश्यकता नहीं होने के कारण, यह रिसाव दर्ज करें को कम करता है।
- संदर्भ द्वारा कॉल का उपयोग करते समय (या पते से कॉल करें, या साझा करके कॉल करें) संदर्भों को पारित करने की आवश्यकता को समाप्त करता है और फिर उन्हें हटा देता है।
हालाँकि, इनलाइनिंग का प्राथमिक लाभ इसके द्वारा अनुमत अतिरिक्त अनुकूलन है। अंतरप्रक्रियात्मक अनुकूलन (IPO) की आवश्यकता के बिना फ़ंक्शन सीमाओं को पार करने वाले ऑप्टिमाइज़ेशन: एक बार इनलाइनिंग का प्रदर्शन किया गया है, बढ़े हुए फ़ंक्शन बॉडी पर अतिरिक्त इंट्राप्रोसेडुरल ऑप्टिमाइज़ेशन (वैश्विक ऑप्टिमाइज़ेशन) संभव हो जाते हैं। उदाहरण के लिए:
- एक तर्क के रूप में पारित एक कॉन्स्टेंट (प्रोग्रामिंग) को अक्सर मिलान पैरामीटर के सभी उदाहरणों में प्रचारित किया जा सकता है, या फ़ंक्शन का हिस्सा लूप से बाहर फहराया जा सकता है (लूप-इनवेरिएंट कोड मोशन के माध्यम से)।
- बड़े कार्य निकाय में रजिस्टर आवंटन किया जा सकता है।
- उच्च-स्तरीय अनुकूलन, जैसे कि पलायन विश्लेषण और पूंछ दोहराव, एक बड़े दायरे में किया जा सकता है और अधिक प्रभावी हो सकता है, खासकर अगर उन अनुकूलन को लागू करने वाला संकलक मुख्य रूप से अंतर-प्रक्रियात्मक विश्लेषण पर निर्भर है।[4]
इन्हें इनलाइनिंग के बिना किया जा सकता है, लेकिन इसके लिए काफी अधिक जटिल कंपाइलर और लिंकर की आवश्यकता होती है (यदि कॉलर और कैली अलग-अलग संकलन इकाइयों में हैं)।
इसके विपरीत, कुछ मामलों में एक भाषा विनिर्देश एक प्रोग्राम को प्रक्रियाओं के लिए तर्कों के बारे में अतिरिक्त धारणा बनाने की अनुमति दे सकता है जो प्रक्रिया के इनलाइन होने के बाद अब नहीं बना सकता है, कुछ अनुकूलन को रोकता है। होशियार संकलक (जैसे ग्लासगो हास्केल कंपाइलर) इसे ट्रैक करेंगे, लेकिन भोली इनलाइनिंग इस जानकारी को खो देती है।
मेमोरी सिस्टम के लिए इनलाइनिंग का एक और लाभ है:
- शाखाओं को हटाने और स्मृति में एक साथ निष्पादित कोड रखने से संदर्भ के स्थानीयता (स्थानिक इलाके और निर्देशों की अनुक्रमिकता) में सुधार करके निर्देश कैश प्रदर्शन में सुधार होता है। यह अनुकूलन से छोटा है जो विशेष रूप से अनुक्रमिकता को लक्षित करता है, लेकिन महत्वपूर्ण है।[5]
प्रत्येक कॉल साइट पर फ़ंक्शन बॉडी को डुप्लिकेट करने के कारण इनलाइनिंग की प्रत्यक्ष लागत कोड आकार में वृद्धि हुई है। हालांकि, यह हमेशा ऐसा नहीं करता है, अर्थात् बहुत ही कम कार्यों के मामले में, जहां फ़ंक्शन बॉडी फ़ंक्शन कॉल के आकार से छोटा होता है (कॉलर पर, तर्क और रिटर्न वैल्यू हैंडलिंग सहित), जैसे तुच्छ एक्सेसर विधियां या म्यूटेटर तरीके (गेटर्स और सेटर्स); या किसी ऐसे फ़ंक्शन के लिए जो केवल एक ही स्थान पर उपयोग किया जाता है, इस मामले में इसे डुप्लिकेट नहीं किया जाता है। इस प्रकार कोड आकार के लिए अनुकूलन करने पर इनलाइनिंग को कम या समाप्त किया जा सकता है, जैसा कि अक्सर अंतः स्थापित प्रणाली में होता है।
कोड विस्तार (दोहराव के कारण) निर्देश कैश प्रदर्शन को नुकसान पहुंचाने के कारण इनलाइनिंग भी प्रदर्शन पर लागत लगाती है।[6] यह सबसे महत्वपूर्ण है अगर, विस्तार से पहले, प्रोग्राम का कार्य का संग्रह (या कोड का एक हॉट सेक्शन) मेमोरी पदानुक्रम (जैसे, एल 1 कैश) के एक स्तर में फिट होता है, लेकिन विस्तार के बाद यह अब फिट नहीं होता है, जिसके परिणामस्वरूप बार-बार कैश उस स्तर पर चूक जाता है। पदानुक्रम के विभिन्न स्तरों पर प्रदर्शन में महत्वपूर्ण अंतर के कारण, यह प्रदर्शन को काफी नुकसान पहुँचाता है। उच्चतम स्तर पर इसके परिणामस्वरूप पृष्ठ दोष बढ़ सकते हैं, थ्रैशिंग (कंप्यूटर विज्ञान) के कारण विपत्तिपूर्ण प्रदर्शन गिरावट, या प्रोग्राम बिल्कुल भी चलने में विफल हो सकता है। यह अंतिम आम डेस्कटॉप और सर्वर अनुप्रयोगों में दुर्लभ है, जहां उपलब्ध मेमोरी के सापेक्ष कोड का आकार छोटा है, लेकिन एम्बेडेड सिस्टम जैसे संसाधन-विवश वातावरण के लिए एक समस्या हो सकती है। इस समस्या को कम करने का एक तरीका है कि कार्यों को एक छोटे गर्म इनलाइन पथ (तेज़ पथ), और एक बड़े ठंडे गैर-इनलाइन पथ (धीमे पथ) में विभाजित किया जाए।[6]
इनलाइनिंग हार्मिंग प्रदर्शन मुख्य रूप से बड़े कार्यों के लिए एक समस्या है जो कई स्थानों पर उपयोग किए जाते हैं, लेकिन ब्रेक-ईवन बिंदु जिसके आगे इनलाइनिंग प्रदर्शन को कम करता है, निर्धारित करना मुश्किल है और सामान्य रूप से सटीक लोड पर निर्भर करता है, इसलिए यह मैन्युअल अनुकूलन या प्रोफ़ाइल के अधीन हो सकता है निर्देशित अनुकूलन।[7] यह लूप अनोलिंग जैसे अन्य कोड विस्तार अनुकूलन के लिए एक समान मुद्दा है, जो संसाधित निर्देशों की संख्या को भी कम करता है, लेकिन खराब कैश प्रदर्शन के कारण प्रदर्शन को कम कर सकता है।
कैश प्रदर्शन पर इनलाइनिंग का सटीक प्रभाव जटिल है। छोटे कैश आकार के लिए (विस्तार से पहले काम करने वाले सेट से बहुत छोटा), बढ़ी हुई अनुक्रमिकता हावी होती है, और इनलाइनिंग कैश प्रदर्शन में सुधार करती है। वर्किंग सेट के करीब कैश आकार के लिए, जहां इनलाइनिंग वर्किंग सेट का विस्तार करती है, इसलिए यह अब कैश में फिट नहीं होता है, यह हावी हो जाता है और कैश का प्रदर्शन कम हो जाता है। कार्य सेट से बड़े कैश आकार के लिए, इनलाइनिंग का कैश प्रदर्शन पर नगण्य प्रभाव पड़ता है। इसके अलावा, कैश डिज़ाइन में परिवर्तन, जैसे लोड अग्रेषण, कैश मिसेस में वृद्धि को ऑफसेट कर सकते हैं।[8]
संकलक समर्थन
कंपाइलर यह तय करने के लिए विभिन्न तंत्रों का उपयोग करते हैं कि कौन सी फ़ंक्शन कॉल इनलाइन की जानी चाहिए; इनमें कमांड-लाइन विकल्पों के माध्यम से समग्र नियंत्रण के साथ-साथ विशिष्ट कार्यों के लिए प्रोग्रामर के मैनुअल संकेत शामिल हो सकते हैं। इनलाइनिंग फायदेमंद है या नहीं, इस निर्णय के आधार पर कई भाषाओं में कई कंपाइलरों द्वारा इनलाइनिंग स्वचालित रूप से की जाती है, जबकि अन्य मामलों में इसे संकलक निर्देश (प्रोग्रामिंग) के माध्यम से मैन्युअल रूप से निर्दिष्ट किया जा सकता है, आमतौर पर एक कीवर्ड या कंपाइलर डायरेक्टिव का उपयोग करके कहा जाता है inline
. आम तौर पर यह केवल संकेत देता है कि इनलाइनिंग की आवश्यकता के बजाय इनलाइनिंग वांछित है, भाषा और कंपाइलर द्वारा अलग-अलग संकेत के बल के साथ।
आमतौर पर, कंपाइलर डेवलपर्स उपरोक्त प्रदर्शन के मुद्दों को ध्यान में रखते हैं, और अपने कंपाइलर्स में heuristics को शामिल करते हैं जो ज्यादातर मामलों में प्रदर्शन को बेहतर बनाने के बजाय इनलाइन करने के लिए कौन से कार्यों को चुनते हैं।
कार्यान्वयन
एक बार जब कंपाइलर किसी विशेष फ़ंक्शन को इनलाइन करने का निर्णय लेता है, तो इनलाइनिंग ऑपरेशन करना आमतौर पर सरल होता है। इस बात पर निर्भर करते हुए कि क्या कंपाइलर इनलाइन कोड में विभिन्न भाषाओं में काम करता है, कंपाइलर या तो उच्च-स्तरीय इंटरमीडिएट प्रतिनिधित्व (जैसे अमूर्त सिंटैक्स पेड़) या निम्न-स्तरीय इंटरमीडिएट प्रतिनिधित्व पर इनलाइनिंग कर सकता है। किसी भी स्थिति में, कंपाइलर केवल पैरामीटर की गणना करता है, उन्हें फ़ंक्शन के तर्कों के अनुरूप चर में संग्रहीत करता है, और फिर कॉल साइट पर फ़ंक्शन के मुख्य भाग को सम्मिलित करता है।
लिंकर (कंप्यूटिंग) फ़ंक्शन इनलाइनिंग भी कर सकता है। जब एक लिंकर इनलाइन कार्य करता है, तो यह उन कार्यों को इनलाइन कर सकता है जिनके स्रोत उपलब्ध नहीं हैं, जैसे लाइब्रेरी फ़ंक्शंस (लिंक-समय अनुकूलन देखें)। एक रन-टाइम सिस्टम इनलाइन कार्य भी कर सकता है। रन टाइम (प्रोग्राम जीवनचक्र चरण) | रन-टाइम इनलाइनिंग डायनेमिक प्रोफाइलिंग जानकारी का उपयोग बेहतर निर्णय लेने के लिए कर सकती है कि कौन से कार्यों को इनलाइन करना है, जैसा कि जावा हॉटस्पॉट कंपाइलर में है।[9] सी (प्रोग्रामिंग भाषा) में स्रोत स्तर पर हाथ से निष्पादित इनलाइन विस्तार का एक सरल उदाहरण यहां दिया गया है: <वाक्यविन्यास प्रकाश लैंग = सी> इंट प्री (इंट एक्स) {
अगर (एक्स == 0) वापसी 0; अन्य वापसी एक्स - 1;
} </वाक्यविन्यास हाइलाइट>
इनलाइन करने से पहले: <वाक्यविन्यास प्रकाश लैंग = सी> इंट फंक (इंट वाई) {
पूर्व वापसी (वाई) + पूर्व (0) + पूर्व (वाई + 1);
} </वाक्यविन्यास हाइलाइट>
इनलाइनिंग के बाद: <वाक्यविन्यास प्रकाश लैंग = सी> इंट फंक (इंट वाई) {
इंट टीएमपी; अगर (वाई == 0) टीएमपी = 0; और टीएमपी = वाई - 1; /* (1) */ अगर (0 == 0) टीएमपी + = 0; और टीएमपी + = 0 - 1; /* (2) */ अगर (वाई + 1 == 0) टीएमपी + = 0; और टीएमपी + = (वाई + 1) - 1; /* (3) */ वापसी टीएमपी;
} </वाक्यविन्यास हाइलाइट>
ध्यान दें कि यह केवल एक उदाहरण है। एक वास्तविक सी अनुप्रयोग में, इस तरह से कोड को बदलने के लिए कंपाइलर को बताने के लिए पैरामिट्रीकृत मैक्रोज़ या इनलाइन फ़ंक्शन जैसे इनलाइनिंग भाषा सुविधा का उपयोग करना बेहतर होगा। अगला खंड इस कोड को अनुकूलित करने के तरीकों को सूचीबद्ध करता है।
असेंबली मैक्रो विस्तार द्वारा इनलाइनिंग
मैक्रो असेंबलर # मैक्रोज़ इनलाइनिंग के लिए एक वैकल्पिक दृष्टिकोण प्रदान करते हैं जिससे निर्देशों का एक क्रम सामान्य रूप से एकल मैक्रो स्रोत स्टेटमेंट (शून्य या अधिक मापदंडों के साथ) से मैक्रो विस्तार द्वारा इनलाइन उत्पन्न किया जा सकता है। पैरामीटर में से एक वैकल्पिक रूप से अनुक्रम युक्त एक बार अलग उपनेमका उत्पन्न करने का विकल्प हो सकता है और इसके बजाय फ़ंक्शन में इनलाइन कॉल द्वारा संसाधित किया जा सकता है। उदाहरण:
आगे बढ़ें = सरणी 1, TO = सरणी 2, इनलाइन = नहीं
अनुमान
इनलाइनिंग के लिए विभिन्न अनुमानों की एक श्रृंखला का पता लगाया गया है। आम तौर पर, एक इनलाइनिंग एल्गोरिदम का एक निश्चित कोड बजट होता है (प्रोग्राम आकार में अनुमत वृद्धि) और उस बजट को पार किए बिना सबसे मूल्यवान कॉलसाइट्स को इनलाइन करना है। इस अर्थ में, कई इनलाइनिंग एल्गोरिदम आमतौर पर नैपसैक समस्या के बाद तैयार किए जाते हैं।[10] यह तय करने के लिए कि कौन सी कॉलसाइट्स अधिक मूल्यवान हैं, एक इनलाइनिंग एल्गोरिदम को उनके लाभ का अनुमान लगाना चाहिए- यानी। निष्पादन समय में अपेक्षित कमी। आम तौर पर, इनलाइनर लाभों का अनुमान लगाने के लिए विभिन्न कोड पथों के निष्पादन की आवृत्ति के बारे में प्रोफाइलिंग जानकारी का उपयोग करते हैं।[11] प्रोफाइलिंग जानकारी के अलावा, नए जस्ट-इन-टाइम कंपाइलर कई और उन्नत ह्यूरिस्टिक्स लागू करते हैं, जैसे:[4]
- यह अनुमान लगाना कि कौन से कोड पथ निष्पादन समय में सबसे अच्छी कमी (इनलाइनिंग के परिणामस्वरूप अतिरिक्त संकलक अनुकूलन को सक्षम करके) और ऐसे पथों के कथित लाभ को बढ़ाएंगे।
- संकलन इकाई के आकार और पहले से ही रेखांकित कोड की मात्रा के आधार पर इनलाइनिंग के लिए लाभ-प्रति-लागत सीमा को अनुकूल रूप से समायोजित करना।
- सबरूटीन्स को क्लस्टर्स में ग्रुप करना, और एकवचन सबरूटीन्स के बजाय पूरे क्लस्टर्स को इनलाइन करना। यहां, हेयुरिस्टिक उन तरीकों को समूहीकृत करके क्लस्टर का अनुमान लगाता है जिसके लिए क्लस्टर के उचित उपसमुच्चय को इनलाइन करने से कुछ भी इनलाइन करने की तुलना में खराब प्रदर्शन होता है।
लाभ
इनलाइन विस्तार स्वयं एक अनुकूलन है, क्योंकि यह कॉल से ओवरहेड को समाप्त करता है, लेकिन यह सक्षम परिवर्तन के रूप में अधिक महत्वपूर्ण है। अर्थात्, एक बार जब संकलक अपनी कॉल साइट के संदर्भ में एक फ़ंक्शन बॉडी का विस्तार करता है - अक्सर उन तर्कों के साथ जो कॉन्स्टेंट (गणित) तय हो सकते हैं - यह कई तरह के परिवर्तन करने में सक्षम हो सकता है जो पहले संभव नहीं थे। उदाहरण के लिए, एक सशर्त शाखा इस विशेष कॉल साइट पर हमेशा सही या हमेशा गलत हो सकती है। यह बदले में मृत कोड उन्मूलन, लूप-इनवेरिएंट कोड मोशन या प्रेरण चर उन्मूलन को सक्षम कर सकता है। पिछले अनुभाग में C उदाहरण में, अनुकूलन के अवसर लाजिमी हैं। संकलक चरणों के इस क्रम का पालन कर सकता है:
tmp += 0
e> कथन (2) और (3) चिह्नित पंक्तियों में कुछ नहीं करते हैं। कंपाइलर उन्हें हटा सकता है।- स्थिति
0 == 0
हमेशा सत्य होता है, इसलिए संकलक (2) चिह्नित रेखा को परिणाम के साथ बदल सकता है,tmp += 0
(जो कुछ नहीं करता)। - कंपाइलर स्थिति को फिर से लिख सकता है
y+1 == 0
कोy == -1
. - कंपाइलर अभिव्यक्ति को कम कर सकता है
(y + 1) - 1
कोy
. - भाव
y
औरy+1
दोनों शून्य के बराबर नहीं हो सकते। यह संकलक को एक परीक्षण को समाप्त करने देता है। - जैसे बयानों में
if (y == 0) return y
का मान हैy
शरीर में जाना जाता है, और इनलाइन किया जा सकता है।
नया कार्य ऐसा दिखता है:
<वाक्यविन्यास प्रकाश लैंग = सी> इंट फंक (इंट वाई) {
अगर (वाई == 0) वापसी 0; अगर (वाई == -1) वापसी -2; वापसी 2*y - 1;
} </वाक्यविन्यास हाइलाइट>
सीमाएं
पुनरावर्तन (कंप्यूटर विज्ञान) के कारण पूर्ण इनलाइन विस्तार हमेशा संभव नहीं होता है: पुनरावर्ती रूप से इनलाइन का विस्तार कॉल समाप्त नहीं होगा। कई समाधान हैं, जैसे कि एक सीमित राशि का विस्तार करना, या कॉल ग्राफ़ का विश्लेषण करना और कुछ नोड्स पर ब्रेकिंग लूप्स (यानी, एक पुनरावर्ती पाश में कुछ किनारे का विस्तार नहीं करना)।[12] मैक्रो विस्तार में एक समान समस्या होती है, क्योंकि पुनरावर्ती विस्तार समाप्त नहीं होता है, और आमतौर पर पुनरावर्ती मैक्रोज़ (सी और सी ++ में) को मना कर हल किया जाता है।
मैक्रोज़ के साथ तुलना
परंपरागत रूप से, C (प्रोग्रामिंग लैंग्वेज) जैसी भाषाओं में, इनलाइन विस्तार को पैरामिट्रीकृत मैक्रोज़ का उपयोग करके स्रोत स्तर पर पूरा किया गया था। वास्तविक इनलाइन फ़ंक्शंस का उपयोग, जैसा कि C99 में उपलब्ध है, इस दृष्टिकोण पर कई लाभ प्रदान करता है:
- सी में, मैक्रो इनवोकेशन प्रकार की जाँच नहीं करते हैं, या यह भी जांचते हैं कि तर्क अच्छी तरह से बने हैं, जबकि फ़ंक्शन कॉल आमतौर पर करते हैं।
- सी में, एक मैक्रो रिटर्न कीवर्ड का उपयोग उसी अर्थ के साथ नहीं कर सकता जैसा कि एक फ़ंक्शन करेगा (यह उस फ़ंक्शन को मैक्रो के बजाय विस्तार को समाप्त करने के लिए कहेगा)। दूसरे शब्दों में, एक मैक्रो कुछ भी वापस नहीं कर सकता है जो उसके अंदर लागू अंतिम अभिव्यक्ति का परिणाम नहीं है।
- चूंकि सी मैक्रोज़ केवल शाब्दिक प्रतिस्थापन का उपयोग करते हैं, इसके परिणामस्वरूप तर्कों के पुनर्मूल्यांकन और संचालन के क्रम के कारण अनपेक्षित दुष्प्रभाव और अक्षमता हो सकती है।
- मैक्रोज़ के भीतर कंपाइलर त्रुटियों को समझना अक्सर मुश्किल होता है, क्योंकि वे प्रोग्रामर द्वारा टाइप किए गए कोड के बजाय विस्तारित कोड को संदर्भित करते हैं। इस प्रकार, मैक्रो-विस्तारित कोड की तुलना में इनलाइन कोड के लिए डिबगिंग जानकारी आमतौर पर अधिक सहायक होती है।
- मैक्रोज़ का उपयोग करके व्यक्त करने के लिए कई निर्माण अजीब या असंभव हैं, या एक महत्वपूर्ण भिन्न सिंटैक्स का उपयोग करते हैं। इनलाइन फ़ंक्शंस सामान्य फ़ंक्शंस के समान सिंटैक्स का उपयोग करते हैं, और इन्हें आसानी से इनलाइन और अन-इनलाइन किया जा सकता है।
कई संकलक कुछ पुनरावर्तन (कंप्यूटर विज्ञान) का विस्तार भी कर सकते हैं;[13] पुनरावर्ती मैक्रोज़ आमतौर पर अवैध होते हैं।
सी ++ के डिजाइनर बज़्ने स्ट्रॉस्ट्रुप, इस बात पर जोर देना पसंद करते हैं कि जहां भी संभव हो मैक्रोज़ से बचा जाना चाहिए, और इनलाइन कार्यों के व्यापक उपयोग की वकालत करता है।
चयन के तरीके
कई कंपाइलर आक्रामक रूप से इनलाइन फ़ंक्शंस करते हैं जहाँ ऐसा करना फायदेमंद होता है। यद्यपि यह बड़े निष्पादन योग्य हो सकता है, फिर भी आक्रामक इनलाइनिंग अधिक से अधिक वांछनीय हो गई है क्योंकि सीपीयू की गति की तुलना में मेमोरी क्षमता तेजी से बढ़ी है। कार्यात्मक प्रोग्रामिंग और वस्तु-उन्मुख प्रोग्रामिंग भाषा में इनलाइनिंग एक महत्वपूर्ण अनुकूलन है, जो क्लासिकल अनुकूलन को प्रभावी बनाने के लिए अपने आम तौर पर छोटे कार्यों के लिए पर्याप्त संदर्भ प्रदान करने के लिए इस पर भरोसा करते हैं।
भाषा समर्थन
जावा (प्रोग्रामिंग भाषा) और कार्यात्मक भाषाओं सहित कई भाषाएं इनलाइन कार्यों के लिए भाषा निर्माण प्रदान नहीं करती हैं, लेकिन उनके संकलक या दुभाषिए अक्सर आक्रामक इनलाइन विस्तार करते हैं।[4]अन्य भाषाएं स्पष्ट संकेत के लिए निर्माण प्रदान करती हैं, आम तौर पर कंपाइलर डायरेक्टिव (प्रोग्रामिंग) (प्रागमस) के रूप में।
Ada प्रोग्रामिंग भाषा में, इनलाइन फ़ंक्शंस के लिए एक प्राग्मा मौजूद है।
सामान्य लिस्प में कार्यों को इसके द्वारा इनलाइन के रूप में परिभाषित किया जा सकता है inline
घोषणा इस प्रकार है:[14]
<वाक्यविन्यास प्रकाश लैंग = लिस्प>
(अस्वीकरण (इनलाइन प्रेषण)) (डिफ्यूज डिस्पैच (x) (फंककॉल (प्राप्त करें (कार x) 'प्रेषण) x))
</वाक्यविन्यास हाइलाइट>
हास्केल (प्रोग्रामिंग भाषा) कंपाइलर ग्लासगो हास्केल कंपाइलर उन कार्यों या मूल्यों को इनलाइन करने की कोशिश करता है जो काफी छोटे हैं लेकिन इनलाइनिंग को स्पष्ट रूप से एक भाषा प्राग्मा का उपयोग करके नोट किया जा सकता है:[15] <वाक्यविन्यास लैंग = हैकेल> key_function :: इंट -> स्ट्रिंग -> (बूल, डबल) {-# इनलाइन key_function #-} </वाक्यविन्यास हाइलाइट>
सी और सी ++
C (कंप्यूटर भाषा) और C++ में एक है inline
कीवर्ड, जो संकलक निर्देश दोनों के रूप में कार्य करता है - निर्दिष्ट करता है कि इनलाइनिंग वांछित है लेकिन आवश्यक नहीं है - और दृश्यता और लिंकिंग व्यवहार को भी बदलता है। फ़ंक्शन को मानक सी टूलचैन के माध्यम से इनलाइन करने की अनुमति देने के लिए दृश्यता परिवर्तन आवश्यक है, जहां अलग-अलग फाइलों का संकलन (बल्कि, अनुवाद इकाई (प्रोग्रामिंग)) लिंकिंग के बाद होता है: लिंकर इनलाइन कार्यों में सक्षम होने के लिए, उन्हें होना चाहिए हेडर में निर्दिष्ट (दिखाई देने के लिए) और चिह्नित inline
(कई परिभाषाओं से अस्पष्टता से बचने के लिए)।
यह भी देखें
टिप्पणियाँ
- ↑ Space usage is "number of instructions", and is both runtime space usage and the binary file size.
- ↑ Code size actually shrinks for very short functions, where the call overhead is larger than the body of the function, or single-use functions, where no duplication occurs.
संदर्भ
- ↑ 1.0 1.1 Chen et al. 1993.
- ↑ 2.0 2.1 Peyton Jones & Marlow 1999, 8. Related work, p. 17.
- ↑ Chen et al. 1993, 3.4 Function inline expansion, p. 14.
- ↑ 4.0 4.1 4.2 [1] Prokopec et al., An Optimization Driven Incremental Inline Substitution Algorithm for Just-In-Time Compilers, CGO'19 publication about the inliner used in the Graal compiler for the JVM
- ↑ Chen et al. 1993, 3.4 Function inline expansion, p. 19–20.
- ↑ 6.0 6.1 Benjamin Poulain (August 8, 2013). "Unusual speed boost: size matters".
- ↑ See for example the Adaptive Optimization System Archived 2011-08-09 at the Wayback Machine in the Jikes RVM for Java.
- ↑ Chen et al. 1993, 3.4 Function inline expansion, p. 24–26.
- ↑ [2] Description of the inliner used in the Graal JIT compiler for Java
- ↑ [3] Scheifler, An Analysis of Inline Substitution for a Structured Programming Language
- ↑ [4] Matthew Arnold, Stephen Fink, Vivek Sarkar, and Peter F. Sweeney, A Comparative Study of Static and Profile-based Heuristics for Inlining
- ↑ Peyton Jones & Marlow 1999, 4. Ensuring Termination, pp. 6–9.
- ↑ Inlining Semantics for Subroutines which are Recursive" by Henry G. Baker
- ↑ Declaration INLINE, NOTINLINE at the Common Lisp HyperSpec
- ↑ 7.13.5.1. INLINE pragma Chapter 7. GHC Language Features
- Chen, W. Y.; Chang, P. P.; Conte, T. M.; Hwu, W. W. (Sep 1993). "The effect of code expanding optimizations on instruction cache design" (PDF). IEEE Transactions on Computers. 42 (9): 1045–1057. doi:10.1109/12.241594. hdl:2142/74513.
- Peyton Jones, Simon; Marlow, Simon (September 1999). Secrets of the Glasgow Haskell Compiler Inliner (Technical report).
बाहरी संबंध
- "Eliminating Virtual Function Calls in C++ Programs" by Gerald Aigner and Urs Hölzle
- "Reducing Indirect Function Call Overhead In C++ Programs" by Brad Calder and Dirk Grumwald
- ALTO - A Link-Time Optimizer for the DEC Alpha
- "Advanced techniques" by John R. Levine
- "Whole Program Optimization with Visual C++ .NET" by Brandon Bray