रजिस्टर फ़ाइल: Difference between revisions
No edit summary |
No edit summary |
||
(3 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
एक रजिस्टर फाइल [[सेंट्रल प्रोसेसिंग यूनिट]] (सीपीयू) में [[प्रोसेसर रजिस्टर]] | एक रजिस्टर फाइल [[सेंट्रल प्रोसेसिंग यूनिट]] (सीपीयू) में [[प्रोसेसर रजिस्टर]] की एक सरणी है। रजिस्टर बैंकिंग ऑपरेटिंग मोड के आधार पर कई अलग-अलग भौतिक रजिस्टरों तक पहुँचने के लिए एक ही नाम का उपयोग करने की विधि है। आधुनिक एकीकृत परिपथ-आधारित रजिस्टर फाइलें सामान्यतः कई पोर्टों के साथ तेज [[स्थिर रैम]] के माध्यम से कार्यान्वित की जाती हैं। इस तरह के रैम को पढ़ने और लिखने के समर्पित पोर्टों से अलग किया जाता है, जबकि साधारण मल्टीपोर्टेड एसआरएएम सामान्यतः एक ही पोर्टों के माध्यम से पढ़ और लिख सकेंगे। | ||
सीपीयू का [[निर्देश सेट वास्तुकला]] लगभग | सीपीयू का [[निर्देश सेट वास्तुकला]] लगभग सदैव रजिस्टरों के एक सेट को परिभाषित करेगा जो कि मेमोरी और चिप पर कार्यात्मक इकाइयों के बीच डेटा को स्टेज करने के लिए उपयोग किया जाता है। सरल सीपीयू में, ये ''आर्किटेक्चरल रजिस्टर'' सीपीयू के भीतर भौतिक रजिस्टर फ़ाइल (पीआरएफ) में प्रविष्टियों के लिए एक-से-एक के अनुरूप होते हैं। अधिक जटिल सीपीयू [[नाम बदलने का पंजीकरण करें]] का उपयोग करते हैं, ताकि मैपिंग जिसमें भौतिक प्रविष्टि एक विशेष वास्तुशिल्प रजिस्टर को संग्रहीत करती है, निष्पादन के दौरान गतिशील रूप से बदल जाती है। पारदर्शी [[सीपीयू कैश]] की अवधारणा के विपरीत, रजिस्टर फ़ाइल निर्देश सेट आर्किटेक्चर का हिस्सा है और प्रोग्रामर को दिखाई देती है। | ||
== रजिस्टर-बैंक स्विचिंग == | == रजिस्टर-बैंक स्विचिंग == | ||
Line 8: | Line 8: | ||
</ref> एक प्रोसेसर में एक से अधिक रजिस्टर बैंक हो सकते हैं। | </ref> एक प्रोसेसर में एक से अधिक रजिस्टर बैंक हो सकते हैं। | ||
एआरएम प्रोसेसर में बैंक और अनबैंक्ड दोनों तरह के रजिस्टर होते हैं। जबकि सभी मोड | एआरएम प्रोसेसर में बैंक और अनबैंक्ड दोनों तरह के रजिस्टर होते हैं। जबकि सभी मोड सदैव पहले आठ सामान्य-उद्देश्य रजिस्टरों के लिए समान भौतिक रजिस्टरों को साझा करते हैं, R0 से R7, भौतिक रजिस्टर जो कि बैंकेड रजिस्टरों, R8 से R14 तक, प्रोसेसर के ऑपरेटिंग मोड पर निर्भर करता है।<ref>{{cite web |title=ARM Architecture Reference Manual |url=http://cs107e.github.io/readings/armv6.pdf |publisher=ARM Limited |access-date=13 October 2021 |date=July 2005}}</ref> विशेष रूप से, [[फास्ट इंटरप्ट अनुरोध]] (FIQ) मोड में R8 से R12 के लिए रजिस्टरों का अपना बैंक है, साथ ही आर्किटेक्चर हर इंटरप्ट मोड के लिए एक निजी स्टैक पॉइंटर (R13) प्रदान करता है। | ||
निर्देश जारी होने से पहले x[[86]] प्रोसेसर निर्देश, डिकोडर, जीपीआर और रजिस्टर फाइलों के बीच स्विच करने के लिए संदर्भ स्विचिंग और फास्ट इंटरप्ट का उपयोग करते हैं, लेकिन यह केवल उन प्रोसेसर पर | निर्देश जारी होने से पहले x[[86]] प्रोसेसर निर्देश, डिकोडर, जीपीआर और रजिस्टर फाइलों के बीच स्विच करने के लिए संदर्भ स्विचिंग और फास्ट इंटरप्ट का उपयोग करते हैं, लेकिन यह केवल उन प्रोसेसर पर सम्मिलित है जो सुपरस्केलर का समर्थन करते हैं। हालाँकि, संदर्भ स्विचिंग एआरएम के रजिस्टर बैंक के रजिस्टरों के भीतर एक पूरी तरह से अलग तंत्र है। | ||
[[MODCOMP]] और बाद में | [[MODCOMP|मोडकॉम्प]] और बाद में इंटेल MCS-51 रजिस्टर 8051-संगत प्रोसेसर वर्तमान में सक्रिय रजिस्टर बैंक का चयन करने के लिए प्रोग्राम स्थिति शब्द में बिट्स का उपयोग करते हैं। | ||
== कार्यान्वयन == | == कार्यान्वयन == | ||
[[Image:regfile array.png|right]]सामान्य लेआउट कन्वेंशन यह है कि एक साधारण सरणी को लंबवत रूप से पढ़ा जाता है। अर्थात्, एक एकल शब्द रेखा, जो क्षैतिज रूप से चलती है, बिट | [[Image:regfile array.png|right]]सामान्य लेआउट कन्वेंशन यह है कि एक साधारण सरणी को लंबवत रूप से पढ़ा जाता है। अर्थात्, एक एकल शब्द रेखा, जो क्षैतिज रूप से चलती है, बिट सेल की एक पंक्ति को उनके डेटा को बिट लाइनों पर रखने का कारण बनती है, जो लंबवत रूप से चलती हैं। [[भाव प्रवर्धक]], जो लो-स्विंग रीड बिटलाइन को फुल-स्विंग लॉजिक स्तरों में परिवर्तित करता है, सामान्यतः नीचे (प्रोग्राम द्वारा) होता है। बड़ी रजिस्टर फाइलें तब कभी-कभी टाइलिंग मिरर और रोटेट सरल सरणियों द्वारा निर्मित की जाती हैं। | ||
रजिस्टर फाइलों में प्रति पोर्ट प्रति प्रविष्टि एक शब्द रेखा होती है, एक बिट लाइन प्रति बिट चौड़ाई प्रति रीड पोर्ट, और दो बिट लाइन प्रति बिट चौड़ाई प्रति राइट पोर्ट होती है। प्रत्येक [[बिट सेल]] में Vdd और Vss भी होते हैं। इसलिए, वायर पिच क्षेत्र | रजिस्टर फाइलों में प्रति पोर्ट प्रति प्रविष्टि एक शब्द रेखा होती है, एक बिट लाइन प्रति बिट चौड़ाई प्रति रीड पोर्ट, और दो बिट लाइन प्रति बिट चौड़ाई प्रति राइट पोर्ट होती है। प्रत्येक [[बिट सेल]] में Vdd और Vss भी होते हैं। इसलिए, वायर पिच क्षेत्र पोर्टों की संख्या के वर्ग के रूप में बढ़ता है, और ट्रांजिस्टर क्षेत्र रैखिक रूप से बढ़ता है।<ref name="janssen" > | ||
Johan Janssen. | Johan Janssen. | ||
[http://ce-publications.et.tudelft.nl/publications/1171_compiler_strategies_for_transport_triggered_architectures.pdf "Compiler Strategies for Transport Triggered Architectures"]. | [http://ce-publications.et.tudelft.nl/publications/1171_compiler_strategies_for_transport_triggered_architectures.pdf "Compiler Strategies for Transport Triggered Architectures"]. | ||
Line 24: | Line 24: | ||
p. 171-173. | p. 171-173. | ||
</ref> | </ref> | ||
कुछ बिंदुओं पर, सभी रीड पोर्ट्स के साथ एक ही रजिस्टर फ़ाइल के बजाय रीड पोर्ट्स की छोटी संख्या के साथ, कई अनावश्यक रजिस्टर फ़ाइलों के लिए यह छोटा और / या तेज़ हो सकता है। | |||
कुछ बिंदुओं पर, सभी रीड पोर्ट्स के साथ एक ही रजिस्टर फ़ाइल के बजाय रीड पोर्ट्स की छोटी संख्या के साथ, कई अनावश्यक रजिस्टर फ़ाइलों के लिए यह छोटा और / या तेज़ हो सकता है। एमआईपीएस आर्किटेक्चर [[R8000]] की [[पूर्णांक (कंप्यूटर विज्ञान)]] इकाई, उदाहरण के लिए, एक 9 रीड 4 राइट पोर्ट 32 प्रविष्टि 64-बिट रजिस्टर फ़ाइल 0.7 माइक्रोमीटर प्रक्रिया में लागू की गई थी, जिसे हाथ की लंबाई से चिप को देखने पर देखा जा सकता था। | |||
रजिस्टरों को कई रजिस्टर फाइलों में विभाजित करने के दो लोकप्रिय तरीके वितरित रजिस्टर फ़ाइल कॉन्फ़िगरेशन और विभाजित रजिस्टर फ़ाइल कॉन्फ़िगरेशन हैं।<ref name="janssen" /> | रजिस्टरों को कई रजिस्टर फाइलों में विभाजित करने के दो लोकप्रिय तरीके वितरित रजिस्टर फ़ाइल कॉन्फ़िगरेशन और विभाजित रजिस्टर फ़ाइल कॉन्फ़िगरेशन हैं।<ref name="janssen" /> | ||
सिद्धांत रूप में, कोई भी ऑपरेशन जो 64-बिट-वाइड रजिस्टर फ़ाइल के साथ कई रीड और राइट पोर्ट के साथ किया जा सकता है, एक 8-बिट-वाइड रजिस्टर फ़ाइल के साथ सिंगल रीड पोर्ट और सिंगल राइट पोर्ट के साथ किया जा सकता है। हालांकि, कई | सिद्धांत रूप में, कोई भी ऑपरेशन जो 64-बिट-वाइड रजिस्टर फ़ाइल के साथ कई रीड और राइट पोर्ट के साथ किया जा सकता है, एक 8-बिट-वाइड रजिस्टर फ़ाइल के साथ सिंगल रीड पोर्ट और सिंगल राइट पोर्ट के साथ किया जा सकता है। हालांकि, कई पोर्टों के साथ विस्तृत रजिस्टर फ़ाइलों की बिट-स्तरीय समानांतरता उन्हें बहुत तेजी से चलाने की अनुमति देती है और इस प्रकार, वे एक ही चक्र में संचालन कर सकते हैं जो कई चक्रों को कम पोर्टों या एक संकीर्ण बिट चौड़ाई या दोनों के साथ ले जाएगा। | ||
रजिस्टर फ़ाइल के बिट्स में चौड़ाई सामान्यतः [[शब्द (डेटा प्रकार)]] में बिट्स की संख्या होती है। | रजिस्टर फ़ाइल के बिट्स में चौड़ाई सामान्यतः [[शब्द (डेटा प्रकार)]] में बिट्स की संख्या होती है। कभी-कभी यह प्रत्येक रजिस्टर में अतिरिक्त बिट संलग्न करने के लिए थोड़ा चौड़ा होता है, जैसे ज़हर बिट। यदि डेटा शब्द की चौड़ाई किसी पते की चौड़ाई से अलग है- या कुछ मामलों में, जैसे कि [[68000]], भले ही वे समान चौड़ाई हों- पता रजिस्टर डेटा रजिस्टरों की तुलना में एक अलग रजिस्टर फ़ाइल में हैं। | ||
कभी-कभी यह प्रत्येक रजिस्टर में अतिरिक्त बिट संलग्न करने के लिए थोड़ा चौड़ा होता है, जैसे ज़हर बिट। | |||
यदि डेटा शब्द की चौड़ाई किसी पते की चौड़ाई से अलग है- या कुछ मामलों में, जैसे कि [[68000]], भले ही वे समान चौड़ाई हों- पता रजिस्टर डेटा रजिस्टरों की तुलना में एक अलग रजिस्टर फ़ाइल में हैं। | |||
=== डिकोडर === | === डिकोडर === | ||
* डिकोडर को | * डिकोडर को प्रायः प्री-डिकोडर और डिकोडर में तोड़ दिया जाता है। | ||
* डिकोडर AND गेट्स की एक श्रृंखला है जो शब्द रेखाओं को संचालित करता है। | * डिकोडर AND गेट्स की एक श्रृंखला है जो शब्द रेखाओं को संचालित करता है। | ||
* प्रति रीड या राइट पोर्ट में एक डिकोडर है। यदि सरणी में चार रीड और दो राइट पोर्ट हैं, उदाहरण के लिए, इसमें सरणी में प्रति बिट सेल में 6 शब्द पंक्तियाँ हैं, और डिकोडर में छह AND गेट्स प्रति पंक्ति हैं। ध्यान दें कि डिकोडर को सरणी से | * प्रति रीड या राइट पोर्ट में एक डिकोडर है। यदि सरणी में चार रीड और दो राइट पोर्ट हैं, उदाहरण के लिए, इसमें सरणी में प्रति बिट सेल में 6 शब्द पंक्तियाँ हैं, और डिकोडर में छह AND गेट्स प्रति पंक्ति हैं। ध्यान दें कि डिकोडर को सरणी से समानता रखना चाहिए, जो उन और द्वारों को चौड़ा और छोटा करने के लिए मजबूर करता है | ||
=== सरणी === | === सरणी === | ||
[[Image:regfile cell.png|right|frame| एक विशिष्ट रजिस्टर फ़ाइल - ट्रिपल-पोर्टेड, 2 रजिस्टरों से पढ़ने और 1 रजिस्टर को एक साथ लिखने में सक्षम - इस तरह की बिट | [[Image:regfile cell.png|right|frame| एक विशिष्ट रजिस्टर फ़ाइल - ट्रिपल-पोर्टेड, 2 रजिस्टरों से पढ़ने और 1 रजिस्टर को एक साथ लिखने में सक्षम - इस तरह की बिट सेल से बना है।]]बिट सेल के लिए मूल योजना: | ||
* राज्य को इनवर्टर की जोड़ी में संग्रहित किया जाता है। | * राज्य को इनवर्टर की जोड़ी में संग्रहित किया जाता है। | ||
* डेटा को NMOS ट्रांजिस्टर द्वारा एक बिट लाइन में पढ़ा जाता है। | * डेटा को NMOS ट्रांजिस्टर द्वारा एक बिट लाइन में पढ़ा जाता है। | ||
Line 46: | Line 45: | ||
* तो: रीड पोर्ट प्रति बिट सेल में एक ट्रांजिस्टर लेते हैं, राइट पोर्ट चार लेते हैं। | * तो: रीड पोर्ट प्रति बिट सेल में एक ट्रांजिस्टर लेते हैं, राइट पोर्ट चार लेते हैं। | ||
कई अनुकूलन संभव हैं: | कई अनुकूलन संभव हैं: | ||
* | * सेल के बीच लाइनें साझा करना, उदाहरण के लिए, Vdd और Vss | ||
* रीड बिट लाइन्स को | * रीड बिट लाइन्स को प्रायः Vdd और Vss के बीच किसी चीज के लिए प्रीचार्ज किया जाता है। | ||
* पढ़ें बिट लाइनें | * पढ़ें बिट लाइनें प्रायः Vdd या Vss के रास्ते का केवल एक अंश स्विंग करती हैं। एक अर्थ प्रवर्धक इस छोटे-स्विंग सिग्नल को पूर्ण तर्क स्तर में परिवर्तित करता है। छोटे स्विंग सिग्नल तेज़ होते हैं क्योंकि बिट लाइन में बहुत कम ड्राइव होती है लेकिन परजीवी धारिता का एक बड़ा सौदा होता है। | ||
* राइट बिट लाइन्स को ब्रेड किया जा सकता है, ताकि वे पास की पढ़ी गई बिटलाइन्स के साथ समान रूप से जोड़े। क्योंकि राइट बिटलाइन्स पूरे जोरों पर हैं, वे रीड बिटलाइन्स पर महत्वपूर्ण | * राइट बिट लाइन्स को ब्रेड किया जा सकता है, ताकि वे पास की पढ़ी गई बिटलाइन्स के साथ समान रूप से जोड़े। क्योंकि राइट बिटलाइन्स पूरे जोरों पर हैं, वे रीड बिटलाइन्स पर महत्वपूर्ण असुविधा पैदा कर सकते हैं। | ||
* यदि Vdd एक क्षैतिज रेखा है, तो इसे किसी अन्य डिकोडर द्वारा बंद किया जा सकता है, यदि कोई भी राइट पोर्ट उस चक्र के दौरान उस रेखा को लिख रहा हो। यह अनुकूलन लिखने की गति को बढ़ाता है। | * यदि Vdd एक क्षैतिज रेखा है, तो इसे किसी अन्य डिकोडर द्वारा बंद किया जा सकता है, यदि कोई भी राइट पोर्ट उस चक्र के दौरान उस रेखा को लिख रहा हो। यह अनुकूलन लिखने की गति को बढ़ाता है। | ||
* तकनीकें जो रजिस्टर फाइलों द्वारा उपयोग की जाने वाली ऊर्जा को कम करती हैं, कम-शक्ति [[कम बिजली इलेक्ट्रॉनिक्स]] में उपयोगी होती हैं<ref> | * तकनीकें जो रजिस्टर फाइलों द्वारा उपयोग की जाने वाली ऊर्जा को कम करती हैं, कम-शक्ति [[कम बिजली इलेक्ट्रॉनिक्स]] में उपयोगी होती हैं<ref> | ||
Line 60: | Line 59: | ||
अधिकांश रजिस्टर फाइलें एक साथ एक ही प्रविष्टि में कई राइट पोर्ट को लिखने से रोकने के लिए कोई विशेष प्रावधान नहीं करती हैं। इसके बजाय, निर्देश शेड्यूलिंग हार्डवेयर यह सुनिश्चित करता है कि किसी विशेष चक्र में केवल एक निर्देश एक विशेष प्रविष्टि लिखता है। यदि एक ही रजिस्टर को लक्षित करने वाले कई निर्देश जारी किए जाते हैं, तो एक को छोड़कर सभी का लेखन सक्षम बंद कर दिया जाता है। | अधिकांश रजिस्टर फाइलें एक साथ एक ही प्रविष्टि में कई राइट पोर्ट को लिखने से रोकने के लिए कोई विशेष प्रावधान नहीं करती हैं। इसके बजाय, निर्देश शेड्यूलिंग हार्डवेयर यह सुनिश्चित करता है कि किसी विशेष चक्र में केवल एक निर्देश एक विशेष प्रविष्टि लिखता है। यदि एक ही रजिस्टर को लक्षित करने वाले कई निर्देश जारी किए जाते हैं, तो एक को छोड़कर सभी का लेखन सक्षम बंद कर दिया जाता है। | ||
क्रास किए गए इनवर्टर राइट ऑपरेशन के बाद व्यवस्थित होने में कुछ सीमित समय लेते हैं, जिसके दौरान रीड ऑपरेशन में या तो अधिक समय लगेगा या | क्रास किए गए इनवर्टर राइट ऑपरेशन के बाद व्यवस्थित होने में कुछ सीमित समय लेते हैं, जिसके दौरान रीड ऑपरेशन में या तो अधिक समय लगेगा या गार्बेज वापस आएगा। बहुसंकेतकों को बायपास करना साधारण बात है जो लिखित डेटा को रीड पोर्ट्स पर बायपास करते हैं जब एक साथ एक ही प्रविष्टि को पढ़ने और लिखने का आदेश दिया जाता है। ये बाईपास मल्टीप्लेक्सर्स प्रायः एक बड़े बाईपास नेटवर्क का हिस्सा होते हैं जो आगे के परिणाम हैं जो अभी तक कार्यात्मक इकाइयों के बीच प्रतिबद्ध नहीं हैं। | ||
रजिस्टर फ़ाइल सामान्यतः उस डेटापथ से पिच-मिलान की जाती है जो वह कार्य करता है। पिच मैचिंग डेटापथ टर्न कॉर्नर के ऊपर से गुजरने वाली कई बसों से बचा जाता है, जो बहुत सारे क्षेत्र का उपयोग करेगा। लेकिन चूँकि प्रत्येक इकाई में एक ही बिट पिच होनी चाहिए, डेटापथ में प्रत्येक इकाई सबसे चौड़ी इकाई द्वारा मजबूर बिट पिच के साथ समाप्त होती है, जो अन्य इकाइयों में क्षेत्र को बर्बाद कर सकती है। फ़ाइलों को पंजीकृत करें, क्योंकि उनके पास दो तार प्रति बिट प्रति राइट पोर्ट हैं, और क्योंकि सभी बिट लाइनों को प्रत्येक बिट सेल पर सिलिकॉन से संपर्क करना चाहिए, | रजिस्टर फ़ाइल सामान्यतः उस डेटापथ से पिच-मिलान की जाती है जो वह कार्य करता है। पिच मैचिंग डेटापथ टर्न कॉर्नर के ऊपर से गुजरने वाली कई बसों से बचा जाता है, जो बहुत सारे क्षेत्र का उपयोग करेगा। लेकिन चूँकि प्रत्येक इकाई में एक ही बिट पिच होनी चाहिए, डेटापथ में प्रत्येक इकाई सबसे चौड़ी इकाई द्वारा मजबूर बिट पिच के साथ समाप्त होती है, जो अन्य इकाइयों में क्षेत्र को बर्बाद कर सकती है। फ़ाइलों को पंजीकृत करें, क्योंकि उनके पास दो तार प्रति बिट प्रति राइट पोर्ट हैं, और क्योंकि सभी बिट लाइनों को प्रत्येक बिट सेल पर सिलिकॉन से संपर्क करना चाहिए, प्रायः डेटापथ की पिच सेट कर सकते हैं। | ||
क्षेत्र को कभी-कभी डेटापथ में कई इकाइयों वाली मशीनों पर दो डेटापथों के साथ-साथ सहेजा जा सकता है, जिनमें से प्रत्येक में एक डेटापथ की तुलना में छोटी बिट पिच होती है। यह | क्षेत्र को कभी-कभी डेटापथ में कई इकाइयों वाली मशीनों पर दो डेटापथों के साथ-साथ सहेजा जा सकता है, जिनमें से प्रत्येक में एक डेटापथ की तुलना में छोटी बिट पिच होती है। यह प्रकरण सामान्यतः रत्येक डेटापथ के लिए एक रजिस्टर फ़ाइल की कई प्रतियों को बाध्य करता है। | ||
उदाहरण के लिए, [[अल्फा 21264]] (EV6) शैडो रजिस्टर फाइल आर्किटेक्चर को लागू करने वाला पहला बड़ा माइक्रो-आर्किटेक्चर था। इसमें पूर्णांक रजिस्टर फ़ाइल की दो प्रतियां और इसके फ्रंट एंड (भविष्य और स्केल फ़ाइल, प्रत्येक में 2 रीड और 2 राइट पोर्ट) में स्थित फ्लोटिंग पॉइंट रजिस्टर की दो प्रतियां थीं, और दोनों के बीच डेटा प्रसारित करने के लिए एक अतिरिक्त चक्र लिया। एक संदर्भ | उदाहरण के लिए, [[अल्फा 21264]] (EV6) शैडो रजिस्टर फाइल आर्किटेक्चर को लागू करने वाला पहला बड़ा माइक्रो-आर्किटेक्चर था। इसमें पूर्णांक रजिस्टर फ़ाइल की दो प्रतियां और इसके फ्रंट एंड (भविष्य और स्केल फ़ाइल, प्रत्येक में 2 रीड और 2 राइट पोर्ट) में स्थित फ्लोटिंग पॉइंट रजिस्टर की दो प्रतियां थीं, और दोनों के बीच डेटा प्रसारित करने के लिए एक अतिरिक्त चक्र लिया। एक संदर्भ स्विच जारी करने वाले तर्क ने दोनों के बीच डेटा अग्रेषण संचालन की संख्या को कम करने का प्रयास किया और इसके पूर्णांक प्रदर्शन में काफी सुधार किया, और सट्टा निष्पादन के साथ सुपरस्क्लेर आर्किटेक्चर में सामान्य-उद्देश्य रजिस्टरों की सीमित संख्या के प्रभाव को कम करने में मदद की। इस डिजाइन को बाद में स्पार्क, [[MIPS Technologies|एमआईपीएस टेक्नोलॉजीस]] और कुछ बाद के x86 कार्यान्वयनों द्वारा अनुकूलित किया गया था। | ||
एमआईपीएस आर्किटेक्चर कई रजिस्टर फाइलों का भी उपयोग करता है। R8000 फ़्लोटिंग-पॉइंट यूनिट में फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल की दो प्रतियाँ थीं, जिनमें से प्रत्येक में चार राइट और चार रीड पोर्ट थे, और एक संदर्भ स्विच के साथ एक ही समय में दोनों प्रतियाँ लिखीं। हालाँकि, यह पूर्णांक संचालन का समर्थन नहीं करता था, और पूर्णांक रजिस्टर फ़ाइल अभी भी वैसी ही बनी हुई थी। बाद में, एम्बेडेड मार्केट के पक्ष में छाया रजिस्टर फाइलों को नए डिजाइनों में छोड़ दिया गया। | |||
[[स्पार्क]] अपनी हाई-एंड लाइन के लिए एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर का भी उपयोग करता है। इसमें पूर्णांक रजिस्टर फाइलों की 4 प्रतियां (भविष्य, सेवानिवृत्त, स्केल और स्क्रैच, प्रत्येक में 7 रीड 4 राइट पोर्ट) और फ्लोटिंग पॉइंट रजिस्टर फ़ाइल की 2 प्रतियां हैं। हालांकि, अल्फा और x86 के विपरीत, वे बैकएंड में अपनी आउट-ऑफ-ऑर्डर यूनिट के ठीक बाद एक रिटायर यूनिट के रूप में स्थित हैं और रजिस्टर फाइलों का नाम बदल रहे हैं। छाया रजिस्टर निर्देश लाने और डिकोडिंग चरणों के दौरान निर्देशों को लोड नहीं करते हैं और इस डिजाइन में एक संदर्भ स्विच अनावश्यक है। | [[स्पार्क]] अपनी हाई-एंड लाइन के लिए एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर का भी उपयोग करता है। इसमें पूर्णांक रजिस्टर फाइलों की 4 प्रतियां (भविष्य, सेवानिवृत्त, स्केल और स्क्रैच, प्रत्येक में 7 रीड 4 राइट पोर्ट) और फ्लोटिंग पॉइंट रजिस्टर फ़ाइल की 2 प्रतियां हैं। हालांकि, अल्फा और x86 के विपरीत, वे बैकएंड में अपनी आउट-ऑफ-ऑर्डर यूनिट के ठीक बाद एक रिटायर यूनिट के रूप में स्थित हैं और रजिस्टर फाइलों का नाम बदल रहे हैं। छाया रजिस्टर निर्देश लाने और डिकोडिंग चरणों के दौरान निर्देशों को लोड नहीं करते हैं और इस डिजाइन में एक संदर्भ स्विच अनावश्यक है। | ||
आईबीएम कई प्रमुख माइक्रोप्रोसेसरों के समान तंत्र का उपयोग करता है, डिकोडर के साथ रजिस्टर फाइल को गहराई से मर्ज करता है, लेकिन इसकी रजिस्टर फाइलें डिकोडर पक्ष से स्वतंत्र रूप से काम करती हैं और इसमें संदर्भ स्विचिंग सम्मिलित नहीं होती है, जो अल्फा और x86 से अलग है। इसकी अधिकांश रजिस्टर फाइलें न केवल इसके समर्पित डिकोडर की सेवा करती हैं, बल्कि थ्रेड स्तर तक भी होती हैं। उदाहरण के लिए, [[POWER8]] में 8 निर्देश डिकोडर तक हैं, लेकिन 32 सामान्य प्रयोजन की 32 रजिस्टर फाइलें प्रत्येक को रजिस्टर करती हैं (4 रीड और 4 राइट | आईबीएम कई प्रमुख माइक्रोप्रोसेसरों के समान तंत्र का उपयोग करता है, डिकोडर के साथ रजिस्टर फाइल को गहराई से मर्ज करता है, लेकिन इसकी रजिस्टर फाइलें डिकोडर पक्ष से स्वतंत्र रूप से काम करती हैं और इसमें संदर्भ स्विचिंग सम्मिलित नहीं होती है, जो अल्फा और x86 से अलग है। इसकी अधिकांश रजिस्टर फाइलें न केवल इसके समर्पित डिकोडर की सेवा करती हैं, बल्कि थ्रेड स्तर तक भी होती हैं। उदाहरण के लिए, [[POWER8]] में 8 निर्देश डिकोडर तक हैं, लेकिन 32 सामान्य प्रयोजन की 32 रजिस्टर फाइलें प्रत्येक को रजिस्टर करती हैं (4 रीड और 4 राइट पोर्ट्स) [[एक साथ मल्टीथ्रेडिंग]] की सुविधा के लिए, क्योंकि संदर्भ स्विच की कमी के कारण इसके समानांतर निर्देशों का उपयोग किसी अन्य रजिस्टर फ़ाइल में नहीं किया जा सकता है। | ||
x86 प्रोसेसर लाइन में, एक विशिष्ट पूर्व-486 CPU में एक व्यक्तिगत रजिस्टर फ़ाइल नहीं थी, क्योंकि सभी सामान्य प्रयोजन रजिस्टर सीधे डिकोडर के साथ काम करते थे, और x87 पुश स्टैक फ़्लोटिंग-पॉइंट यूनिट के भीतर ही स्थित था। [[पेंटियम]] से | x86 प्रोसेसर लाइन में, एक विशिष्ट पूर्व-486 CPU में एक व्यक्तिगत रजिस्टर फ़ाइल नहीं थी, क्योंकि सभी सामान्य प्रयोजन रजिस्टर सीधे डिकोडर के साथ काम करते थे, और x87 पुश स्टैक फ़्लोटिंग-पॉइंट यूनिट के भीतर ही स्थित था। [[पेंटियम]] से प्रारम्भ होकर, एक विशिष्ट पेंटियम-संगत x86 प्रोसेसर एकल-पोर्ट आर्किटेक्चरल रजिस्टर फ़ाइल की एक प्रति के साथ एकीकृत होता है जिसमें 6 सामान्य-उद्देश्य रजिस्टर, 4 नियंत्रण रजिस्टर, 8 डिबग रजिस्टर (दो आरक्षित), 1 स्टैक पॉइंटर रजिस्टर, 1 होता है। स्टैक बेस रजिस्टर, 1 इंस्ट्रक्शन पॉइंटर, 1 फ्लैग रजिस्टर और 6 सेगमेंट रजिस्टर होते हैं। | ||
डिफ़ॉल्ट रूप से 8 x87 FP पुश डाउन स्टैक की एक प्रति, MMX (निर्देश सेट) रजिस्टर वस्तुतः x87 स्टैक से सिम्युलेटेड थे और MMX निर्देश की आपूर्ति के लिए x86 रजिस्टर की आवश्यकता होती है और स्टैक | डिफ़ॉल्ट रूप से 8 x87 FP पुश डाउन स्टैक की एक प्रति, MMX (निर्देश सेट) रजिस्टर वस्तुतः x87 स्टैक से सिम्युलेटेड थे और MMX निर्देश की आपूर्ति के लिए x86 रजिस्टर की आवश्यकता होती है और स्टैक सम्मिलित होने के लिए उपनाम P6 पर, [[सूक्ष्म संचालन]] में डीकोड करने और आउट-ऑफ-ऑर्डर निष्पादन में नाम बदलने से पहले स्वतंत्र रूप से निर्देश को प्रारंभिक पाइपलाइन चरणों में समानांतर में संग्रहीत और निष्पादित किया जा सकता है। [[P6 (माइक्रोआर्किटेक्चर)]] से प्रारम्भ होकर, सभी रजिस्टर फाइलों को डेटा के प्रचार के लिए अतिरिक्त चक्र की आवश्यकता नहीं होती है, आर्किटेक्चरल और फ्लोटिंग पॉइंट जैसी रजिस्टर फाइलें कोड बफर और डिकोडर्स के बीच स्थित होती हैं, जिन्हें रिटायर बफर, रीऑर्डर बफर और OoOE कहा जाता है और रिंग बस के भीतर जुड़ा होता है ( 16 बाइट्स)। रजिस्टर फ़ाइल अभी भी एक x86 रजिस्टर फ़ाइल और एक x87 स्टैक बनी हुई है और दोनों रिटायरमेंट स्टोरिंग के रूप में काम करती हैं। परिणाम भंडारण के लिए बैंडविड्थ बढ़ाने के लिए इसकी x86 रजिस्टर फ़ाइल को दोहरे पोर्ट में बढ़ाया गया था। डिबग/कंडीशन कोड/कंट्रोल/अनाम/फ्लैग जैसे रजिस्टरों को मुख्य रजिस्टर फाइल से हटा दिया गया और माइक्रो-ऑप रोम और इंस्ट्रक्शन सीक्वेंसर के बीच अलग-अलग फाइलों में रखा गया। केवल दुर्गम रजिस्टर जैसे खंड रजिस्टर अब सामान्य-उद्देश्य रजिस्टर फ़ाइल (निर्देश सूचक को छोड़कर) से अलग हो गए हैं; वे अब शेड्यूलर और इंस्ट्रक्शन एलोकेटर के बीच स्थित हैं, ताकि रजिस्टर का नाम बदलने और आउट-ऑफ-ऑर्डर निष्पादन की सुविधा मिल सके। पेंटियम III में 128-बिट XMM रजिस्टर के प्रारम्भ के बाद x87 स्टैक को बाद में फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल के साथ मिला दिया गया था, लेकिन XMM रजिस्टर फ़ाइल अभी भी x86 पूर्णांक रजिस्टर फ़ाइलों से अलग स्थित है। | ||
बाद में P6 कार्यान्वयन (पेंटियम एम, योनाह) ने एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर पेश किया जो दोहरे पोर्ट वाले पूर्णांक आर्किटेक्चरल रजिस्टर फ़ाइलों की 2 प्रतियों तक विस्तारित हुआ और इसमें संदर्भ स्विच (भविष्य और सेवानिवृत्त फ़ाइल और स्केल फ़ाइल के बीच पूर्णांक और पूर्णांक के बीच उपयोग की जाने वाली एक ही चाल का उपयोग करके) सम्मिलित है। तैरनेवाला स्थल)। माइक्रो-ऑपरेशन फ्यूजन | बाद में P6 कार्यान्वयन (पेंटियम एम, योनाह) ने एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर पेश किया जो दोहरे पोर्ट वाले पूर्णांक आर्किटेक्चरल रजिस्टर फ़ाइलों की 2 प्रतियों तक विस्तारित हुआ और इसमें संदर्भ स्विच (भविष्य और सेवानिवृत्त फ़ाइल और स्केल फ़ाइल के बीच पूर्णांक और पूर्णांक के बीच उपयोग की जाने वाली एक ही चाल का उपयोग करके) सम्मिलित है। तैरनेवाला स्थल)। माइक्रो-ऑपरेशन फ्यूजन प्रारम्भ होने के बाद x86 आर्किटेक्चर में सम्मिलित रजिस्टर अड़चन को हल करने के लिए ऐसा किया गया था, लेकिन इसमें अभी भी प्रति फ़ाइल क्षमता में कुल 32 बाइट्स के लिए 8 प्रविष्टियां 32 बिट आर्किटेक्चरल रजिस्टर हैं (सेगमेंट रजिस्टर और इंस्ट्रक्शन पॉइंटर बने हुए हैं) सट्टा फ़ाइल के रूप में फ़ाइल के भीतर, हालांकि वे प्रोग्राम द्वारा पहुंच योग्य नहीं हैं)। दूसरी फ़ाइल को स्केल्ड शैडो रजिस्टर फ़ाइल के रूप में परोसा जाता है, जो संदर्भ स्विच के बिना स्केल की गई फ़ाइल कुछ निर्देशों को स्वतंत्र रूप से संग्रहीत नहीं कर सकती है। SSE2/SSE3/SSSE3 के कुछ निर्देशों को पूर्णांक संचालन के लिए इस सुविधा की आवश्यकता होती है, उदाहरण के लिए PSHUFB, PMADDUBSW, PHSUBW, PHSUBD, PHSUBSW, PHADDW, PHADDD, PHADDSW जैसे निर्देशों के लिए दोनों रजिस्टर फ़ाइलों से EAX/EBX/ECX/EDX लोड करने की आवश्यकता होगी, हालाँकि एक x86 प्रोसेसर के लिए एक ही निर्देश के साथ दूसरी रजिस्टर फ़ाइल का उपयोग करना असामान्य था। ज्यादातर समय, दूसरी फाइल को स्केल रिटायर्ड फाइल के रूप में परोसा जाता है। पेंटियम एम आर्किटेक्चर में अभी भी एक दोहरे पोर्ट वाली फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल (8 प्रविष्टियाँ MM/XMM) हैं जो तीन डिकोडर्स के साथ साझा की गई हैं, और FP रजिस्टर फ़ाइल में इसके साथ एक शैडो रजिस्टर फ़ाइल नहीं है, क्योंकि इसकी शैडो-रजिस्टर-फ़ाइल आर्किटेक्चर में फ़्लोटिंग-पॉइंट फ़ंक्शंस सम्मिलित नहीं थे। P6 के बाद के प्रोसेसर में aआर्किटेक्चरल रजिस्टर फाइलें बाहरी हैं और रिटायर्ड फाइल के बाद प्रोसेसर के बैकएंड में स्थित हैं, जैसा कि रजिस्टर रीनेमिंग/रीऑर्डर बफर के लिए आंतरिक कोर में स्थित आंतरिक रजिस्टर फाइल के विपरीत है। हालाँकि, कोर 2 में अब इसे एक इकाई के भीतर रखा गया है जिसे रजिस्टर अलियास टेबल (RAT) कहा जाता है, जो निर्देश आवंटक के साथ स्थित है, लेकिन सेवानिवृत्ति के समान आकार के रजिस्टर आकार का है। [[कोर (माइक्रोआर्किटेक्चर)]] ने आंतरिक रिंग बस को 24 बाइट्स तक बढ़ा दिया (3 से अधिक निर्देशों को डिकोड करने की अनुमति दी) और इसकी रजिस्टर फ़ाइल को डुअल-पोर्टेड (एक रीड/वन राइट) से क्वाड-पोर्टेड (दो रीड/टू राइट) तक बढ़ा दिया। रजिस्टर अभी भी 32 बिट और 32 बाइट्स में 8 प्रविष्टियां बनी हुई हैं (6 खंड रजिस्टर और एक निर्देश सूचक को सम्मिलित नहीं किया गया है क्योंकि वे फ़ाइल में किसी भी कोड/निर्देश द्वारा एक्सेस करने में असमर्थ हैं) कुल फ़ाइल आकार में और कुल के लिए x64 में 16 प्रविष्टियों तक विस्तारित प्रति फ़ाइल 128 बाइट आकार। पेंटियम एम से इसकी पाइपलाइन पोर्ट और डिकोडर में वृद्धि हुई, लेकिन वे कोड बफर के बजाय आवंटन तालिका के साथ स्थित हैं। इसकी एफपी एक्सएमएम रजिस्टर फ़ाइल को क्वाड-पोर्टेड (2 रीड/2 राइट) में भी बढ़ाया गया है, रजिस्टर अभी भी 32 बिट में 8 प्रविष्टियां बनी हुई हैं और x64 मोड में 16 प्रविष्टियों तक विस्तारित हैं और संख्या अभी भी 1 बनी हुई है क्योंकि इसका शैडो-रजिस्टर-फाइल आर्किटेक्चर है फ़्लोटिंग पॉइंट/एसएसई कार्यों सहित नहीं। | ||
बाद के x86 कार्यान्वयन में, जैसे [[नेहलेम (माइक्रोआर्किटेक्चर)]] और बाद के प्रोसेसर, दोनों पूर्णांक और फ्लोटिंग पॉइंट रजिस्टरों को अब एक एकीकृत ऑक्टा-पोर्टेड (छह पढ़ने और दो लिखने) सामान्य-उद्देश्य रजिस्टर फ़ाइल (32-बिट में 8 + 8) में सम्मिलित किया गया है। 16 + 16 प्रति फ़ाइल x64 में), जबकि [[हाइपर थ्रेडिंग]] को निष्पादित करने के पसंदीदा में बढ़ी हुई शैडो रजिस्टर फ़ाइल आर्किटेक्चर के साथ रजिस्टर फ़ाइल को 2 तक बढ़ाया गया है और प्रत्येक थ्रेड अपने डिकोडर के लिए स्वतंत्र रजिस्टर फ़ाइलों का उपयोग करता है। बाद में [[सैंडी ब्रिज]] और आगे की जगह शैडो रजिस्टर टेबल और आर्किटेक्चरल रजिस्टरों को रीऑर्डर बफर को डिकोड करने से पहले बहुत बड़ी और अभी तक अधिक उन्नत भौतिक रजिस्टर फ़ाइल के साथ बदल दिया गया। रैंडर्ड ने कहा कि सैंडी ब्रिज और आगे अब एक वास्तुशिल्प रजिस्टर नहीं है। | बाद के x86 कार्यान्वयन में, जैसे [[नेहलेम (माइक्रोआर्किटेक्चर)]] और बाद के प्रोसेसर, दोनों पूर्णांक और फ्लोटिंग पॉइंट रजिस्टरों को अब एक एकीकृत ऑक्टा-पोर्टेड (छह पढ़ने और दो लिखने) सामान्य-उद्देश्य रजिस्टर फ़ाइल (32-बिट में 8 + 8) में सम्मिलित किया गया है। 16 + 16 प्रति फ़ाइल x64 में), जबकि [[हाइपर थ्रेडिंग]] को निष्पादित करने के पसंदीदा में बढ़ी हुई शैडो रजिस्टर फ़ाइल आर्किटेक्चर के साथ रजिस्टर फ़ाइल को 2 तक बढ़ाया गया है और प्रत्येक थ्रेड अपने डिकोडर के लिए स्वतंत्र रजिस्टर फ़ाइलों का उपयोग करता है। बाद में [[सैंडी ब्रिज]] और आगे की जगह शैडो रजिस्टर टेबल और आर्किटेक्चरल रजिस्टरों को रीऑर्डर बफर को डिकोड करने से पहले बहुत बड़ी और अभी तक अधिक उन्नत भौतिक रजिस्टर फ़ाइल के साथ बदल दिया गया। रैंडर्ड ने कहा कि सैंडी ब्रिज और आगे अब एक वास्तुशिल्प रजिस्टर नहीं है। | ||
Line 84: | Line 83: | ||
बॉननेल (माइक्रोआर्किटेक्चर) लाइन पर P5 का आधुनिक सरलीकृत संशोधन था। इसमें थ्रेड और डिकोडर के साथ रजिस्टर फाइल शेयर की एकल प्रतियां सम्मिलित हैं। रजिस्टर फ़ाइल एक डुअल-पोर्ट डिज़ाइन है, 8/16 प्रविष्टियाँ GPRS, 8/16 प्रविष्टियाँ डीबग रजिस्टर और 8/16 प्रविष्टियाँ स्थिति कोड एक ही फ़ाइल में एकीकृत हैं। हालाँकि इसमें आठ-प्रविष्टियाँ 64 बिट शैडो आधारित रजिस्टर और आठ-प्रविष्टियाँ 64 बिट अनाम रजिस्टर हैं जो अब मूल P5 डिज़ाइन के विपरीत मुख्य GPRs से अलग हैं और निष्पादन इकाई के बाद स्थित हैं, और इन रजिस्टरों की फ़ाइल सिंगल-पोर्टेड है और Core/Core2 पर पाई गई स्केल्ड शैडो रजिस्टर फाइल जैसे निर्देश के संपर्क में नहीं आता (शैडो रजिस्टर फाइल आर्किटेक्चरल रजिस्टरों से बनी होती है और बॉननेल में शैडो रजिस्टर फाइल आर्किटेक्चर नहीं होने के कारण नहीं था), हालांकि फाइल का उपयोग कमी के कारण नाम बदलने के उद्देश्य से किया जा सकता है बॉननेल आर्किटेक्चर पर ऑर्डर के बाहर निष्पादन पाया गया। इसमें एक्सएमएम फ़्लोटिंग पॉइंट रजिस्टर फ़ाइल प्रति थ्रेड की एक प्रति भी थी। नेहलेम (माइक्रोआर्किटेक्चर) से अंतर यह है कि बॉननेल के पास एकीकृत रजिस्टर फ़ाइल नहीं है और इसके हाइपर थ्रेडिंग के लिए कोई समर्पित रजिस्टर फ़ाइल नहीं है। इसके बजाय, बॉननेल अपने थ्रेड के लिए एक अलग नाम रजिस्टर का उपयोग करता है, भले ही यह क्रम से बाहर न हो। Bonnell, Larrabee (माइक्रोआर्किटेक्चर) और [[Xeon Phi]] के समान ही प्रत्येक के पास केवल एक सामान्य-उद्देश्य पूर्णांक रजिस्टर फ़ाइल है, लेकिन Larrabee में 16 XMM रजिस्टर फ़ाइलें (प्रति फ़ाइल 8 प्रविष्टियाँ) हैं, और Xeon Phi में 128 AVX- तक हैं। 512 रजिस्टर फाइलें, प्रत्येक में वेक्टर इंस्ट्रक्शन स्टोरेज के लिए 32 512-बिट ZMM रजिस्टर होते हैं, जो L2 कैश जितना बड़ा हो सकता है। | बॉननेल (माइक्रोआर्किटेक्चर) लाइन पर P5 का आधुनिक सरलीकृत संशोधन था। इसमें थ्रेड और डिकोडर के साथ रजिस्टर फाइल शेयर की एकल प्रतियां सम्मिलित हैं। रजिस्टर फ़ाइल एक डुअल-पोर्ट डिज़ाइन है, 8/16 प्रविष्टियाँ GPRS, 8/16 प्रविष्टियाँ डीबग रजिस्टर और 8/16 प्रविष्टियाँ स्थिति कोड एक ही फ़ाइल में एकीकृत हैं। हालाँकि इसमें आठ-प्रविष्टियाँ 64 बिट शैडो आधारित रजिस्टर और आठ-प्रविष्टियाँ 64 बिट अनाम रजिस्टर हैं जो अब मूल P5 डिज़ाइन के विपरीत मुख्य GPRs से अलग हैं और निष्पादन इकाई के बाद स्थित हैं, और इन रजिस्टरों की फ़ाइल सिंगल-पोर्टेड है और Core/Core2 पर पाई गई स्केल्ड शैडो रजिस्टर फाइल जैसे निर्देश के संपर्क में नहीं आता (शैडो रजिस्टर फाइल आर्किटेक्चरल रजिस्टरों से बनी होती है और बॉननेल में शैडो रजिस्टर फाइल आर्किटेक्चर नहीं होने के कारण नहीं था), हालांकि फाइल का उपयोग कमी के कारण नाम बदलने के उद्देश्य से किया जा सकता है बॉननेल आर्किटेक्चर पर ऑर्डर के बाहर निष्पादन पाया गया। इसमें एक्सएमएम फ़्लोटिंग पॉइंट रजिस्टर फ़ाइल प्रति थ्रेड की एक प्रति भी थी। नेहलेम (माइक्रोआर्किटेक्चर) से अंतर यह है कि बॉननेल के पास एकीकृत रजिस्टर फ़ाइल नहीं है और इसके हाइपर थ्रेडिंग के लिए कोई समर्पित रजिस्टर फ़ाइल नहीं है। इसके बजाय, बॉननेल अपने थ्रेड के लिए एक अलग नाम रजिस्टर का उपयोग करता है, भले ही यह क्रम से बाहर न हो। Bonnell, Larrabee (माइक्रोआर्किटेक्चर) और [[Xeon Phi]] के समान ही प्रत्येक के पास केवल एक सामान्य-उद्देश्य पूर्णांक रजिस्टर फ़ाइल है, लेकिन Larrabee में 16 XMM रजिस्टर फ़ाइलें (प्रति फ़ाइल 8 प्रविष्टियाँ) हैं, और Xeon Phi में 128 AVX- तक हैं। 512 रजिस्टर फाइलें, प्रत्येक में वेक्टर इंस्ट्रक्शन स्टोरेज के लिए 32 512-बिट ZMM रजिस्टर होते हैं, जो L2 कैश जितना बड़ा हो सकता है। | ||
इंटेल की कुछ अन्य x86 लाइनें हैं जिनके आंतरिक डिज़ाइन, [[MediaGX]] और [[Vortex86]] में एक रजिस्टर फ़ाइल नहीं है और कई एम्बेडेड प्रोसेसर हैं जो पेंटियम-संगत या रिवर्स-इंजीनियर्ड प्रारंभिक 80x86 प्रोसेसर नहीं हैं। इसलिए, उनमें से ज्यादातर के पास रेगी नहीं हैster फ़ाइल उनके डिकोडर्स के लिए है, लेकिन उनके GPRs का अलग-अलग उपयोग किया जाता है। दूसरी ओर, [[नेटबर्स्ट (माइक्रोआर्किटेक्चर)]], इसके डिकोडर के लिए एक रजिस्टर फ़ाइल नहीं है, क्योंकि इसके x86 जीपीआर इसकी संरचना के भीतर सम्मिलित नहीं थे, एक भौतिक एकीकृत नाम बदलने वाली रजिस्टर फ़ाइल (सैंडी ब्रिज के समान, लेकिन) के प्रारम्भ के कारण आर्किटेक्चरल रजिस्टर फ़ाइल को बदलने और x86 डिकोडिंग योजना को छोड़ने के प्रयास के लिए पेंटियम 4 के नामकरण से पहले रजिस्टर का उपयोग करने में असमर्थता के कारण थोड़ा अलग)। इसके बजाय यह एएलयू से पहले पूर्णांक निष्पादन और भंडारण के लिए एसएसई का उपयोग करता है और परिणाम के बाद, एसएसई 2/एसएसई 3/एसएसएसई 3 उसी तंत्र का उपयोग अपने पूर्णांक ऑपरेशन के लिए भी करता है। | |||
AMD के शुरुआती डिज़ाइन जैसे K6 में | AMD के शुरुआती डिज़ाइन जैसे K6 में इंटेल की तरह एक रजिस्टर फ़ाइल नहीं है और यह शैडो रजिस्टर फ़ाइल आर्किटेक्चर का समर्थन नहीं करता है क्योंकि इसके संदर्भ स्विच की कमी और बाईपास इन्वर्टर जो एक रजिस्टर फ़ाइल को उचित रूप से कार्य करने के लिए आवश्यक हैं। इसके बजाय वे एक अलग जीपीआर का उपयोग करते हैं जो एक समर्पित पूर्णांक डिकोडर और फ्लोटिंग डिकोडर के साथ अपने ओओओई सीपीयू के लिए एक नाम रजिस्टर तालिका से सीधे लिंक करता है। तंत्र इंटेल के प्री-पेंटियम प्रोसेसर लाइन के समान है। उदाहरण के लिए, [[AMD K6]] प्रोसेसर में चार int (एक आठ-प्रविष्टियाँ अस्थायी स्क्रैच रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ भविष्य की रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ प्राप्त की गई रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ अनाम रजिस्टर फ़ाइल) और दो FP नाम बदलने वाली रजिस्टर फ़ाइलें होती हैं। (दो आठ-प्रविष्टियाँ x87 ST फ़ाइल एक fadd जाती है और एक fmov जाती है) जो पूर्णांक नाम बदलने के लिए अपने x86 EAX के साथ सीधे लिंक करती है और फ्लोटिंग पॉइंट रीनेमिंग के लिए XMM0 रजिस्टर करती है, लेकिन बाद में [[AMD K7]] ने इसके फ्रंट एंड में शैडो रजिस्टर सम्मिलित किया, इसे बढ़ाया गया डिकोड होने से पहले क्रम पूर्णांक संचालन के लिए 40 प्रविष्टियाँ एकीकृत रजिस्टर फ़ाइल, रजिस्टर फ़ाइल में 8 प्रविष्टियाँ स्क्रैच रजिस्टर + 16 भविष्य की GPRs रजिस्टर फ़ाइल + 16 अनाम GPRs रजिस्टर फ़ाइल होती हैं। बाद के [[एएमडी]] डिजाइनों में यह छाया रजिस्टर डिजाइन को छोड़ देता है और व्यक्तिगत जीपीआर डायरेक्ट लिंक डिजाइन के साथ के6 आर्किटेक्चर का समर्थन करता है। [[आमद फेनम]] की तरह, इसमें तीन इंट रजिस्टर फाइलें और दो एसएसई रजिस्टर फाइलें हैं जो सीधे जीपीआर से जुड़ी भौतिक रजिस्टर फाइल में स्थित हैं। हालाँकि, यह [[बुलडोजर (माइक्रोआर्किटेक्चर)]] पर एक पूर्णांक + एक फ़्लोटिंग-पॉइंट तक मापता है। शुरुआती एएमडी डिजाइनों की तरह, अधिकांश x86 निर्माताओं जैसे कि सिरिक्स, वीआईए, डीएम एंड पी, और एसआईएस ने भी उसी तंत्र का उपयोग किया, जिसके परिणामस्वरूप उनके इन-ऑर्डर सीपीयू के नाम बदलने के बिना पूर्णांक प्रदर्शन की कमी हुई। सिरिक्स और एएमडी जैसी कंपनियों को बाधाओं को कम करने की आशा में कैश आकार में वृद्धि करनी पड़ी। एएमडी का एसएसई पूर्णांक ऑपरेशन कोर 2 और पेंटियम 4 की तुलना में एक अलग तरीके से काम करता है; यह डीकोड चरण से पहले मान को सीधे लोड करने के लिए अपने अलग नाम बदलने वाले पूर्णांक रजिस्टर का उपयोग करता है। हालांकि सैद्धांतिक रूप से इसे इंटेल के एसएसई कार्यान्वयन की तुलना में केवल एक छोटी पाइपलाइन की आवश्यकता होगी, लेकिन सामान्यतः शाखा भविष्यवाणी की लागत इंटेल की तुलना में बहुत अधिक और उच्च लापता दर होती है, और इसके एसएसई निर्देश को निष्पादित करने के लिए कम से कम दो चक्र लेने होंगे चाहे कोई भी हो विस्तृत निर्देश, जैसा कि शुरुआती एएमडी कार्यान्वयन एसएसई निर्देश सेट में एफपी और इंट दोनों को निष्पादित नहीं कर सका जैसे इंटेल के कार्यान्वयन ने किया था। | ||
अल्फा 21264 के विपरीत, | अल्फा 21264 के विपरीत, स्पार्क, और एमआईपीएस आर्किटेक्चर जो एक समय में एक ऑपरेंड को लोड/लाने के लिए केवल एक रजिस्टर फ़ाइल की अनुमति देता है; सुपरस्केल प्राप्त करने के लिए इसे कई रजिस्टर फाइलों की आवश्यकता होगी। दूसरी तरफ [[एआरएम वास्तुकला]] प्रोसेसर निर्देशों को लोड/लाने के लिए एकाधिक रजिस्टर फाइलों को एकीकृत नहीं करता है। एआरएम जीपीआर का निर्देश सेट के लिए कोई विशेष उद्देश्य नहीं है (एआरएम आईएसए को संचायक, सूचकांक और स्टैक/बेस पॉइंट की आवश्यकता नहीं है। रजिस्टरों में एक संचायक नहीं है और बेस/स्टैक पॉइंट केवल थंब मोड में उपयोग किया जा सकता है)। कोई भी जीपीआर छोटे कोड आकार में स्वतंत्र रूप से कई निर्देशों को प्रचारित और संग्रहीत कर सकता है जो एक रजिस्टर में फिट होने में सक्षम होने के लिए काफी छोटा है और इसका वास्तु रजिस्टर एक टेबल के रूप में कार्य करता है और सभी डिकोडर/निर्देशों के साथ सरल बैंक स्विचिंग के साथ साझा किया जाता है।ओडर। एआरएम और अन्य डिजाइनों के बीच प्रमुख अंतर यह है कि एआरएम सुपरस्केलर में अतिरिक्त रजिस्टर फ़ाइल की आवश्यकता के बिना त्वरित बैंक स्विचिंग के साथ समान सामान्य-उद्देश्य रजिस्टर पर चलने की अनुमति देता है। एआरएम के साथ एक ही तंत्र साझा करने वाले x86 के बावजूद कि इसके जीपीआर व्यक्तिगत रूप से किसी भी डेटा को स्टोर कर सकते हैं, यदि तीन से अधिक गैर-संबंधित निर्देश संग्रहीत किए जाते हैं, तो x86 डेटा निर्भरता का सामना करेगा, क्योंकि इसकी जीपीआर प्रति फ़ाइल बहुत छोटी है (32 बिट मोड में आठ और 16 बिट मोड में) डेटा के लिए ARM के 13 में 32 बिट और 31 में 64 बिट की तुलना में 64 बिट, और इसके डिकोडर को फीड करने के लिए कई रजिस्टर फ़ाइलों के बिना सुपरस्क्लेर होना असंभव है (x86 कोड ARM की तुलना में बड़ा और जटिल है)। क्योंकि प्रतिस्पर्धी होने के लिए अधिकांश x86 के फ्रंट-एंड एआरएम प्रोसेसर की तुलना में बहुत बड़े और अधिक शक्ति वाले हो गए हैं (उदाहरण: पेंटियम एम एंड कोर 2 डुओ, बे ट्रेल)। कोई समर्पित रजिस्टर-फाइल आर्किटेक्चर न होने के कारण कुछ तृतीय-पक्ष x86 समतुल्य प्रोसेसर ARM के साथ गैर-प्रतिस्पर्धी भी बन गए। विशेष रूप से एएमडी, साइरिक्स और वीआईए के लिए जो रजिस्टर का नाम बदलने और आदेश निष्पादन के बिना कोई उचित प्रदर्शन नहीं ला सकता है, जो मोबाइल प्रतिस्पर्धा में केवल इंटेल एटम को क्रम में x86 प्रोसेसर कोर होने के लिए छोड़ देता है। यह तब तक था जब तक कि x86 नेहलेम प्रोसेसर ने अपने पूर्णांक और फ़्लोटिंग पॉइंट रजिस्टर दोनों को एक ही फ़ाइल में विलय कर दिया, और इसके आउट-ऑफ-ऑर्डर आंतरिक कोर में नाम बदलने से पहले एक बड़े भौतिक रजिस्टर टेबल और इसके फ्रंट-एंड में एन्हांस्ड एलोकेटर टेबल का परिचय दिया। . | ||
== नाम बदलने का पंजीकरण करें == | == नाम बदलने का पंजीकरण करें == | ||
रजिस्टर रीनेमिंग करने वाले प्रोसेसर भौतिक रजिस्टर फ़ाइल के सबसेट में लिखने के लिए प्रत्येक कार्यात्मक इकाई के लिए व्यवस्था कर सकते हैं। यह व्यवस्था क्षेत्र में बड़ी बचत के लिए प्रति बिट सेल में कई राइट पोर्ट की आवश्यकता को समाप्त कर सकती है। परिणामी रजिस्टर फाइल, प्रभावी रूप से सिंगल राइट पोर्ट के साथ रजिस्टर फाइलों का ढेर, फिर रीड पोर्ट्स की प्रतिकृति और सबसेटिंग से लाभ होता है। सीमा पर, यह तकनीक प्रत्येक कार्यात्मक इकाई के इनपुट पर 1-राइट, 2-रीड रेगफाइल्स का ढेर लगाती है। चूंकि कम संख्या में | रजिस्टर रीनेमिंग करने वाले प्रोसेसर भौतिक रजिस्टर फ़ाइल के सबसेट में लिखने के लिए प्रत्येक कार्यात्मक इकाई के लिए व्यवस्था कर सकते हैं। यह व्यवस्था क्षेत्र में बड़ी बचत के लिए प्रति बिट सेल में कई राइट पोर्ट की आवश्यकता को समाप्त कर सकती है। परिणामी रजिस्टर फाइल, प्रभावी रूप से सिंगल राइट पोर्ट के साथ रजिस्टर फाइलों का ढेर, फिर रीड पोर्ट्स की प्रतिकृति और सबसेटिंग से लाभ होता है। सीमा पर, यह तकनीक प्रत्येक कार्यात्मक इकाई के इनपुट पर 1-राइट, 2-रीड रेगफाइल्स का ढेर लगाती है। चूंकि कम संख्या में पोर्टों के साथ regfiles में प्रायः ट्रांजिस्टर क्षेत्र का प्रभुत्व होता है, इसलिए इस तकनीक को इस सीमा तक नहीं धकेलना सबसे अच्छा है, लेकिन यह सभी के लिए उपयोगी है। | ||
== विंडोज़ पंजीकृत करें == | == विंडोज़ पंजीकृत करें == | ||
स्पार्क ISA [[रजिस्टर विंडो]] को परिभाषित करता है, जिसमें रजिस्टरों के 5-बिट आर्किटेक्चरल नाम वास्तव में सैकड़ों प्रविष्टियों के साथ एक बहुत बड़ी रजिस्टर फ़ाइल पर एक विंडो की ओर इशारा करते हैं। सैकड़ों प्रविष्टियों के साथ मल्टीपोर्टेड रजिस्टर फाइलों को लागू करने के लिए बड़े क्षेत्र की आवश्यकता होती है। जब स्थानांतरित किया जाता है तो रजिस्टर विंडो 16 रजिस्टरों से स्लाइड करती है, ताकि प्रत्येक आर्किटेक्चरल रजिस्टर नाम बड़े सरणी में केवल कुछ ही रजिस्टरों को संदर्भित कर सके, उदा। आर्किटेक्चरल रजिस्टर r20 केवल भौतिक रजिस्टरों #20, #36, #52, #68, #84, #100, #116 को संदर्भित कर सकता है, अगर भौतिक फ़ाइल में सिर्फ सात विंडो हैं। | |||
क्षेत्र को बचाने के लिए, कुछ स्पार्क कार्यान्वयन 32-प्रविष्टि रजिस्टर फ़ाइल को लागू करते हैं, जिसमें प्रत्येक सेल में सात बिट होते हैं। बाहरी | क्षेत्र को बचाने के लिए, कुछ स्पार्क कार्यान्वयन 32-प्रविष्टि रजिस्टर फ़ाइल को लागू करते हैं, जिसमें प्रत्येक सेल में सात बिट होते हैं। बाहरी पोर्टों के माध्यम से केवल एक ही पढ़ा और लिखा जा सकता है, लेकिन बिट्स की सामग्री को घुमाया जा सकता है। एक रोटेशन एक चक्र में रजिस्टर विंडो के एक आंदोलन को पूरा करता है। क्योंकि राज्य संचलन को पूरा करने वाले अधिकांश तार स्थानीय हैं, कम शक्ति के साथ जबरदस्त बैंडविड्थ संभव है। | ||
इसी तकनीक का उपयोग [[R10000]] रजिस्टर रीनेमिंग मैपिंग फ़ाइल में किया जाता है, जो प्रत्येक भौतिक रजिस्टर के लिए 6-बिट वर्चुअल रजिस्टर नंबर संग्रहीत करता है। नाम बदलने वाली फ़ाइल में, जब भी कोई शाखा ली जाती है, तो नाम बदलने की स्थिति की जाँच की जाती है, ताकि जब किसी शाखा के गलत होने का पता चले, तो पुराने नाम बदलने की स्थिति को एक ही चक्र में पुनर्प्राप्त किया जा सके। (रजिस्टर नाम बदलें देखें।) | इसी तकनीक का उपयोग [[R10000]] रजिस्टर रीनेमिंग मैपिंग फ़ाइल में किया जाता है, जो प्रत्येक भौतिक रजिस्टर के लिए 6-बिट वर्चुअल रजिस्टर नंबर संग्रहीत करता है। नाम बदलने वाली फ़ाइल में, जब भी कोई शाखा ली जाती है, तो नाम बदलने की स्थिति की जाँच की जाती है, ताकि जब किसी शाखा के गलत होने का पता चले, तो पुराने नाम बदलने की स्थिति को एक ही चक्र में पुनर्प्राप्त किया जा सके। (रजिस्टर नाम बदलें देखें।) | ||
Line 111: | Line 110: | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
{{Wikibooks | Microprocessor Design | Register File }} | {{Wikibooks | Microprocessor Design | Register File }} | ||
* [http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.18.586 | * [http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.18.586 रजिस्टर file design considerations in dynamically scheduled processors] - Farkas, [[Norman Jouppi|Jouppi]], Chow - 1995 | ||
{{CPU technologies}} | {{CPU technologies}} | ||
[[Category: | [[Category:Collapse templates]] | ||
[[Category:Created On 17/02/2023]] | [[Category:Created On 17/02/2023]] | ||
[[Category:Machine Translated Page]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:कंप्यूटर आर्किटेक्चर]] | |||
[[Category:डिजिटल इलेक्ट्रॉनिक्स]] | |||
[[Category:डिजिटल रजिस्टर]] |
Latest revision as of 16:19, 2 March 2023
एक रजिस्टर फाइल सेंट्रल प्रोसेसिंग यूनिट (सीपीयू) में प्रोसेसर रजिस्टर की एक सरणी है। रजिस्टर बैंकिंग ऑपरेटिंग मोड के आधार पर कई अलग-अलग भौतिक रजिस्टरों तक पहुँचने के लिए एक ही नाम का उपयोग करने की विधि है। आधुनिक एकीकृत परिपथ-आधारित रजिस्टर फाइलें सामान्यतः कई पोर्टों के साथ तेज स्थिर रैम के माध्यम से कार्यान्वित की जाती हैं। इस तरह के रैम को पढ़ने और लिखने के समर्पित पोर्टों से अलग किया जाता है, जबकि साधारण मल्टीपोर्टेड एसआरएएम सामान्यतः एक ही पोर्टों के माध्यम से पढ़ और लिख सकेंगे।
सीपीयू का निर्देश सेट वास्तुकला लगभग सदैव रजिस्टरों के एक सेट को परिभाषित करेगा जो कि मेमोरी और चिप पर कार्यात्मक इकाइयों के बीच डेटा को स्टेज करने के लिए उपयोग किया जाता है। सरल सीपीयू में, ये आर्किटेक्चरल रजिस्टर सीपीयू के भीतर भौतिक रजिस्टर फ़ाइल (पीआरएफ) में प्रविष्टियों के लिए एक-से-एक के अनुरूप होते हैं। अधिक जटिल सीपीयू नाम बदलने का पंजीकरण करें का उपयोग करते हैं, ताकि मैपिंग जिसमें भौतिक प्रविष्टि एक विशेष वास्तुशिल्प रजिस्टर को संग्रहीत करती है, निष्पादन के दौरान गतिशील रूप से बदल जाती है। पारदर्शी सीपीयू कैश की अवधारणा के विपरीत, रजिस्टर फ़ाइल निर्देश सेट आर्किटेक्चर का हिस्सा है और प्रोग्रामर को दिखाई देती है।
रजिस्टर-बैंक स्विचिंग
रजिस्टर फाइलों को रजिस्टर बैंकों के रूप में एक साथ जोड़ा जा सकता है।[1] एक प्रोसेसर में एक से अधिक रजिस्टर बैंक हो सकते हैं।
एआरएम प्रोसेसर में बैंक और अनबैंक्ड दोनों तरह के रजिस्टर होते हैं। जबकि सभी मोड सदैव पहले आठ सामान्य-उद्देश्य रजिस्टरों के लिए समान भौतिक रजिस्टरों को साझा करते हैं, R0 से R7, भौतिक रजिस्टर जो कि बैंकेड रजिस्टरों, R8 से R14 तक, प्रोसेसर के ऑपरेटिंग मोड पर निर्भर करता है।[2] विशेष रूप से, फास्ट इंटरप्ट अनुरोध (FIQ) मोड में R8 से R12 के लिए रजिस्टरों का अपना बैंक है, साथ ही आर्किटेक्चर हर इंटरप्ट मोड के लिए एक निजी स्टैक पॉइंटर (R13) प्रदान करता है।
निर्देश जारी होने से पहले x86 प्रोसेसर निर्देश, डिकोडर, जीपीआर और रजिस्टर फाइलों के बीच स्विच करने के लिए संदर्भ स्विचिंग और फास्ट इंटरप्ट का उपयोग करते हैं, लेकिन यह केवल उन प्रोसेसर पर सम्मिलित है जो सुपरस्केलर का समर्थन करते हैं। हालाँकि, संदर्भ स्विचिंग एआरएम के रजिस्टर बैंक के रजिस्टरों के भीतर एक पूरी तरह से अलग तंत्र है।
मोडकॉम्प और बाद में इंटेल MCS-51 रजिस्टर 8051-संगत प्रोसेसर वर्तमान में सक्रिय रजिस्टर बैंक का चयन करने के लिए प्रोग्राम स्थिति शब्द में बिट्स का उपयोग करते हैं।
कार्यान्वयन
सामान्य लेआउट कन्वेंशन यह है कि एक साधारण सरणी को लंबवत रूप से पढ़ा जाता है। अर्थात्, एक एकल शब्द रेखा, जो क्षैतिज रूप से चलती है, बिट सेल की एक पंक्ति को उनके डेटा को बिट लाइनों पर रखने का कारण बनती है, जो लंबवत रूप से चलती हैं। भाव प्रवर्धक, जो लो-स्विंग रीड बिटलाइन को फुल-स्विंग लॉजिक स्तरों में परिवर्तित करता है, सामान्यतः नीचे (प्रोग्राम द्वारा) होता है। बड़ी रजिस्टर फाइलें तब कभी-कभी टाइलिंग मिरर और रोटेट सरल सरणियों द्वारा निर्मित की जाती हैं।
रजिस्टर फाइलों में प्रति पोर्ट प्रति प्रविष्टि एक शब्द रेखा होती है, एक बिट लाइन प्रति बिट चौड़ाई प्रति रीड पोर्ट, और दो बिट लाइन प्रति बिट चौड़ाई प्रति राइट पोर्ट होती है। प्रत्येक बिट सेल में Vdd और Vss भी होते हैं। इसलिए, वायर पिच क्षेत्र पोर्टों की संख्या के वर्ग के रूप में बढ़ता है, और ट्रांजिस्टर क्षेत्र रैखिक रूप से बढ़ता है।[3]
कुछ बिंदुओं पर, सभी रीड पोर्ट्स के साथ एक ही रजिस्टर फ़ाइल के बजाय रीड पोर्ट्स की छोटी संख्या के साथ, कई अनावश्यक रजिस्टर फ़ाइलों के लिए यह छोटा और / या तेज़ हो सकता है। एमआईपीएस आर्किटेक्चर R8000 की पूर्णांक (कंप्यूटर विज्ञान) इकाई, उदाहरण के लिए, एक 9 रीड 4 राइट पोर्ट 32 प्रविष्टि 64-बिट रजिस्टर फ़ाइल 0.7 माइक्रोमीटर प्रक्रिया में लागू की गई थी, जिसे हाथ की लंबाई से चिप को देखने पर देखा जा सकता था।
रजिस्टरों को कई रजिस्टर फाइलों में विभाजित करने के दो लोकप्रिय तरीके वितरित रजिस्टर फ़ाइल कॉन्फ़िगरेशन और विभाजित रजिस्टर फ़ाइल कॉन्फ़िगरेशन हैं।[3]
सिद्धांत रूप में, कोई भी ऑपरेशन जो 64-बिट-वाइड रजिस्टर फ़ाइल के साथ कई रीड और राइट पोर्ट के साथ किया जा सकता है, एक 8-बिट-वाइड रजिस्टर फ़ाइल के साथ सिंगल रीड पोर्ट और सिंगल राइट पोर्ट के साथ किया जा सकता है। हालांकि, कई पोर्टों के साथ विस्तृत रजिस्टर फ़ाइलों की बिट-स्तरीय समानांतरता उन्हें बहुत तेजी से चलाने की अनुमति देती है और इस प्रकार, वे एक ही चक्र में संचालन कर सकते हैं जो कई चक्रों को कम पोर्टों या एक संकीर्ण बिट चौड़ाई या दोनों के साथ ले जाएगा।
रजिस्टर फ़ाइल के बिट्स में चौड़ाई सामान्यतः शब्द (डेटा प्रकार) में बिट्स की संख्या होती है। कभी-कभी यह प्रत्येक रजिस्टर में अतिरिक्त बिट संलग्न करने के लिए थोड़ा चौड़ा होता है, जैसे ज़हर बिट। यदि डेटा शब्द की चौड़ाई किसी पते की चौड़ाई से अलग है- या कुछ मामलों में, जैसे कि 68000, भले ही वे समान चौड़ाई हों- पता रजिस्टर डेटा रजिस्टरों की तुलना में एक अलग रजिस्टर फ़ाइल में हैं।
डिकोडर
- डिकोडर को प्रायः प्री-डिकोडर और डिकोडर में तोड़ दिया जाता है।
- डिकोडर AND गेट्स की एक श्रृंखला है जो शब्द रेखाओं को संचालित करता है।
- प्रति रीड या राइट पोर्ट में एक डिकोडर है। यदि सरणी में चार रीड और दो राइट पोर्ट हैं, उदाहरण के लिए, इसमें सरणी में प्रति बिट सेल में 6 शब्द पंक्तियाँ हैं, और डिकोडर में छह AND गेट्स प्रति पंक्ति हैं। ध्यान दें कि डिकोडर को सरणी से समानता रखना चाहिए, जो उन और द्वारों को चौड़ा और छोटा करने के लिए मजबूर करता है
सरणी
बिट सेल के लिए मूल योजना:
- राज्य को इनवर्टर की जोड़ी में संग्रहित किया जाता है।
- डेटा को NMOS ट्रांजिस्टर द्वारा एक बिट लाइन में पढ़ा जाता है।
- डेटा को एक दो-NMOS स्टैक के माध्यम से ग्राउंड करने के लिए एक तरफ या दूसरे को छोटा करके लिखा जाता है।
- तो: रीड पोर्ट प्रति बिट सेल में एक ट्रांजिस्टर लेते हैं, राइट पोर्ट चार लेते हैं।
कई अनुकूलन संभव हैं:
- सेल के बीच लाइनें साझा करना, उदाहरण के लिए, Vdd और Vss
- रीड बिट लाइन्स को प्रायः Vdd और Vss के बीच किसी चीज के लिए प्रीचार्ज किया जाता है।
- पढ़ें बिट लाइनें प्रायः Vdd या Vss के रास्ते का केवल एक अंश स्विंग करती हैं। एक अर्थ प्रवर्धक इस छोटे-स्विंग सिग्नल को पूर्ण तर्क स्तर में परिवर्तित करता है। छोटे स्विंग सिग्नल तेज़ होते हैं क्योंकि बिट लाइन में बहुत कम ड्राइव होती है लेकिन परजीवी धारिता का एक बड़ा सौदा होता है।
- राइट बिट लाइन्स को ब्रेड किया जा सकता है, ताकि वे पास की पढ़ी गई बिटलाइन्स के साथ समान रूप से जोड़े। क्योंकि राइट बिटलाइन्स पूरे जोरों पर हैं, वे रीड बिटलाइन्स पर महत्वपूर्ण असुविधा पैदा कर सकते हैं।
- यदि Vdd एक क्षैतिज रेखा है, तो इसे किसी अन्य डिकोडर द्वारा बंद किया जा सकता है, यदि कोई भी राइट पोर्ट उस चक्र के दौरान उस रेखा को लिख रहा हो। यह अनुकूलन लिखने की गति को बढ़ाता है।
- तकनीकें जो रजिस्टर फाइलों द्वारा उपयोग की जाने वाली ऊर्जा को कम करती हैं, कम-शक्ति कम बिजली इलेक्ट्रॉनिक्स में उपयोगी होती हैं[4]
माइक्रोआर्किटेक्चर
अधिकांश रजिस्टर फाइलें एक साथ एक ही प्रविष्टि में कई राइट पोर्ट को लिखने से रोकने के लिए कोई विशेष प्रावधान नहीं करती हैं। इसके बजाय, निर्देश शेड्यूलिंग हार्डवेयर यह सुनिश्चित करता है कि किसी विशेष चक्र में केवल एक निर्देश एक विशेष प्रविष्टि लिखता है। यदि एक ही रजिस्टर को लक्षित करने वाले कई निर्देश जारी किए जाते हैं, तो एक को छोड़कर सभी का लेखन सक्षम बंद कर दिया जाता है।
क्रास किए गए इनवर्टर राइट ऑपरेशन के बाद व्यवस्थित होने में कुछ सीमित समय लेते हैं, जिसके दौरान रीड ऑपरेशन में या तो अधिक समय लगेगा या गार्बेज वापस आएगा। बहुसंकेतकों को बायपास करना साधारण बात है जो लिखित डेटा को रीड पोर्ट्स पर बायपास करते हैं जब एक साथ एक ही प्रविष्टि को पढ़ने और लिखने का आदेश दिया जाता है। ये बाईपास मल्टीप्लेक्सर्स प्रायः एक बड़े बाईपास नेटवर्क का हिस्सा होते हैं जो आगे के परिणाम हैं जो अभी तक कार्यात्मक इकाइयों के बीच प्रतिबद्ध नहीं हैं।
रजिस्टर फ़ाइल सामान्यतः उस डेटापथ से पिच-मिलान की जाती है जो वह कार्य करता है। पिच मैचिंग डेटापथ टर्न कॉर्नर के ऊपर से गुजरने वाली कई बसों से बचा जाता है, जो बहुत सारे क्षेत्र का उपयोग करेगा। लेकिन चूँकि प्रत्येक इकाई में एक ही बिट पिच होनी चाहिए, डेटापथ में प्रत्येक इकाई सबसे चौड़ी इकाई द्वारा मजबूर बिट पिच के साथ समाप्त होती है, जो अन्य इकाइयों में क्षेत्र को बर्बाद कर सकती है। फ़ाइलों को पंजीकृत करें, क्योंकि उनके पास दो तार प्रति बिट प्रति राइट पोर्ट हैं, और क्योंकि सभी बिट लाइनों को प्रत्येक बिट सेल पर सिलिकॉन से संपर्क करना चाहिए, प्रायः डेटापथ की पिच सेट कर सकते हैं।
क्षेत्र को कभी-कभी डेटापथ में कई इकाइयों वाली मशीनों पर दो डेटापथों के साथ-साथ सहेजा जा सकता है, जिनमें से प्रत्येक में एक डेटापथ की तुलना में छोटी बिट पिच होती है। यह प्रकरण सामान्यतः रत्येक डेटापथ के लिए एक रजिस्टर फ़ाइल की कई प्रतियों को बाध्य करता है।
उदाहरण के लिए, अल्फा 21264 (EV6) शैडो रजिस्टर फाइल आर्किटेक्चर को लागू करने वाला पहला बड़ा माइक्रो-आर्किटेक्चर था। इसमें पूर्णांक रजिस्टर फ़ाइल की दो प्रतियां और इसके फ्रंट एंड (भविष्य और स्केल फ़ाइल, प्रत्येक में 2 रीड और 2 राइट पोर्ट) में स्थित फ्लोटिंग पॉइंट रजिस्टर की दो प्रतियां थीं, और दोनों के बीच डेटा प्रसारित करने के लिए एक अतिरिक्त चक्र लिया। एक संदर्भ स्विच जारी करने वाले तर्क ने दोनों के बीच डेटा अग्रेषण संचालन की संख्या को कम करने का प्रयास किया और इसके पूर्णांक प्रदर्शन में काफी सुधार किया, और सट्टा निष्पादन के साथ सुपरस्क्लेर आर्किटेक्चर में सामान्य-उद्देश्य रजिस्टरों की सीमित संख्या के प्रभाव को कम करने में मदद की। इस डिजाइन को बाद में स्पार्क, एमआईपीएस टेक्नोलॉजीस और कुछ बाद के x86 कार्यान्वयनों द्वारा अनुकूलित किया गया था।
एमआईपीएस आर्किटेक्चर कई रजिस्टर फाइलों का भी उपयोग करता है। R8000 फ़्लोटिंग-पॉइंट यूनिट में फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल की दो प्रतियाँ थीं, जिनमें से प्रत्येक में चार राइट और चार रीड पोर्ट थे, और एक संदर्भ स्विच के साथ एक ही समय में दोनों प्रतियाँ लिखीं। हालाँकि, यह पूर्णांक संचालन का समर्थन नहीं करता था, और पूर्णांक रजिस्टर फ़ाइल अभी भी वैसी ही बनी हुई थी। बाद में, एम्बेडेड मार्केट के पक्ष में छाया रजिस्टर फाइलों को नए डिजाइनों में छोड़ दिया गया।
स्पार्क अपनी हाई-एंड लाइन के लिए एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर का भी उपयोग करता है। इसमें पूर्णांक रजिस्टर फाइलों की 4 प्रतियां (भविष्य, सेवानिवृत्त, स्केल और स्क्रैच, प्रत्येक में 7 रीड 4 राइट पोर्ट) और फ्लोटिंग पॉइंट रजिस्टर फ़ाइल की 2 प्रतियां हैं। हालांकि, अल्फा और x86 के विपरीत, वे बैकएंड में अपनी आउट-ऑफ-ऑर्डर यूनिट के ठीक बाद एक रिटायर यूनिट के रूप में स्थित हैं और रजिस्टर फाइलों का नाम बदल रहे हैं। छाया रजिस्टर निर्देश लाने और डिकोडिंग चरणों के दौरान निर्देशों को लोड नहीं करते हैं और इस डिजाइन में एक संदर्भ स्विच अनावश्यक है।
आईबीएम कई प्रमुख माइक्रोप्रोसेसरों के समान तंत्र का उपयोग करता है, डिकोडर के साथ रजिस्टर फाइल को गहराई से मर्ज करता है, लेकिन इसकी रजिस्टर फाइलें डिकोडर पक्ष से स्वतंत्र रूप से काम करती हैं और इसमें संदर्भ स्विचिंग सम्मिलित नहीं होती है, जो अल्फा और x86 से अलग है। इसकी अधिकांश रजिस्टर फाइलें न केवल इसके समर्पित डिकोडर की सेवा करती हैं, बल्कि थ्रेड स्तर तक भी होती हैं। उदाहरण के लिए, POWER8 में 8 निर्देश डिकोडर तक हैं, लेकिन 32 सामान्य प्रयोजन की 32 रजिस्टर फाइलें प्रत्येक को रजिस्टर करती हैं (4 रीड और 4 राइट पोर्ट्स) एक साथ मल्टीथ्रेडिंग की सुविधा के लिए, क्योंकि संदर्भ स्विच की कमी के कारण इसके समानांतर निर्देशों का उपयोग किसी अन्य रजिस्टर फ़ाइल में नहीं किया जा सकता है।
x86 प्रोसेसर लाइन में, एक विशिष्ट पूर्व-486 CPU में एक व्यक्तिगत रजिस्टर फ़ाइल नहीं थी, क्योंकि सभी सामान्य प्रयोजन रजिस्टर सीधे डिकोडर के साथ काम करते थे, और x87 पुश स्टैक फ़्लोटिंग-पॉइंट यूनिट के भीतर ही स्थित था। पेंटियम से प्रारम्भ होकर, एक विशिष्ट पेंटियम-संगत x86 प्रोसेसर एकल-पोर्ट आर्किटेक्चरल रजिस्टर फ़ाइल की एक प्रति के साथ एकीकृत होता है जिसमें 6 सामान्य-उद्देश्य रजिस्टर, 4 नियंत्रण रजिस्टर, 8 डिबग रजिस्टर (दो आरक्षित), 1 स्टैक पॉइंटर रजिस्टर, 1 होता है। स्टैक बेस रजिस्टर, 1 इंस्ट्रक्शन पॉइंटर, 1 फ्लैग रजिस्टर और 6 सेगमेंट रजिस्टर होते हैं।
डिफ़ॉल्ट रूप से 8 x87 FP पुश डाउन स्टैक की एक प्रति, MMX (निर्देश सेट) रजिस्टर वस्तुतः x87 स्टैक से सिम्युलेटेड थे और MMX निर्देश की आपूर्ति के लिए x86 रजिस्टर की आवश्यकता होती है और स्टैक सम्मिलित होने के लिए उपनाम P6 पर, सूक्ष्म संचालन में डीकोड करने और आउट-ऑफ-ऑर्डर निष्पादन में नाम बदलने से पहले स्वतंत्र रूप से निर्देश को प्रारंभिक पाइपलाइन चरणों में समानांतर में संग्रहीत और निष्पादित किया जा सकता है। P6 (माइक्रोआर्किटेक्चर) से प्रारम्भ होकर, सभी रजिस्टर फाइलों को डेटा के प्रचार के लिए अतिरिक्त चक्र की आवश्यकता नहीं होती है, आर्किटेक्चरल और फ्लोटिंग पॉइंट जैसी रजिस्टर फाइलें कोड बफर और डिकोडर्स के बीच स्थित होती हैं, जिन्हें रिटायर बफर, रीऑर्डर बफर और OoOE कहा जाता है और रिंग बस के भीतर जुड़ा होता है ( 16 बाइट्स)। रजिस्टर फ़ाइल अभी भी एक x86 रजिस्टर फ़ाइल और एक x87 स्टैक बनी हुई है और दोनों रिटायरमेंट स्टोरिंग के रूप में काम करती हैं। परिणाम भंडारण के लिए बैंडविड्थ बढ़ाने के लिए इसकी x86 रजिस्टर फ़ाइल को दोहरे पोर्ट में बढ़ाया गया था। डिबग/कंडीशन कोड/कंट्रोल/अनाम/फ्लैग जैसे रजिस्टरों को मुख्य रजिस्टर फाइल से हटा दिया गया और माइक्रो-ऑप रोम और इंस्ट्रक्शन सीक्वेंसर के बीच अलग-अलग फाइलों में रखा गया। केवल दुर्गम रजिस्टर जैसे खंड रजिस्टर अब सामान्य-उद्देश्य रजिस्टर फ़ाइल (निर्देश सूचक को छोड़कर) से अलग हो गए हैं; वे अब शेड्यूलर और इंस्ट्रक्शन एलोकेटर के बीच स्थित हैं, ताकि रजिस्टर का नाम बदलने और आउट-ऑफ-ऑर्डर निष्पादन की सुविधा मिल सके। पेंटियम III में 128-बिट XMM रजिस्टर के प्रारम्भ के बाद x87 स्टैक को बाद में फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल के साथ मिला दिया गया था, लेकिन XMM रजिस्टर फ़ाइल अभी भी x86 पूर्णांक रजिस्टर फ़ाइलों से अलग स्थित है।
बाद में P6 कार्यान्वयन (पेंटियम एम, योनाह) ने एक शैडो रजिस्टर फ़ाइल आर्किटेक्चर पेश किया जो दोहरे पोर्ट वाले पूर्णांक आर्किटेक्चरल रजिस्टर फ़ाइलों की 2 प्रतियों तक विस्तारित हुआ और इसमें संदर्भ स्विच (भविष्य और सेवानिवृत्त फ़ाइल और स्केल फ़ाइल के बीच पूर्णांक और पूर्णांक के बीच उपयोग की जाने वाली एक ही चाल का उपयोग करके) सम्मिलित है। तैरनेवाला स्थल)। माइक्रो-ऑपरेशन फ्यूजन प्रारम्भ होने के बाद x86 आर्किटेक्चर में सम्मिलित रजिस्टर अड़चन को हल करने के लिए ऐसा किया गया था, लेकिन इसमें अभी भी प्रति फ़ाइल क्षमता में कुल 32 बाइट्स के लिए 8 प्रविष्टियां 32 बिट आर्किटेक्चरल रजिस्टर हैं (सेगमेंट रजिस्टर और इंस्ट्रक्शन पॉइंटर बने हुए हैं) सट्टा फ़ाइल के रूप में फ़ाइल के भीतर, हालांकि वे प्रोग्राम द्वारा पहुंच योग्य नहीं हैं)। दूसरी फ़ाइल को स्केल्ड शैडो रजिस्टर फ़ाइल के रूप में परोसा जाता है, जो संदर्भ स्विच के बिना स्केल की गई फ़ाइल कुछ निर्देशों को स्वतंत्र रूप से संग्रहीत नहीं कर सकती है। SSE2/SSE3/SSSE3 के कुछ निर्देशों को पूर्णांक संचालन के लिए इस सुविधा की आवश्यकता होती है, उदाहरण के लिए PSHUFB, PMADDUBSW, PHSUBW, PHSUBD, PHSUBSW, PHADDW, PHADDD, PHADDSW जैसे निर्देशों के लिए दोनों रजिस्टर फ़ाइलों से EAX/EBX/ECX/EDX लोड करने की आवश्यकता होगी, हालाँकि एक x86 प्रोसेसर के लिए एक ही निर्देश के साथ दूसरी रजिस्टर फ़ाइल का उपयोग करना असामान्य था। ज्यादातर समय, दूसरी फाइल को स्केल रिटायर्ड फाइल के रूप में परोसा जाता है। पेंटियम एम आर्किटेक्चर में अभी भी एक दोहरे पोर्ट वाली फ़्लोटिंग-पॉइंट रजिस्टर फ़ाइल (8 प्रविष्टियाँ MM/XMM) हैं जो तीन डिकोडर्स के साथ साझा की गई हैं, और FP रजिस्टर फ़ाइल में इसके साथ एक शैडो रजिस्टर फ़ाइल नहीं है, क्योंकि इसकी शैडो-रजिस्टर-फ़ाइल आर्किटेक्चर में फ़्लोटिंग-पॉइंट फ़ंक्शंस सम्मिलित नहीं थे। P6 के बाद के प्रोसेसर में aआर्किटेक्चरल रजिस्टर फाइलें बाहरी हैं और रिटायर्ड फाइल के बाद प्रोसेसर के बैकएंड में स्थित हैं, जैसा कि रजिस्टर रीनेमिंग/रीऑर्डर बफर के लिए आंतरिक कोर में स्थित आंतरिक रजिस्टर फाइल के विपरीत है। हालाँकि, कोर 2 में अब इसे एक इकाई के भीतर रखा गया है जिसे रजिस्टर अलियास टेबल (RAT) कहा जाता है, जो निर्देश आवंटक के साथ स्थित है, लेकिन सेवानिवृत्ति के समान आकार के रजिस्टर आकार का है। कोर (माइक्रोआर्किटेक्चर) ने आंतरिक रिंग बस को 24 बाइट्स तक बढ़ा दिया (3 से अधिक निर्देशों को डिकोड करने की अनुमति दी) और इसकी रजिस्टर फ़ाइल को डुअल-पोर्टेड (एक रीड/वन राइट) से क्वाड-पोर्टेड (दो रीड/टू राइट) तक बढ़ा दिया। रजिस्टर अभी भी 32 बिट और 32 बाइट्स में 8 प्रविष्टियां बनी हुई हैं (6 खंड रजिस्टर और एक निर्देश सूचक को सम्मिलित नहीं किया गया है क्योंकि वे फ़ाइल में किसी भी कोड/निर्देश द्वारा एक्सेस करने में असमर्थ हैं) कुल फ़ाइल आकार में और कुल के लिए x64 में 16 प्रविष्टियों तक विस्तारित प्रति फ़ाइल 128 बाइट आकार। पेंटियम एम से इसकी पाइपलाइन पोर्ट और डिकोडर में वृद्धि हुई, लेकिन वे कोड बफर के बजाय आवंटन तालिका के साथ स्थित हैं। इसकी एफपी एक्सएमएम रजिस्टर फ़ाइल को क्वाड-पोर्टेड (2 रीड/2 राइट) में भी बढ़ाया गया है, रजिस्टर अभी भी 32 बिट में 8 प्रविष्टियां बनी हुई हैं और x64 मोड में 16 प्रविष्टियों तक विस्तारित हैं और संख्या अभी भी 1 बनी हुई है क्योंकि इसका शैडो-रजिस्टर-फाइल आर्किटेक्चर है फ़्लोटिंग पॉइंट/एसएसई कार्यों सहित नहीं।
बाद के x86 कार्यान्वयन में, जैसे नेहलेम (माइक्रोआर्किटेक्चर) और बाद के प्रोसेसर, दोनों पूर्णांक और फ्लोटिंग पॉइंट रजिस्टरों को अब एक एकीकृत ऑक्टा-पोर्टेड (छह पढ़ने और दो लिखने) सामान्य-उद्देश्य रजिस्टर फ़ाइल (32-बिट में 8 + 8) में सम्मिलित किया गया है। 16 + 16 प्रति फ़ाइल x64 में), जबकि हाइपर थ्रेडिंग को निष्पादित करने के पसंदीदा में बढ़ी हुई शैडो रजिस्टर फ़ाइल आर्किटेक्चर के साथ रजिस्टर फ़ाइल को 2 तक बढ़ाया गया है और प्रत्येक थ्रेड अपने डिकोडर के लिए स्वतंत्र रजिस्टर फ़ाइलों का उपयोग करता है। बाद में सैंडी ब्रिज और आगे की जगह शैडो रजिस्टर टेबल और आर्किटेक्चरल रजिस्टरों को रीऑर्डर बफर को डिकोड करने से पहले बहुत बड़ी और अभी तक अधिक उन्नत भौतिक रजिस्टर फ़ाइल के साथ बदल दिया गया। रैंडर्ड ने कहा कि सैंडी ब्रिज और आगे अब एक वास्तुशिल्प रजिस्टर नहीं है।
बॉननेल (माइक्रोआर्किटेक्चर) लाइन पर P5 का आधुनिक सरलीकृत संशोधन था। इसमें थ्रेड और डिकोडर के साथ रजिस्टर फाइल शेयर की एकल प्रतियां सम्मिलित हैं। रजिस्टर फ़ाइल एक डुअल-पोर्ट डिज़ाइन है, 8/16 प्रविष्टियाँ GPRS, 8/16 प्रविष्टियाँ डीबग रजिस्टर और 8/16 प्रविष्टियाँ स्थिति कोड एक ही फ़ाइल में एकीकृत हैं। हालाँकि इसमें आठ-प्रविष्टियाँ 64 बिट शैडो आधारित रजिस्टर और आठ-प्रविष्टियाँ 64 बिट अनाम रजिस्टर हैं जो अब मूल P5 डिज़ाइन के विपरीत मुख्य GPRs से अलग हैं और निष्पादन इकाई के बाद स्थित हैं, और इन रजिस्टरों की फ़ाइल सिंगल-पोर्टेड है और Core/Core2 पर पाई गई स्केल्ड शैडो रजिस्टर फाइल जैसे निर्देश के संपर्क में नहीं आता (शैडो रजिस्टर फाइल आर्किटेक्चरल रजिस्टरों से बनी होती है और बॉननेल में शैडो रजिस्टर फाइल आर्किटेक्चर नहीं होने के कारण नहीं था), हालांकि फाइल का उपयोग कमी के कारण नाम बदलने के उद्देश्य से किया जा सकता है बॉननेल आर्किटेक्चर पर ऑर्डर के बाहर निष्पादन पाया गया। इसमें एक्सएमएम फ़्लोटिंग पॉइंट रजिस्टर फ़ाइल प्रति थ्रेड की एक प्रति भी थी। नेहलेम (माइक्रोआर्किटेक्चर) से अंतर यह है कि बॉननेल के पास एकीकृत रजिस्टर फ़ाइल नहीं है और इसके हाइपर थ्रेडिंग के लिए कोई समर्पित रजिस्टर फ़ाइल नहीं है। इसके बजाय, बॉननेल अपने थ्रेड के लिए एक अलग नाम रजिस्टर का उपयोग करता है, भले ही यह क्रम से बाहर न हो। Bonnell, Larrabee (माइक्रोआर्किटेक्चर) और Xeon Phi के समान ही प्रत्येक के पास केवल एक सामान्य-उद्देश्य पूर्णांक रजिस्टर फ़ाइल है, लेकिन Larrabee में 16 XMM रजिस्टर फ़ाइलें (प्रति फ़ाइल 8 प्रविष्टियाँ) हैं, और Xeon Phi में 128 AVX- तक हैं। 512 रजिस्टर फाइलें, प्रत्येक में वेक्टर इंस्ट्रक्शन स्टोरेज के लिए 32 512-बिट ZMM रजिस्टर होते हैं, जो L2 कैश जितना बड़ा हो सकता है।
इंटेल की कुछ अन्य x86 लाइनें हैं जिनके आंतरिक डिज़ाइन, MediaGX और Vortex86 में एक रजिस्टर फ़ाइल नहीं है और कई एम्बेडेड प्रोसेसर हैं जो पेंटियम-संगत या रिवर्स-इंजीनियर्ड प्रारंभिक 80x86 प्रोसेसर नहीं हैं। इसलिए, उनमें से ज्यादातर के पास रेगी नहीं हैster फ़ाइल उनके डिकोडर्स के लिए है, लेकिन उनके GPRs का अलग-अलग उपयोग किया जाता है। दूसरी ओर, नेटबर्स्ट (माइक्रोआर्किटेक्चर), इसके डिकोडर के लिए एक रजिस्टर फ़ाइल नहीं है, क्योंकि इसके x86 जीपीआर इसकी संरचना के भीतर सम्मिलित नहीं थे, एक भौतिक एकीकृत नाम बदलने वाली रजिस्टर फ़ाइल (सैंडी ब्रिज के समान, लेकिन) के प्रारम्भ के कारण आर्किटेक्चरल रजिस्टर फ़ाइल को बदलने और x86 डिकोडिंग योजना को छोड़ने के प्रयास के लिए पेंटियम 4 के नामकरण से पहले रजिस्टर का उपयोग करने में असमर्थता के कारण थोड़ा अलग)। इसके बजाय यह एएलयू से पहले पूर्णांक निष्पादन और भंडारण के लिए एसएसई का उपयोग करता है और परिणाम के बाद, एसएसई 2/एसएसई 3/एसएसएसई 3 उसी तंत्र का उपयोग अपने पूर्णांक ऑपरेशन के लिए भी करता है।
AMD के शुरुआती डिज़ाइन जैसे K6 में इंटेल की तरह एक रजिस्टर फ़ाइल नहीं है और यह शैडो रजिस्टर फ़ाइल आर्किटेक्चर का समर्थन नहीं करता है क्योंकि इसके संदर्भ स्विच की कमी और बाईपास इन्वर्टर जो एक रजिस्टर फ़ाइल को उचित रूप से कार्य करने के लिए आवश्यक हैं। इसके बजाय वे एक अलग जीपीआर का उपयोग करते हैं जो एक समर्पित पूर्णांक डिकोडर और फ्लोटिंग डिकोडर के साथ अपने ओओओई सीपीयू के लिए एक नाम रजिस्टर तालिका से सीधे लिंक करता है। तंत्र इंटेल के प्री-पेंटियम प्रोसेसर लाइन के समान है। उदाहरण के लिए, AMD K6 प्रोसेसर में चार int (एक आठ-प्रविष्टियाँ अस्थायी स्क्रैच रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ भविष्य की रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ प्राप्त की गई रजिस्टर फ़ाइल + एक आठ-प्रविष्टियाँ अनाम रजिस्टर फ़ाइल) और दो FP नाम बदलने वाली रजिस्टर फ़ाइलें होती हैं। (दो आठ-प्रविष्टियाँ x87 ST फ़ाइल एक fadd जाती है और एक fmov जाती है) जो पूर्णांक नाम बदलने के लिए अपने x86 EAX के साथ सीधे लिंक करती है और फ्लोटिंग पॉइंट रीनेमिंग के लिए XMM0 रजिस्टर करती है, लेकिन बाद में AMD K7 ने इसके फ्रंट एंड में शैडो रजिस्टर सम्मिलित किया, इसे बढ़ाया गया डिकोड होने से पहले क्रम पूर्णांक संचालन के लिए 40 प्रविष्टियाँ एकीकृत रजिस्टर फ़ाइल, रजिस्टर फ़ाइल में 8 प्रविष्टियाँ स्क्रैच रजिस्टर + 16 भविष्य की GPRs रजिस्टर फ़ाइल + 16 अनाम GPRs रजिस्टर फ़ाइल होती हैं। बाद के एएमडी डिजाइनों में यह छाया रजिस्टर डिजाइन को छोड़ देता है और व्यक्तिगत जीपीआर डायरेक्ट लिंक डिजाइन के साथ के6 आर्किटेक्चर का समर्थन करता है। आमद फेनम की तरह, इसमें तीन इंट रजिस्टर फाइलें और दो एसएसई रजिस्टर फाइलें हैं जो सीधे जीपीआर से जुड़ी भौतिक रजिस्टर फाइल में स्थित हैं। हालाँकि, यह बुलडोजर (माइक्रोआर्किटेक्चर) पर एक पूर्णांक + एक फ़्लोटिंग-पॉइंट तक मापता है। शुरुआती एएमडी डिजाइनों की तरह, अधिकांश x86 निर्माताओं जैसे कि सिरिक्स, वीआईए, डीएम एंड पी, और एसआईएस ने भी उसी तंत्र का उपयोग किया, जिसके परिणामस्वरूप उनके इन-ऑर्डर सीपीयू के नाम बदलने के बिना पूर्णांक प्रदर्शन की कमी हुई। सिरिक्स और एएमडी जैसी कंपनियों को बाधाओं को कम करने की आशा में कैश आकार में वृद्धि करनी पड़ी। एएमडी का एसएसई पूर्णांक ऑपरेशन कोर 2 और पेंटियम 4 की तुलना में एक अलग तरीके से काम करता है; यह डीकोड चरण से पहले मान को सीधे लोड करने के लिए अपने अलग नाम बदलने वाले पूर्णांक रजिस्टर का उपयोग करता है। हालांकि सैद्धांतिक रूप से इसे इंटेल के एसएसई कार्यान्वयन की तुलना में केवल एक छोटी पाइपलाइन की आवश्यकता होगी, लेकिन सामान्यतः शाखा भविष्यवाणी की लागत इंटेल की तुलना में बहुत अधिक और उच्च लापता दर होती है, और इसके एसएसई निर्देश को निष्पादित करने के लिए कम से कम दो चक्र लेने होंगे चाहे कोई भी हो विस्तृत निर्देश, जैसा कि शुरुआती एएमडी कार्यान्वयन एसएसई निर्देश सेट में एफपी और इंट दोनों को निष्पादित नहीं कर सका जैसे इंटेल के कार्यान्वयन ने किया था।
अल्फा 21264 के विपरीत, स्पार्क, और एमआईपीएस आर्किटेक्चर जो एक समय में एक ऑपरेंड को लोड/लाने के लिए केवल एक रजिस्टर फ़ाइल की अनुमति देता है; सुपरस्केल प्राप्त करने के लिए इसे कई रजिस्टर फाइलों की आवश्यकता होगी। दूसरी तरफ एआरएम वास्तुकला प्रोसेसर निर्देशों को लोड/लाने के लिए एकाधिक रजिस्टर फाइलों को एकीकृत नहीं करता है। एआरएम जीपीआर का निर्देश सेट के लिए कोई विशेष उद्देश्य नहीं है (एआरएम आईएसए को संचायक, सूचकांक और स्टैक/बेस पॉइंट की आवश्यकता नहीं है। रजिस्टरों में एक संचायक नहीं है और बेस/स्टैक पॉइंट केवल थंब मोड में उपयोग किया जा सकता है)। कोई भी जीपीआर छोटे कोड आकार में स्वतंत्र रूप से कई निर्देशों को प्रचारित और संग्रहीत कर सकता है जो एक रजिस्टर में फिट होने में सक्षम होने के लिए काफी छोटा है और इसका वास्तु रजिस्टर एक टेबल के रूप में कार्य करता है और सभी डिकोडर/निर्देशों के साथ सरल बैंक स्विचिंग के साथ साझा किया जाता है।ओडर। एआरएम और अन्य डिजाइनों के बीच प्रमुख अंतर यह है कि एआरएम सुपरस्केलर में अतिरिक्त रजिस्टर फ़ाइल की आवश्यकता के बिना त्वरित बैंक स्विचिंग के साथ समान सामान्य-उद्देश्य रजिस्टर पर चलने की अनुमति देता है। एआरएम के साथ एक ही तंत्र साझा करने वाले x86 के बावजूद कि इसके जीपीआर व्यक्तिगत रूप से किसी भी डेटा को स्टोर कर सकते हैं, यदि तीन से अधिक गैर-संबंधित निर्देश संग्रहीत किए जाते हैं, तो x86 डेटा निर्भरता का सामना करेगा, क्योंकि इसकी जीपीआर प्रति फ़ाइल बहुत छोटी है (32 बिट मोड में आठ और 16 बिट मोड में) डेटा के लिए ARM के 13 में 32 बिट और 31 में 64 बिट की तुलना में 64 बिट, और इसके डिकोडर को फीड करने के लिए कई रजिस्टर फ़ाइलों के बिना सुपरस्क्लेर होना असंभव है (x86 कोड ARM की तुलना में बड़ा और जटिल है)। क्योंकि प्रतिस्पर्धी होने के लिए अधिकांश x86 के फ्रंट-एंड एआरएम प्रोसेसर की तुलना में बहुत बड़े और अधिक शक्ति वाले हो गए हैं (उदाहरण: पेंटियम एम एंड कोर 2 डुओ, बे ट्रेल)। कोई समर्पित रजिस्टर-फाइल आर्किटेक्चर न होने के कारण कुछ तृतीय-पक्ष x86 समतुल्य प्रोसेसर ARM के साथ गैर-प्रतिस्पर्धी भी बन गए। विशेष रूप से एएमडी, साइरिक्स और वीआईए के लिए जो रजिस्टर का नाम बदलने और आदेश निष्पादन के बिना कोई उचित प्रदर्शन नहीं ला सकता है, जो मोबाइल प्रतिस्पर्धा में केवल इंटेल एटम को क्रम में x86 प्रोसेसर कोर होने के लिए छोड़ देता है। यह तब तक था जब तक कि x86 नेहलेम प्रोसेसर ने अपने पूर्णांक और फ़्लोटिंग पॉइंट रजिस्टर दोनों को एक ही फ़ाइल में विलय कर दिया, और इसके आउट-ऑफ-ऑर्डर आंतरिक कोर में नाम बदलने से पहले एक बड़े भौतिक रजिस्टर टेबल और इसके फ्रंट-एंड में एन्हांस्ड एलोकेटर टेबल का परिचय दिया। .
नाम बदलने का पंजीकरण करें
रजिस्टर रीनेमिंग करने वाले प्रोसेसर भौतिक रजिस्टर फ़ाइल के सबसेट में लिखने के लिए प्रत्येक कार्यात्मक इकाई के लिए व्यवस्था कर सकते हैं। यह व्यवस्था क्षेत्र में बड़ी बचत के लिए प्रति बिट सेल में कई राइट पोर्ट की आवश्यकता को समाप्त कर सकती है। परिणामी रजिस्टर फाइल, प्रभावी रूप से सिंगल राइट पोर्ट के साथ रजिस्टर फाइलों का ढेर, फिर रीड पोर्ट्स की प्रतिकृति और सबसेटिंग से लाभ होता है। सीमा पर, यह तकनीक प्रत्येक कार्यात्मक इकाई के इनपुट पर 1-राइट, 2-रीड रेगफाइल्स का ढेर लगाती है। चूंकि कम संख्या में पोर्टों के साथ regfiles में प्रायः ट्रांजिस्टर क्षेत्र का प्रभुत्व होता है, इसलिए इस तकनीक को इस सीमा तक नहीं धकेलना सबसे अच्छा है, लेकिन यह सभी के लिए उपयोगी है।
विंडोज़ पंजीकृत करें
स्पार्क ISA रजिस्टर विंडो को परिभाषित करता है, जिसमें रजिस्टरों के 5-बिट आर्किटेक्चरल नाम वास्तव में सैकड़ों प्रविष्टियों के साथ एक बहुत बड़ी रजिस्टर फ़ाइल पर एक विंडो की ओर इशारा करते हैं। सैकड़ों प्रविष्टियों के साथ मल्टीपोर्टेड रजिस्टर फाइलों को लागू करने के लिए बड़े क्षेत्र की आवश्यकता होती है। जब स्थानांतरित किया जाता है तो रजिस्टर विंडो 16 रजिस्टरों से स्लाइड करती है, ताकि प्रत्येक आर्किटेक्चरल रजिस्टर नाम बड़े सरणी में केवल कुछ ही रजिस्टरों को संदर्भित कर सके, उदा। आर्किटेक्चरल रजिस्टर r20 केवल भौतिक रजिस्टरों #20, #36, #52, #68, #84, #100, #116 को संदर्भित कर सकता है, अगर भौतिक फ़ाइल में सिर्फ सात विंडो हैं।
क्षेत्र को बचाने के लिए, कुछ स्पार्क कार्यान्वयन 32-प्रविष्टि रजिस्टर फ़ाइल को लागू करते हैं, जिसमें प्रत्येक सेल में सात बिट होते हैं। बाहरी पोर्टों के माध्यम से केवल एक ही पढ़ा और लिखा जा सकता है, लेकिन बिट्स की सामग्री को घुमाया जा सकता है। एक रोटेशन एक चक्र में रजिस्टर विंडो के एक आंदोलन को पूरा करता है। क्योंकि राज्य संचलन को पूरा करने वाले अधिकांश तार स्थानीय हैं, कम शक्ति के साथ जबरदस्त बैंडविड्थ संभव है।
इसी तकनीक का उपयोग R10000 रजिस्टर रीनेमिंग मैपिंग फ़ाइल में किया जाता है, जो प्रत्येक भौतिक रजिस्टर के लिए 6-बिट वर्चुअल रजिस्टर नंबर संग्रहीत करता है। नाम बदलने वाली फ़ाइल में, जब भी कोई शाखा ली जाती है, तो नाम बदलने की स्थिति की जाँच की जाती है, ताकि जब किसी शाखा के गलत होने का पता चले, तो पुराने नाम बदलने की स्थिति को एक ही चक्र में पुनर्प्राप्त किया जा सके। (रजिस्टर नाम बदलें देखें।)
यह भी देखें
संदर्भ
- ↑ Wikibooks: Microprocessor Design/Register File#Register Bank.
- ↑ "ARM Architecture Reference Manual" (PDF). ARM Limited. July 2005. Retrieved 13 October 2021.
- ↑ 3.0 3.1 Johan Janssen. "Compiler Strategies for Transport Triggered Architectures". 2001. p. 169. p. 171-173.
- ↑ "Energy efficient asymmetrically ported register files" by Aneesh Aggarwal and M. Franklin. 2003.
बाहरी संबंध
- रजिस्टर file design considerations in dynamically scheduled processors - Farkas, Jouppi, Chow - 1995