पावर7: Difference between revisions
Line 57: | Line 57: | ||
}}</ref> | }}</ref> | ||
[[File:Power7 4ghz 9119 8way IHSBottom ChipTop sonic84 IMG 1418.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 | [[File:Power7 4ghz 9119 8way IHSBottom ChipTop sonic84 IMG 1418.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू और IHS]] | ||
[[File:Power7 4ghz 9119 8way IHStop sonic84 IMG 1417.jpg|thumb|आईबीएम पावर7 4 | [[File:Power7 4ghz 9119 8way IHStop sonic84 IMG 1417.jpg|thumb|आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू IHS आईबीएम 9119 से शीर्ष पर है]] | ||
[[File:Power7 4ghz 9119 8way underside interposerRemoved sonic84 IMG 1415.jpg|thumb|आईबीएम पावर7 4 | [[File:Power7 4ghz 9119 8way underside interposerRemoved sonic84 IMG 1415.jpg|thumb|आईबीएम पावर7 4 गीगाहर्ट्ज 8-तरफा सीपीयू आईबीएम 9119 से नीचे]] | ||
[[File:Power7 4ghz 9119 8way underside withInterposer sonic84 IMG 1416.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 | [[File:Power7 4ghz 9119 8way underside withInterposer sonic84 IMG 1416.jpg|thumb|आईबीएम 9119 से आईबीएम पावर7 4 गीगाहर्ट्ज 8-वे सीपीयू हटाने योग्य इंटरपोज़र]] | ||
== इतिहास == | == इतिहास == | ||
Line 86: | Line 86: | ||
|url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699 | |url=http://www.informationweek.com/showArticle.jhtml?articleID=179100699 | ||
|access-date=2006-02-06 | |access-date=2006-02-06 | ||
}}</ref> इसलिए, पावर7 | }}</ref> इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था। | ||
== विशिष्टताएँ == | == विशिष्टताएँ == | ||
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला ]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 [[कैश (कंप्यूटिंग)]] तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए | पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग [[ सूक्ष्मवास्तुकला |माइक्रोआर्किटेक्चर]] और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।<ref>{{Cite web |url=http://www.redbooks.ibm.com/redbooks/pdfs/sg248003.pdf |title=IBM Power Systems 775 HPC Solution |access-date=28 April 2020}}</ref> एक विशेष [[टर्बोकोर]] मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 [[कैश (कंप्यूटिंग)|कैश]] तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।<ref name=ibmp7>{{cite web|title=IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services|url=http://www-03.ibm.com/press/us/en/pressrelease/29315.wss|publisher=IBM.com|access-date=11 August 2011}}</ref> नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।<ref name=ibmp7 /> | ||
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और | प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी<sup>2</sup> बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है। | ||
पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web | पावर7 में ये विशिष्टताएँ हैं:<ref>{{cite web | ||
Line 110: | Line 110: | ||
* [[45 नैनोमीटर]] [[इन्सुलेटर पर सिलिकॉन]] प्रक्रिया, 567 मिमी<sup>2</sup> | * [[45 नैनोमीटर]] [[इन्सुलेटर पर सिलिकॉन]] प्रक्रिया, 567 मिमी<sup>2</sup> | ||
* 1.2 अरब [[ट्रांजिस्टर]] | * 1.2 अरब [[ट्रांजिस्टर]] | ||
* 3.0–4.25 | * 3.0–4.25 गीगाहर्ट्ज क्लॉक स्पीड | ||
* प्रति [[मल्टी-चिप मॉड्यूल]] | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स | * प्रति [[मल्टी-चिप मॉड्यूल]] | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स | ||
** प्रति चिप 4, 6 या 8 सी1 कोर | ** प्रति चिप 4, 6 या 8 सी1 कोर | ||
Line 142: | Line 142: | ||
* अधिकतम 794.88 GFLOPS प्रति चिप | * अधिकतम 794.88 GFLOPS प्रति चिप | ||
प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 | प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है। | ||
पीक [[ दोहरी सुनिश्चितता ]] (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है। | पीक [[ दोहरी सुनिश्चितता ]] (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है। | ||
तुलना के लिए, इंटेल का 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट [[AVX2]] एफपी वेक्टर इकाइयों में फैला हुआ)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 | तुलना के लिए, इंटेल का 2013 [[हैसवेल (माइक्रोआर्किटेक्चर)]] आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी [[फ़्यूज्ड मल्टीप्ली-ऐड]] स्प्रेड 2× 256-बिट [[AVX2]] एफपी वेक्टर इकाइयों में फैला हुआ)।<ref>{{cite web|url=http://www.anandtech.com/show/6355/intels-haswell-architecture|title=Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel|author=Anand Lal Shimpi|date=5 October 2012|website=[[Anandtech]]}}</ref> 3.4 गीगाहर्ट्ज (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के [[ चाल या शक्ति में बढ़ोत्तरी ]] के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी। | ||
यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने [[SPEC]] CPU2006 [[तैरनेवाला स्थल]] बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> पावर7 बनाम 74.0 के लिए<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> i7-4770 के लिए. | यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने [[SPEC]] CPU2006 [[तैरनेवाला स्थल]] बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2010q2/cpu2006-20100426-10752.html|title=SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)}}</ref> पावर7 बनाम 74.0 के लिए<ref>{{cite web|url=https://www.spec.org/cpu2006/results/res2014q3/cpu2006-20140728-30673.html|title=SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)}}</ref> i7-4770 के लिए. | ||
Line 163: | Line 163: | ||
{| class="wikitable sortable" style="text-align:center" border=1 | {| class="wikitable sortable" style="text-align:center" border=1 | ||
|+आईबीएम पावर7 and पावर7+ servers | |+आईबीएम पावर7 and पावर7+ servers | ||
! Name !! Number of sockets !! Number of cores !! | ! Name !! Number of sockets !! Number of cores !! सीपीयू clock frequency | ||
|- | |- | ||
| 710 Express || 1 || 6 || 4.2 | | 710 Express || 1 || 6 || 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 710 Express || 1 || 8 || 4.2 | | 710 Express || 1 || 8 || 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 720 Express (8202-E4B, पावर7)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4637.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-05-13 |ref=redp4637 |page=9 |date=2012-12-03}}</ref> || 1 || 8 || 3.0 | | 720 Express (8202-E4B, पावर7)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4637.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-05-13 |ref=redp4637 |page=9 |date=2012-12-03}}</ref> || 1 || 8 || 3.0 गीगाहर्ट्ज | ||
|- | |- | ||
| 720 Express (8202-E4D, पावर7+)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4984.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-06-03 |ref=redp4984 |page=9 |date=2013-05-16}}</ref> || 1 || 8 || 3.6 | | 720 Express (8202-E4D, पावर7+)<ref>{{cite web |title=IBM Power 720 and 740 Technical Overview and Introduction |url=http://redbooks.ibm.com/redpapers/pdfs/redp4984.pdf |website=IBM Redbooks |publisher=IBM |access-date=2021-06-03 |ref=redp4984 |page=9 |date=2013-05-16}}</ref> || 1 || 8 || 3.6 गीगाहर्ट्ज | ||
|- | |- | ||
| 730 Express || 2 || 12 || 4.2 | | 730 Express || 2 || 12 || 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 730 Express || 2 || 16 || 3.6 | | 730 Express || 2 || 16 || 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 740 Express || 2 || 12 || 4.2 | | 740 Express || 2 || 12 || 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 740 Express || 2 || 16 || 3.6 | | 740 Express || 2 || 16 || 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज | ||
|- | |- | ||
| 750 Express || 4 || 24 || 3.72 | | 750 Express || 4 || 24 || 3.72 गीगाहर्ट्ज | ||
|- | |- | ||
| 750 Express || 4 || 32 || 3.22 | | 750 Express || 4 || 32 || 3.22 गीगाहर्ट्ज or 3.61 गीगाहर्ट्ज | ||
|- | |- | ||
| 755 || 4 || 32 || 3.61 | | 755 || 4 || 32 || 3.61 गीगाहर्ट्ज | ||
|- | |- | ||
| 770 || 8 || 48 || 3.7 | | 770 || 8 || 48 || 3.7 गीगाहर्ट्ज | ||
|- | |- | ||
| 770 || 8 || 64 || 3.3 | | 770 || 8 || 64 || 3.3 गीगाहर्ट्ज | ||
|- | |- | ||
| 775 (Per Node) || 32 || 256 || 3.83 | | 775 (Per Node) || 32 || 256 || 3.83 गीगाहर्ट्ज | ||
|- | |- | ||
| 780 (MaxCore mode) || 8 || 64 || 3.92 | | 780 (MaxCore mode) || 8 || 64 || 3.92 गीगाहर्ट्ज | ||
|- | |- | ||
| 780 ( | | 780 (टर्बोकोर mode) || 8 || 32 || 4.14 गीगाहर्ट्ज | ||
|- | |- | ||
| 780 (4 Socket Node) || 16 || 96 || 3.44 | | 780 (4 Socket Node) || 16 || 96 || 3.44 गीगाहर्ट्ज | ||
|- | |- | ||
| 795 || 32 || 192 || 3.72 | | 795 || 32 || 192 || 3.72 गीगाहर्ट्ज | ||
|- | |- | ||
| 795 (MaxCore mode) || 32 || 256 || 4.0 | | 795 (MaxCore mode) || 32 || 256 || 4.0 गीगाहर्ट्ज | ||
|- | |- | ||
| 795 ( | | 795 (टर्बोकोर mode) || 32 || 128 || 4.25 गीगाहर्ट्ज | ||
|- | |- | ||
|} | |} | ||
Line 210: | Line 210: | ||
{| class="wikitable sortable" style="text-align:center" border=1 | {| class="wikitable sortable" style="text-align:center" border=1 | ||
|+आईबीएम पावर7 blade servers | |+आईबीएम पावर7 blade servers | ||
! Name !! Number of cores !! | ! Name !! Number of cores !! सीपीयू clock frequency !! Blade slots required | ||
|- | |- | ||
| BladeCenter PS700 || 4 || 3.0 | | BladeCenter PS700 || 4 || 3.0 गीगाहर्ट्ज || 1 | ||
|- | |- | ||
| BladeCenter PS701 || 8 || 3.0 | | BladeCenter PS701 || 8 || 3.0 गीगाहर्ट्ज || 1 | ||
|- | |- | ||
| BladeCenter PS702 || 16 || 3.0 | | BladeCenter PS702 || 16 || 3.0 गीगाहर्ट्ज || 2 | ||
|- | |- | ||
| BladeCenter PS703 || 16 || 2.4 | | BladeCenter PS703 || 16 || 2.4 गीगाहर्ट्ज || 1 | ||
|- | |- | ||
| BladeCenter PS704 || 32 || 2.4 | | BladeCenter PS704 || 32 || 2.4 गीगाहर्ट्ज || 2 | ||
|- | |- | ||
|} | |} |
Revision as of 06:28, 20 July 2023
General information | |
---|---|
Launched | 2010 |
Designed by | IBM |
Performance | |
Max. CPU clock rate | 2.4 GHz to 4.25 GHz |
Cache | |
L1 cache | 32+32 KB/core |
L2 cache | 256 KB/core |
L3 cache | 4 MB/core |
Architecture and classification | |
Technology node | 45 nm |
Instruction set | Power ISA (Power ISA v.2.06) |
Physical specifications | |
Cores |
|
History | |
Predecessor | POWER6 |
Successor | POWER8 |
POWER, PowerPC, and Power ISA architectures |
---|
NXP (formerly Freescale and Motorola) |
IBM |
|
IBM/Nintendo |
Other |
Related links |
Cancelled in gray, historic in italic |
पावर7 सुपरस्केलर मल्टी कोर माइक्रोप्रोसेसरों का एक परिवार है जो 2010 में जारी पावर आईएसए 2.06 इंस्ट्रक्शन सेट आर्किटेक्चर पर आधारित है जो पावर6 और पावर6+ के बाद आया है। आईबीएम द्वारा पावर7 को आईबीएम के रोचेस्टर, एमएन सहित कई साइटों पर विकसित किया गया था; ऑस्टिन, टीएक्स; एसेक्स जंक्शन, वीटी; टी. जे. वाटसन अनुसंधान केंद्र, एनवाई; ब्रोमोंट, क्यूसी[1] और आईबीएम डॉयचलैंड रिसर्च एंड डेवलपमेंट जीएमबीएच, बोबलिंगेन, जर्मनी प्रयोगशालाएं। आईबीएम ने 8 फरवरी 2010 को पावर7 पर आधारित सर्वर की घोषणा की थी।[2][3]
इतिहास
आईबीएम ने एचपीसीएस परियोजना में 2010 के अंत से पहले पेटास्केल सुपरकंप्यूटर आर्किटेक्चर विकसित करने के लिए नवंबर 2006 में 244 मिलियन डॉलर का डीएआरपीए अनुबंध जीता। अनुबंध में यह भी कहा गया है कि वास्तुकला व्यावसायिक रूप से उपलब्ध होगी। आईबीएम का प्रस्ताव, पीईआरसीएस (प्रोडक्टिव, इजी-टू-यूज़, रिलाएबल कंप्यूटर सिस्टम), जिसने उन्हें अनुबंध दिलाया, पावर7 प्रोसेसर, ऐक्स ऑपरेटिंग सिस्टम और सामान्य समानांतर फ़ाइल सिस्टम पर आधारित है।[4]
एक सुविधा जिस पर आईबीएम और डीएआरपीए ने सहयोग किया है, वह पावर7 क्लस्टर के लिए वैश्विक साझा मेमोरी स्पेस का समर्थन करने के लिए एड्रेसिंग और पेज टेबल हार्डवेयर को संशोधित कर रहा है। यह अनुसंधान वैज्ञानिकों को मैसेज पासिंग का उपयोग किए बिना क्लस्टर को प्रोग्राम करने में सक्षम बनाता है जैसे कि यह एक एकल सिस्टम था। उत्पादकता के दृष्टिकोण से, यह आवश्यक है क्योंकि कुछ वैज्ञानिक एमपीआई या क्लस्टर में उपयोग की जाने वाली अन्य समानांतर प्रोग्रामिंग तकनीकों से परिचित नहीं हैं।[5]
डिज़ाइन
पावर7 सुपरस्केलर मल्टी-कोर आर्किटेक्चर, पावर6 डिज़ाइन से एक महत्वपूर्ण विकास था, जो एकाधिक कोर और एक साथ मल्टीथ्रेडिंग (एसएमटी) के माध्यम से बिजली दक्षता पर अधिक ध्यान केंद्रित करता था।[6] पावर6 आर्किटेक्चर को बिजली दक्षता की कीमत पर प्रोसेसर आवृत्ति को अधिकतम करने के लिए जमीन से ऊपर तक बनाया गया था। इसने उल्लेखनीय 5 गीगाहर्ट्ज प्राप्त किया। जबकि पावर6 में एक डुअल-कोर प्रोसेसर है, प्रत्येक दो-तरफ़ा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है, आईबीएम पावर7 प्रोसेसर में एक साथ 32 थ्रेड की कुल क्षमता के लिए आठ कोर और चार थ्रेड प्रति कोर हैं।[7]
आईबीएम ने आईएससीए 29[8] में कहा कि बिजली दक्षता की कीमत पर प्रति पाइपलाइन चरण में 10-20 एफओ4 देरी के साथ उच्च-आवृत्ति डिज़ाइन द्वारा चरम प्रदर्शन हासिल किया गया था। हालाँकि, पावर6 बाइनरी फ्लोटिंग-पॉइंट यूनिट "6-चक्र, 13-FO4 पाइपलाइन" प्राप्त करती है।[9] इसलिए, पावर7 सीपीयू के लिए पाइपलाइन को फिर से बदल दिया गया है, जैसे यह पावर5 और पावर6 डिज़ाइन के लिए था। कुछ मामलों में, यह पुनः कार्य 2005 में इंटेल की बारी के समान है जिसने P4 7वीं पीढ़ी के x86 माइक्रोआर्किटेक्चर को छोड़ दिया था।
विशिष्टताएँ
पावर7 प्रति माइक्रोचिप 4, 6, या 8 भौतिक कोर के साथ, 1 से 32-तरफा डिज़ाइन में, 1024 एसएमटी तक और पावर आईएसए के संदर्भ में विस्तारित/उप-विनिर्देशों का समर्थन करने के लिए थोड़ा अलग माइक्रोआर्किटेक्चर और इंटरफेस के साथ उपलब्ध है। और/या विभिन्न सिस्टम आर्किटेक्चर। उदाहरण के लिए, सुपरकंप्यूटिंग (एचपीसी) सिस्टम पावर 775 में इसे 256 भौतिक कोर और 1024 एसएमटी के साथ 32-वे क्वाड-चिप-मॉड्यूल (क्यूसीएम) के रूप में पैक किया गया है।[10] एक विशेष टर्बोकोर मोड भी है जो आठ-कोर प्रोसेसर से आधे कोर को बंद कर सकता है, लेकिन उन 4 कोर के पास बढ़ी हुई घड़ी की गति पर सभी मेमोरी नियंत्रकों और एल 3 कैश तक पहुंच है। यह प्रत्येक कोर के प्रदर्शन को उच्च बनाता है जो कार्यभार के लिए महत्वपूर्ण है जिसके लिए कम समानांतर प्रदर्शन की कीमत पर सबसे तेज़ अनुक्रमिक प्रदर्शन की आवश्यकता होती है। टर्बोकोर मोड उन अनुप्रयोगों के लिए सॉफ़्टवेयर लागत को आधा कर सकता है जो प्रति कोर लाइसेंस प्राप्त हैं, जबकि उस सॉफ़्टवेयर से प्रति कोर प्रदर्शन बढ़ रहा है।[11] नए आईबीएम Power 780 स्केलेबल, हाई-एंड सर्वर में नए टर्बोकोर वर्कलोड ऑप्टिमाइज़िंग मोड की सुविधा है और पावर6 आधारित सिस्टम के प्रति कोर दोगुना प्रदर्शन प्रदान करते हैं।[11]
प्रत्येक कोर चार-तरफा एक साथ मल्टीथ्रेडिंग (एसएमटी) में सक्षम है। पावर7 में लगभग 1.2 बिलियन ट्रांजिस्टर हैं और यह 45 एनएम प्रक्रिया पर निर्मित 567 मिमी2 बड़ा है। पावर6 से एक उल्लेखनीय अंतर यह है कि पावर7 निर्देशों को क्रम के बजाय आउट-ऑफ-ऑर्डर निष्पादित करता है। पावर6 (4.25 गीगाहर्ट्ज बनाम 5.0 गीगाहर्ट्ज) की तुलना में अधिकतम आवृत्ति में कमी के बावजूद, प्रत्येक कोर का प्रदर्शन पावर6 की तुलना में अधिक है, जबकि प्रत्येक प्रोसेसर में कोर की संख्या 4 गुना तक होती है।
पावर7 में ये विशिष्टताएँ हैं:[12][13]
- 45 नैनोमीटर इन्सुलेटर पर सिलिकॉन प्रक्रिया, 567 मिमी2
- 1.2 अरब ट्रांजिस्टर
- 3.0–4.25 गीगाहर्ट्ज क्लॉक स्पीड
- प्रति मल्टी-चिप मॉड्यूल | क्वाड-चिप मॉड्यूल अधिकतम 4 चिप्स
- प्रति चिप 4, 6 या 8 सी1 कोर
- 4 एसएमटी एक साथ मल्टीथ्रेडिंग प्रति सी1 कोर (एईएक्स 6.1 टीएल05 में उपलब्ध (अप्रैल 2010 में रिलीज) और ऊपर)
- प्रति C1 कोर 12 निष्पादन इकाइयाँ:
- 2 निश्चित-बिंदु इकाइयाँ
- 2 लोड/स्टोर इकाइयां
- 4 डबल-प्रिसिजन फ़्लोटिंग-पॉइंट इकाइयाँ
- 1 वेक्टर इकाई Altivec का समर्थन करती है
- 1 दशमलव फ़्लोटिंग-पॉइंट इकाई
- 1 शाखा इकाई
- 1 शर्त रजिस्टर इकाई
- 32+32 केबी एल1 निर्देश और डेटा कैश (प्रति कोर)[14]
- 256 केबी एल2 कैश (प्रति सी1 कोर)
- प्रति सी1 कोर 4 एमबी एल3 कैश, अधिकतम 32 एमबी तक समर्थित। कैश को eDRAM में कार्यान्वित किया जाता है, जिसके लिए मानक स्थैतिक रैंडम-एक्सेस मेमोरी के रूप में प्रति सेल कई ट्रांजिस्टर की आवश्यकता नहीं होती है[5]इसलिए यह SRAM के समान क्षेत्र का उपयोग करते हुए बड़े कैश की अनुमति देता है।
- प्रति चिप 4, 6 या 8 सी1 कोर
तकनीकी विशिष्टता आगे निर्दिष्ट करती है:[15]
<ब्लॉककोट>प्रत्येक पावर7 प्रोसेसर कोर उपलब्ध निष्पादन पथों के उपयोग में उच्च दक्षता लाने के लिए आक्रामक आउट-ऑफ-ऑर्डर (OoO) निर्देश निष्पादन को लागू करता है। पावर7 प्रोसेसर में एक निर्देश अनुक्रम इकाई है जो कतारों के एक सेट पर प्रति चक्र छह निर्देश भेजने में सक्षम है। निर्देश निष्पादन इकाइयों को प्रति चक्र अधिकतम आठ निर्देश जारी किए जा सकते हैं।
यह निम्नलिखित सैद्धांतिक एकल परिशुद्धता (एसपी) प्रदर्शन आंकड़े देता है (4.14 गीगाहर्ट्ज़ 8 कोर कार्यान्वयन पर आधारित):
- अधिकतम 99.36 GFLOPS प्रति कोर
- अधिकतम 794.88 GFLOPS प्रति चिप
प्रति कोर 4 64-बिट SIMD इकाइयाँ, और प्रति कोर एक 128-बिट SIMD VMX इकाई, प्रति चक्र 12 मल्टीप्लाई-ऐड कर सकती है, जिससे प्रति चक्र 24 SP FP ऑप्स मिलते हैं। 4.14 गीगाहर्ट्ज पर, यह 4.14 बिलियन * 24 = 99.36 SP GFLOPS देता है, और 8 कोर पर, 794.88 SP GFLOPS देता है।
पीक दोहरी सुनिश्चितता (डीपी) प्रदर्शन पीक एसपी प्रदर्शन का लगभग आधा है।
तुलना के लिए, इंटेल का 2013 हैसवेल (माइक्रोआर्किटेक्चर) आर्किटेक्चर सीपीयू प्रति चक्र 16 डीपी फ्लॉप या 32 एसपी फ्लॉप कर सकता है (8/16 डीपी/एसपी फ़्यूज्ड मल्टीप्ली-ऐड स्प्रेड 2× 256-बिट AVX2 एफपी वेक्टर इकाइयों में फैला हुआ)।[16] 3.4 गीगाहर्ट्ज (i7-4770) पर यह प्रति कोर 108.8 SP GFLOPS और 4-कोर चिप में 435.2 SP GFLOPS चरम प्रदर्शन में तब्दील हो जाता है, जो इंटेल के चाल या शक्ति में बढ़ोत्तरी के प्रभाव या लाभों को ध्यान में रखे बिना, प्रति कोर प्रदर्शन के लगभग समान स्तर देता है। तकनीकी।
यह सैद्धांतिक शिखर प्रदर्शन तुलना व्यवहार में भी लागू है, पावर7 और i7-4770 ने SPEC CPU2006 तैरनेवाला स्थल बेंचमार्क (सिंगल-थ्रेडेड) में समान स्कोर प्राप्त किया है: 71.5[17] पावर7 बनाम 74.0 के लिए[18] i7-4770 के लिए.
ध्यान दें कि पावर7 चिप ने कुछ बेंचमार्क (बीवेव्स, कैक्टसएडीएम, एलबीएम) में i7 से काफी बेहतर प्रदर्शन (2×–5×) किया है, जबकि अधिकांश अन्य में यह काफी धीमा (2x-3x) है। यह दो चिप्स/मेनबोर्ड/मेमोरी सिस्टम आदि के बीच प्रमुख वास्तुशिल्प अंतर का संकेत है: इन्हें विभिन्न कार्यभार को ध्यान में रखकर डिजाइन किया गया था।
हालाँकि, कुल मिलाकर, बहुत व्यापक अर्थ में, कोई यह कह सकता है कि पावर7 का फ़्लोटिंग-पॉइंट प्रदर्शन हैसवेल i7 के समान है।
पावर7+
आईबीएम ने अगस्त 2012 में गर्म चकतियां सम्मेलन में पावर7+ प्रोसेसर पेश किया। यह उच्च गति, अधिक कैश और एकीकृत त्वरक के साथ एक अद्यतन संस्करण है। इसका निर्माण 32 एनएम निर्माण प्रक्रिया पर किया गया है।[19] पावर7+ प्रोसेसर के साथ आने वाले पहले बॉक्स आईबीएम Power 770 और 780 सर्वर थे। चिप्स में 80 एमबी तक एल3 कैश (10 एमबी/कोर), बेहतर क्लॉक स्पीड (4.4 गीगाहर्ट्ज तक) और 20 एलपीएआर प्रति कोर है।[20]
उत्पाद
As of October 2011[update], आईबीएम पावर सिस्टम्स एक्सप्रेस मॉडल (710, 720, 730, 740 और 750), एंटरप्राइज मॉडल (770, 780 और 795) और उच्च प्रदर्शन कंप्यूटिंग मॉडल (755 और 775) सहित पावर7-आधारित सिस्टम की रेंज। एंटरप्राइज़ मॉडल मांग पर क्षमता की क्षमता में भिन्न होते हैं। अधिकतम विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।
Name | Number of sockets | Number of cores | सीपीयू clock frequency |
---|---|---|---|
710 Express | 1 | 6 | 4.2 गीगाहर्ट्ज |
710 Express | 1 | 8 | 4.2 गीगाहर्ट्ज |
720 Express (8202-E4B, पावर7)[21] | 1 | 8 | 3.0 गीगाहर्ट्ज |
720 Express (8202-E4D, पावर7+)[22] | 1 | 8 | 3.6 गीगाहर्ट्ज |
730 Express | 2 | 12 | 4.2 गीगाहर्ट्ज |
730 Express | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
740 Express | 2 | 12 | 4.2 गीगाहर्ट्ज |
740 Express | 2 | 16 | 3.6 गीगाहर्ट्ज or 4.2 गीगाहर्ट्ज |
750 Express | 4 | 24 | 3.72 गीगाहर्ट्ज |
750 Express | 4 | 32 | 3.22 गीगाहर्ट्ज or 3.61 गीगाहर्ट्ज |
755 | 4 | 32 | 3.61 गीगाहर्ट्ज |
770 | 8 | 48 | 3.7 गीगाहर्ट्ज |
770 | 8 | 64 | 3.3 गीगाहर्ट्ज |
775 (Per Node) | 32 | 256 | 3.83 गीगाहर्ट्ज |
780 (MaxCore mode) | 8 | 64 | 3.92 गीगाहर्ट्ज |
780 (टर्बोकोर mode) | 8 | 32 | 4.14 गीगाहर्ट्ज |
780 (4 Socket Node) | 16 | 96 | 3.44 गीगाहर्ट्ज |
795 | 32 | 192 | 3.72 गीगाहर्ट्ज |
795 (MaxCore mode) | 32 | 256 | 4.0 गीगाहर्ट्ज |
795 (टर्बोकोर mode) | 32 | 128 | 4.25 गीगाहर्ट्ज |
आईबीएम 5 पावर7 आधारित आईबीएम ब्लेडसेंटर भी प्रदान करता है।[23] विशिष्टताओं को नीचे दी गई तालिका में दिखाया गया है।
Name | Number of cores | सीपीयू clock frequency | Blade slots required |
---|---|---|---|
BladeCenter PS700 | 4 | 3.0 गीगाहर्ट्ज | 1 |
BladeCenter PS701 | 8 | 3.0 गीगाहर्ट्ज | 1 |
BladeCenter PS702 | 16 | 3.0 गीगाहर्ट्ज | 2 |
BladeCenter PS703 | 16 | 2.4 गीगाहर्ट्ज | 1 |
BladeCenter PS704 | 32 | 2.4 गीगाहर्ट्ज | 2 |
निम्नलिखित सुपरकंप्यूटर प्रोजेक्ट हैं जो पावर7 प्रोसेसर का उपयोग करते हैं:
- लाभ
- वॉटसन (कंप्यूटर)
यह भी देखें
- शक्ति6
- आईबीएम पावर माइक्रोप्रोसेसर
संदर्भ
- ↑ Authier, Isabelle (17 February 2011). "वॉटसन के केंद्र में आईबीएम ब्रोमोंट" [IBM Bromont at the heart of Watson]. Cyberpresse (in French). Cyberpresse. Archived from the original on 19 February 2011. Retrieved 17 February 2011.
{{cite web}}
: CS1 maint: unrecognized language (link) - ↑ "IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services". IBM. 8 February 2010. Retrieved 13 September 2010.
- ↑ "New POWER7 workload optimizing systems". YouTube. IBM. 5 February 2010. Archived from the original on 8 February 2011. Retrieved 22 February 2010.
- ↑ "Cray, IBM picked for U.S. petaflop computer effort". EE Times. Retrieved 13 November 2022.
- ↑ 5.0 5.1 "Hot Chips XXI Preview". Real World Technologies. Retrieved 17 August 2009.
- ↑ Kanter, David. "New Information on POWER7". Retrieved 11 August 2011.
- ↑ Varhol, Peter (9 February 2010). "IBM Launches POWER 7 Processor February 9, 2010". Retrieved 11 August 2011.
- ↑ "ISCA 29 Conference Notes". Retrieved 11 August 2011.
- ↑ "IBM Tips Power6 Processor Architecture". Information Week. 6 February 2006. Retrieved 6 February 2006.
- ↑ "IBM Power Systems 775 HPC Solution" (PDF). Retrieved 28 April 2020.
- ↑ 11.0 11.1 "IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services". IBM.com. Retrieved 11 August 2011.
- ↑ "IBM in Education – Business & Technology Solutions". IBM. Archived from the original on 4 October 2012. Retrieved 8 July 2009.
- ↑ "IBM's 8-core POWER7: twice the muscle, half the transistors". Ars Technica. September 2009. Retrieved 1 September 2009.
- ↑ "Bluewater HW specifications". National Center for Supercomputing Applications. Archived from the original on 23 January 2010. Retrieved 31 December 2009.
- ↑ "IBM Power 770 and 780 Technical Overview and Introduction" (PDF). IBM. Retrieved 21 August 2011.
- ↑ Anand Lal Shimpi (5 October 2012). "Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel". Anandtech.
- ↑ "SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)".
- ↑ "SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)".
- ↑ "Hot Chips: Update für IBMs Power7". Archived from the original on 18 May 2015. Retrieved 30 August 2012.
- ↑ Morgan, Timothy Prickett (3 October 2012). "Power7+ chips debut in fat IBM midrange systems". The Register.
- ↑ "IBM Power 720 and 740 Technical Overview and Introduction" (PDF). IBM Redbooks. IBM. 3 December 2012. p. 9. Retrieved 13 May 2021.
- ↑ "IBM Power 720 and 740 Technical Overview and Introduction" (PDF). IBM Redbooks. IBM. 16 May 2013. p. 9. Retrieved 3 June 2021.
- ↑ "आईबीएम पावर सिस्टम्स हार्डवेयर - ब्लेड सर्वर". IBM. Retrieved 30 January 2012.
बाहरी संबंध
- आईबीएम पावर7 Systems - आईबीएम पावर7 product page
- आईबीएम पावर7 Technology and Systems - आईबीएम Journal of Research and Development (published by IEEE Xplore)
- आईबीएम Won DARPA HPCS Phase-III
- आईबीएम Won DARPA HPCS Phase-II
- आईबीएम Has Its PERCS
- POWER 780 SPECint_rate_base2006 result
- आईबीएम BladeCenter PS703 and PS704 Technical Overview and Introduction