एनएएस समानांतर बेंचमार्क: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 159: Line 159:


== मानदंड ==
== मानदंड ==
एनपीबी 3.3 के अनुसार, ग्यारह बेंचमार्क को निम्नलिखित तालिका में संक्षेप में परिभाषित किया गया है।
एनपीबी 3.3 के अनुसार, ग्यारह बेंचमार्क को निम्नलिखित सूची में संक्षेप में परिभाषित किया गया है।


{| class="wikitable"
{| class="wikitable"
! Benchmark !! Name derived from<ref name="rnr94007"/> !! Available since !! Description<ref name="rnr94007"/> !! Remarks
! बेंचमार्क !! नाम से व्युत्पन्न<ref name="rnr94007"/> !! तब से उपलब्ध है !! विवरण<ref name="rnr94007"/> !! टिप्पणियां
|-
|-
| MG || '''M'''ulti'''G'''rid
| MG || मल्टीग्रिड
| rowspan="8" | NPB 1<ref name="rnr94007"/>
| rowspan="8" | NPB 1<ref name="rnr94007"/>
| Approximate the solution to a three-dimensional [[discrete Poisson equation]] using the V-cycle [[multigrid method]] ||
| Approximate the solution to a three-dimensional [[discrete Poisson equation]] using the V-cycle [[multigrid method]] ||
|-
|-
| CG || '''C'''onjugate '''G'''radient
| CG || कंजुगेट ग्रेडिएंट
| Estimate the smallest [[eigenvalue]] of a large [[Sparse matrix|sparse]] [[Symmetric matrix|symmetric]] [[positive-definite matrix]] using the [[inverse iteration]] with the [[conjugate gradient method]] as a subroutine for solving [[System of linear equations|systems of linear equations]] ||
| Estimate the smallest [[eigenvalue]] of a large [[Sparse matrix|sparse]] [[Symmetric matrix|symmetric]] [[positive-definite matrix]] using the [[inverse iteration]] with the [[conjugate gradient method]] as a subroutine for solving [[System of linear equations|systems of linear equations]] ||
|-
|-
| FT || Fast '''F'''ourier '''T'''ransform
| FT || फास्ट फूरियर ट्रांसफॉर्म
| Solve a three-dimensional [[partial differential equation]] (PDE) using the [[fast Fourier transform]] (FFT) ||
| Solve a three-dimensional [[partial differential equation]] (PDE) using the [[fast Fourier transform]] (FFT) ||
|-
|-
| IS || [[Integer sorting|'''I'''nteger '''S'''ort]]
| IS || [[Integer sorting|इन्टिजर शार्ट]]
| Sort small integers using the [[bucket sort]]<ref name="npb2.2"/> ||
| Sort small integers using the [[bucket sort]]<ref name="npb2.2"/> ||
|-
|-
| EP || [[Embarrassingly parallel|'''E'''mbarrassingly '''P'''arallel]]
| EP || [[Embarrassingly parallel|एम्ब्रॉसिंगली पैरेलल]]
| Generate independent [[Normal distribution|Gaussian]] [[random variate]]s using the [[Marsaglia polar method]] ||
| Generate independent [[Normal distribution|Gaussian]] [[random variate]]s using the [[Marsaglia polar method]] ||
|-
|-
| BT || '''B'''lock '''T'''ridiagonal
| BT || ब्लॉक त्रिदिकोणीय
| rowspan="3" | Solve a synthetic system of [[Nonlinear#Partial differential equations|nonlinear PDEs]] using three different algorithms involving [[Block matrix#Block tridiagonal matrices|block tridiagonal]], scalar [[Pentadiagonal matrix|pentadiagonal]] and symmetric [[successive over-relaxation]] (SSOR) solver kernels, respectively
| rowspan="3" | Solve a synthetic system of [[Nonlinear#Partial differential equations|nonlinear PDEs]] using three different algorithms involving [[Block matrix#Block tridiagonal matrices|block tridiagonal]], scalar [[Pentadiagonal matrix|pentadiagonal]] and symmetric [[successive over-relaxation]] (SSOR) solver kernels, respectively
| rowspan="3" |
| rowspan="3" |
Line 186: Line 186:
* All three benchmarks have multi-zone versions<ref name="nas03010"/>
* All three benchmarks have multi-zone versions<ref name="nas03010"/>
|-
|-
| SP || '''S'''calar '''P'''entadiagonal<ref name="nas02007"/>
| SP || अदिश पंचकोणीय<ref name="nas02007"/>
|-
|-
| LU || [[Triangular matrix#Forward and back substitution|'''L'''ower-'''U'''pper]] symmetric [[Gauss–Seidel method|Gauss-Seidel]]<ref name="nas02007"/>
| LU || [[Triangular matrix#Forward and back substitution|लोअर अप्पर सिमेट्रिक गौससेइडेल]] <ref name="nas02007"/>
|-
|-
| UA || '''U'''nstructured '''A'''daptive<ref name="nas04006"/>
| UA || असंरचित अडाप्टिव<ref name="nas04006"/>
| rowspan="2" | NPB 3.1<ref name="npbchanges"/> || Solve [[Heat equation]] with convection and diffusion from moving ball. Mesh is adaptive and recomputed at every 5th step.||
| rowspan="2" | NPB 3.1<ref name="npbchanges"/> || Solve [[Heat equation]] with convection and diffusion from moving ball. Mesh is adaptive and recomputed at every 5th step.||
|-
|-
| DC || [[Data cube|'''D'''ata '''C'''ube]] operator<ref name="nas04013"/> || ||
| DC || डाटा क्यूब ऑपरेटर<ref name="nas04013"/> || ||
|-
|-
| DT || '''D'''ata '''T'''raffic<ref name="npbchanges"/> || NPB 3.2<ref name="npbchanges"/> || ||
| DT || डाटा ट्रैफिक<ref name="npbchanges"/> || NPB 3.2<ref name="npbchanges"/> || ||
|}
|}



Revision as of 21:02, 7 August 2023

NAS Parallel Benchmarks
Original author(s)NASA Numerical Aerodynamic Simulation Program
Developer(s)NASA Advanced Supercomputing Division
Initial release1991 (1991)
Stable release
3.4
Websitenas.nasa.gov/Software/NPB/

एनएएस पैरेलल बेंचमार्क (एनपीबी) अत्यधिक समानांतर सुपर कंप्यूटर के प्रदर्शन मूल्यांकन को लक्षित करने वाले बेंचमार्क का सेट है। इन्हें नासा एम्स रिसर्च सेंटर स्थित नासा एडवांस्ड सुपरकंप्यूटिंग (एनएएस) डिवीजन (पूर्व में नासा न्यूमेरिकल एयरोडायनामिक सिमुलेशन प्रोग्राम) द्वारा विकसित एवं सुरक्षित किया जाता है। एनएएस सभी स्रोतों से एनपीबी के लिए प्रदर्शन परिणाम मांगता है।[1]

इतिहास

प्रेरणा

पारंपरिक बेंचमार्क जो एनपीबी से पूर्व सम्मिलित थे, जैसे कि लिवरमोर लूप्स, लिनपैक एवं NAS कर्नेल बेंचमार्क प्रोग्राम, सामान्यतः वेक्टर कंप्यूटरों के लिए विशिष्ट थे। वे सामान्यतः समानता-बाधक ट्यूनिंग प्रतिबंधों एवं अपर्याप्त समस्या आकार सहित अपर्याप्तताओं से पीड़ित थे, जिसने उन्हें अत्यधिक समानांतर सिस्टम के लिए अनुपयुक्त बना दिया। उच्च पोर्टिंग लागत एवं स्वचालित सॉफ़्टवेयर समानांतरकरण टूल की अनुपलब्धता के कारण पूर्ण-स्तरीय एप्लिकेशन बेंचमार्क समान रूप से अनुपयुक्त थे।[2] परिणामस्वरूप, एनपीबी को 1991 में विकसित किया गया[3] एवं 1992 में प्रारम्भ हुई[4] जिससे अत्यधिक समानांतर मशीनों पर प्रस्तावित होने वाले बेंचमार्क की कमी को दूर किया जा सके।

एनपीबी 1

एनपीबी के पूर्व विनिर्देश में यह माना गया कि बेंचमार्क में विशेषताएं होनी चाहिए,

  • नवीन समानांतर-जागरूक एल्गोरिथम एवं सॉफ़्टवेयर विधियाँ,
  • सामान्यता एवं वास्तुकला तटस्थता,
  • परिणामों एवं प्रदर्शन के आंकड़ों की शुद्धता की सरल सत्यापन क्षमता,
  • बढ़ी हुई शक्ति के साथ नवीन सिस्टम्स को समायोजित करने की क्षमता,
  • एवं तैयार वितरण क्षमता

इन दिशानिर्देशों के आलोक में, पेपर एंड पेंसिल बेंचमार्क के संग्रह का उपयोग करना मात्र व्यवहार्य दृष्टिकोण माना गया था जो केवल एल्गोरिदम के अनुसार समस्याओं का सेट निर्दिष्ट करता था एवं कुछ आवश्यक सीमाओं के अंतर्गत अधिकांश कार्यान्वयन विवरणों को कार्यान्वयनकर्ता के विवेक पर छोड़ देता था।

एनपीबी 1 ने आठ बेंचमार्क परिभाषित किए, प्रत्येक को दो समस्या आकारों में क्लास A एवं क्लास B कहा गया। फोरट्रान 77 में लिखे गए प्रतिरूप कोड प्रदान किए गए थे। उन्होंने छोटे समस्या आकार वर्ग S का उपयोग किया एवं बेंचमार्किंग उद्देश्यों के लिए नहीं थे।[2]

एनपीबी 2

अपने प्रचलन के पश्चात से, एनपीबी 1 ने दो प्रमुख कमज़ोरियाँ प्रदर्शित कीं हैं। सबसे पूर्व, इसके पेपर एंड पेंसिल विनिर्देश के कारण, कंप्यूटर विक्रेताओं ने सामान्यतः अपने कार्यान्वयन को अत्यधिक समायोजित किया जिससे वैज्ञानिक प्रोग्रामर के लिए उनका प्रदर्शन प्राप्त करना कठिन हो जाता है। दूसरे, इनमें से कई कार्यान्वयन मालिकाना थे एवं सार्वजनिक रूप से उपलब्ध नहीं थे, जिससे उनकी अनुकूलन प्रौद्योगिकी को प्रभावी रूप से छुपाया गया है। दूसरे, एनपीबी 1 का समस्या आकार सुपर कंप्यूटर के विकास से पीछे रह गया क्योंकि पश्चात में इसका विकास प्रस्तुत रहा है।[3]

एनपीबी 2, 1996 में प्रारम्भ किया गया,[5][6] एनपीबी 1 में परिभाषित आठ बेंचमार्क में से पांच के लिए स्रोत कोड कार्यान्वयन के साथ आया, जो एनपीबी 1 को पूरक करता है किन्तु प्रतिस्थापित नहीं करता है। इसने बेंचमार्क को अप-टू-डेट समस्या आकार क्लास C के साथ बढ़ाया गया है। इसने बेंचमार्किंग परिणाम प्रस्तुत करने के नियमों में भी संशोधन किया है। नवीन नियमों में आउटपुट फ़ाइलों के साथ-साथ संशोधित स्रोत फ़ाइलों के लिए स्पष्ट अनुरोध एवं संशोधनों की सार्वजनिक उपलब्धता एवं परिणामों की पुनरुत्पादकता सुनिश्चित करने के लिए स्क्रिप्ट का निर्माण सम्मिलित था।[3]

एनपीबी 2.2 में दो बेंचमार्क का कार्यान्वयन सम्मिलित था।[5]1997 का एनपीबी 2.3 संदेश पासिंग इंटरफ़ेस में प्रथम पूर्ण कार्यान्वयन था।[4]इसे समानांतर संस्करणों के अनुरूप बेंचमार्क के सीरियल संस्करणों के साथ भेजा गया एवं छोटे-मेमोरी सिस्टम के लिए समस्या आकार क्लास W को परिभाषित किया गया है।[7] 2002 के एनपीबी 2.4 ने नवीन एमपीआई कार्यान्वयन एवं बड़ी समस्या आकार क्लास D की प्रस्तुति की है।[6]इसने इनपुट/आउटपुट सघन उपप्रकारों के साथ बेंचमार्क भी बढ़ाया है।[4]

एनपीबी 3

एनपीबी 3 ने एनपीबी 2 से एमपीआई कार्यान्वयन को स्थिर रखा एवं ओपनएमपी,[8] जावा[9] एवं उच्च प्रदर्शन फोरट्रान नामक अधिक फ्लेवर में आया है।[10] ये नवीन समानांतर कार्यान्वयन अतिरिक्त अनुकूलन के साथ एनपीबी 2.3 में सीरियल कोड से प्राप्त किए गए थे।[7]एनपीबी 3.1 एवं एनपीबी 3.2 ने तीन बेंचमार्क जोड़े,[11][12] चूँकि, जो सभी कार्यान्वयनों में उपलब्ध नहीं थे; एनपीबी 3.3 ने क्लास E समस्या आकार प्रस्तुत किया है।[7]सिंगल-ज़ोन एनपीबी 3 के आधार पर, एमपीआई/ओपनएमपी हाइब्रिड प्रोग्रामिंग मॉडल का लाभ उठाते हुए मल्टी-लेवल एवं हाइब्रिड समानांतरीकरण प्रतिमानों एवं उपकरणों की प्रभावशीलता का परीक्षण करने के लिए एनपीबी-मल्टी-ज़ोन (एनपीबी-एमजेड) नाम के अंतर्गत मल्टी-ज़ोन बेंचमार्क का सेट प्रस्तुत किया गया था।[1][13]

मानदंड

एनपीबी 3.3 के अनुसार, ग्यारह बेंचमार्क को निम्नलिखित सूची में संक्षेप में परिभाषित किया गया है।

बेंचमार्क नाम से व्युत्पन्न[2] तब से उपलब्ध है विवरण[2] टिप्पणियां
MG मल्टीग्रिड NPB 1[2] Approximate the solution to a three-dimensional discrete Poisson equation using the V-cycle multigrid method
CG कंजुगेट ग्रेडिएंट Estimate the smallest eigenvalue of a large sparse symmetric positive-definite matrix using the inverse iteration with the conjugate gradient method as a subroutine for solving systems of linear equations
FT फास्ट फूरियर ट्रांसफॉर्म Solve a three-dimensional partial differential equation (PDE) using the fast Fourier transform (FFT)
IS इन्टिजर शार्ट Sort small integers using the bucket sort[5]
EP एम्ब्रॉसिंगली पैरेलल Generate independent Gaussian random variates using the Marsaglia polar method
BT ब्लॉक त्रिदिकोणीय Solve a synthetic system of nonlinear PDEs using three different algorithms involving block tridiagonal, scalar pentadiagonal and symmetric successive over-relaxation (SSOR) solver kernels, respectively
  • The BT benchmark has I/O-intensive subtypes[4]
  • All three benchmarks have multi-zone versions[13]
SP अदिश पंचकोणीय[6]
LU लोअर अप्पर सिमेट्रिक गौससेइडेल [6]
UA असंरचित अडाप्टिव[11] NPB 3.1[7] Solve Heat equation with convection and diffusion from moving ball. Mesh is adaptive and recomputed at every 5th step.
DC डाटा क्यूब ऑपरेटर[12]
DT डाटा ट्रैफिक[7] NPB 3.2[7]

संदर्भ

  1. 1.0 1.1 "एनएएस समानांतर बेंचमार्क परिवर्तन". NASA Advanced Supercomputing Division. Retrieved 2009-02-23.
  2. 2.0 2.1 2.2 2.3 2.4 Baily, D.; Barszcz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Weeratunga, S. (March 1994), "The NAS Parallel Benchmarks" (PDF), NAS Technical Report RNR-94-007, NASA Ames Research Center, Moffett Field, CA
  3. 3.0 3.1 3.2 Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (December 1995), "The NAS Parallel Benchmarks 2.0" (PDF), NAS Technical Report NAS-95-020, NASA Ames Research Center, Moffett Field, CA
  4. 4.0 4.1 4.2 4.3 Wong, P.; van der Wijngaart, R. (January 2003), "NAS Parallel Benchmarks I/O Version 2.4" (PDF), NAS Technical Report NAS-03-002, NASA Ames Research Center, Moffett Field, CA
  5. 5.0 5.1 5.2 Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M., New Implementations and Results for the NAS Parallel Benchmarks 2 (PDF), NASA Ames Research Center, Moffett Field, CA
  6. 6.0 6.1 6.2 6.3 van der Wijngaart, R. (October 2002), "NAS Parallel Benchmarks Version 2.4" (PDF), NAS Technical Report NAS-02-007, NASA Ames Research Center, Moffett Field, CA
  7. 7.0 7.1 7.2 7.3 7.4 7.5 "NAS Parallel Benchmarks Changes". NASA Advanced Supercomputing Division. Retrieved 2009-03-17.
  8. Jin, H.; Frumkin, M.; Yan, J. (October 1999), "The OpenMP Implementation of NAS Parallel Benchmarks and Its Performance" (PDF), NAS Technical Report NAS-99-011, NASA Ames Research Center, Moffett Field, CA
  9. Frumkin, M.; Schultz, M.; Jin, H.; Yan, J., "Implementation of the NAS Parallel Benchmarks in Java" (PDF), NAS Technical Report NAS-02-009, NASA Ames Research Center, Moffett Field, CA
  10. Frumkin, M.; Jin, H.; Yan, J. (September 1998), "Implementation of NAS Parallel Benchmarks in High Performance Fortran" (PDF), NAS Technical Report NAS-98-009, NASA Ames Research Center, Moffett Field, CA
  11. 11.0 11.1 Feng, H.; van der Wijngaart, F.; Biswas, R.; Mavriplis, C. (July 2004), "Unstructured Adaptive (UA) NAS Parallel Benchmark, Version 1.0" (PDF), NAS Technical Report NAS-04-006, NASA Ames Research Center, Moffett Field, CA
  12. 12.0 12.1 Frumkin, M.; Shabanov, L. (September 2004), "Benchmarking Memory Performance with the Data Cube Operator" (PDF), NAS Technical Report NAS-04-013, NASA Ames Research Center, Moffett Field, CA
  13. 13.0 13.1 van der Wijngaart, R.; Jin, H. (July 2003), "NAS Parallel Benchmarks, Multi-Zone Versions" (PDF), NAS Technical Report NAS-03-010, NASA Ames Research Center, Moffett Field, CA


बाहरी संबंध