कैश-ओब्लिवियस एल्गोरिदम: Difference between revisions
(Created page with "{{Short description|I/O-efficient algorithm regardless of cache size}} कम्प्यूटिंग में, कैश-ओब्लिवियस एल्गो...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|I/O-efficient algorithm regardless of cache size}} | {{Short description|I/O-efficient algorithm regardless of cache size}} | ||
[[ कम्प्यूटिंग ]] में, कैश-ओब्लिवियस एल्गोरिदम (या कैश-ट्रान्सेंडेंट एल्गोरिदम) एक एल्गोरिदम है जिसे एक स्पष्ट पैरामीटर के रूप में कैश के आकार (या [[कैश लाइन]] | [[ कम्प्यूटिंग |कम्प्यूटिंग]] में, '''कैश-ओब्लिवियस एल्गोरिदम''' (या कैश-ट्रान्सेंडेंट एल्गोरिदम) एक एल्गोरिदम है, जिसे एक स्पष्ट पैरामीटर के रूप में कैश के आकार (या [[कैश लाइन|कैश लाइनों]] की लंबाई, आदि) के बिना प्रोसेसर [[सीपीयू कैश]] का लाभ उठाने के लिए डिज़ाइन किया गया है। एक इष्टतम कैश-ओब्लिवियस [[कलन विधि|एल्गोरिदम]] एक कैश-ओब्लिवियस एल्गोरिदम है, जो कैश का इष्टतम रूप से उपयोग करता है (एक [[स्पर्शोन्मुख संकेतन]] के अर्थ में, निरंतर कारकों को अनदेखा करते हुए)। इस प्रकार, एक कैश-ओब्लिवियस एल्गोरिदम को विभिन्न कैश आकारों वाली अनेक मशीनों पर, या विभिन्न आकारों वाले कैश के विभिन्न स्तरों के साथ मेमोरी पदानुक्रम के लिए, बिना किसी संशोधन के अच्छा प्रदर्शन करने के लिए डिज़ाइन किया गया है। कैश-ओब्लिवियस एल्गोरिदम की तुलना स्पष्ट [[लूप टाइलिंग]] से की जाती है, जो किसी समस्या को स्पष्ट रूप से उन ब्लॉकों में तोड़ देता है, जो किसी दिए गए कैश के लिए इष्टतम आकार के होते हैं। | ||
इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस | इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस आव्यूह गुणन, [[मैट्रिक्स स्थानान्तरण|आव्यूह स्थानान्तरण]], [[फ़नलसॉर्ट]] और अनेक अन्य समस्याओं के लिए जाने जाते हैं। कुछ और सामान्य एल्गोरिदम, जैसे '''Cooley-Tukey FFT एल्गोरिदम|'''Cooley-Tukey FFT, पैरामीटर के कुछ विकल्पों के अनुसार इष्टतम रूप से कैश-अनअवेयर हैं। चूँकि ये एल्गोरिदम केवल एक स्पर्शोन्मुख अर्थ में इष्टतम हैं (निरंतर कारकों को अनदेखा करते हुए), पूर्ण अर्थ में लगभग इष्टतम प्रदर्शन प्राप्त करने के लिए आगे मशीन-विशिष्ट प्रदर्शन ट्यूनिंग की आवश्यकता हो सकती है। कैश-ओब्लिवियस एल्गोरिदम का लक्ष्य ऐसी ट्यूनिंग की मात्रा को कम करना है, जो आवश्यक है। | ||
सामान्यतः, एक कैश-ओब्लिवियस एल्गोरिदम एक [[फूट डालो और जीतो एल्गोरिथ्म|पुनरावर्ती विभाजन और विजय एल्गोरिथ्म]] द्वारा कार्य करता है, जहां समस्या को छोटी और छोटी उप-समस्याओं में विभाजित किया जाता है। अंततः, कोई एक उप-समस्या आकार तक पहुँच जाता है, जो कैश आकार की चिंता किए बिना कैश आकार में फिट बैठता है। उदाहरण के लिए, एक इष्टतम [[कैश-विस्मृत मैट्रिक्स गुणन|कैश-ओब्लिवियस आव्यूह गुणन]] प्रत्येक आव्यूह को पुनरावर्ती रूप से विभाजित करने के लिए चार उप-आव्यूह में विभाजित करके प्राप्त किया जाता है, उपआव्यूह को डेप्थ-फर्स्ट फैशन में गुणा किया जाता है।{{cn|date=January 2022}} किसी विशिष्ट मशीन के लिए ट्यूनिंग में, कोई [[हाइब्रिड एल्गोरिदम]] का उपयोग कर सकता है, जो निचले स्तर पर विशिष्ट कैश आकार के लिए ट्यून किए गए लूप टाइलिंग का उपयोग करता है लेकिन अन्यथा कैश-ओब्लिवियस एल्गोरिदम का उपयोग करता है। | |||
==इतिहास== | ==इतिहास== | ||
कैश- | कैश-ओब्लिवियस एल्गोरिदम के लिए विचार (और नाम) की कल्पना चार्ल्स ई. लेइसर्सन ने 1996 के प्रारंभ में की थी और पहली बार 1999 में [[मैसाचुसेट्स की तकनीकी संस्था]] में अपने मास्टर की थीसिस में [[हेराल्ड प्रोकोप]] द्वारा प्रकाशित किया गया था।<ref name="Prokop">Harald Prokop. [http://supertech.csail.mit.edu/papers/Prokop99.pdf Cache-Oblivious Algorithms]. Masters thesis, MIT. 1999.</ref> ऐसे अनेक पूर्ववर्ती थे, जो सामान्यतः विशिष्ट समस्याओं का विश्लेषण करते थे; इन पर फ्रिगो एट अल में विस्तार से चर्चा की गई है। उद्धृत प्रारंभिक उदाहरणों में पुनरावर्ती फास्ट फूरियर ट्रांसफॉर्म के लिए सिंगलटन 1969, अग्रवाल एट अल 1987 में समान विचार, आव्यूह गुणन और एलयू अपघटन के लिए फ्रिगो 1996, और [[ब्लिट्ज़++]] लाइब्रेरी में आव्यूह एल्गोरिदम के लिए [[टॉड वेल्धुइज़न]] 1996 सम्मिलित हैं। | ||
==आदर्शीकृत कैश मॉडल== | ==आदर्शीकृत कैश मॉडल== | ||
सामान्य तौर पर, एक [[कंप्यूटर प्रोग्राम]] को अधिक कैश-सचेत बनाया जा सकता है:<ref name="nick05">{{cite journal|journal= International Symposium on String Processing and Information Retrieval|title=स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प|first1=Nikolas|last1=Askitis|first2=Justin|last2=Zobel|url=https://link.springer.com/chapter/10.1007/11575832_11|doi=10.1007/11575832_1|publisher=[[Springer Publishing|Springer]]|isbn= 978-3-540-29740-6|year=2005|page=93}}</ref> | सामान्य तौर पर, एक [[कंप्यूटर प्रोग्राम]] को अधिक कैश-सचेत बनाया जा सकता है:<ref name="nick05">{{cite journal|journal= International Symposium on String Processing and Information Retrieval|title=स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प|first1=Nikolas|last1=Askitis|first2=Justin|last2=Zobel|url=https://link.springer.com/chapter/10.1007/11575832_11|doi=10.1007/11575832_1|publisher=[[Springer Publishing|Springer]]|isbn= 978-3-540-29740-6|year=2005|page=93}}</ref> | ||
* | *लौकिक स्थान, जहां एल्गोरिदम मेमोरी के एक ही टुकड़े को अनेक बार लाता है; | ||
*स्थानिक | *स्थानिक स्थान, जहां बाद की मेमोरी पहुंच आसन्न या निकटतम मेमोरी एड्रेस हैं। | ||
कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण | कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण सामान्यतः कैश के एक आदर्श मॉडल का उपयोग करके किया जाता है, जिसे कभी-कभी 'कैश-ओब्लिवियस मॉडल' भी कहा जाता है। वास्तविक कैश की विशेषताओं (जिसमें जटिल संबद्धता, प्रतिस्थापन नीतियां इत्यादि) की तुलना में इस मॉडल का विश्लेषण करना बहुत सरल है, लेकिन अनेक स्थितियों में यह अधिक यथार्थवादी कैश के प्रदर्शन के निरंतर कारक के अन्दर सिद्ध होता है। यह [[बाह्य मेमोरी मॉडल]] से भिन्न है, क्योंकि कैश-ओब्लिवियस एल्गोरिदम [[ब्लॉक (डेटा भंडारण)]] या [[कैश (कंप्यूटिंग)]] आकार को नहीं जानता है। | ||
विशेष रूप से, कैश- | विशेष रूप से, कैश-ओब्लिवियस मॉडल एक [[अमूर्त मशीन]] है (अर्थात्, गणना का एक सैद्धांतिक मॉडल)। यह [[रैम मॉडल]] के समान है, जो [[ट्यूरिंग मशीन]] के अनंत टेप को अनंत ऐरे से परिवर्तित कर देता है। ऐरे के अन्दर प्रत्येक स्थान को वास्तविक कंप्यूटर पर [[ रैंडम एक्सेस मेमोरी | रैंडम एक्सेस मेमोरी]] के समान, <math>O(1)</math> समय में एक्सेस किया जा सकता है। '''तक पहुँचा जा सकता है समय, वास्तविक कंप्यूटर पर के समान।''' रैम मशीन मॉडल के विपरीत, यह एक कैश भी रैम और सीपीयू के बीच भंडारण का दूसरा स्तर प्रस्तुत करता है। दोनों मॉडलों के बीच अन्य अंतर नीचे सूचीबद्ध हैं। कैश-ओब्लिवियस मॉडल में: | ||
[[File:External memory.svg|thumb|बायीं ओर कैश | [[File:External memory.svg|thumb|बायीं ओर के कैश में कुल {{mvar|M}} ऑब्जेक्ट के लिए प्रत्येक <math>B</math> आकार के <math>\tfrac{M}{B}</math> ब्लॉक होते हैं। दाहिनी ओर की बाह्य मेमोरी असीमित है।]] | ||
*मुख्य मेमोरी और सीपीयू रजिस्टर के बीच एक लोड या स्टोर को अब कैश से | *मेमोरी को प्रत्येक <math>B</math> ऑब्जेक्ट के ब्लॉक में विभाजित किया गया है। '''ब्लॉकों में विभाजित किया गया है प्रत्येक वस्तु.''' | ||
*मुख्य मेमोरी और सीपीयू रजिस्टर के बीच एक लोड या स्टोर को अब कैश से सर्विस किया जा सकता है। | |||
*यदि किसी लोड या स्टोर को कैश से सर्विस नहीं किया जा सकता है, तो इसे कैश मिस कहा जाता है। | *यदि किसी लोड या स्टोर को कैश से सर्विस नहीं किया जा सकता है, तो इसे कैश मिस कहा जाता है। | ||
*कैश मिस होने के परिणामस्वरूप एक ब्लॉक मुख्य मेमोरी से कैश में लोड हो जाता है। अर्थात्, यदि सीपीयू शब्द | *कैश मिस होने के परिणामस्वरूप एक ब्लॉक मुख्य मेमोरी से कैश में लोड हो जाता है। अर्थात्, यदि सीपीयू शब्द <math>w</math> तक पहुँचने का प्रयास करता है और <math>x</math> वह युक्त पंक्ति है, जिसमें <math>w</math> है, तब <math>x</math> को कैश में लोड किया जाता है। यदि कैश पहले भरा हुआ था, तो एक लाइन भी हटा दी जाएगी (नीचे प्रतिस्थापन नीति देखें)। | ||
*कैश | *कैश में <math>M</math> ऑब्जेक्ट होते हैं, '''धारण करता है वस्तुएं''', जहाँ <math>M = \Omega(B^2)</math> है। इसे लंबी कैश धारणा के रूप में भी जाना जाता है। | ||
*कैश पूरी तरह से सहयोगी है: प्रत्येक पंक्ति को कैश में किसी भी स्थान पर लोड किया जा सकता है।<ref name="Kumar">{{cite journal | *कैश पूरी तरह से सहयोगी है: प्रत्येक पंक्ति को कैश में किसी भी स्थान पर लोड किया जा सकता है।<ref name="Kumar">{{cite journal | ||
|first=Piyush |last=Kumar | |first=Piyush |last=Kumar | ||
Line 32: | Line 33: | ||
|citeseerx=10.1.1.150.5426 | |citeseerx=10.1.1.150.5426 | ||
}}</ref> | }}</ref> | ||
*प्रतिस्थापन नीति इष्टतम | *प्रतिस्थापन नीति इष्टतम है। दूसरे शब्दों में, यह माना जाता है कि कैश को एल्गोरिदम निष्पादन के समय मेमोरी एक्सेस का संपूर्ण अनुक्रम दिया गया है। यदि इसे <math>t</math> समय पर एक लाइन को हटाने की आवश्यकता है, तो यह भविष्य के अनुरोधों के अनुक्रम को ध्यान करेगा और उस लाइन को हटा देगा जिसकी पहली पहुंच भविष्य में सबसे दूर है। व्यवहार में उसका अनुकरण [[कम से कम हाल ही में प्रयुक्त|कम से कम गतकाल में प्रयुक्त]] नीति के साथ किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के एक छोटे स्थिर कारक के अन्दर दिखाया गया है।<ref name="Frigo99">{{cite conference |first1=M. |last1=Frigo |first2=C. E. |last2=Leiserson |authorlink2=Charles Leiserson |first3=H. |last3=Prokop |authorlink3=Harald Prokop |first4=S. |last4=Ramachandran |title=कैश-विस्मृत एल्गोरिदम|conference=Proc. IEEE Symp. on Foundations of Computer Science (FOCS) |pages=285–297 |year=1999 |url=http://supertech.csail.mit.edu/papers/FrigoLePr99.pdf}}</ref><ref name="Sleator">Daniel Sleator, Robert Tarjan. [https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.367.6317&rep=rep1&type=pdf Amortized Efficiency of List Update and Paging Rules]. In ''Communications of the ACM'', Volume 28, Number 2, pp. 202–208. Feb 1985.</ref> | ||
कैश- | *'''इसे के साथ व्यवहार में अनुकरण किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के एक छोटे स्थिर कारक के अन्दर दिखाया गया है''' | ||
कैश-ओब्लिवियस मॉडल के अन्दर निष्पादित होने वाले एल्गोरिदम की जटिलता को मापने के लिए, हम एल्गोरिदम द्वारा अनुभव किए जाने वाले [[कैश मिस]] की संख्या को मापते हैं। क्योंकि मॉडल इस तथ्य को पकड़ता है कि कैश (कंप्यूटिंग) में तत्वों तक पहुंची मुख्य मेमोरी में चीजों तक पहुंचने की तुलना में बहुत तीव्र है, एल्गोरिदम का चलने का समय केवल कैश और मुख्य मेमोरी के बीच मेमोरी ट्रांसफर की संख्या से परिभाषित होता है। यह बाहय मेमोरी मॉडल के समान है, जिसमें उपरोक्त सभी विशेषताएं हैं, लेकिन कैश-ओब्लिवियस एल्गोरिदम कैश पैरामीटर (<math>B</math> और <math>M</math>) से स्वतंत्र हैं।<ref name="Demaine02">[[Erik Demaine]]. [http://erikdemaine.org/papers/BRICS2002/ Cache-Oblivious Algorithms and Data Structures], in Lecture Notes from the EEF Summer School on Massive Data Sets, BRICS, University of Aarhus, Denmark, June 27–July 1, 2002.</ref> इस तरह के एल्गोरिदम का लाभ यह है कि कैश-अनअवेयर मशीन पर जो कुशल है, उनके विशेष वास्तविक मशीन मापदंडों के लिए फ़ाइन-ट्यूनिंग के बिना अनेक वास्तविक मशीनों में कुशल होने की संभावना है। अनेक समस्याओं के लिए, एक इष्टतम कैश-ओब्लिवियस एल्गोरिदम दो से अधिक मेमोरी पदानुक्रम स्तरों वाली मशीन के लिए भी इष्टतम होगा।<ref name="Frigo99"/> | |||
==उदाहरण== | ==उदाहरण== | ||
[[File:Row_and_column_major_order.svg|thumb|upright|पंक्ति और स्तंभ-प्रमुख क्रम का चित्रण]]फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश- | [[File:Row_and_column_major_order.svg|thumb|upright|पंक्ति और स्तंभ-प्रमुख क्रम का चित्रण]]फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश-ओब्लिवियस एल्गोरिदम है। एक आउट-ऑफ़-प्लेस [[ मैट्रिक्स स्थानान्तरण | ट्रांसपोज़ ऑपरेशन]] है, [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|इन-प्लेस आव्यूह]] एल्गोरिदम भी [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|ट्रांसपोज़िशन]] के लिए तैयार किए गए हैं, लेकिन गैर-स्क्वायर आव्यूह के लिए बहुत अधिक जटिल हैं) '''( |इन-प्लेस एल्गोरिदम भी ट्रांसपोज़िशन के लिए तैयार किए गए हैं, लेकिन गैर-स्क्वायर के लिए बहुत अधिक जटिल हैं)।''' m×n ऐरे '''A''' और n×m ऐरे '''B''' को देखते हुए, हम {{mvar|A}} के स्थानान्तरण को {{mvar|B}} में संग्रहीत करना चाहेंगे। सरल समाधान एक ऐरे को पंक्ति-प्रमुख क्रम में और दूसरे को स्तंभ-प्रमुख क्रम में पार करता है। इसका परिणाम यह होता है कि जब आव्यूह बड़े होते हैं, तो हमें कॉलम-वार ट्रैवर्सल के प्रत्येक चरण पर कैश मिस मिलता है। कैश छूटने की कुल संख्या <math>\Theta(mn)</math> है। | ||
[[File:Matrix_transpose_dc.svg|thumb|right|विभाजन और विजय-दृष्टिकोण का उपयोग करके | [[File:Matrix_transpose_dc.svg|thumb|right|विभाजन और विजय-दृष्टिकोण का उपयोग करके आव्यूह ट्रांसपोज़िशन के लिए कैश-ओब्लिवियस एल्गोरिदम का सिद्धांत। ग्राफ़िक आव्यूह को विभाजित करने और प्रत्येक भाग को व्यक्तिगत रूप से स्थानांतरित करने का पुनरावर्ती चरण ('''a''' → '''b''') दिखाता है।]]कैश-ओब्लिवियस एल्गोरिदम में इष्टतम कार्य जटिलता <math>O(mn)</math> है और इष्टतम कैश जटिलता <math>O(1+mn/B)</math> है। मूल विचार यह है कि दो बड़े आव्यूहों के स्थानान्तरण को कम करके छोटे (उप)आव्यूहों का स्थानान्तरण किया जाए। हम आव्यूह को उनके बड़े आयाम के साथ आधे में विभाजित करके ऐसा करते हैं, जब तक कि हमें केवल आव्यूह का स्थानांतरण नहीं करना पड़ता जो कैश में फिट होगा। क्योंकि कैश का आकार एल्गोरिदम को ज्ञात नहीं है, इस बिंदु के बाद भी आव्यूह को पुनरावर्ती रूप से विभाजित किया जाना जारी रहेगा, लेकिन ये आगे के उपखंड कैश में होंगे। एक बार जब आयाम {{mvar|m}} और {{mvar|n}} अत्यधिक छोटे हो जाते हैं तो <math>m \times n</math> आकार का एक इनपुट ऐरे और <math>n \times m</math> आकार का एक आउटपुट ऐरे कैश में फिट हो जाता है, रो-मेजर और कॉलम-मेजर दोनों ट्रैवर्सल के परिणामस्वरूप <math>O(mn)</math> कार्य होता है और <math>O(mn/B)</math> कैश छूट जाता है। इ'''स फूट डालो और विजय दृष्टिकोण का उपयोग करके हम समग्र आव्यूह के लिए जटिलता के समान स्तर को प्राप्त कर सकते हैं।''' | ||
(सैद्धांतिक रूप से, कोई भी | (सैद्धांतिक रूप से, कोई भी आव्यूह को तब तक विभाजित करना जारी रख सकता है जब तक कि आकार 1×1 का बेस केस नहीं पहुंच जाता है, लेकिन व्यवहार में कोई पुनरावर्ती उपरूटीन कॉल के ओवरहेड का [[परिशोधन विश्लेषण]] करने के लिए एक बड़े बेस केस (जैसे 16×16) का उपयोग करता है।) | ||
अधिकांश कैश- | अधिकांश कैश-ओब्लिवियस एल्गोरिदम विभाजन और विजय दृष्टिकोण पर विश्वास करते हैं। वे समस्या को कम करते हैं, जिससे यह अंततः कैश में फिट हो जाए, चाहे कैश कितना भी छोटा क्यों न हो, और फ़ंक्शन-कॉल ओवरहेड और समान कैश-असंबंधित अनुकूलन द्वारा निर्धारित कुछ छोटे आकार पर रिकर्सन को समाप्त करते हैं, और फिर इन छोटी, हल की गई समस्याओं के परिणामों को मिलाने के लिए कुछ कैश-कुशल एक्सेस पैटर्न का उपयोग करते हैं। | ||
बाहय मेमोरी मॉडल में बाहरी सॉर्टिंग की तरह, कैश-ओब्लिवियस सॉर्टिंग दो वेरिएंट में संभव है: फ़नलसॉर्ट, जो [[मर्ज़ सॉर्ट]] जैसा दिखता है, और [[कैश-विस्मृति वितरण प्रकार|कैश-ओब्लिवियस वितरण प्रकार]], जो [[जल्दी से सुलझाएं|क्विक सॉर्ट]] जैसा दिखता है। अपने बाहरी मेमोरी समकक्षों की तरह, दोनों एक रनिंग टाइम <math>O\left(\tfrac{N}{B} \log_{\tfrac{M}{B}} \tfrac{N}{B}\right)</math> प्राप्त करते हैं, जो निचली सीमा से मेल खाता है और इस प्रकार [[स्पर्शोन्मुख रूप से इष्टतम]] है।<ref name="Demaine02"/> | |||
== व्यावहारिकता == | == व्यावहारिकता == | ||
[[प्राथमिकता कतार]] | [[प्राथमिकता कतार|प्राथमिकता पंक्तियों]] को प्रयुक्त करने वाले 2 रैम-आधारित, 1 कैश-अवेयर और 2 कैश-अनअवेयर एल्गोरिदम की अनुभवजन्य तुलना से पता चला कि:<ref>{{cite thesis|url=http://hjemmesider.diku.dk/~jyrki/PE-lab/Publications/olsen-skov02.pdf |access-date=3 January 2022|title=व्यवहार में कैश-ओब्लिवियस एल्गोरिदम|type=Master's|first1=Jesper Holm|last1=Olsen|first2=Søren Christian|last2=Skov|publisher=University of Copenhagen | ||
|date=2 December 2002}}</ref> | |date=2 December 2002}}</ref> | ||
* जब डेटा मुख्य मेमोरी में फिट होता है तो कैश- | * जब डेटा मुख्य मेमोरी में फिट होता है, तो कैश-ओब्लिवियस एल्गोरिदम रैम-आधारित और कैश-अवेयर एल्गोरिदम से भी बुरा प्रदर्शन करते हैं। | ||
* कैश-अवेयर एल्गोरिदम को | * कैश-अवेयर एल्गोरिदम को प्रयुक्त करना कैश-अनअवेयर एल्गोरिदम की तुलना में अधिक जटिल नहीं लगता है, और अध्ययन में परीक्षण की गयी सभी स्थितियों में सर्वश्रेष्ठ प्रदर्शन की प्रस्तुति करता है। | ||
* जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश- | * जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश-ओब्लिवियस एल्गोरिदम ने रैम-आधारित एल्गोरिदम से उत्तम प्रदर्शन किया। | ||
एक अन्य अध्ययन में [[हैश तालिका]] | एक अन्य अध्ययन में [[हैश तालिका|हैश तालिकाओं]] (रैम-आधारित या कैश-अनजान के रूप में), [[ बी-वृक्ष | B-ट्रीज़]] (कैश-अवेयर के रूप में), और कैश-अनअवेयर डेटा संरचना की तुलना की गई जिसे बेंडर सेट कहा जाता है। निष्पादन समय और मेमोरी उपयोग दोनों के लिए, हैश तालिका सबसे अच्छी थी, उसके बाद B-ट्री थी, बेंडर सेट सभी स्थितियों में सबसे खराब था। सभी परीक्षणों के लिए मेमोरी का उपयोग मुख्य मेमोरी से अधिक नहीं था। हैश तालिकाओं को प्रयुक्त करना आसान बताया गया था, जबकि बेंडर सेट को सही ढंग से प्रयुक्त करने के लिए अधिक प्रयास की आवश्यकता थी।<ref>{{cite web |last1=Verver |first1=Maks |title=कैश-ओब्लिवियस डेटा संरचना का मूल्यांकन|url=https://fmt.ewi.utwente.nl/media/61.pdf |access-date=3 January 2022|date=23 June 2008}}</ref> | ||
==यह भी देखें== | ==यह भी देखें== | ||
*कैश- | *कैश-ओब्लिवियस वितरण प्रकार | ||
*बाह्य मेमोरी एल्गोरिदम | *बाह्य मेमोरी एल्गोरिदम | ||
*फ़नलसॉर्ट | *फ़नलसॉर्ट |
Revision as of 01:41, 8 August 2023
कम्प्यूटिंग में, कैश-ओब्लिवियस एल्गोरिदम (या कैश-ट्रान्सेंडेंट एल्गोरिदम) एक एल्गोरिदम है, जिसे एक स्पष्ट पैरामीटर के रूप में कैश के आकार (या कैश लाइनों की लंबाई, आदि) के बिना प्रोसेसर सीपीयू कैश का लाभ उठाने के लिए डिज़ाइन किया गया है। एक इष्टतम कैश-ओब्लिवियस एल्गोरिदम एक कैश-ओब्लिवियस एल्गोरिदम है, जो कैश का इष्टतम रूप से उपयोग करता है (एक स्पर्शोन्मुख संकेतन के अर्थ में, निरंतर कारकों को अनदेखा करते हुए)। इस प्रकार, एक कैश-ओब्लिवियस एल्गोरिदम को विभिन्न कैश आकारों वाली अनेक मशीनों पर, या विभिन्न आकारों वाले कैश के विभिन्न स्तरों के साथ मेमोरी पदानुक्रम के लिए, बिना किसी संशोधन के अच्छा प्रदर्शन करने के लिए डिज़ाइन किया गया है। कैश-ओब्लिवियस एल्गोरिदम की तुलना स्पष्ट लूप टाइलिंग से की जाती है, जो किसी समस्या को स्पष्ट रूप से उन ब्लॉकों में तोड़ देता है, जो किसी दिए गए कैश के लिए इष्टतम आकार के होते हैं।
इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस आव्यूह गुणन, आव्यूह स्थानान्तरण, फ़नलसॉर्ट और अनेक अन्य समस्याओं के लिए जाने जाते हैं। कुछ और सामान्य एल्गोरिदम, जैसे Cooley-Tukey FFT एल्गोरिदम|Cooley-Tukey FFT, पैरामीटर के कुछ विकल्पों के अनुसार इष्टतम रूप से कैश-अनअवेयर हैं। चूँकि ये एल्गोरिदम केवल एक स्पर्शोन्मुख अर्थ में इष्टतम हैं (निरंतर कारकों को अनदेखा करते हुए), पूर्ण अर्थ में लगभग इष्टतम प्रदर्शन प्राप्त करने के लिए आगे मशीन-विशिष्ट प्रदर्शन ट्यूनिंग की आवश्यकता हो सकती है। कैश-ओब्लिवियस एल्गोरिदम का लक्ष्य ऐसी ट्यूनिंग की मात्रा को कम करना है, जो आवश्यक है।
सामान्यतः, एक कैश-ओब्लिवियस एल्गोरिदम एक पुनरावर्ती विभाजन और विजय एल्गोरिथ्म द्वारा कार्य करता है, जहां समस्या को छोटी और छोटी उप-समस्याओं में विभाजित किया जाता है। अंततः, कोई एक उप-समस्या आकार तक पहुँच जाता है, जो कैश आकार की चिंता किए बिना कैश आकार में फिट बैठता है। उदाहरण के लिए, एक इष्टतम कैश-ओब्लिवियस आव्यूह गुणन प्रत्येक आव्यूह को पुनरावर्ती रूप से विभाजित करने के लिए चार उप-आव्यूह में विभाजित करके प्राप्त किया जाता है, उपआव्यूह को डेप्थ-फर्स्ट फैशन में गुणा किया जाता है।[citation needed] किसी विशिष्ट मशीन के लिए ट्यूनिंग में, कोई हाइब्रिड एल्गोरिदम का उपयोग कर सकता है, जो निचले स्तर पर विशिष्ट कैश आकार के लिए ट्यून किए गए लूप टाइलिंग का उपयोग करता है लेकिन अन्यथा कैश-ओब्लिवियस एल्गोरिदम का उपयोग करता है।
इतिहास
कैश-ओब्लिवियस एल्गोरिदम के लिए विचार (और नाम) की कल्पना चार्ल्स ई. लेइसर्सन ने 1996 के प्रारंभ में की थी और पहली बार 1999 में मैसाचुसेट्स की तकनीकी संस्था में अपने मास्टर की थीसिस में हेराल्ड प्रोकोप द्वारा प्रकाशित किया गया था।[1] ऐसे अनेक पूर्ववर्ती थे, जो सामान्यतः विशिष्ट समस्याओं का विश्लेषण करते थे; इन पर फ्रिगो एट अल में विस्तार से चर्चा की गई है। उद्धृत प्रारंभिक उदाहरणों में पुनरावर्ती फास्ट फूरियर ट्रांसफॉर्म के लिए सिंगलटन 1969, अग्रवाल एट अल 1987 में समान विचार, आव्यूह गुणन और एलयू अपघटन के लिए फ्रिगो 1996, और ब्लिट्ज़++ लाइब्रेरी में आव्यूह एल्गोरिदम के लिए टॉड वेल्धुइज़न 1996 सम्मिलित हैं।
आदर्शीकृत कैश मॉडल
सामान्य तौर पर, एक कंप्यूटर प्रोग्राम को अधिक कैश-सचेत बनाया जा सकता है:[2]
- लौकिक स्थान, जहां एल्गोरिदम मेमोरी के एक ही टुकड़े को अनेक बार लाता है;
- स्थानिक स्थान, जहां बाद की मेमोरी पहुंच आसन्न या निकटतम मेमोरी एड्रेस हैं।
कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण सामान्यतः कैश के एक आदर्श मॉडल का उपयोग करके किया जाता है, जिसे कभी-कभी 'कैश-ओब्लिवियस मॉडल' भी कहा जाता है। वास्तविक कैश की विशेषताओं (जिसमें जटिल संबद्धता, प्रतिस्थापन नीतियां इत्यादि) की तुलना में इस मॉडल का विश्लेषण करना बहुत सरल है, लेकिन अनेक स्थितियों में यह अधिक यथार्थवादी कैश के प्रदर्शन के निरंतर कारक के अन्दर सिद्ध होता है। यह बाह्य मेमोरी मॉडल से भिन्न है, क्योंकि कैश-ओब्लिवियस एल्गोरिदम ब्लॉक (डेटा भंडारण) या कैश (कंप्यूटिंग) आकार को नहीं जानता है।
विशेष रूप से, कैश-ओब्लिवियस मॉडल एक अमूर्त मशीन है (अर्थात्, गणना का एक सैद्धांतिक मॉडल)। यह रैम मॉडल के समान है, जो ट्यूरिंग मशीन के अनंत टेप को अनंत ऐरे से परिवर्तित कर देता है। ऐरे के अन्दर प्रत्येक स्थान को वास्तविक कंप्यूटर पर रैंडम एक्सेस मेमोरी के समान, समय में एक्सेस किया जा सकता है। तक पहुँचा जा सकता है समय, वास्तविक कंप्यूटर पर के समान। रैम मशीन मॉडल के विपरीत, यह एक कैश भी रैम और सीपीयू के बीच भंडारण का दूसरा स्तर प्रस्तुत करता है। दोनों मॉडलों के बीच अन्य अंतर नीचे सूचीबद्ध हैं। कैश-ओब्लिवियस मॉडल में:
- मेमोरी को प्रत्येक ऑब्जेक्ट के ब्लॉक में विभाजित किया गया है। ब्लॉकों में विभाजित किया गया है प्रत्येक वस्तु.
- मुख्य मेमोरी और सीपीयू रजिस्टर के बीच एक लोड या स्टोर को अब कैश से सर्विस किया जा सकता है।
- यदि किसी लोड या स्टोर को कैश से सर्विस नहीं किया जा सकता है, तो इसे कैश मिस कहा जाता है।
- कैश मिस होने के परिणामस्वरूप एक ब्लॉक मुख्य मेमोरी से कैश में लोड हो जाता है। अर्थात्, यदि सीपीयू शब्द तक पहुँचने का प्रयास करता है और वह युक्त पंक्ति है, जिसमें है, तब को कैश में लोड किया जाता है। यदि कैश पहले भरा हुआ था, तो एक लाइन भी हटा दी जाएगी (नीचे प्रतिस्थापन नीति देखें)।
- कैश में ऑब्जेक्ट होते हैं, धारण करता है वस्तुएं, जहाँ है। इसे लंबी कैश धारणा के रूप में भी जाना जाता है।
- कैश पूरी तरह से सहयोगी है: प्रत्येक पंक्ति को कैश में किसी भी स्थान पर लोड किया जा सकता है।[3]
- प्रतिस्थापन नीति इष्टतम है। दूसरे शब्दों में, यह माना जाता है कि कैश को एल्गोरिदम निष्पादन के समय मेमोरी एक्सेस का संपूर्ण अनुक्रम दिया गया है। यदि इसे समय पर एक लाइन को हटाने की आवश्यकता है, तो यह भविष्य के अनुरोधों के अनुक्रम को ध्यान करेगा और उस लाइन को हटा देगा जिसकी पहली पहुंच भविष्य में सबसे दूर है। व्यवहार में उसका अनुकरण कम से कम गतकाल में प्रयुक्त नीति के साथ किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के एक छोटे स्थिर कारक के अन्दर दिखाया गया है।[4][5]
- इसे के साथ व्यवहार में अनुकरण किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के एक छोटे स्थिर कारक के अन्दर दिखाया गया है
कैश-ओब्लिवियस मॉडल के अन्दर निष्पादित होने वाले एल्गोरिदम की जटिलता को मापने के लिए, हम एल्गोरिदम द्वारा अनुभव किए जाने वाले कैश मिस की संख्या को मापते हैं। क्योंकि मॉडल इस तथ्य को पकड़ता है कि कैश (कंप्यूटिंग) में तत्वों तक पहुंची मुख्य मेमोरी में चीजों तक पहुंचने की तुलना में बहुत तीव्र है, एल्गोरिदम का चलने का समय केवल कैश और मुख्य मेमोरी के बीच मेमोरी ट्रांसफर की संख्या से परिभाषित होता है। यह बाहय मेमोरी मॉडल के समान है, जिसमें उपरोक्त सभी विशेषताएं हैं, लेकिन कैश-ओब्लिवियस एल्गोरिदम कैश पैरामीटर ( और ) से स्वतंत्र हैं।[6] इस तरह के एल्गोरिदम का लाभ यह है कि कैश-अनअवेयर मशीन पर जो कुशल है, उनके विशेष वास्तविक मशीन मापदंडों के लिए फ़ाइन-ट्यूनिंग के बिना अनेक वास्तविक मशीनों में कुशल होने की संभावना है। अनेक समस्याओं के लिए, एक इष्टतम कैश-ओब्लिवियस एल्गोरिदम दो से अधिक मेमोरी पदानुक्रम स्तरों वाली मशीन के लिए भी इष्टतम होगा।[4]
उदाहरण
फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश-ओब्लिवियस एल्गोरिदम है। एक आउट-ऑफ़-प्लेस ट्रांसपोज़ ऑपरेशन है, इन-प्लेस आव्यूह एल्गोरिदम भी ट्रांसपोज़िशन के लिए तैयार किए गए हैं, लेकिन गैर-स्क्वायर आव्यूह के लिए बहुत अधिक जटिल हैं) ( |इन-प्लेस एल्गोरिदम भी ट्रांसपोज़िशन के लिए तैयार किए गए हैं, लेकिन गैर-स्क्वायर के लिए बहुत अधिक जटिल हैं)। m×n ऐरे A और n×m ऐरे B को देखते हुए, हम A के स्थानान्तरण को B में संग्रहीत करना चाहेंगे। सरल समाधान एक ऐरे को पंक्ति-प्रमुख क्रम में और दूसरे को स्तंभ-प्रमुख क्रम में पार करता है। इसका परिणाम यह होता है कि जब आव्यूह बड़े होते हैं, तो हमें कॉलम-वार ट्रैवर्सल के प्रत्येक चरण पर कैश मिस मिलता है। कैश छूटने की कुल संख्या है।
कैश-ओब्लिवियस एल्गोरिदम में इष्टतम कार्य जटिलता है और इष्टतम कैश जटिलता है। मूल विचार यह है कि दो बड़े आव्यूहों के स्थानान्तरण को कम करके छोटे (उप)आव्यूहों का स्थानान्तरण किया जाए। हम आव्यूह को उनके बड़े आयाम के साथ आधे में विभाजित करके ऐसा करते हैं, जब तक कि हमें केवल आव्यूह का स्थानांतरण नहीं करना पड़ता जो कैश में फिट होगा। क्योंकि कैश का आकार एल्गोरिदम को ज्ञात नहीं है, इस बिंदु के बाद भी आव्यूह को पुनरावर्ती रूप से विभाजित किया जाना जारी रहेगा, लेकिन ये आगे के उपखंड कैश में होंगे। एक बार जब आयाम m और n अत्यधिक छोटे हो जाते हैं तो आकार का एक इनपुट ऐरे और आकार का एक आउटपुट ऐरे कैश में फिट हो जाता है, रो-मेजर और कॉलम-मेजर दोनों ट्रैवर्सल के परिणामस्वरूप कार्य होता है और कैश छूट जाता है। इस फूट डालो और विजय दृष्टिकोण का उपयोग करके हम समग्र आव्यूह के लिए जटिलता के समान स्तर को प्राप्त कर सकते हैं।
(सैद्धांतिक रूप से, कोई भी आव्यूह को तब तक विभाजित करना जारी रख सकता है जब तक कि आकार 1×1 का बेस केस नहीं पहुंच जाता है, लेकिन व्यवहार में कोई पुनरावर्ती उपरूटीन कॉल के ओवरहेड का परिशोधन विश्लेषण करने के लिए एक बड़े बेस केस (जैसे 16×16) का उपयोग करता है।)
अधिकांश कैश-ओब्लिवियस एल्गोरिदम विभाजन और विजय दृष्टिकोण पर विश्वास करते हैं। वे समस्या को कम करते हैं, जिससे यह अंततः कैश में फिट हो जाए, चाहे कैश कितना भी छोटा क्यों न हो, और फ़ंक्शन-कॉल ओवरहेड और समान कैश-असंबंधित अनुकूलन द्वारा निर्धारित कुछ छोटे आकार पर रिकर्सन को समाप्त करते हैं, और फिर इन छोटी, हल की गई समस्याओं के परिणामों को मिलाने के लिए कुछ कैश-कुशल एक्सेस पैटर्न का उपयोग करते हैं।
बाहय मेमोरी मॉडल में बाहरी सॉर्टिंग की तरह, कैश-ओब्लिवियस सॉर्टिंग दो वेरिएंट में संभव है: फ़नलसॉर्ट, जो मर्ज़ सॉर्ट जैसा दिखता है, और कैश-ओब्लिवियस वितरण प्रकार, जो क्विक सॉर्ट जैसा दिखता है। अपने बाहरी मेमोरी समकक्षों की तरह, दोनों एक रनिंग टाइम प्राप्त करते हैं, जो निचली सीमा से मेल खाता है और इस प्रकार स्पर्शोन्मुख रूप से इष्टतम है।[6]
व्यावहारिकता
प्राथमिकता पंक्तियों को प्रयुक्त करने वाले 2 रैम-आधारित, 1 कैश-अवेयर और 2 कैश-अनअवेयर एल्गोरिदम की अनुभवजन्य तुलना से पता चला कि:[7]
- जब डेटा मुख्य मेमोरी में फिट होता है, तो कैश-ओब्लिवियस एल्गोरिदम रैम-आधारित और कैश-अवेयर एल्गोरिदम से भी बुरा प्रदर्शन करते हैं।
- कैश-अवेयर एल्गोरिदम को प्रयुक्त करना कैश-अनअवेयर एल्गोरिदम की तुलना में अधिक जटिल नहीं लगता है, और अध्ययन में परीक्षण की गयी सभी स्थितियों में सर्वश्रेष्ठ प्रदर्शन की प्रस्तुति करता है।
- जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश-ओब्लिवियस एल्गोरिदम ने रैम-आधारित एल्गोरिदम से उत्तम प्रदर्शन किया।
एक अन्य अध्ययन में हैश तालिकाओं (रैम-आधारित या कैश-अनजान के रूप में), B-ट्रीज़ (कैश-अवेयर के रूप में), और कैश-अनअवेयर डेटा संरचना की तुलना की गई जिसे बेंडर सेट कहा जाता है। निष्पादन समय और मेमोरी उपयोग दोनों के लिए, हैश तालिका सबसे अच्छी थी, उसके बाद B-ट्री थी, बेंडर सेट सभी स्थितियों में सबसे खराब था। सभी परीक्षणों के लिए मेमोरी का उपयोग मुख्य मेमोरी से अधिक नहीं था। हैश तालिकाओं को प्रयुक्त करना आसान बताया गया था, जबकि बेंडर सेट को सही ढंग से प्रयुक्त करने के लिए अधिक प्रयास की आवश्यकता थी।[8]
यह भी देखें
- कैश-ओब्लिवियस वितरण प्रकार
- बाह्य मेमोरी एल्गोरिदम
- फ़नलसॉर्ट
संदर्भ
- ↑ Harald Prokop. Cache-Oblivious Algorithms. Masters thesis, MIT. 1999.
- ↑ Askitis, Nikolas; Zobel, Justin (2005). "स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प". International Symposium on String Processing and Information Retrieval. Springer: 93. doi:10.1007/11575832_1. ISBN 978-3-540-29740-6.
- ↑ Kumar, Piyush. "Cache-Oblivious Algorithms". Algorithms for Memory Hierarchies. LNCS 2625. Springer Verlag: 193–212. CiteSeerX 10.1.1.150.5426.
- ↑ 4.0 4.1 Frigo, M.; Leiserson, C. E.; Prokop, H.; Ramachandran, S. (1999). कैश-विस्मृत एल्गोरिदम (PDF). Proc. IEEE Symp. on Foundations of Computer Science (FOCS). pp. 285–297.
- ↑ Daniel Sleator, Robert Tarjan. Amortized Efficiency of List Update and Paging Rules. In Communications of the ACM, Volume 28, Number 2, pp. 202–208. Feb 1985.
- ↑ 6.0 6.1 Erik Demaine. Cache-Oblivious Algorithms and Data Structures, in Lecture Notes from the EEF Summer School on Massive Data Sets, BRICS, University of Aarhus, Denmark, June 27–July 1, 2002.
- ↑ Olsen, Jesper Holm; Skov, Søren Christian (2 December 2002). व्यवहार में कैश-ओब्लिवियस एल्गोरिदम (PDF) (Master's). University of Copenhagen. Retrieved 3 January 2022.
- ↑ Verver, Maks (23 June 2008). "कैश-ओब्लिवियस डेटा संरचना का मूल्यांकन" (PDF). Retrieved 3 January 2022.