कैश-ओब्लिवियस एल्गोरिदम: Difference between revisions
No edit summary |
No edit summary |
||
Line 4: | Line 4: | ||
इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस आव्यूह गुणन, [[मैट्रिक्स स्थानान्तरण|आव्यूह स्थानान्तरण]], [[फ़नलसॉर्ट]] और अनेक अन्य समस्याओं के लिए जाने जाते हैं। कुछ और सामान्य एल्गोरिदम, जैसे कुले-टूके एफएफटी, पैरामीटर के कुछ विकल्पों के अनुसार इष्टतम रूप से कैश-अनअवेयर हैं। चूँकि ये एल्गोरिदम केवल स्पर्शोन्मुख अर्थ में इष्टतम हैं (निरंतर कारकों को अनदेखा करते हुए), पूर्ण अर्थ में लगभग इष्टतम प्रदर्शन प्राप्त करने के लिए आगे मशीन-विशिष्ट प्रदर्शन ट्यूनिंग की आवश्यकता हो सकती है। कैश-ओब्लिवियस एल्गोरिदम का लक्ष्य ऐसी ट्यूनिंग की मात्रा को कम करना है, जो आवश्यक है। | इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस आव्यूह गुणन, [[मैट्रिक्स स्थानान्तरण|आव्यूह स्थानान्तरण]], [[फ़नलसॉर्ट]] और अनेक अन्य समस्याओं के लिए जाने जाते हैं। कुछ और सामान्य एल्गोरिदम, जैसे कुले-टूके एफएफटी, पैरामीटर के कुछ विकल्पों के अनुसार इष्टतम रूप से कैश-अनअवेयर हैं। चूँकि ये एल्गोरिदम केवल स्पर्शोन्मुख अर्थ में इष्टतम हैं (निरंतर कारकों को अनदेखा करते हुए), पूर्ण अर्थ में लगभग इष्टतम प्रदर्शन प्राप्त करने के लिए आगे मशीन-विशिष्ट प्रदर्शन ट्यूनिंग की आवश्यकता हो सकती है। कैश-ओब्लिवियस एल्गोरिदम का लक्ष्य ऐसी ट्यूनिंग की मात्रा को कम करना है, जो आवश्यक है। | ||
सामान्यतः | सामान्यतः कैश-ओब्लिवियस एल्गोरिदम [[फूट डालो और जीतो एल्गोरिथ्म|पुनरावर्ती विभाजन और विजय एल्गोरिथ्म]] द्वारा कार्य करता है, जहां समस्या को छोटी और छोटी उप-समस्याओं में विभाजित किया जाता है। अंततः, कोई उप-समस्या आकार तक पहुँच जाता है, जो कैश आकार की चिंता किए बिना कैश आकार में फिट बैठता है। उदाहरण के लिए, इष्टतम [[कैश-विस्मृत मैट्रिक्स गुणन|कैश-ओब्लिवियस आव्यूह गुणन]] प्रत्येक आव्यूह को पुनरावर्ती रूप से विभाजित करने के लिए चार उप-आव्यूह में विभाजित करके प्राप्त किया जाता है, उपआव्यूह को डेप्थ-फर्स्ट फैशन में गुणा किया जाता है। किसी विशिष्ट मशीन के लिए ट्यूनिंग में, कोई [[हाइब्रिड एल्गोरिदम]] का उपयोग कर सकता है, जो निचले स्तर पर विशिष्ट कैश आकार के लिए ट्यून किए गए लूप टाइलिंग का उपयोग करता है किंतु अन्यथा कैश-ओब्लिवियस एल्गोरिदम का उपयोग करता है। | ||
==इतिहास== | ==इतिहास== | ||
कैश-ओब्लिवियस एल्गोरिदम के लिए विचार (और नाम) की कल्पना चार्ल्स ई. लेइसर्सन ने 1996 के प्रारंभ में की थी और पहली बार 1999 में [[मैसाचुसेट्स की तकनीकी संस्था]] में अपने मास्टर की थीसिस में [[हेराल्ड प्रोकोप]] द्वारा प्रकाशित किया गया था।<ref name="Prokop">Harald Prokop. [http://supertech.csail.mit.edu/papers/Prokop99.pdf Cache-Oblivious Algorithms]. Masters thesis, MIT. 1999.</ref> ऐसे अनेक पूर्ववर्ती थे, जो सामान्यतः विशिष्ट समस्याओं का विश्लेषण करते थे; इन पर फ्रिगो एट अल में विस्तार से | कैश-ओब्लिवियस एल्गोरिदम के लिए विचार (और नाम) की कल्पना चार्ल्स ई. लेइसर्सन ने 1996 के प्रारंभ में की थी और पहली बार 1999 में [[मैसाचुसेट्स की तकनीकी संस्था]] में अपने मास्टर की थीसिस में [[हेराल्ड प्रोकोप]] द्वारा प्रकाशित किया गया था।<ref name="Prokop">Harald Prokop. [http://supertech.csail.mit.edu/papers/Prokop99.pdf Cache-Oblivious Algorithms]. Masters thesis, MIT. 1999.</ref> ऐसे अनेक पूर्ववर्ती थे, जो सामान्यतः विशिष्ट समस्याओं का विश्लेषण करते थे; इन पर फ्रिगो एट अल में विस्तार से विचार की गई है। उद्धृत प्रारंभिक उदाहरणों में पुनरावर्ती फास्ट फूरियर ट्रांसफॉर्म के लिए सिंगलटन 1969, अग्रवाल एट अल 1987 में समान विचार, आव्यूह गुणन और एलयू अपघटन के लिए फ्रिगो 1996, और [[ब्लिट्ज़++]] लाइब्रेरी में आव्यूह एल्गोरिदम के लिए [[टॉड वेल्धुइज़न]] 1996 सम्मिलित हैं। | ||
==आदर्शीकृत कैश मॉडल== | ==आदर्शीकृत कैश मॉडल== | ||
सामान्यतः, [[कंप्यूटर प्रोग्राम]] को अधिक कैश-सचेत बनाया जा सकता है:<ref name="nick05">{{cite journal|journal= International Symposium on String Processing and Information Retrieval|title=स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प|first1=Nikolas|last1=Askitis|first2=Justin|last2=Zobel|url=https://link.springer.com/chapter/10.1007/11575832_11|doi=10.1007/11575832_1|publisher=[[Springer Publishing|Springer]]|isbn= 978-3-540-29740-6|year=2005|page=93}}</ref> | सामान्यतः, [[कंप्यूटर प्रोग्राम]] को अधिक कैश-सचेत बनाया जा सकता है:<ref name="nick05">{{cite journal|journal= International Symposium on String Processing and Information Retrieval|title=स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प|first1=Nikolas|last1=Askitis|first2=Justin|last2=Zobel|url=https://link.springer.com/chapter/10.1007/11575832_11|doi=10.1007/11575832_1|publisher=[[Springer Publishing|Springer]]|isbn= 978-3-540-29740-6|year=2005|page=93}}</ref> | ||
*लौकिक स्थान, जहां एल्गोरिदम मेमोरी के एक ही | *लौकिक स्थान, जहां एल्गोरिदम मेमोरी के एक ही पीस को अनेक बार लाता है; | ||
*स्थानिक स्थान, जहां बाद की मेमोरी पहुंच आसन्न या निकटतम मेमोरी एड्रेस हैं। | *स्थानिक स्थान, जहां बाद की मेमोरी पहुंच आसन्न या निकटतम मेमोरी एड्रेस हैं। | ||
कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण सामान्यतः कैश के आदर्श मॉडल का उपयोग करके किया जाता है, जिसे कभी-कभी 'कैश-ओब्लिवियस मॉडल' भी कहा जाता है। वास्तविक कैश की विशेषताओं (जिसमें | कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण सामान्यतः कैश के आदर्श मॉडल का उपयोग करके किया जाता है, जिसे कभी-कभी 'कैश-ओब्लिवियस मॉडल' भी कहा जाता है। वास्तविक कैश की विशेषताओं (जिसमें काम्प्लेक्स संबद्धता, प्रतिस्थापन नीतियां इत्यादि) की तुलना में इस मॉडल का विश्लेषण करना बहुत सरल है, किंतु अनेक स्थितियों में यह अधिक यथार्थवादी कैश के प्रदर्शन के निरंतर कारक के अन्दर सिद्ध होता है। यह [[बाह्य मेमोरी मॉडल]] से भिन्न है, क्योंकि कैश-ओब्लिवियस एल्गोरिदम [[ब्लॉक (डेटा भंडारण)|ब्लॉक (डेटा स्टोरेज)]] या [[कैश (कंप्यूटिंग)]] आकार को नहीं जानता है। | ||
विशेष रूप से, कैश-ओब्लिवियस मॉडल [[अमूर्त मशीन]] है (अर्थात्, गणना का सैद्धांतिक मॉडल)। यह [[रैम मॉडल]] के समान है, जो [[ट्यूरिंग मशीन]] के अनंत टेप को अनंत ऐरे से परिवर्तित कर देता है। ऐरे के अन्दर प्रत्येक स्थान को वास्तविक कंप्यूटर पर [[ रैंडम एक्सेस मेमोरी |रैंडम एक्सेस मेमोरी]] के समान, <math>O(1)</math> समय में एक्सेस किया जा सकता है। रैम मशीन मॉडल के विपरीत, यह कैश भी रैम और सीपीयू के बीच भंडारण का दूसरा स्तर प्रस्तुत करता है। दोनों मॉडलों के बीच अन्य अंतर नीचे सूचीबद्ध हैं। कैश-ओब्लिवियस मॉडल में: | विशेष रूप से, कैश-ओब्लिवियस मॉडल [[अमूर्त मशीन]] है (अर्थात्, गणना का सैद्धांतिक मॉडल)। यह [[रैम मॉडल]] के समान है, जो [[ट्यूरिंग मशीन]] के अनंत टेप को अनंत ऐरे से परिवर्तित कर देता है। ऐरे के अन्दर प्रत्येक स्थान को वास्तविक कंप्यूटर पर [[ रैंडम एक्सेस मेमोरी |रैंडम एक्सेस मेमोरी]] के समान, <math>O(1)</math> समय में एक्सेस किया जा सकता है। रैम मशीन मॉडल के विपरीत, यह कैश भी रैम और सीपीयू के बीच भंडारण का दूसरा स्तर प्रस्तुत करता है। दोनों मॉडलों के बीच अन्य अंतर नीचे सूचीबद्ध हैं। कैश-ओब्लिवियस मॉडल में: | ||
Line 34: | Line 34: | ||
}}</ref> | }}</ref> | ||
*प्रतिस्थापन नीति इष्टतम है। दूसरे शब्दों में, यह माना जाता है कि कैश को एल्गोरिदम निष्पादन के समय मेमोरी एक्सेस का संपूर्ण अनुक्रम दिया गया है। यदि इसे <math>t</math> समय पर लाइन को हटाने की आवश्यकता है, तो यह भविष्य के अनुरोधों के अनुक्रम को ध्यान करेगा और उस लाइन को हटा देगा जिसकी पहली पहुंच भविष्य में सबसे दूर है। व्यवहार में उसका अनुकरण [[कम से कम हाल ही में प्रयुक्त|कम से कम गतकाल में प्रयुक्त]] नीति के साथ किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के छोटे स्थिर कारक के अन्दर दिखाया गया है।<ref name="Frigo99">{{cite conference |first1=M. |last1=Frigo |first2=C. E. |last2=Leiserson |authorlink2=Charles Leiserson |first3=H. |last3=Prokop |authorlink3=Harald Prokop |first4=S. |last4=Ramachandran |title=कैश-विस्मृत एल्गोरिदम|conference=Proc. IEEE Symp. on Foundations of Computer Science (FOCS) |pages=285–297 |year=1999 |url=http://supertech.csail.mit.edu/papers/FrigoLePr99.pdf}}</ref><ref name="Sleator">Daniel Sleator, Robert Tarjan. [https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.367.6317&rep=rep1&type=pdf Amortized Efficiency of List Update and Paging Rules]. In ''Communications of the ACM'', Volume 28, Number 2, pp. 202–208. Feb 1985.</ref> | *प्रतिस्थापन नीति इष्टतम है। दूसरे शब्दों में, यह माना जाता है कि कैश को एल्गोरिदम निष्पादन के समय मेमोरी एक्सेस का संपूर्ण अनुक्रम दिया गया है। यदि इसे <math>t</math> समय पर लाइन को हटाने की आवश्यकता है, तो यह भविष्य के अनुरोधों के अनुक्रम को ध्यान करेगा और उस लाइन को हटा देगा जिसकी पहली पहुंच भविष्य में सबसे दूर है। व्यवहार में उसका अनुकरण [[कम से कम हाल ही में प्रयुक्त|कम से कम गतकाल में प्रयुक्त]] नीति के साथ किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के छोटे स्थिर कारक के अन्दर दिखाया गया है।<ref name="Frigo99">{{cite conference |first1=M. |last1=Frigo |first2=C. E. |last2=Leiserson |authorlink2=Charles Leiserson |first3=H. |last3=Prokop |authorlink3=Harald Prokop |first4=S. |last4=Ramachandran |title=कैश-विस्मृत एल्गोरिदम|conference=Proc. IEEE Symp. on Foundations of Computer Science (FOCS) |pages=285–297 |year=1999 |url=http://supertech.csail.mit.edu/papers/FrigoLePr99.pdf}}</ref><ref name="Sleator">Daniel Sleator, Robert Tarjan. [https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.367.6317&rep=rep1&type=pdf Amortized Efficiency of List Update and Paging Rules]. In ''Communications of the ACM'', Volume 28, Number 2, pp. 202–208. Feb 1985.</ref> | ||
कैश-ओब्लिवियस मॉडल के अन्दर निष्पादित होने वाले एल्गोरिदम की | कैश-ओब्लिवियस मॉडल के अन्दर निष्पादित होने वाले एल्गोरिदम की काम्प्लेक्स को मापने के लिए, हम एल्गोरिदम द्वारा अनुभव किए जाने वाले [[कैश मिस]] की संख्या को मापते हैं। क्योंकि मॉडल इस तथ्य को पकड़ता है कि कैश (कंप्यूटिंग) में तत्वों तक पहुंची मुख्य मेमोरी में चीजों तक पहुंचने की तुलना में बहुत तीव्र है, एल्गोरिदम का चलने का समय केवल कैश और मुख्य मेमोरी के बीच मेमोरी ट्रांसफर की संख्या से परिभाषित होता है। यह बाहय मेमोरी मॉडल के समान है, जिसमें उपरोक्त सभी विशेषताएं हैं, किंतु कैश-ओब्लिवियस एल्गोरिदम कैश पैरामीटर (<math>B</math> और <math>M</math>) से स्वतंत्र हैं।<ref name="Demaine02">[[Erik Demaine]]. [http://erikdemaine.org/papers/BRICS2002/ Cache-Oblivious Algorithms and Data Structures], in Lecture Notes from the EEF Summer School on Massive Data Sets, BRICS, University of Aarhus, Denmark, June 27–July 1, 2002.</ref> इस तरह के एल्गोरिदम का लाभ यह है कि कैश-अनअवेयर मशीन पर जो कुशल है, उनके विशेष वास्तविक मशीन मापदंडों के लिए फ़ाइन-ट्यूनिंग के बिना अनेक वास्तविक मशीनों में कुशल होने की संभावना है। अनेक समस्याओं के लिए, इष्टतम कैश-ओब्लिवियस एल्गोरिदम दो से अधिक मेमोरी पदानुक्रम स्तरों वाली मशीन के लिए भी इष्टतम होगा।<ref name="Frigo99"/> | ||
==उदाहरण== | ==उदाहरण== | ||
[[File:Row_and_column_major_order.svg|thumb|upright|पंक्ति और स्तंभ-प्रमुख क्रम का चित्रण]]फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश-ओब्लिवियस एल्गोरिदम है। आउट-ऑफ़-प्लेस [[ मैट्रिक्स स्थानान्तरण |ट्रांसपोज़ ऑपरेशन]] है, [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|इन-प्लेस आव्यूह]] एल्गोरिदम भी [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|ट्रांसपोज़िशन]] के लिए तैयार किए गए हैं, | [[File:Row_and_column_major_order.svg|thumb|upright|पंक्ति और स्तंभ-प्रमुख क्रम का चित्रण]]फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश-ओब्लिवियस एल्गोरिदम है। आउट-ऑफ़-प्लेस [[ मैट्रिक्स स्थानान्तरण |ट्रांसपोज़ ऑपरेशन]] है, [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|इन-प्लेस आव्यूह]] एल्गोरिदम भी [[इन-प्लेस मैट्रिक्स ट्रांसपोज़िशन|ट्रांसपोज़िशन]] के लिए तैयार किए गए हैं, किंतु गैर-स्क्वायर आव्यूह के लिए बहुत अधिक काम्प्लेक्स हैं)। m×n ऐरे '''A''' और n×m ऐरे '''B''' को देखते हुए, हम {{mvar|A}} के स्थानान्तरण को {{mvar|B}} में संग्रहीत करना चाहेंगे। सरल समाधान ऐरे को पंक्ति-प्रमुख क्रम में और दूसरे को स्तंभ-प्रमुख क्रम में पार करता है। इसका परिणाम यह होता है कि जब आव्यूह बड़े होते हैं, तो हमें कॉलम-वार ट्रैवर्सल के प्रत्येक चरण पर कैश मिस मिलता है। कैश छूटने की कुल संख्या <math>\Theta(mn)</math> है। | ||
[[File:Matrix_transpose_dc.svg|thumb|right|विभाजन और विजय-दृष्टिकोण का उपयोग करके आव्यूह ट्रांसपोज़िशन के लिए कैश-ओब्लिवियस एल्गोरिदम का सिद्धांत। ग्राफ़िक आव्यूह को विभाजित करने और प्रत्येक भाग को व्यक्तिगत रूप से स्थानांतरित करने का पुनरावर्ती चरण ('''a''' → '''b''') दिखाता है।]]कैश-ओब्लिवियस एल्गोरिदम में इष्टतम कार्य | [[File:Matrix_transpose_dc.svg|thumb|right|विभाजन और विजय-दृष्टिकोण का उपयोग करके आव्यूह ट्रांसपोज़िशन के लिए कैश-ओब्लिवियस एल्गोरिदम का सिद्धांत। ग्राफ़िक आव्यूह को विभाजित करने और प्रत्येक भाग को व्यक्तिगत रूप से स्थानांतरित करने का पुनरावर्ती चरण ('''a''' → '''b''') दिखाता है।]]कैश-ओब्लिवियस एल्गोरिदम में इष्टतम कार्य काम्प्लेक्स <math>O(mn)</math> है और इष्टतम कैश काम्प्लेक्स <math>O(1+mn/B)</math> है। मूल विचार यह है कि दो बड़े आव्यूहों के स्थानान्तरण को कम करके छोटे (उप)आव्यूहों का स्थानान्तरण किया जाए। हम आव्यूह को उनके बड़े आयाम के साथ आधे में विभाजित करके ऐसा करते हैं, जब तक कि हमें केवल आव्यूह का स्थानांतरण नहीं करना पड़ता जो कैश में फिट होगा। क्योंकि कैश का आकार एल्गोरिदम को ज्ञात नहीं है, इस बिंदु के बाद भी आव्यूह को पुनरावर्ती रूप से विभाजित किया जाना जारी रहेगा, किंतु ये आगे के उपखंड कैश में होंगे। एक बार जब आयाम {{mvar|m}} और {{mvar|n}} अत्यधिक छोटे हो जाते हैं तो <math>m \times n</math> आकार का इनपुट ऐरे और <math>n \times m</math> आकार का आउटपुट ऐरे कैश में फिट हो जाता है, रो-मेजर और कॉलम-मेजर दोनों ट्रैवर्सल के परिणामस्वरूप <math>O(mn)</math> कार्य होता है और <math>O(mn/B)</math> कैश छूट जाता है। | ||
(सैद्धांतिक रूप से, कोई भी आव्यूह को तब तक विभाजित करना जारी रख सकता है जब तक कि आकार 1×1 का बेस केस नहीं पहुंच जाता है, | (सैद्धांतिक रूप से, कोई भी आव्यूह को तब तक विभाजित करना जारी रख सकता है जब तक कि आकार 1×1 का बेस केस नहीं पहुंच जाता है, किंतु व्यवहार में कोई पुनरावर्ती उपरूटीन कॉल के ओवरहेड का [[परिशोधन विश्लेषण]] करने के लिए बड़े बेस केस (जैसे 16×16) का उपयोग करता है।) | ||
अधिकांश कैश-ओब्लिवियस एल्गोरिदम विभाजन और विजय दृष्टिकोण पर विश्वास करते हैं। वे समस्या को कम करते हैं, जिससे यह अंततः कैश में फिट हो जाए, चाहे कैश कितना भी छोटा क्यों न हो, और फ़ंक्शन-कॉल ओवरहेड और समान कैश-असंबंधित अनुकूलन द्वारा निर्धारित कुछ छोटे आकार पर रिकर्सन को समाप्त करते हैं, और फिर इन छोटी, हल की गई समस्याओं के परिणामों को मिलाने के लिए कुछ कैश-कुशल एक्सेस पैटर्न का उपयोग करते हैं। | अधिकांश कैश-ओब्लिवियस एल्गोरिदम विभाजन और विजय दृष्टिकोण पर विश्वास करते हैं। वे समस्या को कम करते हैं, जिससे यह अंततः कैश में फिट हो जाए, चाहे कैश कितना भी छोटा क्यों न हो, और फ़ंक्शन-कॉल ओवरहेड और समान कैश-असंबंधित अनुकूलन द्वारा निर्धारित कुछ छोटे आकार पर रिकर्सन को समाप्त करते हैं, और फिर इन छोटी, हल की गई समस्याओं के परिणामों को मिलाने के लिए कुछ कैश-कुशल एक्सेस पैटर्न का उपयोग करते हैं। | ||
Line 54: | Line 54: | ||
|date=2 December 2002}}</ref> | |date=2 December 2002}}</ref> | ||
* जब डेटा मुख्य मेमोरी में फिट होता है, तो कैश-ओब्लिवियस एल्गोरिदम रैम-आधारित और कैश-अवेयर एल्गोरिदम से भी बुरा प्रदर्शन करते हैं। | * जब डेटा मुख्य मेमोरी में फिट होता है, तो कैश-ओब्लिवियस एल्गोरिदम रैम-आधारित और कैश-अवेयर एल्गोरिदम से भी बुरा प्रदर्शन करते हैं। | ||
* कैश-अवेयर एल्गोरिदम को प्रयुक्त करना कैश-अनअवेयर एल्गोरिदम की तुलना में अधिक | * कैश-अवेयर एल्गोरिदम को प्रयुक्त करना कैश-अनअवेयर एल्गोरिदम की तुलना में अधिक काम्प्लेक्स नहीं लगता है, और अध्ययन में परीक्षण की गयी सभी स्थितियों में सर्वश्रेष्ठ प्रदर्शन की प्रस्तुति करता है। | ||
* जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश-ओब्लिवियस एल्गोरिदम ने रैम-आधारित एल्गोरिदम से उत्तम प्रदर्शन किया। | * जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश-ओब्लिवियस एल्गोरिदम ने रैम-आधारित एल्गोरिदम से उत्तम प्रदर्शन किया। | ||
एक अन्य अध्ययन में [[हैश तालिका|हैश तालिकाओं]] (रैम-आधारित या कैश-अनजान के रूप में), [[ बी-वृक्ष |B-ट्रीज़]] (कैश-अवेयर के रूप में), और कैश-अनअवेयर डेटा संरचना की तुलना की गई जिसे बेंडर सेट कहा जाता है। निष्पादन समय और मेमोरी उपयोग दोनों के लिए, हैश तालिका सबसे अच्छी थी, उसके बाद B-ट्री थी, बेंडर सेट सभी स्थितियों में सबसे खराब था। सभी परीक्षणों के लिए मेमोरी का उपयोग मुख्य मेमोरी से अधिक नहीं था। हैश तालिकाओं को प्रयुक्त करना आसान बताया गया था, जबकि बेंडर सेट को सही | एक अन्य अध्ययन में [[हैश तालिका|हैश तालिकाओं]] (रैम-आधारित या कैश-अनजान के रूप में), [[ बी-वृक्ष |B-ट्रीज़]] (कैश-अवेयर के रूप में), और कैश-अनअवेयर डेटा संरचना की तुलना की गई जिसे बेंडर सेट कहा जाता है। निष्पादन समय और मेमोरी उपयोग दोनों के लिए, हैश तालिका सबसे अच्छी थी, उसके बाद B-ट्री थी, बेंडर सेट सभी स्थितियों में सबसे खराब था। सभी परीक्षणों के लिए मेमोरी का उपयोग मुख्य मेमोरी से अधिक नहीं था। हैश तालिकाओं को प्रयुक्त करना आसान बताया गया था, जबकि बेंडर सेट को सही रूप से प्रयुक्त करने के लिए अधिक प्रयास की आवश्यकता थी।<ref>{{cite web |last1=Verver |first1=Maks |title=कैश-ओब्लिवियस डेटा संरचना का मूल्यांकन|url=https://fmt.ewi.utwente.nl/media/61.pdf |access-date=3 January 2022|date=23 June 2008}}</ref> | ||
Revision as of 12:55, 9 August 2023
कम्प्यूटिंग में, कैश-ओब्लिवियस एल्गोरिदम (या कैश-ट्रान्सेंडेंट एल्गोरिदम) एल्गोरिदम है, जिसे स्पष्ट पैरामीटर के रूप में कैश के आकार (या कैश लाइनों की लंबाई, आदि) के बिना प्रोसेसर सीपीयू कैश का लाभ उठाने के लिए डिज़ाइन किया गया है। इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस एल्गोरिदम है, जो कैश का इष्टतम रूप से उपयोग करता है (स्पर्शोन्मुख संकेतन के अर्थ में, निरंतर कारकों को अनदेखा करते हुए)। इस प्रकार, कैश-ओब्लिवियस एल्गोरिदम को विभिन्न कैश आकारों वाली अनेक मशीनों पर, या विभिन्न आकारों वाले कैश के विभिन्न स्तरों के साथ मेमोरी पदानुक्रम के लिए, बिना किसी संशोधन के अच्छा प्रदर्शन करने के लिए डिज़ाइन किया गया है। कैश-ओब्लिवियस एल्गोरिदम की तुलना स्पष्ट लूप टाइलिंग से की जाती है, जो किसी समस्या को स्पष्ट रूप से उन ब्लॉकों में तोड़ देता है, जो किसी दिए गए कैश के लिए इष्टतम आकार के होते हैं।
इष्टतम कैश-ओब्लिवियस एल्गोरिदम कैश-ओब्लिवियस आव्यूह गुणन, आव्यूह स्थानान्तरण, फ़नलसॉर्ट और अनेक अन्य समस्याओं के लिए जाने जाते हैं। कुछ और सामान्य एल्गोरिदम, जैसे कुले-टूके एफएफटी, पैरामीटर के कुछ विकल्पों के अनुसार इष्टतम रूप से कैश-अनअवेयर हैं। चूँकि ये एल्गोरिदम केवल स्पर्शोन्मुख अर्थ में इष्टतम हैं (निरंतर कारकों को अनदेखा करते हुए), पूर्ण अर्थ में लगभग इष्टतम प्रदर्शन प्राप्त करने के लिए आगे मशीन-विशिष्ट प्रदर्शन ट्यूनिंग की आवश्यकता हो सकती है। कैश-ओब्लिवियस एल्गोरिदम का लक्ष्य ऐसी ट्यूनिंग की मात्रा को कम करना है, जो आवश्यक है।
सामान्यतः कैश-ओब्लिवियस एल्गोरिदम पुनरावर्ती विभाजन और विजय एल्गोरिथ्म द्वारा कार्य करता है, जहां समस्या को छोटी और छोटी उप-समस्याओं में विभाजित किया जाता है। अंततः, कोई उप-समस्या आकार तक पहुँच जाता है, जो कैश आकार की चिंता किए बिना कैश आकार में फिट बैठता है। उदाहरण के लिए, इष्टतम कैश-ओब्लिवियस आव्यूह गुणन प्रत्येक आव्यूह को पुनरावर्ती रूप से विभाजित करने के लिए चार उप-आव्यूह में विभाजित करके प्राप्त किया जाता है, उपआव्यूह को डेप्थ-फर्स्ट फैशन में गुणा किया जाता है। किसी विशिष्ट मशीन के लिए ट्यूनिंग में, कोई हाइब्रिड एल्गोरिदम का उपयोग कर सकता है, जो निचले स्तर पर विशिष्ट कैश आकार के लिए ट्यून किए गए लूप टाइलिंग का उपयोग करता है किंतु अन्यथा कैश-ओब्लिवियस एल्गोरिदम का उपयोग करता है।
इतिहास
कैश-ओब्लिवियस एल्गोरिदम के लिए विचार (और नाम) की कल्पना चार्ल्स ई. लेइसर्सन ने 1996 के प्रारंभ में की थी और पहली बार 1999 में मैसाचुसेट्स की तकनीकी संस्था में अपने मास्टर की थीसिस में हेराल्ड प्रोकोप द्वारा प्रकाशित किया गया था।[1] ऐसे अनेक पूर्ववर्ती थे, जो सामान्यतः विशिष्ट समस्याओं का विश्लेषण करते थे; इन पर फ्रिगो एट अल में विस्तार से विचार की गई है। उद्धृत प्रारंभिक उदाहरणों में पुनरावर्ती फास्ट फूरियर ट्रांसफॉर्म के लिए सिंगलटन 1969, अग्रवाल एट अल 1987 में समान विचार, आव्यूह गुणन और एलयू अपघटन के लिए फ्रिगो 1996, और ब्लिट्ज़++ लाइब्रेरी में आव्यूह एल्गोरिदम के लिए टॉड वेल्धुइज़न 1996 सम्मिलित हैं।
आदर्शीकृत कैश मॉडल
सामान्यतः, कंप्यूटर प्रोग्राम को अधिक कैश-सचेत बनाया जा सकता है:[2]
- लौकिक स्थान, जहां एल्गोरिदम मेमोरी के एक ही पीस को अनेक बार लाता है;
- स्थानिक स्थान, जहां बाद की मेमोरी पहुंच आसन्न या निकटतम मेमोरी एड्रेस हैं।
कैश-ओब्लिवियस एल्गोरिदम का विश्लेषण सामान्यतः कैश के आदर्श मॉडल का उपयोग करके किया जाता है, जिसे कभी-कभी 'कैश-ओब्लिवियस मॉडल' भी कहा जाता है। वास्तविक कैश की विशेषताओं (जिसमें काम्प्लेक्स संबद्धता, प्रतिस्थापन नीतियां इत्यादि) की तुलना में इस मॉडल का विश्लेषण करना बहुत सरल है, किंतु अनेक स्थितियों में यह अधिक यथार्थवादी कैश के प्रदर्शन के निरंतर कारक के अन्दर सिद्ध होता है। यह बाह्य मेमोरी मॉडल से भिन्न है, क्योंकि कैश-ओब्लिवियस एल्गोरिदम ब्लॉक (डेटा स्टोरेज) या कैश (कंप्यूटिंग) आकार को नहीं जानता है।
विशेष रूप से, कैश-ओब्लिवियस मॉडल अमूर्त मशीन है (अर्थात्, गणना का सैद्धांतिक मॉडल)। यह रैम मॉडल के समान है, जो ट्यूरिंग मशीन के अनंत टेप को अनंत ऐरे से परिवर्तित कर देता है। ऐरे के अन्दर प्रत्येक स्थान को वास्तविक कंप्यूटर पर रैंडम एक्सेस मेमोरी के समान, समय में एक्सेस किया जा सकता है। रैम मशीन मॉडल के विपरीत, यह कैश भी रैम और सीपीयू के बीच भंडारण का दूसरा स्तर प्रस्तुत करता है। दोनों मॉडलों के बीच अन्य अंतर नीचे सूचीबद्ध हैं। कैश-ओब्लिवियस मॉडल में:
- मेमोरी को प्रत्येक ऑब्जेक्ट के ब्लॉक में विभाजित किया गया है।
- मुख्य मेमोरी और सीपीयू रजिस्टर के बीच लोड या स्टोर को अब कैश से सर्विस किया जा सकता है।
- यदि किसी लोड या स्टोर को कैश से सर्विस नहीं किया जा सकता है, तो इसे कैश मिस कहा जाता है।
- कैश मिस होने के परिणामस्वरूप ब्लॉक मुख्य मेमोरी से कैश में लोड हो जाता है। अर्थात्, यदि सीपीयू शब्द तक पहुँचने का प्रयास करता है और वह युक्त पंक्ति है, जिसमें है, तब को कैश में लोड किया जाता है। यदि कैश पहले भरा हुआ था, तो लाइन भी हटा दी जाएगी (नीचे प्रतिस्थापन नीति देखें)।
- कैश में ऑब्जेक्ट होते हैं, जहाँ है। इसे लंबी कैश धारणा के रूप में भी जाना जाता है।
- कैश पूरी तरह से सहयोगी है: प्रत्येक पंक्ति को कैश में किसी भी स्थान पर लोड किया जा सकता है।[3]
- प्रतिस्थापन नीति इष्टतम है। दूसरे शब्दों में, यह माना जाता है कि कैश को एल्गोरिदम निष्पादन के समय मेमोरी एक्सेस का संपूर्ण अनुक्रम दिया गया है। यदि इसे समय पर लाइन को हटाने की आवश्यकता है, तो यह भविष्य के अनुरोधों के अनुक्रम को ध्यान करेगा और उस लाइन को हटा देगा जिसकी पहली पहुंच भविष्य में सबसे दूर है। व्यवहार में उसका अनुकरण कम से कम गतकाल में प्रयुक्त नीति के साथ किया जा सकता है, जिसे ऑफ़लाइन इष्टतम प्रतिस्थापन रणनीति के छोटे स्थिर कारक के अन्दर दिखाया गया है।[4][5]
कैश-ओब्लिवियस मॉडल के अन्दर निष्पादित होने वाले एल्गोरिदम की काम्प्लेक्स को मापने के लिए, हम एल्गोरिदम द्वारा अनुभव किए जाने वाले कैश मिस की संख्या को मापते हैं। क्योंकि मॉडल इस तथ्य को पकड़ता है कि कैश (कंप्यूटिंग) में तत्वों तक पहुंची मुख्य मेमोरी में चीजों तक पहुंचने की तुलना में बहुत तीव्र है, एल्गोरिदम का चलने का समय केवल कैश और मुख्य मेमोरी के बीच मेमोरी ट्रांसफर की संख्या से परिभाषित होता है। यह बाहय मेमोरी मॉडल के समान है, जिसमें उपरोक्त सभी विशेषताएं हैं, किंतु कैश-ओब्लिवियस एल्गोरिदम कैश पैरामीटर ( और ) से स्वतंत्र हैं।[6] इस तरह के एल्गोरिदम का लाभ यह है कि कैश-अनअवेयर मशीन पर जो कुशल है, उनके विशेष वास्तविक मशीन मापदंडों के लिए फ़ाइन-ट्यूनिंग के बिना अनेक वास्तविक मशीनों में कुशल होने की संभावना है। अनेक समस्याओं के लिए, इष्टतम कैश-ओब्लिवियस एल्गोरिदम दो से अधिक मेमोरी पदानुक्रम स्तरों वाली मशीन के लिए भी इष्टतम होगा।[4]
उदाहरण
फ्रिगो एट अल में प्रस्तुत सबसे सरल कैश-ओब्लिवियस एल्गोरिदम है। आउट-ऑफ़-प्लेस ट्रांसपोज़ ऑपरेशन है, इन-प्लेस आव्यूह एल्गोरिदम भी ट्रांसपोज़िशन के लिए तैयार किए गए हैं, किंतु गैर-स्क्वायर आव्यूह के लिए बहुत अधिक काम्प्लेक्स हैं)। m×n ऐरे A और n×m ऐरे B को देखते हुए, हम A के स्थानान्तरण को B में संग्रहीत करना चाहेंगे। सरल समाधान ऐरे को पंक्ति-प्रमुख क्रम में और दूसरे को स्तंभ-प्रमुख क्रम में पार करता है। इसका परिणाम यह होता है कि जब आव्यूह बड़े होते हैं, तो हमें कॉलम-वार ट्रैवर्सल के प्रत्येक चरण पर कैश मिस मिलता है। कैश छूटने की कुल संख्या है।
कैश-ओब्लिवियस एल्गोरिदम में इष्टतम कार्य काम्प्लेक्स है और इष्टतम कैश काम्प्लेक्स है। मूल विचार यह है कि दो बड़े आव्यूहों के स्थानान्तरण को कम करके छोटे (उप)आव्यूहों का स्थानान्तरण किया जाए। हम आव्यूह को उनके बड़े आयाम के साथ आधे में विभाजित करके ऐसा करते हैं, जब तक कि हमें केवल आव्यूह का स्थानांतरण नहीं करना पड़ता जो कैश में फिट होगा। क्योंकि कैश का आकार एल्गोरिदम को ज्ञात नहीं है, इस बिंदु के बाद भी आव्यूह को पुनरावर्ती रूप से विभाजित किया जाना जारी रहेगा, किंतु ये आगे के उपखंड कैश में होंगे। एक बार जब आयाम m और n अत्यधिक छोटे हो जाते हैं तो आकार का इनपुट ऐरे और आकार का आउटपुट ऐरे कैश में फिट हो जाता है, रो-मेजर और कॉलम-मेजर दोनों ट्रैवर्सल के परिणामस्वरूप कार्य होता है और कैश छूट जाता है।
(सैद्धांतिक रूप से, कोई भी आव्यूह को तब तक विभाजित करना जारी रख सकता है जब तक कि आकार 1×1 का बेस केस नहीं पहुंच जाता है, किंतु व्यवहार में कोई पुनरावर्ती उपरूटीन कॉल के ओवरहेड का परिशोधन विश्लेषण करने के लिए बड़े बेस केस (जैसे 16×16) का उपयोग करता है।)
अधिकांश कैश-ओब्लिवियस एल्गोरिदम विभाजन और विजय दृष्टिकोण पर विश्वास करते हैं। वे समस्या को कम करते हैं, जिससे यह अंततः कैश में फिट हो जाए, चाहे कैश कितना भी छोटा क्यों न हो, और फ़ंक्शन-कॉल ओवरहेड और समान कैश-असंबंधित अनुकूलन द्वारा निर्धारित कुछ छोटे आकार पर रिकर्सन को समाप्त करते हैं, और फिर इन छोटी, हल की गई समस्याओं के परिणामों को मिलाने के लिए कुछ कैश-कुशल एक्सेस पैटर्न का उपयोग करते हैं।
बाहय मेमोरी मॉडल में बाहरी सॉर्टिंग की तरह, कैश-ओब्लिवियस सॉर्टिंग दो वेरिएंट में संभव है: फ़नलसॉर्ट, जो मर्ज़ सॉर्ट जैसा दिखता है, और कैश-ओब्लिवियस वितरण प्रकार, जो क्विक सॉर्ट जैसा दिखता है। अपने बाहरी मेमोरी समकक्षों की तरह, दोनों रनिंग टाइम प्राप्त करते हैं, जो निचली सीमा से मेल खाता है और इस प्रकार स्पर्शोन्मुख रूप से इष्टतम है।[6]
व्यावहारिकता
प्राथमिकता पंक्तियों को प्रयुक्त करने वाले 2 रैम-आधारित, 1 कैश-अवेयर और 2 कैश-अनअवेयर एल्गोरिदम की अनुभवजन्य तुलना से पता चला कि:[7]
- जब डेटा मुख्य मेमोरी में फिट होता है, तो कैश-ओब्लिवियस एल्गोरिदम रैम-आधारित और कैश-अवेयर एल्गोरिदम से भी बुरा प्रदर्शन करते हैं।
- कैश-अवेयर एल्गोरिदम को प्रयुक्त करना कैश-अनअवेयर एल्गोरिदम की तुलना में अधिक काम्प्लेक्स नहीं लगता है, और अध्ययन में परीक्षण की गयी सभी स्थितियों में सर्वश्रेष्ठ प्रदर्शन की प्रस्तुति करता है।
- जब डेटा का आकार मुख्य मेमोरी के आकार से अधिक हो जाता है, तो कैश-ओब्लिवियस एल्गोरिदम ने रैम-आधारित एल्गोरिदम से उत्तम प्रदर्शन किया।
एक अन्य अध्ययन में हैश तालिकाओं (रैम-आधारित या कैश-अनजान के रूप में), B-ट्रीज़ (कैश-अवेयर के रूप में), और कैश-अनअवेयर डेटा संरचना की तुलना की गई जिसे बेंडर सेट कहा जाता है। निष्पादन समय और मेमोरी उपयोग दोनों के लिए, हैश तालिका सबसे अच्छी थी, उसके बाद B-ट्री थी, बेंडर सेट सभी स्थितियों में सबसे खराब था। सभी परीक्षणों के लिए मेमोरी का उपयोग मुख्य मेमोरी से अधिक नहीं था। हैश तालिकाओं को प्रयुक्त करना आसान बताया गया था, जबकि बेंडर सेट को सही रूप से प्रयुक्त करने के लिए अधिक प्रयास की आवश्यकता थी।[8]
यह भी देखें
- कैश-ओब्लिवियस वितरण प्रकार
- बाह्य मेमोरी एल्गोरिदम
- फ़नलसॉर्ट
संदर्भ
- ↑ Harald Prokop. Cache-Oblivious Algorithms. Masters thesis, MIT. 1999.
- ↑ Askitis, Nikolas; Zobel, Justin (2005). "स्ट्रिंग हैश टेबल्स में कैश-सचेत टकराव संकल्प". International Symposium on String Processing and Information Retrieval. Springer: 93. doi:10.1007/11575832_1. ISBN 978-3-540-29740-6.
- ↑ Kumar, Piyush. "Cache-Oblivious Algorithms". Algorithms for Memory Hierarchies. LNCS 2625. Springer Verlag: 193–212. CiteSeerX 10.1.1.150.5426.
- ↑ 4.0 4.1 Frigo, M.; Leiserson, C. E.; Prokop, H.; Ramachandran, S. (1999). कैश-विस्मृत एल्गोरिदम (PDF). Proc. IEEE Symp. on Foundations of Computer Science (FOCS). pp. 285–297.
- ↑ Daniel Sleator, Robert Tarjan. Amortized Efficiency of List Update and Paging Rules. In Communications of the ACM, Volume 28, Number 2, pp. 202–208. Feb 1985.
- ↑ 6.0 6.1 Erik Demaine. Cache-Oblivious Algorithms and Data Structures, in Lecture Notes from the EEF Summer School on Massive Data Sets, BRICS, University of Aarhus, Denmark, June 27–July 1, 2002.
- ↑ Olsen, Jesper Holm; Skov, Søren Christian (2 December 2002). व्यवहार में कैश-ओब्लिवियस एल्गोरिदम (PDF) (Master's). University of Copenhagen. Retrieved 3 January 2022.
- ↑ Verver, Maks (23 June 2008). "कैश-ओब्लिवियस डेटा संरचना का मूल्यांकन" (PDF). Retrieved 3 January 2022.