डेटा स्ट्रिपिंग
कंप्यूटर डेटा स्टोरेज में, डेटा स्ट्रिपिंग एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को खंडित करने की तकनीक है, ताकि लगातार खंड विभिन्न भौतिक स्टोरेज उपकरणों पर संग्रहीत हो सकें।
स्ट्रिपिंग तब उपयोगी होती है जब एक प्रोसेसिंग डिवाइस एक स्टोरेज डिवाइस की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई डिवाइसों में सेगमेंट को फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट लोड को संतुलित करने के लिए भी एक उपयोगी तरीका है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, नेटवर्क इंटरफ़ेस कंट्रोलर, डिस्क एरेज़, क्लस्टर फाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है।
विधि
स्ट्रिपिंग की एक विधि डेटा अनुक्रम की शुरुआत से राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर अनुक्रमिक सेगमेंट को इंटरलीविंग (अंतथपत्रण) करके की जाती है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस डिवाइस में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष डिवाइस के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए डिवाइस को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है।
अन्य विधियों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहित नहीं होते हैं। कुछ त्रुटि सुधार योजनाओं में इस तरह के गैर-अनुक्रमिक इंटरलीविंग के लाभ हो सकते हैं।
लाभ और हानि
स्ट्रिपिंग के फायदों में प्रदर्शन और प्रवाह क्षमता शामिल है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज डिवाइस के कम डेटा एक्सेस थ्रूपुट को नियोजित स्टोरेज डिवाइसों की संख्या से संचयी रूप से गुणा किया जा सकता है बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग डिवाइस को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह डाटा प्रोसेसिंग के बेहतर प्रदर्शन में प्रकट हुआ है।
क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज डिवाइस पर रखे जाते हैं, एक डिवाइस की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, भंडारण उपकरणों की श्रेणी की विफलता दर प्रत्येक भंडारण उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के भंडारण से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त संग्रहण की आवश्यकता की कीमत पर क्षति दूर हो जाता है।
शब्दावली
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को आमतौर पर चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे अक्सर बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।[1][2][3][4]
एक स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।[5] वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही सरणी में ड्राइव्स पर फैले होते हैं।
अनुप्रयोग
डेटा स्ट्रिपिंग का उपयोग कुछ डेटाबेस में किया जाता है, जैसे कि साइबेस, और कुछ रेड उपकरणों में सॉफ्टवेयर या हार्डवेयर नियंत्रण के तहत, जैसे आईबीएम के 9394 रैमएसी ऐरे सबसिस्टम। क्लस्टर के फाइल सिस्टम भी स्ट्राइपिंग का उपयोग करते हैं। ओरेकल ऑटोमैटिक स्टोरेज मैनेजमेंट एएसएम फाइलों को या तो अशिष्ट या सूक्ष्म स्ट्राइप की अनुमति देता है।
- रेड (स्वतंत्र डिस्क की निरर्थक सारणी)
- कुछ रेड विन्यासों में, जैसे कि रेड 0, रेड सरणी के एकल सदस्य ड्राइव की विफलता के कारण सभी संग्रहीत डेटा खो जाते हैं। अन्य रेड कॉन्फ़िगरेशन में, जैसे कि एक रेड 5 जिसमें वितरित समता शामिल है और अतिरेक प्रदान करता है, यदि एक सदस्य ड्राइव विफल हो जाता है, तो डेटा को सरणी में अन्य ड्राइव का उपयोग करके पुनर्स्थापित किया जा सकता है।
- एलवीएम2
- लाइनक्स के लॉजिकल वॉल्यूम मैनेजमेंट (एलवीएम) के साथ डेटा स्ट्रिपिंग भी प्राप्त की जा सकती है। एलवीएम सिस्टम स्ट्रिपिंग पैटर्न की खुरदरापन के समायोजन की अनुमति देता है। एलवीएम उपकरण मिररिंग के संयोजन में डेटा स्ट्रिपिंग को लागू करने की अनुमति देगा। एलवीएम धीमी स्पिनिंग स्टोरेज के लिए एनवीएम एक्सप्रेस पर पढ़ने और लिखने के कैशिंग का अतिरिक्त लाभ प्रदान करता है। एलवीएम के अन्य लाभ हैं जो सीधे तौर पर डेटा स्ट्रिपिंग से संबंधित नहीं हैं (जैसे स्नैपशॉट, गतिशील आकार बदलना, आदि)।
- बीआरटीएफ और जेडएफएस
- रेड जैसी विशेषताएं हैं लेकिन अनुपयुक्त ब्लॉकों का पता लगाने के लिए चंक प्रामाणिकता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या को जोड़ने का अतिरिक्त फ्लेक्सिबिलिटी है। उनके पास अन्य फायदे भी हैं जो सीधे डेटा स्ट्रिपिंग से संबंधित नहीं हैं (लिखने पर प्रतिलिपि, आदि)।
यह भी देखें
संदर्भ
- ↑ "Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system". Red Hat. 9 October 2014. Retrieved 8 February 2015.
- ↑ "mdadm(8) – Linux man page". linux.die.net. Retrieved 8 February 2015.
- ↑ "Linux kernel documentation: RAID setup". kernel.org. 11 November 2014. Retrieved 8 February 2015.
- ↑ "RAID चंक आकार" (PDF). xyratex.com. January 2008. pp. 6–7. Archived from the original (PDF) on 1 August 2014. Retrieved 8 February 2015.
- ↑ "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."