डेटा स्ट्रिपिंग
कंप्यूटर डेटा भंडारण में, डेटा स्ट्रिपिंग एक फ़ाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को खंडित करने की तकनीक है, ताकि विभिन्न भौतिक भंडारण उपकरणों पर लगातार खंड संग्रहीत किए जा सकें।
स्ट्रिपिंग तब उपयोगी होती है जब एक प्रोसेसिंग डिवाइस एक स्टोरेज डिवाइस की तुलना में अधिक तेजी से डेटा का अनुरोध करता है। कई डिवाइसों में सेगमेंट फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट बढ़ाया जाता है। डिस्क की एक सरणी में I/O लोड को संतुलित करने के लिए यह एक उपयोगी तरीका भी है। RAID (RAID) स्टोरेज, नेटवर्क इंटरफ़ेस नियंत्रक, डिस्क एरेज़, क्लस्टर फ़ाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड उन्मुख भंडारण , और कुछ सिस्टम में रैंडम एक्सेस मेमोरी में डिस्क भंडारण में स्ट्रिपिंग का उपयोग किया जाता है।
विधि
डेटा अनुक्रम की शुरुआत से एक राउंड-रॉबिन शेड्यूलिंग|राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर अनुक्रमिक खंडों को अंतःस्थापित करके स्ट्रिपिंग की एक विधि की जाती है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए यह जानना आवश्यक होगा कि किस डिवाइस में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा सेगमेंट का भौतिक पता किसी विशेष डिवाइस को एक-से-एक मैपिंग असाइन किया जाता है, तो अनुरोध किए गए प्रत्येक सेगमेंट तक पहुंचने वाले डिवाइस को डेटा के ऑफ़सेट को जाने बिना पते से गणना की जा सकती है। पूरा क्रम।
अन्य तरीकों को नियोजित किया जा सकता है जिसमें अनुक्रमिक खंड अनुक्रमिक उपकरणों पर संग्रहीत नहीं होते हैं। इस तरह के गैर-अनुक्रमिक इंटरलीविंग से कुछ त्रुटि का पता लगाने और सुधार योजनाओं में लाभ हो सकता है।
फायदे और नुकसान
स्ट्राइपिंग के फायदों में प्रदर्शन और थ्रूपुट शामिल हैं। डेटा एक्सेस के अनुक्रमिक समय इंटरलीविंग प्रत्येक स्टोरेज डिवाइस के कम डेटा एक्सेस थ्रूपुट को नियोजित स्टोरेज डिवाइसों की संख्या से संचयी रूप से गुणा करने की अनुमति देता है। बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग डिवाइस को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस तरह इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह डेटा प्रोसेसिंग के बेहतर प्रदर्शन में प्रकट होता है।
क्योंकि डेटा के विभिन्न खंड अलग-अलग स्टोरेज डिवाइस पर रखे जाते हैं, एक डिवाइस की विफलता पूरे डेटा अनुक्रम के भ्रष्टाचार का कारण बनती है। वास्तव में, भंडारण उपकरणों की सरणी की विफलताओं के बीच का औसत समय प्रत्येक भंडारण उपकरण की विफलता दर के योग के बराबर होता है। त्रुटि सुधार के उद्देश्य के लिए, स्ट्राइपिंग के इस नुकसान को निरर्थक जानकारी के भंडारण से दूर किया जा सकता है, जैसे कि पैरिटी बिट#RAID। ऐसी प्रणाली में, अतिरिक्त भंडारण की आवश्यकता की कीमत पर नुकसान को दूर किया जाता है।
शब्दावली
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को आमतौर पर चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट्स कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके तार्किक समूहों को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे अक्सर बाइट्स में दर्शाया जाता है, को विभिन्न रूप से चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लेंथ के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकता है।[1][2][3][4] एक स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम्स स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्य में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।[5] वाइड स्ट्रिपिंग तब होती है जब डेटा का हिस्सा कई सरणियों में फैला होता है, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा के टुकड़े एक ही सरणी में ड्राइव में फैले होते हैं।
अनुप्रयोग
डेटा स्ट्रिपिंग का उपयोग कुछ डेटाबेस में किया जाता है, जैसे साइबेस, और सॉफ्टवेयर या हार्डवेयर नियंत्रण के तहत कुछ RAID उपकरणों में, जैसे IBM का IBM 9394 RAMAC ऐरे सबसिस्टम। कंप्यूटर क्लस्टर के फाइल सिस्टम भी स्ट्रिपिंग का उपयोग करते हैं। Oracle Corporation स्वचालित भंडारण प्रबंधन ASM फ़ाइलों को मोटे या ठीक धारीदार होने की अनुमति देता है।
- छापा
- कुछ RAID कॉन्फ़िगरेशन में, जैसे कि मानक RAID स्तर#RAID 0|RAID 0, RAID सरणी के एकल सदस्य ड्राइव की विफलता के कारण सभी संग्रहीत डेटा खो जाते हैं। अन्य RAID कॉन्फ़िगरेशन में, जैसे कि एक मानक RAID स्तर#RAID 5|RAID 5 जिसमें वितरित समानता शामिल है और रिडंडेंसी (सूचना सिद्धांत) प्रदान करता है, यदि एक सदस्य ड्राइव विफल हो जाता है, तो सरणी में अन्य ड्राइव का उपयोग करके डेटा को पुनर्स्थापित किया जा सकता है।
- एलवीएम2
- Linux के तार्किक मात्रा प्रबंधन (LVM) के साथ डेटा स्ट्रिपिंग भी हासिल की जा सकती है। LVM सिस्टम स्ट्रिपिंग पैटर्न के मोटेपन के समायोजन की अनुमति देता है। LVM उपकरण डिस्क मिररिंग के संयोजन में डेटा स्ट्रिपिंग के कार्यान्वयन की अनुमति देगा। LVM स्लो स्पिनिंग स्टोरेज के लिए NVM Express पर रीड एंड राइट कैशिंग का अतिरिक्त लाभ प्रदान करता है। LVM के अन्य लाभ हैं जो सीधे तौर पर डेटा स्ट्रिपिंग से संबंधित नहीं हैं (जैसे स्नैपशॉट, डायनेमिक रीसाइज़िंग, आदि)।
- बीआरटीएफ और जेडएफएस
- RAID जैसी विशेषताएं हैं लेकिन खराब ब्लॉकों का पता लगाने के लिए चंक अखंडता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या जोड़ने का अतिरिक्त लचीलापन है। उनके पास अन्य फायदे भी हैं जो सीधे डेटा स्ट्रिपिंग (लिखने पर प्रतिलिपि, आदि) से संबंधित नहीं हैं।
यह भी देखें
संदर्भ
- ↑ "Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system". Red Hat. 9 October 2014. Retrieved 8 February 2015.
- ↑ "mdadm(8) – Linux man page". linux.die.net. Retrieved 8 February 2015.
- ↑ "Linux kernel documentation: RAID setup". kernel.org. 11 November 2014. Retrieved 8 February 2015.
- ↑ "RAID चंक आकार" (PDF). xyratex.com. January 2008. pp. 6–7. Archived from the original (PDF) on 1 August 2014. Retrieved 8 February 2015.
- ↑ "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."