डेटा स्ट्रिपिंग

From Vigyanwiki
Revision as of 08:03, 14 June 2023 by alpha>Adityak

कंप्यूटर डेटा स्टोरेज में, डेटा स्ट्रिपिंग एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को खंडित करने की तकनीक है, ताकि लगातार खंड विभिन्न भौतिक स्टोरेज उपकरणों पर संग्रहीत हो सकें।

डेटा स्ट्रिपिंग का उदाहरण। फाइलें A और B, चार ब्लॉकों में से प्रत्येक डिस्क D1 से D3 तक फैली हुई हैं।

स्ट्रिपिंग तब उपयोगी होती है जब प्रोसेसिंग उपकरण स्टोरेज उपकरण की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई उपकरणों में सेगमेंट को फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट  लोड को संतुलित करने के लिए भी एक उपयोगी तरीका है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, नेटवर्क इंटरफ़ेस कंट्रोलर, डिस्क एरेज़, क्लस्टर फाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है।

विधि

स्ट्रिपिंग की विधि डेटा अनुक्रम की प्रारम्भ से राउंड-रॉबिन फैशन में स्टोरेज उपकरण पर अनुक्रमिक सेगमेंट को इंटरलीविंग (अंतथपत्रण) करके की जाती है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस उपकरण में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष उपकरण के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए उपकरण को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है।

अन्य विधियों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहित नहीं होते हैं। कुछ त्रुटि सुधार योजनाओं में इस तरह के गैर-अनुक्रमिक इंटरलीविंग के लाभ हो सकते हैं।

लाभ और हानि

स्ट्रिपिंग के लाभों में प्रदर्शन और प्रवाह क्षमता सम्मिलित है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज उपकरण के कम डेटा एक्सेस थ्रूपुट को नियोजित स्टोरेज उपकरणों की संख्या से संचयी रूप से गुणा किया जा सकता है  बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग उपकरण को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह डाटा प्रोसेसिंग के बेहतर प्रदर्शन में प्रकट हुआ है।

क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज उपकरण पर रखे जाते हैं, उपकरण की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, स्टोरेज उपकरणों की श्रेणी की विफलता दर प्रत्येक स्टोरेज उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के स्टोरेज से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त संग्रहण की आवश्यकता की कीमत पर क्षति दूर हो जाता है।

शब्दावली

अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को सामान्यतः चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे प्रायः बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।[1][2][3][4]

स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।[5] वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही सरणी में ड्राइव्स पर फैले होते हैं।

अनुप्रयोग

डेटा स्ट्रिपिंग का उपयोग कुछ डेटाबेस में किया जाता है, जैसे कि साइबेस, और कुछ रेड उपकरणों में सॉफ्टवेयर या हार्डवेयर नियंत्रण के तहत, जैसे आईबीएम के 9394 रैमएसी ऐरे सबसिस्टम। क्लस्टर के फाइल सिस्टम भी स्ट्राइपिंग का उपयोग करते हैं। ओरेकल ऑटोमैटिक स्टोरेज मैनेजमेंट एएसएम फाइलों को या तो अशिष्ट या सूक्ष्म स्ट्राइप की अनुमति देता है।

रेड (स्वतंत्र डिस्क की निरर्थक सारणी)
कुछ रेड विन्यासों में, जैसे कि रेड 0, रेड सरणी के एकल सदस्य ड्राइव की विफलता के कारण सभी संग्रहीत डेटा खो जाते हैं। अन्य रेड कॉन्फ़िगरेशन में, जैसे कि रेड 5 जिसमें वितरित समता सम्मिलित है और अतिरेक प्रदान करता है, यदि एक सदस्य ड्राइव विफल हो जाता है, तो डेटा को सरणी में अन्य ड्राइव का उपयोग करके पुनर्स्थापित किया जा सकता है।
एलवीएम2
लाइनक्स के लॉजिकल वॉल्यूम मैनेजमेंट (एलवीएम) के साथ डेटा स्ट्रिपिंग भी प्राप्त की जा सकती है। एलवीएम सिस्टम स्ट्रिपिंग पैटर्न की खुरदरापन के समायोजन की अनुमति देता है। एलवीएम उपकरण मिररिंग के संयोजन में डेटा स्ट्रिपिंग को लागू करने की अनुमति देगा। एलवीएम धीमी स्पिनिंग स्टोरेज के लिए एनवीएम एक्सप्रेस पर पढ़ने और लिखने के कैशिंग का अतिरिक्त लाभ प्रदान करता है। एलवीएम के अन्य लाभ हैं जो सीधे तौर पर डेटा स्ट्रिपिंग से संबंधित नहीं हैं (जैसे स्नैपशॉट, गतिशील आकार बदलना, आदि)।
बीआरटीएफ और जेडएफएस
रेड जैसी विशेषताएं हैं लेकिन अनुपयुक्त ब्लॉकों का पता लगाने के लिए चंक प्रामाणिकता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या को जोड़ने का अतिरिक्त फ्लेक्सिबिलिटी है। उनके पास अन्य लाभ भी हैं जो सीधे डेटा स्ट्रिपिंग से संबंधित नहीं हैं (लिखने पर प्रतिलिपि, आदि)।

यह भी देखें

संदर्भ

  1. "Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system". Red Hat. 9 October 2014. Retrieved 8 February 2015.
  2. "mdadm(8) – Linux man page". linux.die.net. Retrieved 8 February 2015.
  3. "Linux kernel documentation: RAID setup". kernel.org. 11 November 2014. Retrieved 8 February 2015.
  4. "RAID चंक आकार" (PDF). xyratex.com. January 2008. pp. 6–7. Archived from the original (PDF) on 1 August 2014. Retrieved 8 February 2015.
  5. "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."