डेटा स्ट्रिपिंग: Difference between revisions
(Created page with "{{Other uses|Stripe (disambiguation){{!}}Stripe}} कंप्यूटर डेटा भंडारण में, डेटा स्ट्रिपिंग एक...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{Other uses|Stripe (disambiguation){{!}}Stripe}} | {{Other uses|Stripe (disambiguation){{!}}Stripe}} | ||
कंप्यूटर डेटा स्टोरेज में, '''डेटा स्ट्रिपिंग''' एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को खंडित करने की तकनीक है, ताकि लगातार खंड विभिन्न भौतिक स्टोरेज उपकरणों पर संग्रहीत हो सकें। | |||
[[File:Data striping example.svg|thumb|डेटा स्ट्रिपिंग का एक उदाहरण। फाइलें ए और बी, चार ब्लॉकों में से प्रत्येक डिस्क डी 1 से डी 3 तक फैली हुई हैं।]]स्ट्रिपिंग तब उपयोगी होती है जब एक प्रोसेसिंग डिवाइस एक स्टोरेज डिवाइस की तुलना में अधिक तेजी से डेटा का अनुरोध करता है। कई डिवाइसों में सेगमेंट फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट | [[File:Data striping example.svg|thumb|डेटा स्ट्रिपिंग का एक उदाहरण। फाइलें ए और बी, चार ब्लॉकों में से प्रत्येक डिस्क डी 1 से डी 3 तक फैली हुई हैं।]]स्ट्रिपिंग तब उपयोगी होती है जब एक प्रोसेसिंग डिवाइस एक स्टोरेज डिवाइस की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई डिवाइसों में सेगमेंट को फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट लोड को संतुलित करने के लिए भी एक उपयोगी तरीका है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, [[नेटवर्क इंटरफ़ेस नियंत्रक|नेटवर्क इंटरफ़ेस]] कंट्रोलर, डिस्क एरेज़, क्लस्टर फ़ाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है। | ||
== विधि == | == विधि == | ||
डेटा अनुक्रम की शुरुआत से | स्ट्रिपिंग की एक विधि डेटा अनुक्रम की शुरुआत से राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर अनुक्रमिक सेगमेंट को इंटरलीविंग (अंतथपत्रण) करके की जाती है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस डिवाइस में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष डिवाइस के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए डिवाइस को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है। | ||
अन्य | अन्य विधियों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहित नहीं होते हैं। कुछ त्रुटि सुधार योजनाओं में इस तरह के गैर-अनुक्रमिक इंटरलीविंग के लाभ हो सकते हैं। | ||
== | == लाभ और हानि == | ||
स्ट्रिपिंग के फायदों में प्रदर्शन और प्रवाह क्षमता शामिल है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज डिवाइस के कम डेटा एक्सेस थ्रूपुट को नियोजित स्टोरेज डिवाइसों की संख्या से संचयी रूप से गुणा किया जा सकता है बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग डिवाइस को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह डाटा प्रोसेसिंग के बेहतर प्रदर्शन में प्रकट हुआ है। | |||
क्योंकि डेटा के | क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज डिवाइस पर रखे जाते हैं, एक डिवाइस की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, भंडारण उपकरणों की श्रेणी की विफलता दर प्रत्येक भंडारण उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के भंडारण से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त संग्रहण की आवश्यकता की कीमत पर क्षति दूर हो जाता है। | ||
== शब्दावली == | == शब्दावली == | ||
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को आमतौर पर चंक्स, स्ट्राइड्स या स्ट्राइप | अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को आमतौर पर चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे अक्सर बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।<ref>{{cite web|url=https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Storage_Administration_Guide/ch-ext4.html|title=Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system|date=9 October 2014|accessdate=8 February 2015|publisher=[[Red Hat]]}}</ref><ref>{{cite web|url=http://linux.die.net/man/8/mdadm|title=mdadm(8) – Linux man page|accessdate=8 February 2015|website=linux.die.net}}</ref><ref>{{cite web|url=https://raid.wiki.kernel.org/index.php/RAID_setup|title=Linux kernel documentation: RAID setup|date=11 November 2014|accessdate=8 February 2015|website=kernel.org}}</ref><ref>{{cite web|url=http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf#page=8|title=RAID चंक आकार|date=January 2008|accessdate=8 February 2015|website=xyratex.com|format=PDF|pages=6–7|url-status=dead|archive-url=https://web.archive.org/web/20140801150001/http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf|archive-date=1 August 2014}}</ref> | ||
एक स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ | |||
एक स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।<ref>[http://docs.oracle.com/cd/B10501_01/server.920/a96533/iodesign.htm "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."]</ref> वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही सरणी में ड्राइव्स पर फैले होते हैं। | |||
== अनुप्रयोग == | == अनुप्रयोग == |
Revision as of 07:38, 14 June 2023
कंप्यूटर डेटा स्टोरेज में, डेटा स्ट्रिपिंग एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को खंडित करने की तकनीक है, ताकि लगातार खंड विभिन्न भौतिक स्टोरेज उपकरणों पर संग्रहीत हो सकें।
स्ट्रिपिंग तब उपयोगी होती है जब एक प्रोसेसिंग डिवाइस एक स्टोरेज डिवाइस की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई डिवाइसों में सेगमेंट को फैलाकर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा थ्रूपुट में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट लोड को संतुलित करने के लिए भी एक उपयोगी तरीका है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, नेटवर्क इंटरफ़ेस कंट्रोलर, डिस्क एरेज़, क्लस्टर फ़ाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है।
विधि
स्ट्रिपिंग की एक विधि डेटा अनुक्रम की शुरुआत से राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर अनुक्रमिक सेगमेंट को इंटरलीविंग (अंतथपत्रण) करके की जाती है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस डिवाइस में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष डिवाइस के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए डिवाइस को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है।
अन्य विधियों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहित नहीं होते हैं। कुछ त्रुटि सुधार योजनाओं में इस तरह के गैर-अनुक्रमिक इंटरलीविंग के लाभ हो सकते हैं।
लाभ और हानि
स्ट्रिपिंग के फायदों में प्रदर्शन और प्रवाह क्षमता शामिल है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज डिवाइस के कम डेटा एक्सेस थ्रूपुट को नियोजित स्टोरेज डिवाइसों की संख्या से संचयी रूप से गुणा किया जा सकता है बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग डिवाइस को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह डाटा प्रोसेसिंग के बेहतर प्रदर्शन में प्रकट हुआ है।
क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज डिवाइस पर रखे जाते हैं, एक डिवाइस की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, भंडारण उपकरणों की श्रेणी की विफलता दर प्रत्येक भंडारण उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के भंडारण से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त संग्रहण की आवश्यकता की कीमत पर क्षति दूर हो जाता है।
शब्दावली
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को आमतौर पर चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे अक्सर बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।[1][2][3][4]
एक स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।[5] वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही सरणी में ड्राइव्स पर फैले होते हैं।
अनुप्रयोग
डेटा स्ट्रिपिंग का उपयोग कुछ डेटाबेस में किया जाता है, जैसे साइबेस, और सॉफ्टवेयर या हार्डवेयर नियंत्रण के तहत कुछ RAID उपकरणों में, जैसे IBM का IBM 9394 RAMAC ऐरे सबसिस्टम। कंप्यूटर क्लस्टर के फाइल सिस्टम भी स्ट्रिपिंग का उपयोग करते हैं। Oracle Corporation स्वचालित भंडारण प्रबंधन ASM फ़ाइलों को मोटे या ठीक धारीदार होने की अनुमति देता है।
- छापा
- कुछ RAID कॉन्फ़िगरेशन में, जैसे कि मानक RAID स्तर#RAID 0|RAID 0, RAID सरणी के एकल सदस्य ड्राइव की विफलता के कारण सभी संग्रहीत डेटा खो जाते हैं। अन्य RAID कॉन्फ़िगरेशन में, जैसे कि एक मानक RAID स्तर#RAID 5|RAID 5 जिसमें वितरित समानता शामिल है और रिडंडेंसी (सूचना सिद्धांत) प्रदान करता है, यदि एक सदस्य ड्राइव विफल हो जाता है, तो सरणी में अन्य ड्राइव का उपयोग करके डेटा को पुनर्स्थापित किया जा सकता है।
- एलवीएम2
- Linux के तार्किक मात्रा प्रबंधन (LVM) के साथ डेटा स्ट्रिपिंग भी हासिल की जा सकती है। LVM सिस्टम स्ट्रिपिंग पैटर्न के मोटेपन के समायोजन की अनुमति देता है। LVM उपकरण डिस्क मिररिंग के संयोजन में डेटा स्ट्रिपिंग के कार्यान्वयन की अनुमति देगा। LVM स्लो स्पिनिंग स्टोरेज के लिए NVM Express पर रीड एंड राइट कैशिंग का अतिरिक्त लाभ प्रदान करता है। LVM के अन्य लाभ हैं जो सीधे तौर पर डेटा स्ट्रिपिंग से संबंधित नहीं हैं (जैसे स्नैपशॉट, डायनेमिक रीसाइज़िंग, आदि)।
- बीआरटीएफ और जेडएफएस
- RAID जैसी विशेषताएं हैं लेकिन खराब ब्लॉकों का पता लगाने के लिए चंक अखंडता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या जोड़ने का अतिरिक्त लचीलापन है। उनके पास अन्य फायदे भी हैं जो सीधे डेटा स्ट्रिपिंग (लिखने पर प्रतिलिपि, आदि) से संबंधित नहीं हैं।
यह भी देखें
संदर्भ
- ↑ "Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system". Red Hat. 9 October 2014. Retrieved 8 February 2015.
- ↑ "mdadm(8) – Linux man page". linux.die.net. Retrieved 8 February 2015.
- ↑ "Linux kernel documentation: RAID setup". kernel.org. 11 November 2014. Retrieved 8 February 2015.
- ↑ "RAID चंक आकार" (PDF). xyratex.com. January 2008. pp. 6–7. Archived from the original (PDF) on 1 August 2014. Retrieved 8 February 2015.
- ↑ "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."