डेटा स्ट्रिपिंग: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Other uses|स्ट्राइप (बहुविकल्पी){{!}}स्ट्राइप}} | {{Other uses|स्ट्राइप (बहुविकल्पी){{!}}स्ट्राइप}} | ||
कंप्यूटर डेटा स्टोरेज में, '''डेटा स्ट्रिपिंग''' एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को | कंप्यूटर डेटा स्टोरेज में, '''डेटा स्ट्रिपिंग''' एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को विभाजित करने की तकनीक है, ताकि अलग-अलग भौतिक स्टोरेज उपकरणों पर लगातार भागों को संग्रहीत किया जा सके। | ||
[[File:Data striping example.svg|thumb|डेटा स्ट्रिपिंग का उदाहरण। फाइलें A और B, चार ब्लॉकों में से प्रत्येक डिस्क D1 से D3 तक फैली हुई हैं।]]स्ट्रिपिंग तब उपयोगी होती है जब प्रोसेसिंग उपकरण स्टोरेज उपकरण की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई उपकरणों में सेगमेंट को | [[File:Data striping example.svg|thumb|डेटा स्ट्रिपिंग का उदाहरण। फाइलें A और B, चार ब्लॉकों में से प्रत्येक डिस्क D1 से D3 तक फैली हुई हैं।]]स्ट्रिपिंग तब उपयोगी होती है जब प्रोसेसिंग उपकरण स्टोरेज उपकरण की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई उपकरणों में सेगमेंट को प्रसारित कर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा साद्यांत में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट लोड को संतुलित करने का एक उपयोगी विधि भी है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, [[नेटवर्क इंटरफ़ेस नियंत्रक|नेटवर्क इंटरफ़ेस]] कंट्रोलर, डिस्क एरेज़, क्लस्टर फाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है। | ||
== विधि == | == विधि == | ||
स्ट्राइपिंग की स्थिति को इंडेक्स से इंडेक्स तक राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर इंडेक्स दस्तावेज़ों को इंटरलीविंग करके किया जाता है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस उपकरण में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष उपकरण के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए उपकरण को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है। | |||
अन्य | अन्य तरीकों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहीत नहीं होते हैं। इस प्रकार की गैर-अनुक्रमिक अंतःक्रिया से कुछ त्रुटि सुधार योजनाओं में लाभ हो सकता है। | ||
== लाभ और हानि == | == लाभ और हानि == | ||
स्ट्रिपिंग के लाभों में प्रदर्शन और प्रवाह क्षमता सम्मिलित है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज उपकरण के कम डेटा एक्सेस | स्ट्रिपिंग के लाभों में प्रदर्शन और प्रवाह क्षमता सम्मिलित है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज उपकरण के कम डेटा एक्सेस साद्यांत को नियोजित स्टोरेज उपकरणों की संख्या से संचयी रूप से गुणा किया जा सकता है बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग उपकरण को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह बेहतर डाटा प्रोसेसिंग प्रदर्शन में प्रकट होता है। | ||
क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज उपकरण पर रखे जाते हैं, उपकरण की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, स्टोरेज उपकरणों की श्रेणी की विफलता दर प्रत्येक स्टोरेज उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के स्टोरेज से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त | क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज उपकरण पर रखे जाते हैं, उपकरण की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, स्टोरेज उपकरणों की श्रेणी की विफलता दर प्रत्येक स्टोरेज उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के स्टोरेज से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त स्टोरेज की आवश्यकता की लागत पर क्षति की भरपाई की जाती है। | ||
== शब्दावली == | == शब्दावली == | ||
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को सामान्यतः चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे प्रायः बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।<ref>{{cite web|url=https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Storage_Administration_Guide/ch-ext4.html|title=Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system|date=9 October 2014|accessdate=8 February 2015|publisher=[[Red Hat]]}}</ref><ref>{{cite web|url=http://linux.die.net/man/8/mdadm|title=mdadm(8) – Linux man page|accessdate=8 February 2015|website=linux.die.net}}</ref><ref>{{cite web|url=https://raid.wiki.kernel.org/index.php/RAID_setup|title=Linux kernel documentation: RAID setup|date=11 November 2014|accessdate=8 February 2015|website=kernel.org}}</ref><ref>{{cite web|url=http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf#page=8|title=RAID चंक आकार|date=January 2008|accessdate=8 February 2015|website=xyratex.com|format=PDF|pages=6–7|url-status=dead|archive-url=https://web.archive.org/web/20140801150001/http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf|archive-date=1 August 2014}}</ref> | अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को सामान्यतः चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे प्रायः बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।<ref>{{cite web|url=https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Storage_Administration_Guide/ch-ext4.html|title=Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system|date=9 October 2014|accessdate=8 February 2015|publisher=[[Red Hat]]}}</ref><ref>{{cite web|url=http://linux.die.net/man/8/mdadm|title=mdadm(8) – Linux man page|accessdate=8 February 2015|website=linux.die.net}}</ref><ref>{{cite web|url=https://raid.wiki.kernel.org/index.php/RAID_setup|title=Linux kernel documentation: RAID setup|date=11 November 2014|accessdate=8 February 2015|website=kernel.org}}</ref><ref>{{cite web|url=http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf#page=8|title=RAID चंक आकार|date=January 2008|accessdate=8 February 2015|website=xyratex.com|format=PDF|pages=6–7|url-status=dead|archive-url=https://web.archive.org/web/20140801150001/http://www.xyratex.com/sites/default/files/Xyratex_White_Paper_RAID_Chunk_Size_1-0.pdf|archive-date=1 August 2014}}</ref> | ||
स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।<ref>[http://docs.oracle.com/cd/B10501_01/server.920/a96533/iodesign.htm "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."]</ref> वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही | स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।<ref>[http://docs.oracle.com/cd/B10501_01/server.920/a96533/iodesign.htm "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."]</ref> वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही ऐरे में ड्राइव्स पर प्रचारित हो जाता है। | ||
== अनुप्रयोग == | == अनुप्रयोग == | ||
Line 30: | Line 30: | ||
; बीआरटीएफ और जेडएफएस | ; बीआरटीएफ और जेडएफएस | ||
: रेड जैसी विशेषताएं हैं लेकिन अनुपयुक्त ब्लॉकों का पता लगाने के लिए चंक प्रामाणिकता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या को जोड़ने का अतिरिक्त | : रेड जैसी विशेषताएं हैं लेकिन अनुपयुक्त ब्लॉकों का पता लगाने के लिए चंक प्रामाणिकता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या को जोड़ने का अतिरिक्त उपयोग क्षमता है। उनके पास अन्य लाभ भी हैं जो डेटा स्ट्रिपिंग से सीधे संबंधित नहीं हैं (लिखने पर कॉपी, आदि)। | ||
== यह भी देखें == | == यह भी देखें == |
Revision as of 00:07, 15 June 2023
कंप्यूटर डेटा स्टोरेज में, डेटा स्ट्रिपिंग एक फाइल जैसे तार्किक रूप से अनुक्रमिक डेटा को विभाजित करने की तकनीक है, ताकि अलग-अलग भौतिक स्टोरेज उपकरणों पर लगातार भागों को संग्रहीत किया जा सके।
स्ट्रिपिंग तब उपयोगी होती है जब प्रोसेसिंग उपकरण स्टोरेज उपकरण की तुलना में अधिक तेजी से डेटा का अनुरोध करता है जो इसे प्रदान कर सकता है। कई उपकरणों में सेगमेंट को प्रसारित कर, जिन्हें समवर्ती रूप से एक्सेस किया जा सकता है, कुल डेटा साद्यांत में वृद्धि होती है। यह डिस्क की एक सरणी में इनपुट/आउटपुट लोड को संतुलित करने का एक उपयोगी विधि भी है। स्ट्रिपिंग का उपयोग डिस्क ड्राइव में स्वतंत्र डिस्क (रेड) स्टोरेज, नेटवर्क इंटरफ़ेस कंट्रोलर, डिस्क एरेज़, क्लस्टर फाइल सिस्टम में विभिन्न कंप्यूटरों और ग्रिड-ओरिएंटेड स्टोरेज, और कुछ सिस्टम में रैम के एक निरर्थक सरणी में होता है।
विधि
स्ट्राइपिंग की स्थिति को इंडेक्स से इंडेक्स तक राउंड-रॉबिन फैशन में स्टोरेज डिवाइस पर इंडेक्स दस्तावेज़ों को इंटरलीविंग करके किया जाता है। यह स्ट्रीमिंग डेटा के लिए अच्छी तरह से काम करता है, लेकिन बाद के रैंडम एक्सेस के लिए ज्ञान की आवश्यकता होगी कि किस उपकरण में डेटा है। यदि डेटा को इस तरह संग्रहीत किया जाता है कि प्रत्येक डेटा खंड का भौतिक पता किसी विशेष उपकरण के लिए एक-से-एक मैपिंग निर्दिष्ट किया जाता है, अनुरोध किए गए प्रत्येक खंड तक पहुँचने के लिए उपकरण को पूर्ण अनुक्रम के भीतर डेटा के ऑफसेट को जाने बिना एड्रेस से गणना की जा सकती है।
अन्य तरीकों को नियोजित किया जा सकता है जिसमें अनुक्रमिक सेगमेंट अनुक्रमिक उपकरणों पर संग्रहीत नहीं होते हैं। इस प्रकार की गैर-अनुक्रमिक अंतःक्रिया से कुछ त्रुटि सुधार योजनाओं में लाभ हो सकता है।
लाभ और हानि
स्ट्रिपिंग के लाभों में प्रदर्शन और प्रवाह क्षमता सम्मिलित है। डेटा एक्सेस के अनुक्रमिक समय अंतराल से प्रत्येक स्टोरेज उपकरण के कम डेटा एक्सेस साद्यांत को नियोजित स्टोरेज उपकरणों की संख्या से संचयी रूप से गुणा किया जा सकता है बढ़ा हुआ प्रवाह डेटा प्रोसेसिंग उपकरण को बिना किसी रुकावट के अपना काम जारी रखने की अनुमति देता है, और इस प्रकार इसकी प्रक्रियाओं को और अधिक तेज़ी से पूरा करता है। यह बेहतर डाटा प्रोसेसिंग प्रदर्शन में प्रकट होता है।
क्योंकि डेटा के अलग-अलग सेगमेंट अलग-अलग स्टोरेज उपकरण पर रखे जाते हैं, उपकरण की विफलता पूरे डेटा अनुक्रम के अवमिश्रण का कारण बनती है। वास्तव में, स्टोरेज उपकरणों की श्रेणी की विफलता दर प्रत्येक स्टोरेज उपकरण की विफलता दर के योग के बराबर है। त्रुटि सुधार के उद्देश्य के लिए स्ट्रिपिंग के इस क्षति को अनावश्यक जानकारी, जैसे समता के स्टोरेज से दूर किया जा सकता है। ऐसी प्रणाली में, अतिरिक्त स्टोरेज की आवश्यकता की लागत पर क्षति की भरपाई की जाती है।
शब्दावली
अगली डिस्क पर ऑपरेशन जारी रहने से पहले डिस्क से लिखे या पढ़े गए अनुक्रमिक डेटा के सेगमेंट को सामान्यतः चंक्स, स्ट्राइड्स या स्ट्राइप यूनिट कहा जाता है, जबकि सिंगल स्ट्राइप्ड ऑपरेशंस बनाने वाले उनके लॉजिकल ग्रुप को स्ट्रिप्स या स्ट्राइप्स कहा जाता है। एक चंक (स्ट्राइप यूनिट) में डेटा की मात्रा, जिसे प्रायः बाइट्स में दर्शाया जाता है, को चंक आकार, स्ट्राइड आकार, स्ट्राइप आकार, स्ट्राइप डेप्थ या स्ट्राइप लंबाई के रूप में संदर्भित किया जाता है। सरणी में डेटा डिस्क की संख्या को कभी-कभी स्ट्राइप चौड़ाई कहा जाता है, लेकिन यह स्ट्राइप के भीतर डेटा की मात्रा को भी संदर्भित कर सकती है।[1][2][3][4]
स्ट्राइड में डेटा की मात्रा को सरणी में डेटा डिस्क की संख्या से गुणा किया जाता है (यानी, स्ट्राइप डेप्थ टाइम स्ट्राइप चौड़ाई, जो ज्यामितीय सादृश्यता में एक क्षेत्र उत्पन्न करेगा) को कभी-कभी स्ट्राइप आकार या स्ट्राइप चौड़ाई कहा जाता है।[5] वाइड स्ट्रिपिंग तब होती है जब डेटा के टुकड़े कई सरणियों में फैले होते हैं, संभवतः सिस्टम में सभी ड्राइव। नैरो स्ट्रिपिंग तब होती है जब डेटा एक ही ऐरे में ड्राइव्स पर प्रचारित हो जाता है।
अनुप्रयोग
डेटा स्ट्रिपिंग का उपयोग कुछ डेटाबेस में किया जाता है, जैसे कि साइबेस, और कुछ रेड उपकरणों में सॉफ्टवेयर या हार्डवेयर नियंत्रण के तहत, जैसे आईबीएम के 9394 रैमएसी ऐरे सबसिस्टम। क्लस्टर के फाइल सिस्टम भी स्ट्राइपिंग का उपयोग करते हैं। ओरेकल ऑटोमैटिक स्टोरेज मैनेजमेंट एएसएम फाइलों को या तो अशिष्ट या सूक्ष्म स्ट्राइप की अनुमति देता है।
- रेड (स्वतंत्र डिस्क की निरर्थक सारणी)
- कुछ रेड विन्यासों में, जैसे कि रेड 0, रेड सरणी के एकल सदस्य ड्राइव की विफलता के कारण सभी संग्रहीत डेटा खो जाते हैं। अन्य रेड कॉन्फ़िगरेशन में, जैसे कि रेड 5 जिसमें वितरित समता सम्मिलित है और अतिरेक प्रदान करता है, यदि एक सदस्य ड्राइव विफल हो जाता है, तो डेटा को सरणी में अन्य ड्राइव का उपयोग करके पुनर्स्थापित किया जा सकता है।
- एलवीएम2
- लाइनक्स के लॉजिकल वॉल्यूम मैनेजमेंट (एलवीएम) के साथ डेटा स्ट्रिपिंग भी प्राप्त की जा सकती है। एलवीएम सिस्टम स्ट्रिपिंग पैटर्न की खुरदरापन के समायोजन की अनुमति देता है। एलवीएम उपकरण मिररिंग के संयोजन में डेटा स्ट्रिपिंग को लागू करने की अनुमति देगा। एलवीएम धीमी स्पिनिंग स्टोरेज के लिए एनवीएम एक्सप्रेस पर पढ़ने और लिखने के कैशिंग का अतिरिक्त लाभ प्रदान करता है। एलवीएम के अन्य लाभ हैं जो सीधे तौर पर डेटा स्ट्रिपिंग से संबंधित नहीं हैं (जैसे स्नैपशॉट, गतिशील आकार बदलना, आदि)।
- बीआरटीएफ और जेडएफएस
- रेड जैसी विशेषताएं हैं लेकिन अनुपयुक्त ब्लॉकों का पता लगाने के लिए चंक प्रामाणिकता की सुरक्षा के साथ, और अतिरिक्त ड्राइव की मनमानी संख्या को जोड़ने का अतिरिक्त उपयोग क्षमता है। उनके पास अन्य लाभ भी हैं जो डेटा स्ट्रिपिंग से सीधे संबंधित नहीं हैं (लिखने पर कॉपी, आदि)।
यह भी देखें
संदर्भ
- ↑ "Red Hat Enterprise Linux 6 storage administration guide, chapter 6. The ext4 file system". Red Hat. 9 October 2014. Retrieved 8 February 2015.
- ↑ "mdadm(8) – Linux man page". linux.die.net. Retrieved 8 February 2015.
- ↑ "Linux kernel documentation: RAID setup". kernel.org. 11 November 2014. Retrieved 8 February 2015.
- ↑ "RAID चंक आकार" (PDF). xyratex.com. January 2008. pp. 6–7. Archived from the original (PDF) on 1 August 2014. Retrieved 8 February 2015.
- ↑ "Stripe depth is the size of the stripe, sometimes called stripe unit. Stripe width is the product of the stripe depth and the number of drives in the striped set."