फॉल्ट टॉलरेंस: Difference between revisions

From Vigyanwiki
(text edit)
No edit summary
 
(44 intermediate revisions by 7 users not shown)
Line 1: Line 1:
{{Short description|Resilience of systems to component failures or errors}}
{{Short description|Resilience of systems to component failures or errors}}
{{Use American English|date = February 2019}}
{{Use American English}}
{{More citations needed|date=January 2008}}


'''फॉल्ट टॉलरेंस''' वह गुण है जो किसी प्रणाली([[ सिस्टम | सिस्टम)]] को इसके कुछ घटकों में एक या अधिक दोषों की विफलता की स्थिति में ठीक से संचालन जारी रखने में सक्षम बनाता है। यदि इसकी परिचालन गुणवत्ता बिल्कुल भी कम हो जाती है, तो कमी विफलता की गंभीरता के समानुपाती होती है,एक सरलता से डिज़ाइन की गई प्रणाली की तुलना में, जिसमें एक छोटी सी विफलता भी विघटन का कारण बन सकती है। [[ उच्च उपलब्धता |उच्च उपलब्धता, महत्वपूर्ण]] लक्ष्य, या यहां तक ​​कि जीवन महत्वपूर्ण प्रणाली में दोष सहिष्णुता ('''फॉल्ट टॉलरेंस)''' की विशेष रूप से मांग की जाती है। सिस्टम के कुछ हिस्सों के टूटने पर कार्यक्षमता को बनाए रखने की क्षमता को '''ग्रेसफुल डिग्रेडेशन कहा जाता है।<ref>[http://scholarworks.umass.edu/cgi/viewcontent.cgi?article=1186&context=cs_faculty_pubs अडैप्टिव फॉल्ट टॉलरेंस एंड ग्रेसफुल डिग्रेडेशन], ऑस्कर गोंजालेज एट अल।, 1997, मैसाचुसेट्स विश्वविद्यालय - एम्हेर्स</ref>'''
'''फॉल्ट टॉलरेंस''' के द्वारा किसी [[प्रणाली|प्रणाली (सिस्टम)]] को इसके कुछ घटकों में एक या अधिक दोषों की विफलता की स्थिति में भी ठीक से संचालन जारी रखने में सक्षम बनाता है। यदि इसकी परिचालन गुणवत्ता बिल्कुल भी कम हो जाती है, तो कमी विफलता की गंभीरता के समानुपाती होती है,एक सरलता से डिज़ाइन की गई प्रणाली की तुलना में, जिसमें एक छोटी सी विफलता भी विघटन का कारण बन सकती है। [[ उच्च उपलब्धता |उच्च उपलब्धता, महत्वपूर्ण]] लक्ष्य, या यहां तक ​​कि जीवन महत्वपूर्ण प्रणाली में दोष सहिष्णुता ('''फॉल्ट टॉलरेंस)''' प्रणाली  की विशेष रूप से मांग की जाती है। सिस्टम के कुछ हिस्सों के बिगड़ने पर कार्यक्षमता बनाए रखने की क्षमता को ही ग्रेसफुल डिग्रेडेशन कहा जाता है।'''<ref>[http://scholarworks.umass.edu/cgi/viewcontent.cgi?article=1186&context=cs_faculty_pubs अडैप्टिव फॉल्ट टॉलरेंस एंड ग्रेसफुल डिग्रेडेशन], ऑस्कर गोंजालेज एट अल।, 1997, मैसाचुसेट्स विश्वविद्यालय - एम्हेर्स</ref>'''


एक '''दोष-सहनशील डिज़ाइन '''सिस्टम को अपने इच्छित संचालन को जारी रखने में सक्षम बनाता है, संभवतः कम स्तर पर, पूरी तरह से विफल होने के बजाय, सिस्टम का कुछ हिस्सा [[ विफलता |विफल हो जाता है।]] <ref>जॉनसन, बी. डब्ल्यू. (1984)। [https://www.computer.org/csdl/mags/mi/1984/06/04071150.pdf फॉल्ट-टॉलरेंट माइक्रोप्रोसेसर-आधारित सिस्टम्स], आईईईई माइक्रो, वॉल्यूम। 4, नहीं। 6, पीपी. 6-2</ref> इस शब्द का प्रयोग आमतौर पर [[ कंप्यूटर सिस्टम ]]का वर्णन करने के लिए किया जाता है, जिसे कम या ज्यादा पूरी तरह से चालू रखने के लिए डिज़ाइन किया गया है, शायद, कुछ आंशिक विफलता की स्थिति में  प्रवाह क्षमतामें कमी या [[ प्रतिक्रिया समय (प्रौद्योगिकी) में वृद्धि |प्रतिक्रिया समय में वृद्धि होती है]]। अर्थात्,[[ कंप्यूटर हार्डवेयर | हार्डवेयर]] या [[ सॉफ़्टवेयर |सॉफ़्टवेयर]] में समस्याओं के कारण संपूर्ण रूप से सिस्टम बंद नहीं होता है। एक अन्य क्षेत्र में एक उदाहरण एक मोटर वाहन है जिसे डिज़ाइन किया गया है, इसलिए यदि टायरों में से एक पंचर हो गया है, या एक संरचना जो थकान, जंग, निर्माण दोष, या प्रभाव जैसे कारणों से होने वाली क्षति की उपस्थिति में अपनी अखंडता बनाए रखने में सक्षम हो, तो इसे चलाना जारी रहेगा।
एक '''दोष-सहनशील डिज़ाइन '''सिस्टम के संचालन को जारी रखने में सक्षम बनाता है, संभवतः इसके द्वारा, पूरी तरह से विफल होने के बजाय, सिस्टम का कुछ ही हिस्सा [[ विफलता |विफल हो जाता है।]] <ref>जॉनसन, बी. डब्ल्यू. (1984)। [https://www.computer.org/csdl/mags/mi/1984/06/04071150.pdf फॉल्ट-टॉलरेंट माइक्रोप्रोसेसर-आधारित सिस्टम्स], आईईईई माइक्रो, वॉल्यूम। 4, नहीं। 6, पीपी. 6-2</ref> इस शब्द का प्रयोग आमतौर पर [[कंप्यूटर|कंप्यूटर सिस्टम]] का वर्णन करने के लिए किया जाता है, जिसे कम या ज्यादा पूरी तरह से चालू रखने के लिए डिज़ाइन किया गया है, शायद, कुछ आंशिक विफलता की स्थिति में  प्रवाह क्षमतामें कमी या [[ प्रतिक्रिया समय (प्रौद्योगिकी) में वृद्धि |प्रतिक्रिया समय में वृद्धि होती है]]। अर्थात्,[[ कंप्यूटर हार्डवेयर | हार्डवेयर]] या सॉफ़्टवेयर में समस्याओं के कारण संपूर्ण रूप से सिस्टम बंद नहीं होता है। एक अन्य क्षेत्र में एक उदाहरण एक मोटर वाहन है जिसे डिज़ाइन किया गया है, इसलिए यदि टायरों में से एक पंचर हो गया है, या एक संरचना जो थकान, जंग, निर्माण दोष, या प्रभाव जैसे कारणों से होने वाली क्षति की उपस्थिति में अपनी अखंडता बनाए रखने में सक्षम हो, तो इसे चलाना जारी रहेगा।


एक ''व्यक्तिगत'' प्रणाली के दायरे में, असाधारण परिस्थितियों का अनुमान लगाकर और उनसे निपटने के लिए प्रणाली का निर्माण करके दोष सहिष्णुता प्राप्त की जा सकती है, और सामान्य तौर पर,[[ आत्म-स्थिरीकरण |आत्म-स्थिरीकरण]] का लक्ष्य है कि सिस्टम एक त्रुटि मुक्त स्थिति की ओर परिवर्तित हो जाए। हालांकि,यदि सिस्टम विफलता के परिणाम विनाशकारी हैं, या इसे पर्याप्त रूप से विश्वसनीय बनाने की लागत बहुत अधिक है, तो किसी प्रकार के दोहराव का उपयोग करना बेहतर समाधान हो सकता है। किसी भी मामले में, यदि सिस्टम की विफलता का परिणाम इतना भयावह है, तो सिस्टम को सुरक्षित मोड में वापस आने के लिए रिवर्सन का उपयोग करने में सक्षम होना चाहिए। यह रोल-बैक रिकवरी के समान है, लेकिन यदि मानव लूप में मौजूद हैं तो यह एक मानवीय क्रिया हो सकती है।
एक ''व्यक्तिगत'' प्रणाली के दायरे में, असाधारण परिस्थितियों का अनुमान लगाकर और उनसे निपटने के लिए प्रणाली का निर्माण करके दोष सहिष्णुता प्राप्त की जा सकती है, और सामान्य तौर पर,[[ आत्म-स्थिरीकरण |आत्म-स्थिरीकरण]] का लक्ष्य है कि सिस्टम एक त्रुटि मुक्त स्थिति की ओर परिवर्तित हो जाए। हालांकि,यदि सिस्टम विफलता के परिणाम विनाशकारी हैं, या इसे पर्याप्त रूप से विश्वसनीय बनाने की लागत बहुत अधिक है, तो किसी प्रकार के दोहराव का उपयोग करना बेहतर समाधान हो सकता है। किसी भी मामले में, यदि सिस्टम की विफलता का परिणाम इतना भयावह है, तो सिस्टम को सुरक्षित मोड में वापस आने के लिए रिवर्सन का उपयोग करने में सक्षम होना चाहिए। यह रोल-बैक रिकवरी के समान है, लेकिन यदि मानव लूप में मौजूद हैं तो यह एक मानवीय क्रिया हो सकती है।


== इतिहास ==
== इतिहास ==
पहला ज्ञात दोष-सहिष्णु('''फॉल्ट टॉलरेंस)''' कंप्यूटर [[ SAPO (कंप्यूटर) | SAPO]] था,जिसे 1951 में चेकोस्लोवाकिया में एंटोनिन स्वोबोडा द्वारा बनाया गया था।<ref name="computer-structures">{{cite book|url=https://archive.org/details/computerstructur01siew|title=Computer Structures: Principles and Examples|author1=Daniel P. Siewiorek|author2=C. Gordon Bell|author3=Allen Newell|publisher=[[McGraw-Hill]]|year=1982|isbn=0-07-057302-6|url-access=registration}}</ref>{{rp|155}} इसका मूल डिजाइन चुंबकीय ड्रम था जो रिले के माध्यम से जुड़ा हुआ था, जिसमें स्मृति त्रुटि का पता लगाने की मतदान पद्धति (ट्रिपल मॉड्यूलर रिडंडेंसी) थी। इस लाइन के साथ कई अन्य मशीनें विकसित की गईं, जो ज्यादातर सैन्य उपयोग के लिए थीं। आखिरकार, वे तीन अलग-अलग श्रेणियों में विभाजित हो गए: मशीनें जो बिना किसी रखरखाव के लंबे समय तक चलेंगी, जैसे कि [[ नासा |नासा]] [[ अंतरिक्ष जांच |अंतरिक्ष जांच]] और [[ उपग्रह |उपग्रह]] पर उपयोग की जाने वाली मशीनें; ऐसे कंप्यूटर जो बहुत भरोसेमंद थे लेकिन उन्हें निरंतर निगरानी की आवश्यकता थी, जैसे कि [[ परमाणु ऊर्जा संयंत्र |परमाणु ऊर्जा संयंत्र]] या [[ कोलाइडर |सुपरकोलाइडर]] प्रयोगों की निगरानी और नियंत्रण के लिए उपयोग किए जाने वाले कंप्यूटर; और अंत में, उच्च मात्रा में रनटाइम वाले कंप्यूटर जो भारी उपयोग में होंगे, जैसे कि [[ बीमा कंपनियों |बीमा कंपनियों]] द्वारा उनकी सम्भाविकी निगरानी के लिए उपयोग किए जाने वाले कई सुपर कंप्यूटर।
पहला ज्ञात दोष-सहिष्णु('''फॉल्ट टॉलरेंस)''' कंप्यूटर ([[ SAPO (कंप्यूटर) |SAPO]]) था,जिसे 1951 में चेकोस्लोवाकिया में एंटोनिन स्वोबोडा द्वारा बनाया गया था।<ref name="computer-structures">{{cite book|url=https://archive.org/details/computerstructur01siew|title=Computer Structures: Principles and Examples|author1=Daniel P. Siewiorek|author2=C. Gordon Bell|author3=Allen Newell|publisher=[[McGraw-Hill]]|year=1982|isbn=0-07-057302-6|url-access=registration}}</ref>{{rp|155}} इसका मूल डिजाइन मेमोरी एरर डिटेक्शन ( ट्रिपल मॉड्यूलर रिडंडेंसी ) की वोटिंग विधि के साथ रिले के माध्यम से जुड़े चुंबकीय ड्रम थे। इस लाइन के साथ कई अन्य मशीनें विकसित की गईं, जो ज्यादातर सैन्य उपयोग के लिए थीं। आखिरकार, वे तीन अलग-अलग श्रेणियों में विभाजित हो गए: मशीनें जो बिना किसी रखरखाव के लंबे समय तक चलेंगी, जैसे कि [[ नासा |नासा]] [[ अंतरिक्ष जांच |अंतरिक्ष जांच]] और [[ उपग्रह |उपग्रह]] पर उपयोग की जाने वाली मशीनें; ऐसे कंप्यूटर जो बहुत भरोसेमंद थे लेकिन उन्हें निरंतर निगरानी की आवश्यकता थी, जैसे कि [[ परमाणु ऊर्जा संयंत्र |परमाणु ऊर्जा संयंत्र]] या [[ कोलाइडर |सुपरकोलाइडर]] प्रयोगों की निगरानी और नियंत्रण के लिए उपयोग किए जाने वाले कंप्यूटर; और अंत में, उच्च मात्रा में रनटाइम वाले कंप्यूटर जो भारी उपयोग में होंगे, जैसे कि [[ बीमा कंपनियों |बीमा कंपनियों]] द्वारा उनकी सम्भाविकी निगरानी के लिए उपयोग किए जाने वाले कई सुपर कंप्यूटर।


तथाकथित LLNM (लॉन्ग लाइफ,नो मेंटेनेंस) कंप्यूटिंग में अधिकांश विकास 1960 के दशक में[[ प्रोजेक्ट अपोलो | अपोलो योजना]] और अन्य शोध पहलुओं की तैयारी के दौरान किया गया था।<ref>{{cite web|url=https://www.computer.org/csdl/proceedings/ftcsh/1995/7150/00/00532604.pdf|title=The STAR (Self-Testing And Repairing) Computer: An Investigation Of the Theory and Practice Of Fault-tolerant Computer Design|author1=Algirdas Avižienis|author2=George C. Gilley|author3=Francis P. Mathur|author4=David A. Rennels|author5=John A. Rohr|author6=David K. Rubin}}</ref> पहली मशीन [[ अंतरिक्ष वेधशाला |अंतरिक्ष प्रेक्षणगृह]] में गई और उनका दूसरा प्रयास JSTAR कंप्यूटर,समुद्रयात्रा में इस्तेमाल किया गया। मेमोरी रिकवरी विधियों का उपयोग करने के लिए इस कंप्यूटर में मेमोरी सरणियों का बैकअप था और इस प्रकार इसे जेपीएल सेल्फ-टेस्टिंग-एंड-रिपेयरिंग कंप्यूटर कहा जाता था। यह अपनी स्वयं की त्रुटियों का पता लगा सकता है और उन्हें ठीक कर सकता है या आवश्यकतानुसार अनावश्यक मॉड्यूल ला सकता है। 2022 की शुरुआत तक कंप्यूटर अभी भी काम कर रहा है।<ref>{{Cite web|title=Voyager Mission state (more often than not at least three months out of date) |url=https://voyager.jpl.nasa.gov/mission/weekly-reports/|access-date=2022-04-01|website=NASA|language=en}}</ref>
तथाकथित LLNM (लॉन्ग लाइफ,नो मेंटेनेंस) कंप्यूटिंग में अधिकांश विकास 1960 के दशक में[[ प्रोजेक्ट अपोलो | अपोलो योजना]] और अन्य शोध पहलुओं की तैयारी के दौरान किया गया था।<ref>{{cite web|url=https://www.computer.org/csdl/proceedings/ftcsh/1995/7150/00/00532604.pdf|title=The STAR (Self-Testing And Repairing) Computer: An Investigation Of the Theory and Practice Of Fault-tolerant Computer Design|author1=Algirdas Avižienis|author2=George C. Gilley|author3=Francis P. Mathur|author4=David A. Rennels|author5=John A. Rohr|author6=David K. Rubin}}</ref> पहली मशीन [[ अंतरिक्ष वेधशाला |अंतरिक्ष प्रेक्षणगृह]] में गई और उनका दूसरा प्रयास JSTAR कंप्यूटर,समुद्रयात्रा में इस्तेमाल किया गया। मेमोरी रिकवरी विधियों का उपयोग करने के लिए इस कंप्यूटर में मेमोरी सरणियों का बैकअप था और इस प्रकार इसे जेपीएल सेल्फ-टेस्टिंग-एंड-रिपेयरिंग कंप्यूटर कहा जाता था। यह अपनी स्वयं की त्रुटियों का पता लगा सकता है और उन्हें ठीक कर सकता है या आवश्यकतानुसार अनावश्यक मॉड्यूल ला सकता है। 2022 की शुरुआत तक कंप्यूटर अभी भी काम कर रहा है।<ref>{{Cite web|title=Voyager Mission state (more often than not at least three months out of date) |url=https://voyager.jpl.nasa.gov/mission/weekly-reports/|access-date=2022-04-01|website=NASA|language=en}}</ref>


हाइपर-डिपेंडेबल कंप्यूटरों का संचालन ज्यादातर [[ विमान |विमान]] निर्माताओं,परमाणु ऊर्जा कंपनियों और रेल उद्योग द्वारा किया गया था।<ref name="computer-structures"/>{{rp|210}} इन्हें भारी मात्रा में अपटाइम वाले कंप्यूटरों की आवश्यकता थी जो इस तथ्य पर भरोसा करते हुए कि कंप्यूटर आउटपुट को लगातार मनुष्यों द्वारा दोषों का पता लगाने के लिए मॉनिटर किया जाएगा। फिर से,आईबीएम (IBM) ने [[ सैटर्न वी |सैटर्न वी]] रॉकेट के मार्गदर्शन के लिए इस तरह का पहला कंप्यूटर विकसित किया, लेकिन बाद में  [[ बीएनएसएफ | बीएनएसएफ( BNSF)]], [[ यूनिसिस |यूनिसिस]] और [[ जनरल इलेक्ट्रिक |जनरल इलेक्ट्रिक]] ने अपना खुद का कंप्यूटर बनाया।<ref name="computer-structures"/>{{rp|223}}
हाइपर-डिपेंडेबल कंप्यूटरों का संचालन ज्यादातर [[ विमान |विमान]] निर्माताओं,[https://en.wikipedia.org/wiki/Nuclear_power|'''परमाणु ऊर्जा'''] कंपनियों और रेल उद्योग द्वारा किया गया था।<ref name="computer-structures"/>{{rp|210}} इन्हें भारी मात्रा में अपटाइम वाले कंप्यूटरों की आवश्यकता थी जो इस तथ्य पर भरोसा करते हुए कि कंप्यूटर आउटपुट को लगातार मनुष्यों द्वारा दोषों का पता लगाने के लिए मॉनिटर किया जाएगा। फिर से,आईबीएम (IBM) ने [[ सैटर्न वी |सैटर्न वी]] रॉकेट के मार्गदर्शन के लिए इस तरह का पहला कंप्यूटर विकसित किया, लेकिन बाद में  [[ बीएनएसएफ | बीएनएसएफ( BNSF)]], [[ यूनिसिस |यूनिसिस]] और [[ जनरल इलेक्ट्रिक |जनरल इलेक्ट्रिक]] ने अपना खुद का कंप्यूटर बनाया।<ref name="computer-structures"/>{{rp|223}}


1970 के दशक में इस क्षेत्र में बहुत काम हुआ है,<ref>{{cite journal |author-first1=Brian |author-last=Randell |author-link1=Brian Randell |author-first2=P.A. |author-last2=Lee |author-first3=P. C. |author-last3=Treleaven |title=Reliability Issues in Computing System Design | journal = [[ACM Computing Surveys]] | pages=123–165 | volume =10 | issue = 2 |date=June 1978 | url = http://portal.acm.org/citation.cfm?id=356729&coll=&dl=ACM&CFID=15151515&CFTOKEN=6184618 |doi=10.1145/356725.356729 |s2cid=16909447 | issn= 0360-0300 }}</ref><ref>{{उद्धरण जर्नल |  लेखक = पी. जे. डेनिंग |  लेखक-लिंक = पी. जे. डेनिंग |  शीर्षक = दोष सहिष्णु ऑपरेटिंग सिस्टम |  जर्नल = एसीएम कम्प्यूटिंग सुरveys |  पेज=359–389 |  वॉल्यूम =8 |  अंक = 4 |  तारीख=दिसंबर 1976 |  यूआरएल = http://portal.acm.org/citation.cfm?id=356680&dl=ACM&coll=&CFID=15151515&CFTOKEN=6184618 |  doi =10.1145/356678.356680 |  s2cid=207736773 |  issn= 0360-0300}</ref><ref>{{cite journal | author= Theodore A. Linden |title=Operating System Structures to Support Security and Reliable Software | journal = ACM Computing Surveys | pages=409–445 | volume =8 | issue = 4 |date=December 1976 | url = http://portal.acm.org/citation.cfm?id=356682&coll=&dl=ACM&CFID=15151515&CFTOKEN=6184618 |doi=10.1145/356678.356682 | issn= 0360-0300 | hdl=2027/mdp.39015086560037 |s2cid=16720589 | hdl-access=free }}</ref> उदाहरण के लिए, [[ एफ14 सीएडीसी |एफ14 सीएडीसी]] में[[ अंतर्निर्मित आत्म-परीक्षण ]] किया गया था।<ref>
1970 के दशक में इस क्षेत्र में बहुत काम हुआ है,<ref>{{cite journal |author-first1=Brian |author-last=Randell |author-link1=Brian Randell |author-first2=P.A. |author-last2=Lee |author-first3=P. C. |author-last3=Treleaven |title=Reliability Issues in Computing System Design | journal = [[ACM Computing Surveys]] | pages=123–165 | volume =10 | issue = 2 |date=June 1978 | url = http://portal.acm.org/citation.cfm?id=356729&coll=&dl=ACM&CFID=15151515&CFTOKEN=6184618 |doi=10.1145/356725.356729 |s2cid=16909447 | issn= 0360-0300 }}</ref><ref>{{उद्धरण जर्नल |  लेखक = पी. जे. डेनिंग |  लेखक-लिंक = पी. जे. डेनिंग |  शीर्षक = दोष सहिष्णु ऑपरेटिंग सिस्टम |  जर्नल = एसीएम कम्प्यूटिंग सुरveys |  पेज=359–389 |  वॉल्यूम =8 |  अंक = 4 |  तारीख=दिसंबर 1976 |  यूआरएल = http://portal.acm.org/citation.cfm?id=356680&dl=ACM&coll=&CFID=15151515&CFTOKEN=6184618 |  doi =10.1145/356678.356680 |  s2cid=207736773 |  issn= 0360-0300}</ref><ref>{{cite journal | author= Theodore A. Linden |title=Operating System Structures to Support Security and Reliable Software | journal = ACM Computing Surveys | pages=409–445 | volume =8 | issue = 4 |date=December 1976 | url = http://portal.acm.org/citation.cfm?id=356682&coll=&dl=ACM&CFID=15151515&CFTOKEN=6184618 |doi=10.1145/356678.356682 | issn= 0360-0300 | hdl=2027/mdp.39015086560037 |s2cid=16720589 | hdl-access=free }}</ref> उदाहरण के लिए, [[ एफ14 सीएडीसी |एफ14 सीएडीसी]] में[[ अंतर्निर्मित आत्म-परीक्षण ]] किया गया था।<ref>
Line 31: Line 30:


[[ टैंडेम कंप्यूटर्स |  टेंडेम]] और [[ स्ट्रैटस टेक्नोलॉजीज |स्ट्रैटस]] [[ ऑनलाइन ट्रांजेक्शन प्रोसेसिंग |ऑनलाइन लेनदेन प्रोसेसिंग]] के लिए दोष-सहनशील कंप्यूटर सिस्टम के डिजाइन में विशेषज्ञता वाली पहली कंपनियों में से थे।
[[ टैंडेम कंप्यूटर्स |  टेंडेम]] और [[ स्ट्रैटस टेक्नोलॉजीज |स्ट्रैटस]] [[ ऑनलाइन ट्रांजेक्शन प्रोसेसिंग |ऑनलाइन लेनदेन प्रोसेसिंग]] के लिए दोष-सहनशील कंप्यूटर सिस्टम के डिजाइन में विशेषज्ञता वाली पहली कंपनियों में से थे।
== उदाहरण ==
== उदाहरण ==
[[File:Twitter M2 mobile website.png|thumb|M2 मोबाइल वेब, ट्विटर का मूल मोबाइल वेब फ्रंट एंड, बाद में दिसंबर 2020 तक  [[ क्लाइंट (कंप्यूटिंग) |  क्लाइंट ]] के लिए बिना जावास्क्रिप्ट सपोर्ट और/या असंगत ब्राउज़र के फॉलबैक लीगेसी वर्जन के रूप में कार्य किया। ]]
[[File:Twitter M2 mobile website.png|thumb|M2 मोबाइल वेब, ट्विटर का मूल मोबाइल वेब फ्रंट एंड, बाद में दिसंबर 2020 तक  [[ क्लाइंट (कंप्यूटिंग) |  क्लाइंट ]] के लिए बिना जावास्क्रिप्ट सपोर्ट और/या असंगत ब्राउज़र के फॉलबैक लीगेसी वर्जन के रूप में कार्य किया। ]]
Line 40: Line 38:
[[ विफल-सुरक्षित | विफल-सुरक्षित]] आर्किटेक्चर में कंप्यूटर सॉफ़्टवेयर भी शामिल हो सकता है, उदाहरण के लिए प्रक्रिया [[ प्रतिकृति (कंप्यूटर विज्ञान) |प्रतिकृति]] द्वारा।
[[ विफल-सुरक्षित | विफल-सुरक्षित]] आर्किटेक्चर में कंप्यूटर सॉफ़्टवेयर भी शामिल हो सकता है, उदाहरण के लिए प्रक्रिया [[ प्रतिकृति (कंप्यूटर विज्ञान) |प्रतिकृति]] द्वारा।


डेटा स्वरूपों को भी नष्ट करने के लिए डिज़ाइन किया जा सकता है। उदाहरण के लिए [[ एचटीएमएल | एचटीएमएल (HTML)]], को ऐसे डिज़ाइन किया गया है,जिससे  [[ वेब ब्राउज़र ]]दस्तावेज़ को अनुपयोगी किए बिना नए और असमर्थित एचटीएमएल (HTML)  इकाइयों को अनदेखा करने की इजाजत देता है। इसके अतिरिक्त, कुछ साइटें, जिनमें ट्विटर (Twitter) (दिसंबर 2020 तक) जैसे लोकप्रिय प्लेटफॉर्म शामिल हैं, जो [[ जावास्क्रिप्ट |जावास्क्रिप्ट(JavaScript)]] पर निर्भर नहीं है और इसमें  [[ अतिसूक्ष्मवाद (कंप्यूटिंग) |न्यूनतम]] लेआउट है, जिसमे व्यापक उपलब्धता और पहुँच है,जैसे सीमित वेब ब्राउज़िंग क्षमताओं के साथ कार्य ढाँचा।<ref>{{Cite web|title=Why your website should work without JavaScript.|url=https://dev.to/shadowfaxrodeo/why-your-website-should-work-without-javascript-3kko|access-date=2021-05-16|website=DEV Community|language=en}}</ref><ref>{{Cite web|last=Fairfax|first=Zackerie|date=2020-11-28|title=Legacy Twitter Shutdown Means You Can't Tweet From The 3DS Anymore|url=https://screenrant.com/twitter-legacy-nintendo-3ds-shut-down-date-december-2020/|url-status=live|access-date=2021-07-01|website=[[ScreenRant]]|language=en-US}}</ref>
डेटा स्वरूपों को भी नष्ट करने के लिए डिज़ाइन किया जा सकता है। उदाहरण के लिए [https://en.wikipedia.org/wiki/HTML|'''एचटीएमएल (HTML)'''], को ऐसे डिज़ाइन किया गया है,जिससे  [[ वेब ब्राउज़र ]]दस्तावेज़ को अनुपयोगी किए बिना नए और असमर्थित एचटीएमएल (HTML)  इकाइयों को अनदेखा करने की इजाजत देता है। इसके अतिरिक्त, कुछ साइटें, जिनमें ट्विटर (Twitter) (दिसंबर 2020 तक) जैसे लोकप्रिय प्लेटफॉर्म शामिल हैं, जो [[ जावास्क्रिप्ट |जावास्क्रिप्ट(JavaScript)]] पर निर्भर नहीं है और इसमें  [[ अतिसूक्ष्मवाद (कंप्यूटिंग) |न्यूनतम]] लेआउट है, जिसमे व्यापक उपलब्धता और पहुँच है,जैसे सीमित वेब ब्राउज़िंग क्षमताओं के साथ कार्य ढाँचा।<ref>{{Cite web|title=Why your website should work without JavaScript.|url=https://dev.to/shadowfaxrodeo/why-your-website-should-work-without-javascript-3kko|access-date=2021-05-16|website=DEV Community|language=en}}</ref><ref>{{Cite web|last=Fairfax|first=Zackerie|date=2020-11-28|title=Legacy Twitter Shutdown Means You Can't Tweet From The 3DS Anymore|url=https://screenrant.com/twitter-legacy-nintendo-3ds-shut-down-date-december-2020/|url-status=live|access-date=2021-07-01|website=[[ScreenRant]]|language=en-US}}</ref>


== शब्दावली ==
== शब्दावली ==
Line 52: Line 50:
एक प्रणाली जिसे ग्रेसफुल डिग्रेडेशन का अनुभव करने के लिए डिज़ाइन किया गया है, या '''सॉफ्ट विफल '''(कंप्यूटिंग में उपयोग किया जाता है, असफल सुरक्षित के समान<ref>स्टालिंग्स, डब्ल्यू (2009): ऑपरेटिंग सिस्टम। आंतरिक और डिजाइन सिद्धांत '', छठा संस्करण</ref>) कुछ घटक विफलताओं के बाद प्रदर्शन के कम स्तर पर काम करता है। उदाहरण के लिए, एक इमारत कम स्तर पर प्रकाश और कम गति पर लिफ्ट संचालित कर सकती है यदि ग्रिड पावर विफल हो जाती है, तो लोगों को पूरी तरह से अंधेरे में फंसाने के बजाय पूरी शक्ति से काम करना जारी रखता है। ग्रेसफुल डिग्रेडेशन के एक उदाहरण की गणना में यह है कि यदि ऑनलाइन वीडियो स्ट्रीम करने के लिए अपर्याप्त नेटवर्क बैंडविड्थ उपलब्ध है, तो उच्च-रिज़ॉल्यूशन संस्करण के स्थान पर कम-रिज़ॉल्यूशन संस्करण को स्ट्रीम किया जा सकता है। [[ प्रोग्रेसिव एन्हांसमेंट |प्रोग्रेसिव एन्हांसमेंट]] कंप्यूटिंग में एक उदाहरण है, जहां वेब पेज पुराने, छोटे स्क्रीन या सीमित क्षमता वाले वेब ब्राउज़र के लिए एक बुनियादी कार्यात्मक प्रारूप में उपलब्ध हैं, लेकिन अतिरिक्त तकनीकों को संभालने में सक्षम ब्राउज़रों के लिए एक उन्नत संस्करण में उपलब्ध हैं या बड़े डिस्प्ले वाले ब्राउज़र में उपलब्ध हैं।
एक प्रणाली जिसे ग्रेसफुल डिग्रेडेशन का अनुभव करने के लिए डिज़ाइन किया गया है, या '''सॉफ्ट विफल '''(कंप्यूटिंग में उपयोग किया जाता है, असफल सुरक्षित के समान<ref>स्टालिंग्स, डब्ल्यू (2009): ऑपरेटिंग सिस्टम। आंतरिक और डिजाइन सिद्धांत '', छठा संस्करण</ref>) कुछ घटक विफलताओं के बाद प्रदर्शन के कम स्तर पर काम करता है। उदाहरण के लिए, एक इमारत कम स्तर पर प्रकाश और कम गति पर लिफ्ट संचालित कर सकती है यदि ग्रिड पावर विफल हो जाती है, तो लोगों को पूरी तरह से अंधेरे में फंसाने के बजाय पूरी शक्ति से काम करना जारी रखता है। ग्रेसफुल डिग्रेडेशन के एक उदाहरण की गणना में यह है कि यदि ऑनलाइन वीडियो स्ट्रीम करने के लिए अपर्याप्त नेटवर्क बैंडविड्थ उपलब्ध है, तो उच्च-रिज़ॉल्यूशन संस्करण के स्थान पर कम-रिज़ॉल्यूशन संस्करण को स्ट्रीम किया जा सकता है। [[ प्रोग्रेसिव एन्हांसमेंट |प्रोग्रेसिव एन्हांसमेंट]] कंप्यूटिंग में एक उदाहरण है, जहां वेब पेज पुराने, छोटे स्क्रीन या सीमित क्षमता वाले वेब ब्राउज़र के लिए एक बुनियादी कार्यात्मक प्रारूप में उपलब्ध हैं, लेकिन अतिरिक्त तकनीकों को संभालने में सक्षम ब्राउज़रों के लिए एक उन्नत संस्करण में उपलब्ध हैं या बड़े डिस्प्ले वाले ब्राउज़र में उपलब्ध हैं।


[[ दोष-सहनशील कंप्यूटर सिस्टम | दोष-सहनशील कंप्यूटर सिस्टम]] में, महत्वपूर्ण माने जाने वाले प्रोग्राम पूरी तरह से क्रैश होने के बजाय त्रुटि,अपवाद या अमान्य इनपुट के बावजूद संचालन जारी रखने के लिए डिज़ाइन किए गए हैं। [[ सॉफ्टवेयर भंगुरता |सॉफ्टवेयर भंगुरता]] मजबूती के विपरीत है। [[ लचीलापन (नेटवर्क) |लचीला नेटवर्क]] कुछ लिंक या नोड्स की विफलता के बावजूद डेटा संचारित करना जारी रखता है; इसी तरह[[ लचीलापन (इंजीनियरिंग और निर्माण) | लचीला भवन और बुनियादी ढाँचा]] से भूकंप, बाढ़, या टकराव जैसी स्थितियों में पूर्ण विफलता को रोकने की उम्मीद की जाती है।
[[ दोष-सहनशील कंप्यूटर सिस्टम | दोष-सहनशील कंप्यूटर सिस्टम]] में, महत्वपूर्ण माने जाने वाले प्रोग्राम पूरी तरह से क्रैश होने के बजाय त्रुटि,अपवाद या अमान्य इनपुट के बावजूद संचालन जारी रखने के लिए डिज़ाइन किए गए हैं। [[सॉफ्टवेयर]] भंगुरता मजबूती के विपरीत है। [[ लचीलापन (नेटवर्क) |लचीला नेटवर्क]] कुछ लिंक या नोड्स की विफलता के बावजूद डेटा संचारित करना जारी रखता है; इसी तरह[[ लचीलापन (इंजीनियरिंग और निर्माण) | लचीला भवन और बुनियादी ढाँचा]] से भूकंप, बाढ़, या टकराव जैसी स्थितियों में पूर्ण विफलता को रोकने की उम्मीद की जाती है।


उच्च [[ विफलता पारदर्शिता |विफलता पारदर्शिता]] के साथ एक प्रणाली उपयोगकर्ताओं को सचेत करेगी कि एक घटक विफलता हुई है, भले ही वह पूर्ण प्रदर्शन के साथ काम करना जारी रखे, ताकि विफलता की मरम्मत की जा सके या आसन्न पूर्ण विफलता प्रत्याशित हो।<ref>{{cite arXiv|last=Thampi|first=Sabu M.|date=2009-11-23|title=Introduction to Distributed Systems|class=cs.DC|eprint=0911.4395}}</ref> इसी तरह, एक [[ फेल-फास्ट |फेल-फास्ट]] घटक को विफलता के पहले बिंदु पर रिपोर्ट करने के लिए डिज़ाइन किया गया है, बजाय इसके कि डाउनस्ट्रीम घटकों को विफल होने और रिपोर्ट उत्पन्न करने की अनुमति दी जाए। यह अंतर्निहित समस्या का आसान निदान करने की अनुमति देता है, और विघटित स्थिति में अनुचित संचालन को रोक सकता है।
उच्च [[ विफलता पारदर्शिता |विफलता पारदर्शिता]] के साथ एक प्रणाली उपयोगकर्ताओं को सचेत करेगी कि एक घटक विफलता हुई है, भले ही वह पूर्ण प्रदर्शन के साथ काम करना जारी रखे, ताकि विफलता की मरम्मत की जा सके या आसन्न पूर्ण विफलता प्रत्याशित हो।<ref>{{cite arXiv|last=Thampi|first=Sabu M.|date=2009-11-23|title=Introduction to Distributed Systems|class=cs.DC|eprint=0911.4395}}</ref> इसी तरह, एक [[ फेल-फास्ट |फेल-फास्ट]] घटक को विफलता के पहले बिंदु पर रिपोर्ट करने के लिए डिज़ाइन किया गया है, बजाय इसके कि डाउनस्ट्रीम घटकों को विफल होने और रिपोर्ट उत्पन्न करने की अनुमति दी जाए। यह अंतर्निहित समस्या का आसान निदान करने की अनुमति देता है, और विघटित स्थिति में अनुचित संचालन को रोक सकता है।


=== सिंगल फॉल्ट कंडीशन ===
=== सिंगल फॉल्ट कंडीशन ===
सिंगल फॉल्ट एक ऐसी स्थिति है जहां [[ सुरक्षा तंत्र |सुरक्षा]] के लिए [[ खतरे |खतरे]] के खिलाफ एक साधन दोषपूर्ण है। यदि सिंगल फॉल्ट की स्थिति अपरिहार्य रूप से एक और एकल गलती की स्थिति में होती है, तो दो विफलताओं को एक एकल दोष स्थिति के रूप में माना जाता है।<ref>{{cite web|url=http://grouper.ieee.org/groups/1461/glossary.htm |title=Control |website=Grouper.ieee.org |archive-url=https://web.archive.org/web/19991008210224/http://grouper.ieee.org/groups/1461/glossary.htm |access-date=2016-04-06|archive-date=1999-10-08 }}</ref> एक स्रोत निम्नलिखित उदाहरण प्रस्तुत करता है:
सिंगल फॉल्ट की स्थिति एक ऐसी स्थिति है जहां किसी खतरे से बचाव का माध्यम दोषपूर्ण होता है।। यदि सिंगल फॉल्ट की स्थिति अपरिहार्य रूप से एक और एकल गलती की स्थिति में होती है, तो दो विफलताओं को एक एकल दोष स्थिति के रूप में माना जाता है।<ref>{{cite web|url=http://grouper.ieee.org/groups/1461/glossary.htm |title=Control |website=Grouper.ieee.org |archive-url=https://web.archive.org/web/19991008210224/http://grouper.ieee.org/groups/1461/glossary.htm |access-date=2016-04-06|archive-date=1999-10-08 }}</ref> एक स्रोत निम्नलिखित उदाहरण प्रस्तुत करता है:
 
{{quote|A ''single-fault condition'' is a condition when a single means for protection against hazard in equipment is defective or a single external abnormal condition is present, e.g. short circuit between the live parts and the applied part.<ref>Baha Al-Shaikh, Simon G. Stacey, ''Essentials of Equipment in Anaesthesia, Critical Care, and Peri-Operative Medicine'' (2017), p. 247.</ref>}}


==मानदंड==
==मानदंड==
Line 77: Line 73:


== आवश्यकताएँ ==
== आवश्यकताएँ ==
दोष सहिष्णुता की बुनियादी विशेषताओं की आवश्यकता है:
दोष सहिष्णुता को बुनियादी विशेषताओं की आवश्यकता है:
# नहीं  [[ विफलता का एकल बिंदु ]] - यदि कोई सिस्टम विफलता का अनुभव करता है, तो उसे मरम्मत प्रक्रिया के दौरान बिना किसी रुकावट के काम करना जारी रखना चाहिए।
# [[ विफलता का एकल बिंदु |'''विफलता का कोई एकल बिंदु नहीं''']] - यदि कोई सिस्टम विफलता का अनुभव करता है, तो उसे मरम्मत प्रक्रिया के दौरान बिना किसी रुकावट के काम करना जारी रखना चाहिए।
#  [[ फॉल्ट आइसोलेशन ]] फेलिंग कंपोनेंट के लिए - जब कोई विफलता होती है, तो सिस्टम को विफल घटक को अलग करने में सक्षम होना चाहिए। इसके लिए समर्पित विफलता पहचान तंत्र को जोड़ने की आवश्यकता है जो केवल दोष अलगाव के उद्देश्य से मौजूद है। एक गलती की स्थिति से वसूली के लिए गलती या असफल घटक को वर्गीकृत करने की आवश्यकता होती है। [[ राष्ट्रीय मानक और प्रौद्योगिकी संस्थान ]] (एनआईएसटी) इलाके, कारण, अवधि और प्रभाव के आधार पर दोषों को वर्गीकृत करता है{{Where|date=June 2017}}{{clarify|date=June 2017}}
#  [[ फॉल्ट आइसोलेशन | '''विफल घटक के लिए दोष अलग करना''']] - जब कोई विफलता होती है,तो सिस्टम को विफल घटक को अलग करने में सक्षम होना चाहिए। इसके लिए विफलता पहचान तंत्र को जोड़ने की आवश्यकता है जो केवल त्रुटि अलग करने के उद्देश्य से मौजूद है। एक त्रुटि की स्थिति मे असफल घटक को वर्गीकृत करने की आवश्यकता होती है। [[ राष्ट्रीय मानक और प्रौद्योगिकी संस्थान |राष्ट्रीय मानक और प्रौद्योगिकी संस्थान]] ('''NIST)''' स्थिति, कारण, अवधि और प्रभाव के आधार पर त्रुटियो को वर्गीकृत करता है।{{clarify}}
# विफलता के प्रसार को रोकने के लिए दोष नियंत्रण - कुछ विफलता तंत्र बाकी सिस्टम में विफलता का प्रचार करके सिस्टम को विफल कर सकते हैं। इस तरह की विफलता का एक उदाहरण दुष्ट ट्रांसमीटर है जो एक सिस्टम में वैध संचार को दलदल कर सकता है और समग्र सिस्टम विफलता का कारण बन सकता है। [[ फ़ायरवॉल (कंप्यूटिंग) | फ़ायरवॉल ]] एस या अन्य तंत्र जो सिस्टम की सुरक्षा के लिए एक दुष्ट ट्रांसमीटर या विफल घटक को अलग करते हैं, की आवश्यकता होती है।
# '''विफलता के प्रसार को रोकने के लिए दोष नियंत्रण''' - कुछ विफल प्रक्रिया पूरे सिस्टम को विफल कर सकती हैं। इस तरह की विफलता का एक उदाहरण बेकार ट्रांसमीटर है जो एक सिस्टम में वैध संचार को प्रभावित कर सकता है और पूरे सिस्टम की विफलता का कारण बन सकता है। [[ फ़ायरवॉल (कंप्यूटिंग) |फ़ायरवॉल (Firewalls)]] या अन्य प्रक्रिया की आवश्यकता है,जो सिस्टम की सुरक्षा के लिए एक बेकार ट्रांसमीटर या विफल घटक को अलग करते हैं।
# [[ प्रत्यावर्तन (सॉफ्टवेयर विकास) | प्रत्यावर्तन मोड की उपलब्धता]{{clarify|date=June 2014}}
#  प्रत्यावर्तन प्रणाली की उपलब्धता{{clarify|date=June 2014}}


इसके अलावा, दोष-सहिष्णु प्रणालियों को नियोजित सेवा आउटेज और अनियोजित सेवा आउटेज दोनों के संदर्भ में चित्रित किया गया है। इन्हें आमतौर पर एप्लिकेशन स्तर पर मापा जाता है, न कि केवल हार्डवेयर स्तर पर। योग्यता के आंकड़े को [[ उपलब्धता ]] कहा जाता है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, [[ 5 नाइन | फाइव नाइन ]] प्रणाली सांख्यिकीय रूप से 99.999% उपलब्धता प्रदान करेगी।
इसके अलावा, दोष-सहिष्णुता ('''फॉल्ट टॉलरेंस)''' प्रणालियों को नियोजित जाँच आउटेज और अनियोजित जाँच आउटेज दोनों के संदर्भ में चित्रित किया गया है। इन्हें आमतौर पर एप्लिकेशन स्तर(application level) पर   मापा जाता है,न कि हार्डवेयर स्तर पर। योग्यता के आंकड़े को [[ उपलब्धता |उपलब्धता]] कहा जाता है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए,[[ 5 नाइन |फाइव नाइन (]]<nowiki/>five nines) प्रणाली सांख्यिकीय रूप से 99.999% उपलब्धता प्रदान करेगी।


दोष-सहिष्णु प्रणालियाँ आमतौर पर अतिरेक की अवधारणा पर आधारित होती हैं।
दोष- सहिष्णुता ('''फॉल्ट टॉलरेंस)''' प्रणालियाँ आमतौर पर अतिरेक की अवधारणा पर आधारित होती हैं।


== दोष सहिष्णुता तकनीक ==
== दोष सहिष्णुता तकनीक ==
महत्वपूर्ण प्रणालियों के लिए आवश्यक सहिष्णुता के प्रकार में अनुसंधान में बड़ी मात्रा में अंतःविषय कार्य शामिल हैं। प्रणाली जितनी अधिक जटिल होगी, उतनी ही सावधानी से सभी संभावित अंतःक्रियाओं पर विचार करना होगा और इसके लिए तैयार रहना होगा। परिवहन में उच्च मूल्य प्रणालियों के महत्व को ध्यान में रखते हुए,  [[ सार्वजनिक उपयोगिताओं ]] और सेना, अनुसंधान पर स्पर्श करने वाले विषयों का क्षेत्र बहुत व्यापक है: इसमें [[ सॉफ्टवेयर मॉडलिंग ]] और विश्वसनीयता, या [[ हार्डवेयर डिजाइन ]] जैसे स्पष्ट विषय शामिल हो सकते हैं। , [[ स्टोकेस्टिक ]] मॉडल, [[ ग्राफ सिद्धांत ]], औपचारिक या बहिष्करण तर्क, [[ समानांतर कंप्यूटिंग | समानांतर प्रसंस्करण ]], दूरस्थ  [[ डेटा ट्रांसमिशन ]], और अधिक जैसे रहस्यमय तत्वों के लिए<ref>{{cite book |title=Reliability evaluation of some fault-tolerant computer architectures |date=November 1980 |publisher=Springer-Verlag |isbn=978-3-540-10274-8}}</ref>
महत्वपूर्ण प्रणालियों के लिए अनुसंधान में बड़ी मात्रा में बहुविषयक अध्यययन शामिल हैं। प्रणाली जितनी अधिक जटिल होगी,उतनी ही सावधानी से सभी संभावित अंतःक्रियाओं पर विचार करना होगा और इसके लिए तैयार रहना होगा। परिवहन,सार्वजनिक उपयोगिताओं और सेना में उच्च-मूल्य वाली प्रणालियों के महत्व को ध्यान में रखते हुए,अनुसंधान में संबंधित विषयों का क्षेत्र बहुत विस्तृत है: इसमें [[ सॉफ्टवेयर मॉडलिंग |सॉफ्टवेयर मॉडलिंग]]( '''software modeling''')या [[ हार्डवेयर डिजाइन |हार्डवेयर डिजाइन]]('''hardware design''') जैसे स्पष्ट विषय शामिल हो सकते हैं,जैसे [[ स्टोकेस्टिक |स्टोकेस्टिक(stochastic )]] मॉडल, [[ ग्राफ सिद्धांत |ग्राफ सिद्धांत]] ,औपचारिक तर्क,[[ समानांतर कंप्यूटिंग |समानांतर प्रसंस्करण(parallel processing]]), रिमोट [[:en:Data_communication|'''डेटा ट्रांसमिशन''']],और बहुत कुछ। <ref>{{cite book |title=Reliability evaluation of some fault-tolerant computer architectures |date=November 1980 |publisher=Springer-Verlag |isbn=978-3-540-10274-8}}</ref>
 
===प्रतिकृत ===
====स्पेयर कंपोनेंट्स (अतिरिक़्त घटक) फॉल्ट टॉलरेंस की पहली मूलभूत विशेषता को तीन तरीकों से संबोधित करते हैं: ====
*  [[ प्रतिकृति (कंप्यूटर विज्ञान) |  प्रतिकृति]]: एक ही सिस्टम या सबसिस्टम के कई समान उदाहरण प्रदान करना,उन सभी के कार्यों या अनुरोधों को निर्देशित करना,और निर्दिष्ट संख्या [[ कोरम के आधार पर सही परिणाम चुनना |के आधार पर सही परिणाम चुनना।]]
*  [[ अतिरेक (इंजीनियरिंग) |  अतिरेक]]: एक ही प्रणाली के कई समान उदाहरण प्रदान करना और विफलता के मामले में शेष उदाहरणों में से एक पर स्विच करना।
* '''विविधता''': एक ही विनिर्देश के कई 'अलग' कार्यान्वयन प्रदान करना,और एक विशिष्ट कार्यान्वयन में त्रुटियों से निपटने के लिए प्रतिकृति प्रणालियों की तरह उनका उपयोग करना।
RAID 0 को छोड़कर,RAID (रेडंडान्त ऐरे ऑफ़ इनएक्सपेंसिवे डिसकस ) एक दोष-सहिष्णुता [[ डेटा स्टोरेज डिवाइस |स्टोरेज डिवाइस]](storage device) के उदाहरण हैं जो डेटा अतिरेक का उपयोग करता है।


===प्रतिकृति ===
एक [[ लॉकस्टेप (कंप्यूटिंग) |लॉकस्टेप]](lockstep) दोष-सहिष्णुता मशीन में समानांतर काम कर रहे प्रतिकृति तत्वों का उपयोग करती है। किसी भी समय, प्रत्येक तत्व की सभी प्रतिकृति एक ही अवस्था में होनी चाहिए। प्रत्येक[[ प्रतिकृति (कंप्यूटिंग) | प्रतिकृति]] को समान इनपुट(inputs) प्रदान किए जाते हैं,और समान आउटपुट(outputs) को प्रत्याशित किया जाता है। प्रतिकृति के आउटपुट(outputs) की तुलना वोटिंग सर्किट(voting circuit) का उपयोग करके की जाती है। प्रत्येक तत्व की दो प्रतिकृति वाली मशीन को [[ दोहरी मॉड्यूलर अतिरेक |दोहरी मॉड्यूलर निरर्थक]] (DMR) कहा जाता है। रिकवरी अन्य तरीकों पर निर्भर करती है जब वोटिंग सर्किट केवल गलत अवतरण का पता लगा सकता है। प्रत्येक तत्व की तीन प्रतिकृति वाली मशीन को [[ ट्रिपल मॉड्यूलर रिडंडेंसी | ट्रिपल मॉड्यूलर रिडंडेंट]] (TMR) कहा जाता है। विद्युत क्षृंखला यह निर्धारित कर सकती है कि दो-से-एक क्षृंखला देखे जाने पर कौन सी प्रतिकृति त्रुटि में है। इस मामले में, विद्युत क्षृंखला सही परिणाम आउटपुट कर सकती है,और त्रुटिपूर्ण संस्करण को हटा सकती है ।इसके बाद,त्रुटिपूर्ण प्रतिकृति आंतरिक स्थिति को अन्य दो से अलग कर विद्युत क्षृंखला को डीएमआर(DMR) मोड में बदल सकती है। इस मॉडल को किसी भी बड़ी संख्या में प्रतिकृतियों पर लागू किया जा सकता है।
स्पेयर कंपोनेंट्स फॉल्ट टॉलरेंस की पहली मूलभूत विशेषता को तीन तरीकों से संबोधित करते हैं:
[[ प्रतिकृति (कंप्यूटर विज्ञान) | प्रतिकृति ]]: एक ही प्रणाली या उपप्रणाली के कई समान उदाहरण प्रदान करना,  [[ समानांतर कंप्यूटिंग |  समानांतर ]] में उन सभी को कार्यों या अनुरोधों को निर्देशित करना, और  [[ कोरम के आधार पर सही परिणाम चुनना ]];
*  [[ अतिरेक (इंजीनियरिंग) | अतिरेक ]]: एक ही प्रणाली के कई समान उदाहरण प्रदान करना और विफलता के मामले में शेष उदाहरणों में से एक पर स्विच करना ( [[ विफलता ]]);
* विविधता: एक ही विनिर्देश के कई 'अलग' कार्यान्वयन प्रदान करना, और एक विशिष्ट कार्यान्वयन में त्रुटियों से निपटने के लिए प्रतिकृति प्रणालियों की तरह उनका उपयोग करना।
[[ RAID | RAID]] [[ RAID | के सभी कार्यान्वयन स्वतंत्र डिस्क]] के निरर्थक सरणी, RAID 0 को छोड़कर, एक दोष-सहिष्णु  [[ डेटा स्टोरेज डिवाइस |  स्टोरेज डिवाइस]] के उदाहरण हैं जो  [[ डेटा रिडंडेंसी | डेटा रिडंडेंसी]] का उपयोग करता है।


एक  [[ लॉकस्टेप (कंप्यूटिंग) |  लॉकस्टेप ]] दोष-सहिष्णु मशीन समानांतर में चल रहे प्रतिकृति तत्वों का उपयोग करती है। किसी भी समय, प्रत्येक तत्व की सभी प्रतिकृति एक ही अवस्था में होनी चाहिए। प्रत्येक  [[ प्रतिकृति (कंप्यूटिंग) | प्रतिकृति ]] को समान इनपुट प्रदान किए जाते हैं, और समान आउटपुट की अपेक्षा की जाती है। प्रतिकृति के आउटपुट की तुलना वोटिंग सर्किट का उपयोग करके की जाती है। प्रत्येक तत्व की दो प्रतिकृति वाली मशीन को  [[ दोहरी मॉड्यूलर अतिरेक |  दोहरी मॉड्यूलर निरर्थक ]] (डीएमआर) कहा जाता है। तब वोटिंग सर्किट केवल एक बेमेल का पता लगा सकता है और वसूली अन्य तरीकों पर निर्भर करती है। प्रत्येक तत्व की तीन प्रतिकृति वाली मशीन को  [[ ट्रिपल मॉड्यूलर रिडंडेंसी |  ट्रिपल मॉड्यूलर रिडंडेंट ]] (TMR) कहा जाता है। वोटिंग सर्किट यह निर्धारित कर सकता है कि दो-से-एक वोट देखे जाने पर कौन सी प्रतिकृति त्रुटि में है। इस मामले में, वोटिंग सर्किट सही परिणाम आउटपुट कर सकता है, और गलत संस्करण को त्याग सकता है। इसके बाद, गलत प्रतिकृति की आंतरिक स्थिति को अन्य दो से अलग माना जाता है, और वोटिंग सर्किट डीएमआर मोड में बदल सकता है। इस मॉडल को किसी भी बड़ी संख्या में प्रतिकृति पर लागू किया जा सकता है।
लॉकस्टेप दोष-सहिष्णुता मशीनों को आसानी से [[ सिंक्रोनाइजेशन (कंप्यूटर साइंस) |सिंक्रोनस]] (समकालिक) बनाता है, प्रतिकृति के प्रत्येक गेट के साथ घड़ी के एक ही किनारे पर परिवर्तन होता है,और प्रतिकृति के लिए घड़ियां बिल्कुल चरण में होती हैं। हालांकि,इसके बिना लॉकस्टेप सिस्टम बनाना संभव है।


[[ लॉकस्टेप (कंप्यूटिंग) |  लॉकस्टेप]] दोष-सहिष्णु मशीनें सबसे आसानी से पूरी तरह से पूरी तरह से बनाई जाती हैं  [[ सिंक्रोनाइजेशन (कंप्यूटर साइंस) | सिंक्रोनस]] , प्रत्येक प्रतिकृति के प्रत्येक गेट के साथ घड़ी के एक ही किनारे पर एक ही राज्य संक्रमण होता है, और घड़ियां प्रतिकृति बिल्कुल चरण में है। हालांकि, इस आवश्यकता के बिना लॉकस्टेप सिस्टम बनाना संभव है।
प्रतिकृतियों को [[ सिंक्रोनाइजेशन (कंप्यूटर साइंस) |सिंक्रोनस]](समकालिकता) में लाने के लिए उनकी आंतरिक संग्रहीत अवस्थाओं को समान बनाने की आवश्यकता होती है। उन्हें रीसेट की स्थिति(reset state)से शुरू किया जा सकता है। वैकल्पिक रूप से,एक प्रतिकृति की आंतरिक स्थिति को दूसरी प्रतिकृति में कॉपी किया जा सकता है।
प्रतिकृतियों को समकालिकता में लाने के लिए उनकी आंतरिक संग्रहीत अवस्थाओं को समान बनाने की आवश्यकता होती है। उन्हें एक निश्चित प्रारंभिक स्थिति से शुरू किया जा सकता है, जैसे कि रीसेट स्थिति। वैकल्पिक रूप से, एक प्रतिकृति की आंतरिक स्थिति को दूसरी प्रतिकृति में कॉपी किया जा सकता है।


डीएमआर का एक प्रकार ''' जोड़ी और अतिरिक्त ''' है। दो प्रतिकृति तत्व लॉकस्टेप में एक जोड़ी के रूप में काम करते हैं, एक वोटिंग सर्किट के साथ जो उनके संचालन के बीच किसी भी बेमेल का पता लगाता है और एक संकेत आउटपुट करता है जो दर्शाता है कि कोई त्रुटि है। एक और जोड़ी ठीक उसी तरह काम करती है। एक अंतिम सर्किट जोड़ी के आउटपुट का चयन करता है जो यह घोषणा नहीं करता है कि यह त्रुटि में है। जोड़ी और अतिरिक्त टीएमआर के तीन के बजाय चार प्रतिकृतियों की आवश्यकता होती है, लेकिन व्यावसायिक रूप से इसका उपयोग किया गया है।
डीएमआर(DMR) का एक प्रकार '''जोड़ी और अतिरिक्त''' है।दो प्रतिकृति तत्व लॉकस्टेप में एक जोड़ी के रूप में काम करते हैं,एक विद्युत क्षृंखला के संचालन में किसी गलत अवतरण का पता लगाती है और त्रुटि का संकेत देती है। दूसरी जोड़ी ठीक उसी तरह काम करती है।अंतिम क्षृंखला जोड़ी के आउटपुट का चयन करके त्रुटि की घोषणा नहीं करती है। '''जोड़ी और अतिरिक्त''' में तीन के बजाय चार प्रतिकृतियों के टीएमआर(TMR) की आवश्यकता होती है, लेकिन व्यावसायिक रूप से इसका उपयोग किया गया है।


===विफलता-अनभिज्ञ कंप्यूटिंग ===
===विफलता-अनभिज्ञ कंप्यूटिंग ===
''विफलता-अनभिज्ञ कंप्यूटिंग'' एक ऐसी तकनीक है जो [[ कंप्यूटर प्रोग्राम ]] को [[ डेटा हानि | त्रुटियों ]] के बावजूद निष्पादन जारी रखने में सक्षम बनाती है<ref>{{Cite journal|last1=Herzberg|first1=Amir|last2=Shulman|first2=Haya|date=2012|title=Oblivious and Fair Server-Aided Two-Party Computation|url=http://dx.doi.org/10.1109/ares.2012.28|journal=2012 Seventh International Conference on Availability, Reliability and Security|pages=75–84|publisher=IEEE|doi=10.1109/ares.2012.28|isbn=978-1-4673-2244-7|s2cid=6579295}}</ref> तकनीक को विभिन्न संदर्भों में लागू किया जा सकता है। सबसे पहले, यह प्रोग्राम में निर्मित मूल्य लौटाकर अमान्य मेमोरी रीड को संभाल सकता है<ref>{{Citation|last1=Rigger|first1=Manuel|title=Context-Aware Failure-Oblivious Computing as a Means of Preventing Buffer Overflows|date=2018|url=http://dx.doi.org/10.1007/978-3-030-02744-5_28|work=Network and System Security|pages=376–390|place=Cham|publisher=Springer International Publishing|isbn=978-3-030-02743-8|access-date=2020-10-07|last2=Pekarek|first2=Daniel|last3=Mössenböck|first3=Hanspeter|doi=10.1007/978-3-030-02744-5_28|arxiv=1806.09026}}</ref> जो बदले में, निर्मित मूल्य का उपयोग करता है और पूर्व  [[ कंप्यूटर मेमोरी |  मेमोरी ]] मान को एक्सेस करने का प्रयास करता है, यह [[ रैम समता |  विशिष्ट मेमोरी चेकर्स ]] के विपरीत है, जो त्रुटि के कार्यक्रम को सूचित करता है या निरस्त करता है कार्यक्रम। दूसरा, इसे उन अपवादों पर लागू किया जा सकता है जहां अप्रत्याशित अपवादों को पकड़ने के लिए कुछ कैच ब्लॉक लिखे या संश्लेषित किए जाते हैं<ref>{{Cite journal|last1=Zhang|first1=Long|last2=Monperrus|first2=Martin|date=2019|title=TripleAgent: Monitoring, Perturbation and Failure-Obliviousness for Automated Resilience Improvement in Java Applications|url=https://arxiv.org/pdf/1812.10706|journal=2019 IEEE 30th International Symposium on Software Reliability Engineering (ISSRE)|location=Berlin, Germany|publisher=IEEE|pages=116–127|doi=10.1109/ISSRE.2019.00021|arxiv=1812.10706|isbn=978-1-7281-4982-0|s2cid=57189195}}</ref> इसके अलावा, ऐसा होता है कि कैस्केडिंग विफलताओं को रोकने के लिए निष्पादन को लगातार कई बार संशोधित किया जाता है<ref name="DurieuxHamadi2018">{{cite book|last1=Durieux|first1=Thomas|last2=Hamadi|first2=Youssef|last3=Yu|first3=Zhongxing|last4=Baudry|first4=Benoit|last5=Monperrus|first5=Martin|title=2018 IEEE 11th International Conference on Software Testing, Verification and Validation (ICST)|chapter=Exhaustive Exploration of the Failure-Oblivious Computing Search Space|year=2018|pages=139–149|doi=10.1109/ICST.2018.00023|arxiv=1710.09722|isbn=978-1-5386-5012-7|s2cid=4304123}}</ref>
''विफलता-अनभिज्ञ कंप्यूटिंग'' एक ऐसी तकनीक है जो [[ कंप्यूटर प्रोग्राम |कंप्यूटर प्रोग्राम]] को [[ डेटा हानि |त्रुटियों]] के बावजूद निष्पादन जारी रखने में सक्षम बनाती है।<ref>{{Cite journal|last1=Herzberg|first1=Amir|last2=Shulman|first2=Haya|date=2012|title=Oblivious and Fair Server-Aided Two-Party Computation|url=http://dx.doi.org/10.1109/ares.2012.28|journal=2012 Seventh International Conference on Availability, Reliability and Security|pages=75–84|publisher=IEEE|doi=10.1109/ares.2012.28|isbn=978-1-4673-2244-7|s2cid=6579295}}</ref> इस तकनीक को विभिन्न संदर्भों में लागू किया जा सकता है। सबसे पहले,यह प्रोग्राम अमान्य मेमोरी को रीड कर,<ref>{{Citation|last1=Rigger|first1=Manuel|title=Context-Aware Failure-Oblivious Computing as a Means of Preventing Buffer Overflows|date=2018|url=http://dx.doi.org/10.1007/978-3-030-02744-5_28|work=Network and System Security|pages=376–390|place=Cham|publisher=Springer International Publishing|isbn=978-3-030-02743-8|access-date=2020-10-07|last2=Pekarek|first2=Daniel|last3=Mössenböck|first3=Hanspeter|doi=10.1007/978-3-030-02744-5_28|arxiv=1806.09026}}</ref> उस मेमोरी वैल्यू को अनदेखा करता है जिसे उसने एक्सेस करने का प्रयास किया था,यह सामान्य मेमोरी चेकर्स के विपरीत प्रोग्राम को त्रुटि की सूचना देता है या प्रोग्राम को निरस्त कर देता है।दूसरा,इसे उन अपवादों पर लागू किया जा सकता है जहां अप्रत्याशित अपवादों को रोकने के लिए कुछ कैच ब्लॉक(catch blocks) लिखे या संश्लेषित किए जाते हैं।<ref>{{Cite journal|last1=Zhang|first1=Long|last2=Monperrus|first2=Martin|date=2019|title=TripleAgent: Monitoring, Perturbation and Failure-Obliviousness for Automated Resilience Improvement in Java Applications|url=https://arxiv.org/pdf/1812.10706|journal=2019 IEEE 30th International Symposium on Software Reliability Engineering (ISSRE)|location=Berlin, Germany|publisher=IEEE|pages=116–127|doi=10.1109/ISSRE.2019.00021|arxiv=1812.10706|isbn=978-1-7281-4982-0|s2cid=57189195}}</ref> इसके अलावा,कैस्केडिंग विफलताओं(cascading failures) को रोकने के लिए निष्पादन को कई बार संशोधित किया जाता है।<ref name="DurieuxHamadi2018">{{cite book|last1=Durieux|first1=Thomas|last2=Hamadi|first2=Youssef|last3=Yu|first3=Zhongxing|last4=Baudry|first4=Benoit|last5=Monperrus|first5=Martin|title=2018 IEEE 11th International Conference on Software Testing, Verification and Validation (ICST)|chapter=Exhaustive Exploration of the Failure-Oblivious Computing Search Space|year=2018|pages=139–149|doi=10.1109/ICST.2018.00023|arxiv=1710.09722|isbn=978-1-5386-5012-7|s2cid=4304123}}</ref>


दृष्टिकोण में प्रदर्शन लागत है: क्योंकि तकनीक पते की वैधता के लिए गतिशील जांच डालने के लिए कोड को फिर से लिखती है, निष्पादन समय 80% से 500% तक बढ़ जाएगा<ref>{{Citation
यह तकनीक गतिशील जांच के लिए कोड को फिर से लिखती है जिससेे निष्पादन समय 80% से 500% तक बढ़ जाता हैं।<ref>{{Citation
   | first = Angelos D.
   | first = Angelos D.
   | last = Keromytis
   | last = Keromytis
Line 126: Line 121:
</ref>
</ref>


=== वसूली चरवाहा ===
=== रिकवरी शेपर्ड ===
पुनर्प्राप्ति चरवाहा एक हल्की तकनीक है जो सॉफ़्टवेयर प्रोग्राम को अन्यथा घातक त्रुटियों से पुनर्प्राप्त करने में सक्षम बनाती है जैसे कि नल पॉइंटर डीरेफरेंस और शून्य से विभाजित करना<ref name=rcv>{{cite book
रिकवरी शेपर्ड एक प्रभावहीन तकनीक है जो सॉफ़्टवेयर प्रोग्राम को घातक त्रुटियों से बचने में सक्षम बनाती है जैसे कि नल पॉइंटर डीरेफरेंस(null pointer dereference)और शून्य से विभाजित करना।<ref name=rcv>{{cite book
|last1=Long
|last1=Long
|first1=Fan
|first1=Fan
Line 144: Line 139:
|doi=10.1145/2594291.2594337
|doi=10.1145/2594291.2594337
|s2cid=6252501
|s2cid=6252501
}}</ref> विफलता बेखबर कंप्यूटिंग तकनीक की तुलना में, पुनर्प्राप्ति चरवाहा सीधे संकलित प्रोग्राम बाइनरी पर काम करता है और इसे प्रोग्राम में पुन: संकलित करने की आवश्यकता नहीं होती है।
}}</ref> विफल कंप्यूटिंग तकनीक की तुलना में, रिकवरी शेपर्ड को पुन: संकलित करने की आवश्यकता नहीं होती,यह प्रोग्राम सीधे बाइनरी पर काम करता है।


यह [[ जस्ट-इन-टाइम संकलन |  जस्ट-इन-टाइम ]]  [[ इंस्ट्रूमेंटेशन (कंप्यूटर प्रोग्रामिंग) | बाइनरी इंस्ट्रूमेंटेशन ]] फ्रेमवर्क [[ पिन (कंप्यूटर प्रोग्राम) | पिन ]] का उपयोग करता है। यह त्रुटि होने पर आवेदन प्रक्रिया से जुड़ जाता है, निष्पादन की मरम्मत करता है,
यह सही समय पर [[ इंस्ट्रूमेंटेशन (कंप्यूटर प्रोग्रामिंग) |बाइनरी इंस्ट्रूमेंटेशन]] फ्रेमवर्क[[ पिन (कंप्यूटर प्रोग्राम) | पिन]] का उपयोग करता है। यह त्रुटि होने पर आवेदन प्रक्रिया से जुड़कर निष्पादन की मरम्मत कर प्रभावों को ट्रैक करता है और आवेदन प्रक्रिया से सभी मरम्मत प्रभावों को फ़्लश करने के बाद प्रक्रिया से अलग हो जाता है।यह कार्यक्रम के निष्पादन में हस्तक्षेप नहीं करता है।<ref name=rcv/>18 में से 17 के लिए नल-डीरेफरेंस और डिवाइड-बाय-जीरो,एक प्रोटोटाइप कार्यान्वयन एप्लिकेशन अपने उपयोगकर्ताओं को आउटपुट और सेवा प्रदान करने के लिए निष्पादन करना जारी रखता है।<ref name=rcv/>
निष्पादन जारी रहने पर मरम्मत प्रभावों को ट्रैक करता है, आवेदन प्रक्रिया के भीतर मरम्मत प्रभाव समाहित करता है, और प्रक्रिया की स्थिति से सभी मरम्मत प्रभावों को फ़्लश करने के बाद प्रक्रिया से अलग हो जाता है। यह कार्यक्रम के सामान्य निष्पादन में हस्तक्षेप नहीं करता है और इसलिए नगण्य उपरि खर्च करता है<ref name=rcv/> 18 में से 17 के लिए व्यवस्थित रूप से एकत्रित वास्तविक दुनिया नल-डीरेफरेंस और डिवाइड-बाय-जीरो त्रुटियों के लिए, एक प्रोटोटाइप कार्यान्वयन एप्लिकेशन को त्रुटि-ट्रिगर इनपुट पर अपने उपयोगकर्ताओं को स्वीकार्य आउटपुट और सेवा प्रदान करने के लिए निष्पादित करना जारी रखता है।<ref name=rcv/>


=== सर्किट ब्रेकर ===
=== सर्किट ब्रेकर ===
{{Main|Circuit breaker design pattern}}[[ सर्किट ब्रेकर डिजाइन पैटर्न | सर्किट ब्रेकर डिजाइन पैटर्न]] वितरित प्रणालियों में भयावह विफलताओं से बचने के लिए एक तकनीक है।
{{Main|Circuit breaker design pattern}}[[ सर्किट ब्रेकर डिजाइन पैटर्न | सर्किट ब्रेकर डिजाइन पैटर्न(circuit breaker design pattern]]) सिस्टम को भयावह विफलताओं से की एक तकनीक है।


== अतिरेक ==
== अतिरेक ==
{{main article|Redundancy (engineering)}}
{{main article|Redundancy (engineering)}}
अतिरेक कार्यात्मक क्षमताओं का प्रावधान है जो एक दोष मुक्त वातावरण में अनावश्यक होगा<ref>लैप्री, जे.सी. (1985)। [http://www.macedo.ufba.br/conceptsANDTermonology.pdf डिपेंडेबल कंप्यूटिंग एंड फॉल्ट टॉलरेंस: कॉन्सेप्ट्स एंड टर्मिनोलॉजी], फॉल्ट-टॉलरेंट कंप्यूटिंग (FTSC-15) पर 15वें अंतर्राष्ट्रीय संगोष्ठी की कार्यवाही, पीपी 2–1</ref>
अतिरेक कार्यात्मक क्षमताओं का प्रावधान है जो एक दोष मुक्त वातावरण में अनावश्यक होगा।<ref>लैप्री, जे.सी. (1985)। [http://www.macedo.ufba.br/conceptsANDTermonology.pdf डिपेंडेबल कंप्यूटिंग एंड फॉल्ट टॉलरेंस: कॉन्सेप्ट्स एंड टर्मिनोलॉजी], फॉल्ट-टॉलरेंट कंप्यूटिंग (FTSC-15) पर 15वें अंतर्राष्ट्रीय संगोष्ठी की कार्यवाही, पीपी 2–1</ref> इसमें बैकअप घटक शामिल हो सकते हैं जो एक घटक के विफल होने पर स्वचालित रूप से किक(kick)करते हैं। उदाहरण के लिए,बड़े मालवाहक ट्रक उनके पास कई टायर हैं,और कोई भी टायर महत्वपूर्ण नहीं है (सामने के टायरों के अपवाद के साथ, जो चलाने के लिए उपयोग किए जाते हैं, लेकिन आम तौर पर कम भार उठाते हैं, प्रत्येक और कुल मिलाकर,अन्य चार से 16 की तुलना में, इसलिए विफल होने की संभावना कम होती है)।सिस्टम में सुधार के लिए अतिरेक को शामिल करने का विचार 1950 के दशक में पेश किया गया था।<ref>वॉन न्यूमैन, जे। (1956)। [http://www.cyclify.com/wiki/images/a/af/Von_Neumann_Probabilistic_Logics_and_the_Synthesis_of_Reliable_Organisms_from_Unreliable_Components.pdf प्रोबेबिलिस्टिक लॉजिक्स एंड सिंथेसिस ऑफ रिलायबल कंपोनेंट्स फ्रॉम अनरिलायबल कंपोनेंट्स स्टडीज, एड। सी. शैनन और जे. मैकार्थी, प्रिंसटन यूनिवर्सिटी प्रेस, पीपी. 43–9</ref>
इसमें बैकअप घटक शामिल हो सकते हैं जो एक घटक के विफल होने पर स्वचालित रूप से किक करते हैं। उदाहरण के लिए, बड़े मालवाहक ट्रक बिना किसी बड़े परिणाम के एक टायर खो सकते हैं। उनके पास कई टायर हैं, और कोई भी टायर महत्वपूर्ण नहीं है (सामने के टायरों के अपवाद के साथ, जो चलाने के लिए उपयोग किए जाते हैं, लेकिन आम तौर पर कम भार उठाते हैं, प्रत्येक और कुल मिलाकर, अन्य चार से 16 की तुलना में, इसलिए विफल होने की संभावना कम होती है )
एक प्रणाली की विश्वसनीयता में सुधार के लिए अतिरेक को शामिल करने का विचार [[ जॉन वॉन न्यूमैन ]] द्वारा 1950 के दशक में पेश किया गया था।<ref>वॉन न्यूमैन, जे। (1956)। [http://www.cyclify.com/wiki/images/a/af/Von_Neumann_Probabilistic_Logics_and_the_Synthesis_of_Reliable_Organisms_from_Unreliable_Components.pdf प्रोबेबिलिस्टिक लॉजिक्स एंड सिंथेसिस ऑफ रिलायबल कंपोनेंट्स फ्रॉम अनरिलायबल कंपोनेंट्स स्टडीज, एड। सी. शैनन और जे. मैकार्थी, प्रिंसटन यूनिवर्सिटी प्रेस, पीपी. 43–9</ref>


दो प्रकार की अतिरेक संभव है<ref>एविज़िएनिस, ए। (1976)। [https://www.computer.org/csdl/trans/tc/1976/12/01674598.pdf फॉल्ट-टॉलरेंट सिस्टम्स] , कंप्यूटर पर आईईईई लेनदेन, वॉल्यूम। 25, नहीं। 12, पीपी. 1304–131</ref> अंतरिक्ष अतिरेक और समय अतिरेक। अंतरिक्ष अतिरेक अतिरिक्त घटक, कार्य या डेटा आइटम प्रदान करता है जो दोष मुक्त संचालन के लिए अनावश्यक हैं। अंतरिक्ष अतिरेक को आगे हार्डवेयर, सॉफ्टवेयर और सूचना अतिरेक में वर्गीकृत किया जाता है, जो सिस्टम में जोड़े गए अनावश्यक संसाधनों के प्रकार पर निर्भर करता है। समय के अतिरेक में गणना या डेटा ट्रांसमिशन दोहराया जाता है और परिणाम की तुलना पिछले परिणाम की एक संग्रहीत प्रति से की जाती है। इस तरह के परीक्षण के लिए वर्तमान शब्दावली को 'इन सर्विस फॉल्ट टॉलरेंस टेस्टिंग या ISFTT संक्षेप में' कहा जाता है।
दो प्रकार की अतिरेक संभव है,<ref>एविज़िएनिस, ए। (1976)। [https://www.computer.org/csdl/trans/tc/1976/12/01674598.pdf फॉल्ट-टॉलरेंट सिस्टम्स] , कंप्यूटर पर आईईईई लेनदेन, वॉल्यूम। 25, नहीं। 12, पीपी. 1304–131</ref> अंतरिक्ष अतिरेक और समय अतिरेक।अंतरिक्ष अतिरेक अतिरिक्त घटक,कार्य या डेटा आइटम प्रदान करता है जो त्रुटि मुक्त संचालन के लिए अनावश्यक हैं।अंतरिक्ष अतिरेक को हार्डवेयर,सॉफ्टवेयर और सूचना अतिरेक में वर्गीकृत किया जाता है,जो सिस्टम में जोड़े गए अनावश्यक संसाधनों के प्रकार पर निर्भर करता है।समय के अतिरेक में गणना या डेटा ट्रांसमिशन दोहराया जाता है और परिणाम की तुलना पिछले परिणाम की संग्रहीत प्रति(stored copy)से की जाती है। इस तरह के परीक्षण को ''''इन सर्विस फॉल्ट टॉलरेंस टेस्टिंग''' (ISFTT) कहा जाता है।


== नुकसान ==
== नुकसान ==
दोष-सहिष्णु डिजाइन के फायदे स्पष्ट हैं, जबकि इसके कई नुकसान नहीं हैं:
दोष-सहिष्णुता डिजाइन के फायदे स्पष्ट हैं, जबकि इसके कोई नुकसान नहीं हैं:


* '''एक ही घटक में खराबी का पता लगाने में हस्तक्षेप।''' उपरोक्त यात्री वाहन उदाहरण को जारी रखने के लिए, किसी भी दोष-सहिष्णु प्रणाली के साथ यह ड्राइवर के लिए स्पष्ट नहीं हो सकता है कि टायर पंचर हो गया है। यह आमतौर पर एक अलग स्वचालित गलती-पहचान प्रणाली के साथ नियंत्रित किया जाता है। टायर के मामले में, एक एयर प्रेशर मॉनिटर दबाव के नुकसान का पता लगाता है और ड्राइवर को सूचित करता है। विकल्प एक मैनुअल गलती-पहचान प्रणाली है, जैसे प्रत्येक स्टॉप पर सभी टायरों का मैन्युअल रूप से निरीक्षण करना।
* '''एक ही घटक में खराबी का पता लगाने के साथ हस्तक्षेप।'''उदाहरण जैसे यात्री वाहन, किसी भी दोष-सहिष्णुता प्रणाली में ड्राइवर को पता नहीं हो सकता है कि टायर पंचर हो गया है। यह स्वचालित त्रुटि -पहचान प्रणाली के साथ नियंत्रित किया जाता है।टायर के मामले में,एयर प्रेशर मॉनिटर दबाव के नुकसान का पता लगाता है और ड्राइवर को सूचित करता है।प्रत्येक स्टॉप पर सभी टायरों का मैन्युअल रूप से निरीक्षण करना  मैनुअल त्रुटि -पहचान प्रणाली है।
* ''' दूसरे घटक में गलती का पता लगाने में हस्तक्षेप। ''' इस समस्या का एक और बदलाव तब होता है जब एक घटक में गलती सहनशीलता एक अलग घटक में गलती का पता लगाने से रोकती है। उदाहरण के लिए, यदि घटक बी घटक ए से आउटपुट के आधार पर कुछ ऑपरेशन करता है, तो बी में गलती सहनशीलता के साथ एक समस्या छुपा सकती है। यदि घटक बी को बाद में बदल दिया जाता है (कम गलती-सहिष्णु डिजाइन के लिए) तो सिस्टम अचानक विफल हो सकता है, यह प्रकट करना कि नया घटक बी समस्या है। सिस्टम की सावधानीपूर्वक जांच करने के बाद ही यह स्पष्ट होगा कि मूल समस्या वास्तव में घटक ए के साथ है।
* ''' दूसरे घटक में गलती का पता लगाने के साथ हस्तक्षेप। '''इस समस्या मे एक और परिवर्तन तब होता है जब एक घटक में दोष सहिष्णुता दूसरे घटक में गलती का पता लगाने से रोकती है। उदाहरण के लिए, यदि घटक बी(B) घटक ए(A) से आउटपुट के आधार पर कुछ ऑपरेशन करता है,तो बी(B) में दोष सहिष्णुता (A) की समस्या छुपा सकती है। यदि घटक बी(B) को बाद में बदल दिया जाता है (कम दोष-सहिष्णुता डिजाइन के लिए) तो सिस्टम अचानक विफल हो सकता है, जिससे यह प्रतीत होता है कि नया घटक बी(B) समस्या है।सिस्टम की सावधानीपूर्वक जांच करने के बाद ही यह स्पष्ट होगा कि मूल समस्या वास्तव में घटक ए(A) के साथ है।
* ''' गलती सुधार की प्राथमिकता में कमी। ''' भले ही ऑपरेटर को गलती के बारे में पता हो, एक दोष-सहिष्णु प्रणाली होने से गलती की मरम्मत के महत्व को कम करने की संभावना है। यदि दोषों को ठीक नहीं किया जाता है, तो यह अंततः सिस्टम विफलता की ओर ले जाएगा, जब दोष-सहिष्णु घटक पूरी तरह से विफल हो जाता है या जब सभी निरर्थक घटक भी विफल हो जाते हैं।
* ''' गलती सुधार की प्राथमिकता में कमी। '''भले ही ऑपरेटर को त्रुटि के बारे में पता हो लेकिन एक दोष-सहिष्णुता प्रणाली होने से त्रुटि के प्रभाव को कम किया जा सकता है।यदि त्रुटि को ठीक नहीं किया गया तो दोष-सहिष्णु घटक पूरी तरह से विफल हो जायेंगे और यह सिस्टम को विफलता की ओर ले जाएगा।
* ''' परीक्षण कठिनाई। ''' [[ परमाणु रिएक्टर ]] जैसे कुछ महत्वपूर्ण दोष-सहिष्णु प्रणालियों के लिए, यह सत्यापित करने का कोई आसान तरीका नहीं है कि बैकअप घटक कार्यात्मक हैं। इसका सबसे कुख्यात उदाहरण [[ चेरनोबिल आपदा | चेरनोबिल ]] है, जहां ऑपरेटरों ने प्राथमिक और माध्यमिक शीतलन को अक्षम करके आपातकालीन बैकअप कूलिंग का परीक्षण किया। बैकअप विफल हो गया, जिसके परिणामस्वरूप कोर मेल्टडाउन और विकिरण की बड़े पैमाने पर रिहाई हुई।
* ''' परीक्षण कठिनाई। '''[[ परमाणु रिएक्टर |परमाणु रिएक्टर]] जैसे कुछ महत्वपूर्ण दोष-सहिष्णुता प्रणालियों के लिए,बैकअप घटक कार्यात्मक हैं यह सत्यापित करने का कोई आसान तरीका नहीं है। इसका उदाहरण[[ चेरनोबिल आपदा |चेरनोबिल(Chernobyl)]] है, जहां ऑपरेटरों ने प्राथमिक और द्वितीयक कूलिंग को अक्षम करके आपातकालीन बैकअप कूलिंग का परीक्षण किया। बैकअप विफल हो गया, जिसके परिणामस्वरूप बड़े पैमाने पर परमाणु दुर्घटना हुई।
* ''' लागत। ''' दोष-सहनशील घटकों और निरर्थक घटकों दोनों की लागत में वृद्धि होती है। यह पूरी तरह से आर्थिक लागत हो सकती है या इसमें वजन जैसे अन्य उपाय शामिल हो सकते हैं।  [[ मानव अंतरिक्ष यान | मानवयुक्त अंतरिक्ष यान ]] , उदाहरण के लिए, इतने अनावश्यक और दोष-सहिष्णु घटक हैं कि उनका वजन मानव रहित प्रणालियों पर नाटकीय रूप से बढ़ जाता है, जिन्हें समान स्तर की सुरक्षा की आवश्यकता नहीं होती है।
* ''' लागत। '''दोष-सहिष्णुता घटकों और निरर्थक घटकों दोनों की लागत में वृद्धि होती है। इसमें वजन जैसे अन्य उपाय शामिल करके किफ़ायती बनाया जा सकता है। उदाहरण के लिए, [[ मानव अंतरिक्ष यान |मानवयुक्त अंतरिक्ष यान]],में इतने अनावश्यक और दोष-सहिष्णुता घटक हैं कि उनका वजन मानव रहित प्रणालियों पर बढ़ जाता है,जिन्हें समान स्तर की सुरक्षा की आवश्यकता नहीं होती है।
* '''अवर घटक।''' एक दोष-सहिष्णु डिज़ाइन निम्न घटकों के उपयोग की अनुमति दे सकता है, जो अन्यथा सिस्टम को निष्क्रिय बना देता। हालांकि इस अभ्यास में लागत वृद्धि को कम करने की क्षमता है, कई निम्न घटकों का उपयोग सिस्टम की विश्वसनीयता को एक तुलनीय गैर-गलती-सहिष्णु प्रणाली के बराबर या उससे भी बदतर स्तर तक कम कर सकता है।
* '''निम्न घटक।''' एक दोष-सहिष्णुता डिज़ाइन जो सिस्टम को निष्क्रिय बना देता है, निम्न घटकों के उपयोग की अनुमति दे सकता है। हालांकि इसमें लागत वृद्धि को कम करने की क्षमता है,कई निम्न घटकों का उपयोग कर सिस्टम को गैर-दोष-सहिष्णुता प्रणाली के बराबर या उससे और ज्यादा स्तर तक कम कर सकता है।


== संबंधित शब्द ==
== संबंधित शब्द ==
दोष सहिष्णुता और उन प्रणालियों के बीच अंतर है जिनमें शायद ही कभी समस्याएं होती हैं। उदाहरण के लिए, [[ वेस्टर्न इलेक्ट्रिक ]] [[ क्रॉसबार स्विच | क्रॉसबार ]] सिस्टम की विफलता दर प्रति चालीस वर्षों में दो घंटे थी, और इसलिए अत्यधिक "गलती प्रतिरोधी" थी। लेकिन जब कोई गलती हुई तो उन्होंने पूरी तरह से काम करना बंद कर दिया, और इसलिए 'गलती सहिष्णु' नहीं थे।
दोष सहिष्णुता और उन प्रणालियों में अंतर है जिनमें शायद ही कभी समस्याएं होती हैं। उदाहरण के लिए,[[ वेस्टर्न इलेक्ट्रिक |वेस्टर्न इलेक्ट्रिक]] [[ क्रॉसबार स्विच |क्रॉसबार]](Western Electric crossbar) सिस्टम "दोष प्रतिरोधी" थे क्योंकि इसमे विफलता दर प्रति चालीस वर्षों में दो घंटे थी। लेकिन जब कोई त्रुटि हुई तो सिस्टम ने काम करना बंद कर दिया,और इसलिए यह 'दोष सहिष्णु' नहीं थे।


==See also==
==यह भी देखे==
{{Div col}}
{{Div col}}
*[[Byzantine fault tolerance]]
*[[Byzantine fault tolerance]]
Line 196: Line 188:
*[[Self-management (computer science)]]
*[[Self-management (computer science)]]
*[[Software diversity]]
*[[Software diversity]]
{{Div col end
{{Div col end}}
}
==संदर्भ==
[[Category:Machine Translated Page]]
 
[[Category:All Wikipedia articles written in American English]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with invalid date parameter in template]]
[[Category:Articles with short description]]
[[Category:CS1]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 maint]]
[[Category:Computer systems]]
[[Category:Control engineering]]
[[Category:Fault tolerance]]
[[Category:Short description with empty Wikidata description]]
[[Category:Use American English]]
[[Category:Wikipedia articles needing clarification]]
[[Category:Wikipedia articles needing clarification from June 2014]]

Latest revision as of 09:58, 4 August 2022

फॉल्ट टॉलरेंस के द्वारा किसी प्रणाली (सिस्टम) को इसके कुछ घटकों में एक या अधिक दोषों की विफलता की स्थिति में भी ठीक से संचालन जारी रखने में सक्षम बनाता है। यदि इसकी परिचालन गुणवत्ता बिल्कुल भी कम हो जाती है, तो कमी विफलता की गंभीरता के समानुपाती होती है,एक सरलता से डिज़ाइन की गई प्रणाली की तुलना में, जिसमें एक छोटी सी विफलता भी विघटन का कारण बन सकती है। उच्च उपलब्धता, महत्वपूर्ण लक्ष्य, या यहां तक ​​कि जीवन महत्वपूर्ण प्रणाली में दोष सहिष्णुता (फॉल्ट टॉलरेंस) प्रणाली की विशेष रूप से मांग की जाती है। सिस्टम के कुछ हिस्सों के बिगड़ने पर कार्यक्षमता बनाए रखने की क्षमता को ही ग्रेसफुल डिग्रेडेशन कहा जाता है।[1]

एक दोष-सहनशील डिज़ाइन सिस्टम के संचालन को जारी रखने में सक्षम बनाता है, संभवतः इसके द्वारा, पूरी तरह से विफल होने के बजाय, सिस्टम का कुछ ही हिस्सा विफल हो जाता है। [2] इस शब्द का प्रयोग आमतौर पर कंप्यूटर सिस्टम का वर्णन करने के लिए किया जाता है, जिसे कम या ज्यादा पूरी तरह से चालू रखने के लिए डिज़ाइन किया गया है, शायद, कुछ आंशिक विफलता की स्थिति में प्रवाह क्षमतामें कमी या प्रतिक्रिया समय में वृद्धि होती है। अर्थात्, हार्डवेयर या सॉफ़्टवेयर में समस्याओं के कारण संपूर्ण रूप से सिस्टम बंद नहीं होता है। एक अन्य क्षेत्र में एक उदाहरण एक मोटर वाहन है जिसे डिज़ाइन किया गया है, इसलिए यदि टायरों में से एक पंचर हो गया है, या एक संरचना जो थकान, जंग, निर्माण दोष, या प्रभाव जैसे कारणों से होने वाली क्षति की उपस्थिति में अपनी अखंडता बनाए रखने में सक्षम हो, तो इसे चलाना जारी रहेगा।

एक व्यक्तिगत प्रणाली के दायरे में, असाधारण परिस्थितियों का अनुमान लगाकर और उनसे निपटने के लिए प्रणाली का निर्माण करके दोष सहिष्णुता प्राप्त की जा सकती है, और सामान्य तौर पर,आत्म-स्थिरीकरण का लक्ष्य है कि सिस्टम एक त्रुटि मुक्त स्थिति की ओर परिवर्तित हो जाए। हालांकि,यदि सिस्टम विफलता के परिणाम विनाशकारी हैं, या इसे पर्याप्त रूप से विश्वसनीय बनाने की लागत बहुत अधिक है, तो किसी प्रकार के दोहराव का उपयोग करना बेहतर समाधान हो सकता है। किसी भी मामले में, यदि सिस्टम की विफलता का परिणाम इतना भयावह है, तो सिस्टम को सुरक्षित मोड में वापस आने के लिए रिवर्सन का उपयोग करने में सक्षम होना चाहिए। यह रोल-बैक रिकवरी के समान है, लेकिन यदि मानव लूप में मौजूद हैं तो यह एक मानवीय क्रिया हो सकती है।

इतिहास

पहला ज्ञात दोष-सहिष्णु(फॉल्ट टॉलरेंस) कंप्यूटर (SAPO) था,जिसे 1951 में चेकोस्लोवाकिया में एंटोनिन स्वोबोडा द्वारा बनाया गया था।[3]: 155  इसका मूल डिजाइन मेमोरी एरर डिटेक्शन ( ट्रिपल मॉड्यूलर रिडंडेंसी ) की वोटिंग विधि के साथ रिले के माध्यम से जुड़े चुंबकीय ड्रम थे। इस लाइन के साथ कई अन्य मशीनें विकसित की गईं, जो ज्यादातर सैन्य उपयोग के लिए थीं। आखिरकार, वे तीन अलग-अलग श्रेणियों में विभाजित हो गए: मशीनें जो बिना किसी रखरखाव के लंबे समय तक चलेंगी, जैसे कि नासा अंतरिक्ष जांच और उपग्रह पर उपयोग की जाने वाली मशीनें; ऐसे कंप्यूटर जो बहुत भरोसेमंद थे लेकिन उन्हें निरंतर निगरानी की आवश्यकता थी, जैसे कि परमाणु ऊर्जा संयंत्र या सुपरकोलाइडर प्रयोगों की निगरानी और नियंत्रण के लिए उपयोग किए जाने वाले कंप्यूटर; और अंत में, उच्च मात्रा में रनटाइम वाले कंप्यूटर जो भारी उपयोग में होंगे, जैसे कि बीमा कंपनियों द्वारा उनकी सम्भाविकी निगरानी के लिए उपयोग किए जाने वाले कई सुपर कंप्यूटर।

तथाकथित LLNM (लॉन्ग लाइफ,नो मेंटेनेंस) कंप्यूटिंग में अधिकांश विकास 1960 के दशक में अपोलो योजना और अन्य शोध पहलुओं की तैयारी के दौरान किया गया था।[4] पहली मशीन अंतरिक्ष प्रेक्षणगृह में गई और उनका दूसरा प्रयास JSTAR कंप्यूटर,समुद्रयात्रा में इस्तेमाल किया गया। मेमोरी रिकवरी विधियों का उपयोग करने के लिए इस कंप्यूटर में मेमोरी सरणियों का बैकअप था और इस प्रकार इसे जेपीएल सेल्फ-टेस्टिंग-एंड-रिपेयरिंग कंप्यूटर कहा जाता था। यह अपनी स्वयं की त्रुटियों का पता लगा सकता है और उन्हें ठीक कर सकता है या आवश्यकतानुसार अनावश्यक मॉड्यूल ला सकता है। 2022 की शुरुआत तक कंप्यूटर अभी भी काम कर रहा है।[5]

हाइपर-डिपेंडेबल कंप्यूटरों का संचालन ज्यादातर विमान निर्माताओं,परमाणु ऊर्जा कंपनियों और रेल उद्योग द्वारा किया गया था।[3]: 210  इन्हें भारी मात्रा में अपटाइम वाले कंप्यूटरों की आवश्यकता थी जो इस तथ्य पर भरोसा करते हुए कि कंप्यूटर आउटपुट को लगातार मनुष्यों द्वारा दोषों का पता लगाने के लिए मॉनिटर किया जाएगा। फिर से,आईबीएम (IBM) ने सैटर्न वी रॉकेट के मार्गदर्शन के लिए इस तरह का पहला कंप्यूटर विकसित किया, लेकिन बाद में बीएनएसएफ( BNSF), यूनिसिस और जनरल इलेक्ट्रिक ने अपना खुद का कंप्यूटर बनाया।[3]: 223 

1970 के दशक में इस क्षेत्र में बहुत काम हुआ है,[6][7][8] उदाहरण के लिए, एफ14 सीएडीसी मेंअंतर्निर्मित आत्म-परीक्षण किया गया था।[9]

सामान्य तौर पर, दोष-सहिष्णु डिजाइनों के शुरुआती प्रयास मुख्य रूप से आंतरिक निदान पर केंद्रित थे, जहां एक गलती से संकेत मिलता था कि कुछ विफल हो रहा था और एक कार्यकर्ता इसे बदल सकता है। उदाहरण के लिए, SAPO के पास एक तरीका था जिसके द्वारा दोषपूर्ण मेमोरी ड्रम विफलता से पहले एक शोर का उत्सर्जन करेगा।[10] बाद के प्रयासों से पता चला कि पूरी तरह से प्रभावी होने के लिए, सिस्टम को स्वयं-मरम्मत और निदान करना होगा - एक गलती को अलग करना और फिर मरम्मत की आवश्यकता को चेतावनी देते हुए एक अनावश्यक बैकअप को लागू करना। इसे एन-मॉडल अतिरेक के रूप में जाना जाता है, जहां दोष स्वत: सुरक्षित और ऑपरेटर को चेतावनी का कारण बनते हैं, और यह आज भी उपयोग में स्तर एक दोष-सहिष्णु डिजाइन का सबसे सामान्य रूप है।

वोटिंग एक और प्रारंभिक विधि थी, जैसा कि ऊपर चर्चा की गई है, जिसमें कई निरर्थक बैकअप लगातार काम कर रहे हैं और एक दूसरे के परिणामों की जांच कर रहे हैं, इस परिणाम के साथ कि यदि, उदाहरण के लिए, चार घटकों ने 5 के उत्तर की सूचना दी और एक घटक ने 6 के उत्तर की सूचना दी, तो अन्य चार "वोट" करेंगे कि पाँचवाँ घटक दोषपूर्ण था और इसे सेवा से बाहर कर दिया गया था। इसे N बहुमत वाले मतदान में से M कहा जाता है।

ऐतिहासिक रूप से, गति हमेशा एन-मॉडल(N-model) से आगे बढ़ने के लिए और एन(N) से एम(M) से अधिक तक आगे बढ़ने के लिए रही है क्योंकि सिस्टम की जटिलता और संक्रमणीय स्थिति को गलती-नकारात्मक से गलती-सकारात्मक तक सुनिश्चित करने की कठिनाई ने संचालन को बाधित नहीं किया।

टेंडेम और स्ट्रैटस ऑनलाइन लेनदेन प्रोसेसिंग के लिए दोष-सहनशील कंप्यूटर सिस्टम के डिजाइन में विशेषज्ञता वाली पहली कंपनियों में से थे।

उदाहरण

M2 मोबाइल वेब, ट्विटर का मूल मोबाइल वेब फ्रंट एंड, बाद में दिसंबर 2020 तक क्लाइंट के लिए बिना जावास्क्रिप्ट सपोर्ट और/या असंगत ब्राउज़र के फॉलबैक लीगेसी वर्जन के रूप में कार्य किया।

हार्डवेयर दोष सहनशीलता के लिए कभी-कभी यह आवश्यक होता है कि टूटे हुए हिस्सों को बाहर निकाला जाए और सिस्टम के अभी भी चालू होने पर नए भागों के साथ बदल दिया जाए (कंप्यूटिंग में जिसे हॉट स्वैपिंग के रूप में जाना जाता है)। एकल बैकअप के साथ लागू की गई ऐसी प्रणाली को एकल बिंदु सहिष्णु ( सिंगल पॉइंट टॉलरेंट) के रूप में जाना जाता है और यह अधिकांश दोष-सहिष्णु प्रणालियों का प्रतिनिधित्व करता है। ऐसी प्रणालियों में विफलता के बीच का औसत समय इतना लंबा होना चाहिए कि इससे पहले कि बैकअप भी विफल हो जाए ऑपरेटर टूटे हुए उपकरणों को ठीक कर सकेे। यदि विफलताओं के बीच का समय यथासंभव लंबा हो तो यह सहायक होता है, लेकिन दोष-सहिष्णु प्रणाली में इसकी विशेष रूप से आवश्यकता नहीं होती है।

कंप्यूटर अनुप्रयोगों में दोष सहिष्णुता उल्लेखनीय रूप से सफल है। टेंडेम कंप्यूटर्स ने अपना पूरा व्यवसाय ऐसी मशीनों पर बनाया, जिन्होंने नॉनस्टॉप सिस्टम बनाने के लिए सिंगल-पॉइंट टॉलरेंस का इस्तेमाल किया, जिसमें अपटाइम मापा गया।

विफल-सुरक्षित आर्किटेक्चर में कंप्यूटर सॉफ़्टवेयर भी शामिल हो सकता है, उदाहरण के लिए प्रक्रिया प्रतिकृति द्वारा।

डेटा स्वरूपों को भी नष्ट करने के लिए डिज़ाइन किया जा सकता है। उदाहरण के लिए एचटीएमएल (HTML), को ऐसे डिज़ाइन किया गया है,जिससे वेब ब्राउज़र दस्तावेज़ को अनुपयोगी किए बिना नए और असमर्थित एचटीएमएल (HTML) इकाइयों को अनदेखा करने की इजाजत देता है। इसके अतिरिक्त, कुछ साइटें, जिनमें ट्विटर (Twitter) (दिसंबर 2020 तक) जैसे लोकप्रिय प्लेटफॉर्म शामिल हैं, जो जावास्क्रिप्ट(JavaScript) पर निर्भर नहीं है और इसमें न्यूनतम लेआउट है, जिसमे व्यापक उपलब्धता और पहुँच है,जैसे सीमित वेब ब्राउज़िंग क्षमताओं के साथ कार्य ढाँचा।[11][12]

शब्दावली

पारदर्शिता वाली छवि में डिज़ाइन द्वारा ग्रेसफुल डिग्रेडेशन का एक उदाहरण। शीर्ष दो छवियों में से प्रत्येक एक दर्शक में समग्र छवि को देखने का परिणाम है जो पारदर्शिता को पहचानता है। नीचे की दो छवियां एक ऐसे दर्शक का परिणाम हैं, जिसमें पारदर्शिता के लिए कोई समर्थन नहीं है। क्योंकि ट्रांसपेरेंसी मास्क (सेंटर बॉटम) को हटा दिया जाता है, केवल ओवरले (सेंटर टॉप) रहता है; बाईं ओर की छवि को इनायत से नीचा दिखाने के लिए डिज़ाइन किया गया है, इसलिए इसकी पारदर्शिता जानकारी के बिना अभी भी सार्थक है।

एक या अधिक घटक विफल होने पर भी दोष-सहिष्णु प्रणाली प्रदर्शन के समान स्तर पर जारी रह सकती है। उदाहरण के लिए,एक बैकअप विद्युत जनरेटर भवन दीवार के आउटलेट को समान वोल्टेज प्रदान करेगा,भले ही ग्रिड पावर विफल हो जाए।

एक प्रणाली जो सुरक्षित,या असफल-सुरक्षित, या विफल होने के लिए डिज़ाइन की गई है, चाहे वह कम स्तर पर कार्य करे या पूरी तरह से विफल हो, ऐसा इस तरह से करता है जो लोगों, संपत्ति या डेटा ( data) को चोट, क्षति ,घुसपैठ या प्रकटीकरण से बचाता है।कंप्यूटर में, एक त्रुटि का अनुभव करने के बाद डेटा अवमिश्रण को रोकने के लिए ग्रेसफुल एग्जिट (एक अनियंत्रित क्रैश के विपरीत) को निष्पादित करके एक प्रोग्राम विफल-सुरक्षित हो सकता है। इस तरह का अंतर "अच्छी तरह से विफल" और "बुरी तरह से विफल" के बीच किया जाता है।

विफल-घातक विपरीत रणनीति है, जिसका उपयोग हथियार प्रणालियों में किया जा सकता है जो लक्ष्य को मारने या घायल करने के लिए डिज़ाइन किए गए हैं, भले ही सिस्टम का हिस्सा क्षतिग्रस्त या नष्ट हो गया हो।

एक प्रणाली जिसे ग्रेसफुल डिग्रेडेशन का अनुभव करने के लिए डिज़ाइन किया गया है, या सॉफ्ट विफल (कंप्यूटिंग में उपयोग किया जाता है, असफल सुरक्षित के समान[13]) कुछ घटक विफलताओं के बाद प्रदर्शन के कम स्तर पर काम करता है। उदाहरण के लिए, एक इमारत कम स्तर पर प्रकाश और कम गति पर लिफ्ट संचालित कर सकती है यदि ग्रिड पावर विफल हो जाती है, तो लोगों को पूरी तरह से अंधेरे में फंसाने के बजाय पूरी शक्ति से काम करना जारी रखता है। ग्रेसफुल डिग्रेडेशन के एक उदाहरण की गणना में यह है कि यदि ऑनलाइन वीडियो स्ट्रीम करने के लिए अपर्याप्त नेटवर्क बैंडविड्थ उपलब्ध है, तो उच्च-रिज़ॉल्यूशन संस्करण के स्थान पर कम-रिज़ॉल्यूशन संस्करण को स्ट्रीम किया जा सकता है। प्रोग्रेसिव एन्हांसमेंट कंप्यूटिंग में एक उदाहरण है, जहां वेब पेज पुराने, छोटे स्क्रीन या सीमित क्षमता वाले वेब ब्राउज़र के लिए एक बुनियादी कार्यात्मक प्रारूप में उपलब्ध हैं, लेकिन अतिरिक्त तकनीकों को संभालने में सक्षम ब्राउज़रों के लिए एक उन्नत संस्करण में उपलब्ध हैं या बड़े डिस्प्ले वाले ब्राउज़र में उपलब्ध हैं।

दोष-सहनशील कंप्यूटर सिस्टम में, महत्वपूर्ण माने जाने वाले प्रोग्राम पूरी तरह से क्रैश होने के बजाय त्रुटि,अपवाद या अमान्य इनपुट के बावजूद संचालन जारी रखने के लिए डिज़ाइन किए गए हैं। सॉफ्टवेयर भंगुरता मजबूती के विपरीत है। लचीला नेटवर्क कुछ लिंक या नोड्स की विफलता के बावजूद डेटा संचारित करना जारी रखता है; इसी तरह लचीला भवन और बुनियादी ढाँचा से भूकंप, बाढ़, या टकराव जैसी स्थितियों में पूर्ण विफलता को रोकने की उम्मीद की जाती है।

उच्च विफलता पारदर्शिता के साथ एक प्रणाली उपयोगकर्ताओं को सचेत करेगी कि एक घटक विफलता हुई है, भले ही वह पूर्ण प्रदर्शन के साथ काम करना जारी रखे, ताकि विफलता की मरम्मत की जा सके या आसन्न पूर्ण विफलता प्रत्याशित हो।[14] इसी तरह, एक फेल-फास्ट घटक को विफलता के पहले बिंदु पर रिपोर्ट करने के लिए डिज़ाइन किया गया है, बजाय इसके कि डाउनस्ट्रीम घटकों को विफल होने और रिपोर्ट उत्पन्न करने की अनुमति दी जाए। यह अंतर्निहित समस्या का आसान निदान करने की अनुमति देता है, और विघटित स्थिति में अनुचित संचालन को रोक सकता है।

सिंगल फॉल्ट कंडीशन

सिंगल फॉल्ट की स्थिति एक ऐसी स्थिति है जहां किसी खतरे से बचाव का माध्यम दोषपूर्ण होता है।। यदि सिंगल फॉल्ट की स्थिति अपरिहार्य रूप से एक और एकल गलती की स्थिति में होती है, तो दो विफलताओं को एक एकल दोष स्थिति के रूप में माना जाता है।[15] एक स्रोत निम्नलिखित उदाहरण प्रस्तुत करता है:

मानदंड

प्रत्येक घटक के लिए दोष-सहनशील डिज़ाइन प्रदान करना सामान्य रूप से एक विकल्प नहीं है। एसोसिएटेड रिडंडेंसी कई दंड लाता है: वजन,आकार, बिजली की खपत, लागत में वृद्धि, साथ ही डिजाइन, सत्यापन और परीक्षण के लिए समय। इसलिए, यह निर्धारित करने के लिए कई विकल्पों की जांच की जानी चाहिए कि कौन से घटक दोष सहिष्णु होने चाहिए।[16]

  • घटक कितना क्रिटिकल है? कार में रेडियो क्रिटिकल नहीं होता है, इसलिए इस कंपोनेंट में फॉल्ट टॉलरेंस की जरूरत कम होती है।
  • घटक के विफल होने की कितनी संभावना है? कार में ड्राइव शाफ्ट जैसे कुछ घटकों के विफल होने की संभावना नहीं है, इसलिए किसी दोष सहिष्णुता की आवश्यकता नहीं है।
  • घटक फॉल्ट टॉलरेंट बनाना कितना महंगा है? एक निरर्थक कार इंजन की आवश्यकता, उदाहरण के लिए, आर्थिक रूप से और वजन और स्थान दोनों के मामले में बहुत महंगा होगा, जिस पर विचार किया जा सकता है।

एक घटक का एक उदाहरण जो सभी परीक्षण पास करता है वह एक कार की अधिभोगी संयम प्रणाली है। जबकि हम आम तौर पर 'प्राथमिक' अधिभोग संयम प्रणाली के बारे में नहीं सोचते हैं, यह गुरुत्वाकर्षण है। यदि वाहन लुढ़कता है या गंभीर जी-बलों( g-forces) से गुजरता है, तो अधिभोगी संयम की यह प्राथमिक विधि विफल हो सकती है। इस तरह की दुर्घटना के दौरान रहने वालों को रोकना सुरक्षा के लिए अत्यंत महत्वपूर्ण है, इसलिए हम पहली परीक्षा पास करते हैं। सीट बेल्ट लगाने से पहले ऑक्यूपेंट निरोधक के कारण दुर्घटनाएं काफी आम थीं, इसलिए हम दूसरा टेस्ट पास करते हैं। सीट बेल्ट जैसी अनावश्यक संयम पद्धति की लागत आर्थिक रूप से और वजन और स्थान दोनों के मामले में काफी कम है, इसलिए हम तीसरी परीक्षा पास करते हैं। इसलिए, सभी वाहनों में सीट बेल्ट जोड़ना एक उत्कृष्ट विचार है। अन्य पूरक संयम प्रणालियां, जैसे एयरबैग अधिक महंगे हैं और इसलिए उस परीक्षा को एक छोटे अंतर से पास करते हैं।

इस सिद्धांत का एक और उत्कृष्ट और दीर्घकालिक उदाहरण व्यवहार में लाया जा रहा है ब्रेकिंग सिस्टम: जबकि वास्तविक ब्रेक तंत्र महत्वपूर्ण हैं, वे विशेष रूप से अचानक (बल्कि प्रगतिशील) विफलता के लिए प्रवण नहीं हैं, और किसी भी मामले में अनुमति देने के लिए आवश्यक रूप से दोहराया गया है सभी पहियों पर ब्रेक बल का सम और संतुलित अनुप्रयोग। मुख्य घटकों को और दोगुना करना भी निषेधात्मक रूप से महंगा होगा और वे काफी वजन जोड़ देंगे। हालांकि, ड्राइवर नियंत्रण के तहत ब्रेक को सक्रिय करने के लिए आम तौर पर एक केबल (जंग, खिंचाव, जाम, स्नैप) या हाइड्रोलिक तरल पदार्थ (रिसाव कर सकते हैं, उबाल सकते हैं और बुलबुले विकसित कर सकते हैं, पानी को अवशोषित कर सकते हैं और इस प्रकार प्रभावशीलता खो सकते हैं) समान रूप से महत्वपूर्ण प्रणालियां स्वाभाविक रूप से कम मजबूत होती हैं। इस प्रकार अधिकांश आधुनिक कारों में फुटब्रेक हाइड्रोलिक ब्रेक सर्किट को तिरछे रूप से विभाजित किया जाता है ताकि विफलता के दो छोटे बिंदु दिए जा सकें, या तो केवल ब्रेक पावर को 50% तक कम करने का नुकसान और सीधे फ्रंट-बैक या लेफ्ट-राइट जितना खतरनाक ब्रेकफोर्स असंतुलन पैदा नहीं करता है। विभाजित,और हाइड्रोलिक सर्किट पूरी तरह से विफल हो जाना चाहिए (एक अपेक्षाकृत बहुत ही दुर्लभ घटना), केबल-एक्ट्यूएटेड पार्किंग ब्रेक के रूप में एक फेलसेफ है जो अपेक्षाकृत कमजोर रियर ब्रेक को संचालित करता है, लेकिन फिर भी वाहन को सुरक्षित पड़ाव पर ला सकता है ट्रांसमिशन/इंजन ब्रेकिंग के संयोजन के साथ, जब तक कि उस पर मांग सामान्य यातायात प्रवाह के अनुरूप हो। एक आपात स्थिति में कठोर ब्रेकिंग की आवश्यकता के साथ कुल फुट ब्रेक विफलता के संचयी रूप से असंभावित संयोजन के परिणामस्वरूप टकराव हो सकता है, लेकिन फिर भी कम गति पर एक की तुलना में दूसरे प्रकार से होता है।

फुट पेडल सक्रिय सर्विस ब्रेक की तुलना में, पार्किंग ब्रेक अपने आप में एक कम महत्वपूर्ण वस्तु है, और जब तक इसे फुटब्रेक के लिए एक बार के बैकअप के रूप में उपयोग नहीं किया जाता है, तब तक तत्काल खतरा नहीं होगा यदि यह गैर-कार्यात्मक पाया जाता है। इसलिए, इसमें कोई अतिरेक नहीं बनाया गया है (और यह आमतौर पर एक सस्ता, हल्का, लेकिन कम हार्डवियरिंग केबल एक्चुएशन सिस्टम का उपयोग करता है ), और यह पर्याप्त हो सकता है, अगर यह एक पहाड़ी पर होता है, तो पहले सड़क का एक सपाट टुकड़ा खोजने के लिए जिस पर रुकना है तो वाहन को क्षण भर के लिए स्थिर रखने के लिए फुटब्रेक का उपयोग करना पडता है। वैकल्पिक रूप से, कम ग्रेडिएंट्स पर, ट्रांसमिशन को पार्क, रिवर्स या फर्स्ट गियर में स्थानांतरित किया जा सकता है,और ट्रांसमिशन लॉक/इंजन दबाव इसे स्थिर रखने के लिए उपयोग किया जाता है, क्योंकि उन्हें पहले इसे रोकने के लिए कृत्रिमता शामिल करने की कोई आवश्यकता नहीं है। .

मोटरसाइकिलों पर, समान स्तर की विफलता-सुरक्षा सरल विधियों द्वारा प्रदान की जाती है; सबसे पहले आगे और पीछे के ब्रेक सिस्टम पूरी तरह से अलग हैं, भले ही उनकी सक्रियता की विधि (जो केबल, रॉड या हाइड्रोलिक हो सकती है) की परवाह किए बिना, एक को पूरी तरह से विफल होने की अनुमति देता है जबकि दूसरे को अप्रभावित छोड़ देता है। दूसरे, स्वचालित की तुलना में पिछला ब्रेक अपेक्षाकृत मजबूत है, यहां तक ​​​​कि स्पोर्ट्स मॉडल पर एक शक्तिशाली डिस्क होने के बावजूद, सामान्य इरादा फ्रंट सिस्टम के लिए ब्रेकिंग बल का विशाल बहुमत प्रदान करना है; चूंकि समग्र वाहन का वजन अधिक केंद्रीय होता है, पिछला टायर आम तौर पर बड़ा और ग्रिपियर होता है, और सवार उस पर अधिक भार डालने के लिए पीछे की ओर झुक सकता है, इसलिए पहिया के लॉक होने से पहले अधिक ब्रेक बल लगाने की अनुमति देता है। सस्ती, धीमी उपयोगिता-श्रेणी की मशीनों पर, फ्रंट व्हील को अतिरिक्त ब्रेक बल और आसान पैकेजिंग के लिए हाइड्रोलिक डिस्क का उपयोग करना चाहिए, रियर आमतौर पर एक साधारण, कुछ हद तक निष्फल, लेकिन असाधारण रूप से मजबूत रॉड-एक्ट्यूएटेड ड्रम होगा,आसानी के लिए इस तरह से फुटपेडल को पहिया से जोड़ने और,इससे भी महत्वपूर्ण बात,विनाशकारी विफलता की लगभग असंभवता, भले ही बाकी मशीन, जैसे कि उनके पहले कुछ वर्षों के उपयोग के बाद कम कीमत वाली बाइक, उपेक्षित रखरखाव से पतन के बिंदु पर है।

आवश्यकताएँ

दोष सहिष्णुता को बुनियादी विशेषताओं की आवश्यकता है:

  1. विफलता का कोई एकल बिंदु नहीं - यदि कोई सिस्टम विफलता का अनुभव करता है, तो उसे मरम्मत प्रक्रिया के दौरान बिना किसी रुकावट के काम करना जारी रखना चाहिए।
  2. विफल घटक के लिए दोष अलग करना - जब कोई विफलता होती है,तो सिस्टम को विफल घटक को अलग करने में सक्षम होना चाहिए। इसके लिए विफलता पहचान तंत्र को जोड़ने की आवश्यकता है जो केवल त्रुटि अलग करने के उद्देश्य से मौजूद है। एक त्रुटि की स्थिति मे असफल घटक को वर्गीकृत करने की आवश्यकता होती है। राष्ट्रीय मानक और प्रौद्योगिकी संस्थान (NIST) स्थिति, कारण, अवधि और प्रभाव के आधार पर त्रुटियो को वर्गीकृत करता है।[clarification needed]
  3. विफलता के प्रसार को रोकने के लिए दोष नियंत्रण - कुछ विफल प्रक्रिया पूरे सिस्टम को विफल कर सकती हैं। इस तरह की विफलता का एक उदाहरण बेकार ट्रांसमीटर है जो एक सिस्टम में वैध संचार को प्रभावित कर सकता है और पूरे सिस्टम की विफलता का कारण बन सकता है। फ़ायरवॉल (Firewalls) या अन्य प्रक्रिया की आवश्यकता है,जो सिस्टम की सुरक्षा के लिए एक बेकार ट्रांसमीटर या विफल घटक को अलग करते हैं।
  4. प्रत्यावर्तन प्रणाली की उपलब्धता[clarification needed]

इसके अलावा, दोष-सहिष्णुता (फॉल्ट टॉलरेंस) प्रणालियों को नियोजित जाँच आउटेज और अनियोजित जाँच आउटेज दोनों के संदर्भ में चित्रित किया गया है। इन्हें आमतौर पर एप्लिकेशन स्तर(application level) पर मापा जाता है,न कि हार्डवेयर स्तर पर। योग्यता के आंकड़े को उपलब्धता कहा जाता है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए,फाइव नाइन (five nines) प्रणाली सांख्यिकीय रूप से 99.999% उपलब्धता प्रदान करेगी।

दोष- सहिष्णुता (फॉल्ट टॉलरेंस) प्रणालियाँ आमतौर पर अतिरेक की अवधारणा पर आधारित होती हैं।

दोष सहिष्णुता तकनीक

महत्वपूर्ण प्रणालियों के लिए अनुसंधान में बड़ी मात्रा में बहुविषयक अध्यययन शामिल हैं। प्रणाली जितनी अधिक जटिल होगी,उतनी ही सावधानी से सभी संभावित अंतःक्रियाओं पर विचार करना होगा और इसके लिए तैयार रहना होगा। परिवहन,सार्वजनिक उपयोगिताओं और सेना में उच्च-मूल्य वाली प्रणालियों के महत्व को ध्यान में रखते हुए,अनुसंधान में संबंधित विषयों का क्षेत्र बहुत विस्तृत है: इसमें सॉफ्टवेयर मॉडलिंग( software modeling)या हार्डवेयर डिजाइन(hardware design) जैसे स्पष्ट विषय शामिल हो सकते हैं,जैसे स्टोकेस्टिक(stochastic ) मॉडल, ग्राफ सिद्धांत ,औपचारिक तर्क,समानांतर प्रसंस्करण(parallel processing), रिमोट डेटा ट्रांसमिशन,और बहुत कुछ। [17]

प्रतिकृत

स्पेयर कंपोनेंट्स (अतिरिक़्त घटक) फॉल्ट टॉलरेंस की पहली मूलभूत विशेषता को तीन तरीकों से संबोधित करते हैं:

  • प्रतिकृति: एक ही सिस्टम या सबसिस्टम के कई समान उदाहरण प्रदान करना,उन सभी के कार्यों या अनुरोधों को निर्देशित करना,और निर्दिष्ट संख्या के आधार पर सही परिणाम चुनना।
  • अतिरेक: एक ही प्रणाली के कई समान उदाहरण प्रदान करना और विफलता के मामले में शेष उदाहरणों में से एक पर स्विच करना।
  • विविधता: एक ही विनिर्देश के कई 'अलग' कार्यान्वयन प्रदान करना,और एक विशिष्ट कार्यान्वयन में त्रुटियों से निपटने के लिए प्रतिकृति प्रणालियों की तरह उनका उपयोग करना।

RAID 0 को छोड़कर,RAID (रेडंडान्त ऐरे ऑफ़ इनएक्सपेंसिवे डिसकस ) एक दोष-सहिष्णुता स्टोरेज डिवाइस(storage device) के उदाहरण हैं जो डेटा अतिरेक का उपयोग करता है।

एक लॉकस्टेप(lockstep) दोष-सहिष्णुता मशीन में समानांतर काम कर रहे प्रतिकृति तत्वों का उपयोग करती है। किसी भी समय, प्रत्येक तत्व की सभी प्रतिकृति एक ही अवस्था में होनी चाहिए। प्रत्येक प्रतिकृति को समान इनपुट(inputs) प्रदान किए जाते हैं,और समान आउटपुट(outputs) को प्रत्याशित किया जाता है। प्रतिकृति के आउटपुट(outputs) की तुलना वोटिंग सर्किट(voting circuit) का उपयोग करके की जाती है। प्रत्येक तत्व की दो प्रतिकृति वाली मशीन को दोहरी मॉड्यूलर निरर्थक (DMR) कहा जाता है। रिकवरी अन्य तरीकों पर निर्भर करती है जब वोटिंग सर्किट केवल गलत अवतरण का पता लगा सकता है। प्रत्येक तत्व की तीन प्रतिकृति वाली मशीन को ट्रिपल मॉड्यूलर रिडंडेंट (TMR) कहा जाता है। विद्युत क्षृंखला यह निर्धारित कर सकती है कि दो-से-एक क्षृंखला देखे जाने पर कौन सी प्रतिकृति त्रुटि में है। इस मामले में, विद्युत क्षृंखला सही परिणाम आउटपुट कर सकती है,और त्रुटिपूर्ण संस्करण को हटा सकती है ।इसके बाद,त्रुटिपूर्ण प्रतिकृति आंतरिक स्थिति को अन्य दो से अलग कर विद्युत क्षृंखला को डीएमआर(DMR) मोड में बदल सकती है। इस मॉडल को किसी भी बड़ी संख्या में प्रतिकृतियों पर लागू किया जा सकता है।

लॉकस्टेप दोष-सहिष्णुता मशीनों को आसानी से सिंक्रोनस (समकालिक) बनाता है, प्रतिकृति के प्रत्येक गेट के साथ घड़ी के एक ही किनारे पर परिवर्तन होता है,और प्रतिकृति के लिए घड़ियां बिल्कुल चरण में होती हैं। हालांकि,इसके बिना लॉकस्टेप सिस्टम बनाना संभव है।

प्रतिकृतियों को सिंक्रोनस(समकालिकता) में लाने के लिए उनकी आंतरिक संग्रहीत अवस्थाओं को समान बनाने की आवश्यकता होती है। उन्हें रीसेट की स्थिति(reset state)से शुरू किया जा सकता है। वैकल्पिक रूप से,एक प्रतिकृति की आंतरिक स्थिति को दूसरी प्रतिकृति में कॉपी किया जा सकता है।

डीएमआर(DMR) का एक प्रकार जोड़ी और अतिरिक्त है।दो प्रतिकृति तत्व लॉकस्टेप में एक जोड़ी के रूप में काम करते हैं,एक विद्युत क्षृंखला के संचालन में किसी गलत अवतरण का पता लगाती है और त्रुटि का संकेत देती है। दूसरी जोड़ी ठीक उसी तरह काम करती है।अंतिम क्षृंखला जोड़ी के आउटपुट का चयन करके त्रुटि की घोषणा नहीं करती है। जोड़ी और अतिरिक्त में तीन के बजाय चार प्रतिकृतियों के टीएमआर(TMR) की आवश्यकता होती है, लेकिन व्यावसायिक रूप से इसका उपयोग किया गया है।

विफलता-अनभिज्ञ कंप्यूटिंग

विफलता-अनभिज्ञ कंप्यूटिंग एक ऐसी तकनीक है जो कंप्यूटर प्रोग्राम को त्रुटियों के बावजूद निष्पादन जारी रखने में सक्षम बनाती है।[18] इस तकनीक को विभिन्न संदर्भों में लागू किया जा सकता है। सबसे पहले,यह प्रोग्राम अमान्य मेमोरी को रीड कर,[19] उस मेमोरी वैल्यू को अनदेखा करता है जिसे उसने एक्सेस करने का प्रयास किया था,यह सामान्य मेमोरी चेकर्स के विपरीत प्रोग्राम को त्रुटि की सूचना देता है या प्रोग्राम को निरस्त कर देता है।दूसरा,इसे उन अपवादों पर लागू किया जा सकता है जहां अप्रत्याशित अपवादों को रोकने के लिए कुछ कैच ब्लॉक(catch blocks) लिखे या संश्लेषित किए जाते हैं।[20] इसके अलावा,कैस्केडिंग विफलताओं(cascading failures) को रोकने के लिए निष्पादन को कई बार संशोधित किया जाता है।[21]

यह तकनीक गतिशील जांच के लिए कोड को फिर से लिखती है जिससेे निष्पादन समय 80% से 500% तक बढ़ जाता हैं।[22]

रिकवरी शेपर्ड

रिकवरी शेपर्ड एक प्रभावहीन तकनीक है जो सॉफ़्टवेयर प्रोग्राम को घातक त्रुटियों से बचने में सक्षम बनाती है जैसे कि नल पॉइंटर डीरेफरेंस(null pointer dereference)और शून्य से विभाजित करना।[23] विफल कंप्यूटिंग तकनीक की तुलना में, रिकवरी शेपर्ड को पुन: संकलित करने की आवश्यकता नहीं होती,यह प्रोग्राम सीधे बाइनरी पर काम करता है।

यह सही समय पर बाइनरी इंस्ट्रूमेंटेशन फ्रेमवर्क पिन का उपयोग करता है। यह त्रुटि होने पर आवेदन प्रक्रिया से जुड़कर निष्पादन की मरम्मत कर प्रभावों को ट्रैक करता है और आवेदन प्रक्रिया से सभी मरम्मत प्रभावों को फ़्लश करने के बाद प्रक्रिया से अलग हो जाता है।यह कार्यक्रम के निष्पादन में हस्तक्षेप नहीं करता है।[23]18 में से 17 के लिए नल-डीरेफरेंस और डिवाइड-बाय-जीरो,एक प्रोटोटाइप कार्यान्वयन एप्लिकेशन अपने उपयोगकर्ताओं को आउटपुट और सेवा प्रदान करने के लिए निष्पादन करना जारी रखता है।[23]

सर्किट ब्रेकर

सर्किट ब्रेकर डिजाइन पैटर्न(circuit breaker design pattern) सिस्टम को भयावह विफलताओं से की एक तकनीक है।

अतिरेक

अतिरेक कार्यात्मक क्षमताओं का प्रावधान है जो एक दोष मुक्त वातावरण में अनावश्यक होगा।[24] इसमें बैकअप घटक शामिल हो सकते हैं जो एक घटक के विफल होने पर स्वचालित रूप से किक(kick)करते हैं। उदाहरण के लिए,बड़े मालवाहक ट्रक उनके पास कई टायर हैं,और कोई भी टायर महत्वपूर्ण नहीं है (सामने के टायरों के अपवाद के साथ, जो चलाने के लिए उपयोग किए जाते हैं, लेकिन आम तौर पर कम भार उठाते हैं, प्रत्येक और कुल मिलाकर,अन्य चार से 16 की तुलना में, इसलिए विफल होने की संभावना कम होती है)।सिस्टम में सुधार के लिए अतिरेक को शामिल करने का विचार 1950 के दशक में पेश किया गया था।[25]

दो प्रकार की अतिरेक संभव है,[26] अंतरिक्ष अतिरेक और समय अतिरेक।अंतरिक्ष अतिरेक अतिरिक्त घटक,कार्य या डेटा आइटम प्रदान करता है जो त्रुटि मुक्त संचालन के लिए अनावश्यक हैं।अंतरिक्ष अतिरेक को हार्डवेयर,सॉफ्टवेयर और सूचना अतिरेक में वर्गीकृत किया जाता है,जो सिस्टम में जोड़े गए अनावश्यक संसाधनों के प्रकार पर निर्भर करता है।समय के अतिरेक में गणना या डेटा ट्रांसमिशन दोहराया जाता है और परिणाम की तुलना पिछले परिणाम की संग्रहीत प्रति(stored copy)से की जाती है। इस तरह के परीक्षण को 'इन सर्विस फॉल्ट टॉलरेंस टेस्टिंग (ISFTT) कहा जाता है।

नुकसान

दोष-सहिष्णुता डिजाइन के फायदे स्पष्ट हैं, जबकि इसके कोई नुकसान नहीं हैं:

  • एक ही घटक में खराबी का पता लगाने के साथ हस्तक्षेप।उदाहरण जैसे यात्री वाहन, किसी भी दोष-सहिष्णुता प्रणाली में ड्राइवर को पता नहीं हो सकता है कि टायर पंचर हो गया है। यह स्वचालित त्रुटि -पहचान प्रणाली के साथ नियंत्रित किया जाता है।टायर के मामले में,एयर प्रेशर मॉनिटर दबाव के नुकसान का पता लगाता है और ड्राइवर को सूचित करता है।प्रत्येक स्टॉप पर सभी टायरों का मैन्युअल रूप से निरीक्षण करना मैनुअल त्रुटि -पहचान प्रणाली है।
  • दूसरे घटक में गलती का पता लगाने के साथ हस्तक्षेप। इस समस्या मे एक और परिवर्तन तब होता है जब एक घटक में दोष सहिष्णुता दूसरे घटक में गलती का पता लगाने से रोकती है। उदाहरण के लिए, यदि घटक बी(B) घटक ए(A) से आउटपुट के आधार पर कुछ ऑपरेशन करता है,तो बी(B) में दोष सहिष्णुता ए(A) की समस्या छुपा सकती है। यदि घटक बी(B) को बाद में बदल दिया जाता है (कम दोष-सहिष्णुता डिजाइन के लिए) तो सिस्टम अचानक विफल हो सकता है, जिससे यह प्रतीत होता है कि नया घटक बी(B) समस्या है।सिस्टम की सावधानीपूर्वक जांच करने के बाद ही यह स्पष्ट होगा कि मूल समस्या वास्तव में घटक ए(A) के साथ है।
  • गलती सुधार की प्राथमिकता में कमी। भले ही ऑपरेटर को त्रुटि के बारे में पता हो लेकिन एक दोष-सहिष्णुता प्रणाली होने से त्रुटि के प्रभाव को कम किया जा सकता है।यदि त्रुटि को ठीक नहीं किया गया तो दोष-सहिष्णु घटक पूरी तरह से विफल हो जायेंगे और यह सिस्टम को विफलता की ओर ले जाएगा।
  • परीक्षण कठिनाई। परमाणु रिएक्टर जैसे कुछ महत्वपूर्ण दोष-सहिष्णुता प्रणालियों के लिए,बैकअप घटक कार्यात्मक हैं यह सत्यापित करने का कोई आसान तरीका नहीं है। इसका उदाहरणचेरनोबिल(Chernobyl) है, जहां ऑपरेटरों ने प्राथमिक और द्वितीयक कूलिंग को अक्षम करके आपातकालीन बैकअप कूलिंग का परीक्षण किया। बैकअप विफल हो गया, जिसके परिणामस्वरूप बड़े पैमाने पर परमाणु दुर्घटना हुई।
  • लागत। दोष-सहिष्णुता घटकों और निरर्थक घटकों दोनों की लागत में वृद्धि होती है। इसमें वजन जैसे अन्य उपाय शामिल करके किफ़ायती बनाया जा सकता है। उदाहरण के लिए, मानवयुक्त अंतरिक्ष यान,में इतने अनावश्यक और दोष-सहिष्णुता घटक हैं कि उनका वजन मानव रहित प्रणालियों पर बढ़ जाता है,जिन्हें समान स्तर की सुरक्षा की आवश्यकता नहीं होती है।
  • निम्न घटक। एक दोष-सहिष्णुता डिज़ाइन जो सिस्टम को निष्क्रिय बना देता है, निम्न घटकों के उपयोग की अनुमति दे सकता है। हालांकि इसमें लागत वृद्धि को कम करने की क्षमता है,कई निम्न घटकों का उपयोग कर सिस्टम को गैर-दोष-सहिष्णुता प्रणाली के बराबर या उससे और ज्यादा स्तर तक कम कर सकता है।

संबंधित शब्द

दोष सहिष्णुता और उन प्रणालियों में अंतर है जिनमें शायद ही कभी समस्याएं होती हैं। उदाहरण के लिए,वेस्टर्न इलेक्ट्रिक क्रॉसबार(Western Electric crossbar) सिस्टम "दोष प्रतिरोधी" थे क्योंकि इसमे विफलता दर प्रति चालीस वर्षों में दो घंटे थी। लेकिन जब कोई त्रुटि हुई तो सिस्टम ने काम करना बंद कर दिया,और इसलिए यह 'दोष सहिष्णु' नहीं थे।

यह भी देखे

संदर्भ

  1. अडैप्टिव फॉल्ट टॉलरेंस एंड ग्रेसफुल डिग्रेडेशन, ऑस्कर गोंजालेज एट अल।, 1997, मैसाचुसेट्स विश्वविद्यालय - एम्हेर्स
  2. जॉनसन, बी. डब्ल्यू. (1984)। फॉल्ट-टॉलरेंट माइक्रोप्रोसेसर-आधारित सिस्टम्स, आईईईई माइक्रो, वॉल्यूम। 4, नहीं। 6, पीपी. 6-2
  3. 3.0 3.1 3.2 Daniel P. Siewiorek; C. Gordon Bell; Allen Newell (1982). Computer Structures: Principles and Examples. McGraw-Hill. ISBN 0-07-057302-6.
  4. Algirdas Avižienis; George C. Gilley; Francis P. Mathur; David A. Rennels; John A. Rohr; David K. Rubin. "The STAR (Self-Testing And Repairing) Computer: An Investigation Of the Theory and Practice Of Fault-tolerant Computer Design" (PDF).
  5. "Voyager Mission state (more often than not at least three months out of date)". NASA (in English). Retrieved 2022-04-01.
  6. Randell, Brian; Lee, P.A.; Treleaven, P. C. (June 1978). "Reliability Issues in Computing System Design". ACM Computing Surveys. 10 (2): 123–165. doi:10.1145/356725.356729. ISSN 0360-0300. S2CID 16909447.
  7. {{उद्धरण जर्नल | लेखक = पी. जे. डेनिंग | लेखक-लिंक = पी. जे. डेनिंग | शीर्षक = दोष सहिष्णु ऑपरेटिंग सिस्टम | जर्नल = एसीएम कम्प्यूटिंग सुरveys | पेज=359–389 | वॉल्यूम =8 | अंक = 4 | तारीख=दिसंबर 1976 | यूआरएल = http://portal.acm.org/citation.cfm?id=356680&dl=ACM&coll=&CFID=15151515&CFTOKEN=6184618 | doi =10.1145/356678.356680 | s2cid=207736773 | issn= 0360-0300}
  8. Theodore A. Linden (December 1976). "Operating System Structures to Support Security and Reliable Software". ACM Computing Surveys. 8 (4): 409–445. doi:10.1145/356678.356682. hdl:2027/mdp.39015086560037. ISSN 0360-0300. S2CID 16720589.
  9. रे होल्ट। F14A सेंट्रल एयर डेटा कंप्यूटर, और 1968 में एलएसआई टेक्नोलॉजी स्टेट-ऑफ-द-आर्ट
  10. कंप्यूटर डिजाइन में दोष सहिष्णु कंप्यूटिंग नीलफोरोशन, एम.आर जर्नल ऑफ कंप्यूटिंग साइंसेज इन कॉलेज आर्काइव खंड 18, अंक 4 (अप्रैल 2003) पृष्ठ: 213 - 220, ISSN 1937-4771
  11. "Why your website should work without JavaScript". DEV Community (in English). Retrieved 2021-05-16.
  12. Fairfax, Zackerie (2020-11-28). "Legacy Twitter Shutdown Means You Can't Tweet From The 3DS Anymore". ScreenRant (in English). Retrieved 2021-07-01.{{cite web}}: CS1 maint: url-status (link)
  13. स्टालिंग्स, डब्ल्यू (2009): ऑपरेटिंग सिस्टम। आंतरिक और डिजाइन सिद्धांत , छठा संस्करण
  14. Thampi, Sabu M. (2009-11-23). "Introduction to Distributed Systems". arXiv:0911.4395 [cs.DC].
  15. "Control". Grouper.ieee.org. Archived from the original on 1999-10-08. Retrieved 2016-04-06.
  16. डबरोवा, ई। (2013)। दोष-सहिष्णु डिजाइन, स्प्रिंगर, 2013, ISBN 978-1-4614-2112-2
  17. Reliability evaluation of some fault-tolerant computer architectures. Springer-Verlag. November 1980. ISBN 978-3-540-10274-8.
  18. Herzberg, Amir; Shulman, Haya (2012). "Oblivious and Fair Server-Aided Two-Party Computation". 2012 Seventh International Conference on Availability, Reliability and Security. IEEE: 75–84. doi:10.1109/ares.2012.28. ISBN 978-1-4673-2244-7. S2CID 6579295.
  19. Rigger, Manuel; Pekarek, Daniel; Mössenböck, Hanspeter (2018), "Context-Aware Failure-Oblivious Computing as a Means of Preventing Buffer Overflows", Network and System Security, Cham: Springer International Publishing, pp. 376–390, arXiv:1806.09026, doi:10.1007/978-3-030-02744-5_28, ISBN 978-3-030-02743-8, retrieved 2020-10-07
  20. Zhang, Long; Monperrus, Martin (2019). "TripleAgent: Monitoring, Perturbation and Failure-Obliviousness for Automated Resilience Improvement in Java Applications". 2019 IEEE 30th International Symposium on Software Reliability Engineering (ISSRE). Berlin, Germany: IEEE: 116–127. arXiv:1812.10706. doi:10.1109/ISSRE.2019.00021. ISBN 978-1-7281-4982-0. S2CID 57189195.
  21. Durieux, Thomas; Hamadi, Youssef; Yu, Zhongxing; Baudry, Benoit; Monperrus, Martin (2018). "Exhaustive Exploration of the Failure-Oblivious Computing Search Space". 2018 IEEE 11th International Conference on Software Testing, Verification and Validation (ICST). pp. 139–149. arXiv:1710.09722. doi:10.1109/ICST.2018.00023. ISBN 978-1-5386-5012-7. S2CID 4304123.
  22. Keromytis, Angelos D. (2007), "Characterizing Software Self-Healing Systems", in Gorodetski, Vladimir I.; Kotenko, Igor; Skormin, Victor A. (eds.), Characterizing Software Self-Healing Systems, Computer network security: Fourth International Conference on Mathematical Methods, Models, and Architectures for Computer Network Security, Springer, ISBN 978-3-540-73985-2
  23. 23.0 23.1 23.2 Long, Fan; Sidiroglou-Douskos, Stelios; Rinard, Martin (2014). "Automatic Runtime Error Repair and Containment via Recovery Shepherding". Proceedings of the 35th ACM SIGPLAN Conference on Programming Language Design and Implementation. PLDI '14'. New York, NY, USA: ACM. pp. 227–238. doi:10.1145/2594291.2594337. ISBN 978-1-4503-2784-8. S2CID 6252501.
  24. लैप्री, जे.सी. (1985)। डिपेंडेबल कंप्यूटिंग एंड फॉल्ट टॉलरेंस: कॉन्सेप्ट्स एंड टर्मिनोलॉजी, फॉल्ट-टॉलरेंट कंप्यूटिंग (FTSC-15) पर 15वें अंतर्राष्ट्रीय संगोष्ठी की कार्यवाही, पीपी 2–1
  25. वॉन न्यूमैन, जे। (1956)। [http://www.cyclify.com/wiki/images/a/af/Von_Neumann_Probabilistic_Logics_and_the_Synthesis_of_Reliable_Organisms_from_Unreliable_Components.pdf प्रोबेबिलिस्टिक लॉजिक्स एंड सिंथेसिस ऑफ रिलायबल कंपोनेंट्स फ्रॉम अनरिलायबल कंपोनेंट्स स्टडीज, एड। सी. शैनन और जे. मैकार्थी, प्रिंसटन यूनिवर्सिटी प्रेस, पीपी. 43–9
  26. एविज़िएनिस, ए। (1976)। फॉल्ट-टॉलरेंट सिस्टम्स , कंप्यूटर पर आईईईई लेनदेन, वॉल्यूम। 25, नहीं। 12, पीपी. 1304–131