फॉल्ट टॉलरेंस
This article needs additional citations for verification. (January 2008) (Learn how and when to remove this template message) |
फॉल्ट टॉलरेंस वह गुण है जो किसी प्रणाली( सिस्टम) को इसके कुछ घटकों में एक या अधिक दोषों की विफलता की स्थिति में ठीक से संचालन जारी रखने में सक्षम बनाता है। यदि इसकी परिचालन गुणवत्ता बिल्कुल भी कम हो जाती है, तो कमी विफलता की गंभीरता के समानुपाती होती है,एक सरलता से डिज़ाइन की गई प्रणाली की तुलना में, जिसमें एक छोटी सी विफलता भी विघटन का कारण बन सकती है। उच्च उपलब्धता, महत्वपूर्ण लक्ष्य, या यहां तक कि जीवन महत्वपूर्ण प्रणाली में दोष सहिष्णुता (फॉल्ट टॉलरेंस) की विशेष रूप से मांग की जाती है। सिस्टम के कुछ हिस्सों के टूटने पर कार्यक्षमता को बनाए रखने की क्षमता को ग्रेसफुल डिग्रेडेशन कहा जाता है।[1]
एक दोष-सहनशील डिज़ाइन सिस्टम को अपने इच्छित संचालन को जारी रखने में सक्षम बनाता है, संभवतः कम स्तर पर, पूरी तरह से विफल होने के बजाय, सिस्टम का कुछ हिस्सा विफल हो जाता है। [2] इस शब्द का प्रयोग आमतौर पर कंप्यूटर सिस्टम का वर्णन करने के लिए किया जाता है, जिसे कम या ज्यादा पूरी तरह से चालू रखने के लिए डिज़ाइन किया गया है, शायद, कुछ आंशिक विफलता की स्थिति में प्रवाह क्षमतामें कमी या प्रतिक्रिया समय में वृद्धि होती है। अर्थात्, हार्डवेयर या सॉफ़्टवेयर में समस्याओं के कारण संपूर्ण रूप से सिस्टम बंद नहीं होता है। एक अन्य क्षेत्र में एक उदाहरण एक मोटर वाहन है जिसे डिज़ाइन किया गया है, इसलिए यदि टायरों में से एक पंचर हो गया है, या एक संरचना जो थकान, जंग, निर्माण दोष, या प्रभाव जैसे कारणों से होने वाली क्षति की उपस्थिति में अपनी अखंडता बनाए रखने में सक्षम हो, तो इसे चलाना जारी रहेगा।
एक व्यक्तिगत प्रणाली के दायरे में, असाधारण परिस्थितियों का अनुमान लगाकर और उनसे निपटने के लिए प्रणाली का निर्माण करके दोष सहिष्णुता प्राप्त की जा सकती है, और सामान्य तौर पर,आत्म-स्थिरीकरण का लक्ष्य है कि सिस्टम एक त्रुटि मुक्त स्थिति की ओर परिवर्तित हो जाए। हालांकि,यदि सिस्टम विफलता के परिणाम विनाशकारी हैं, या इसे पर्याप्त रूप से विश्वसनीय बनाने की लागत बहुत अधिक है, तो किसी प्रकार के दोहराव का उपयोग करना बेहतर समाधान हो सकता है। किसी भी मामले में, यदि सिस्टम की विफलता का परिणाम इतना भयावह है, तो सिस्टम को सुरक्षित मोड में वापस आने के लिए रिवर्सन का उपयोग करने में सक्षम होना चाहिए। यह रोल-बैक रिकवरी के समान है, लेकिन यदि मानव लूप में मौजूद हैं तो यह एक मानवीय क्रिया हो सकती है।
इतिहास
पहला ज्ञात दोष-सहिष्णु(फॉल्ट टॉलरेंस) कंप्यूटर SAPO था,जिसे 1951 में चेकोस्लोवाकिया में एंटोनिन स्वोबोडा द्वारा बनाया गया था।[3]: 155 इसका मूल डिजाइन चुंबकीय ड्रम था जो रिले के माध्यम से जुड़ा हुआ था, जिसमें स्मृति त्रुटि का पता लगाने की मतदान पद्धति (ट्रिपल मॉड्यूलर रिडंडेंसी) थी। इस लाइन के साथ कई अन्य मशीनें विकसित की गईं, जो ज्यादातर सैन्य उपयोग के लिए थीं। आखिरकार, वे तीन अलग-अलग श्रेणियों में विभाजित हो गए: मशीनें जो बिना किसी रखरखाव के लंबे समय तक चलेंगी, जैसे कि नासा अंतरिक्ष जांच और उपग्रह पर उपयोग की जाने वाली मशीनें; ऐसे कंप्यूटर जो बहुत भरोसेमंद थे लेकिन उन्हें निरंतर निगरानी की आवश्यकता थी, जैसे कि परमाणु ऊर्जा संयंत्र या सुपरकोलाइडर प्रयोगों की निगरानी और नियंत्रण के लिए उपयोग किए जाने वाले कंप्यूटर; और अंत में, उच्च मात्रा में रनटाइम वाले कंप्यूटर जो भारी उपयोग में होंगे, जैसे कि बीमा कंपनियों द्वारा उनकी सम्भाविकी निगरानी के लिए उपयोग किए जाने वाले कई सुपर कंप्यूटर।
तथाकथित LLNM (लॉन्ग लाइफ,नो मेंटेनेंस) कंप्यूटिंग में अधिकांश विकास 1960 के दशक में अपोलो योजना और अन्य शोध पहलुओं की तैयारी के दौरान किया गया था।[4] पहली मशीन अंतरिक्ष प्रेक्षणगृह में गई और उनका दूसरा प्रयास JSTAR कंप्यूटर,समुद्रयात्रा में इस्तेमाल किया गया। मेमोरी रिकवरी विधियों का उपयोग करने के लिए इस कंप्यूटर में मेमोरी सरणियों का बैकअप था और इस प्रकार इसे जेपीएल सेल्फ-टेस्टिंग-एंड-रिपेयरिंग कंप्यूटर कहा जाता था। यह अपनी स्वयं की त्रुटियों का पता लगा सकता है और उन्हें ठीक कर सकता है या आवश्यकतानुसार अनावश्यक मॉड्यूल ला सकता है। 2022 की शुरुआत तक कंप्यूटर अभी भी काम कर रहा है।[5]
हाइपर-डिपेंडेबल कंप्यूटरों का संचालन ज्यादातर विमान निर्माताओं,परमाणु ऊर्जा कंपनियों और रेल उद्योग द्वारा किया गया था।[3]: 210 इन्हें भारी मात्रा में अपटाइम वाले कंप्यूटरों की आवश्यकता थी जो इस तथ्य पर भरोसा करते हुए कि कंप्यूटर आउटपुट को लगातार मनुष्यों द्वारा दोषों का पता लगाने के लिए मॉनिटर किया जाएगा। फिर से,आईबीएम (IBM) ने सैटर्न वी रॉकेट के मार्गदर्शन के लिए इस तरह का पहला कंप्यूटर विकसित किया, लेकिन बाद में बीएनएसएफ( BNSF), यूनिसिस और जनरल इलेक्ट्रिक ने अपना खुद का कंप्यूटर बनाया।[3]: 223
1970 के दशक में इस क्षेत्र में बहुत काम हुआ है,[6][7][8] उदाहरण के लिए, एफ14 सीएडीसी मेंअंतर्निर्मित आत्म-परीक्षण किया गया था।[9]
सामान्य तौर पर, दोष-सहिष्णु डिजाइनों के शुरुआती प्रयास मुख्य रूप से आंतरिक निदान पर केंद्रित थे, जहां एक गलती से संकेत मिलता था कि कुछ विफल हो रहा था और एक कार्यकर्ता इसे बदल सकता है। उदाहरण के लिए, SAPO के पास एक तरीका था जिसके द्वारा दोषपूर्ण मेमोरी ड्रम विफलता से पहले एक शोर का उत्सर्जन करेगा।[10] बाद के प्रयासों से पता चला कि पूरी तरह से प्रभावी होने के लिए, सिस्टम को स्वयं-मरम्मत और निदान करना होगा - एक गलती को अलग करना और फिर मरम्मत की आवश्यकता को चेतावनी देते हुए एक अनावश्यक बैकअप को लागू करना। इसे एन-मॉडल अतिरेक के रूप में जाना जाता है, जहां दोष स्वत: सुरक्षित और ऑपरेटर को चेतावनी का कारण बनते हैं, और यह आज भी उपयोग में स्तर एक दोष-सहिष्णु डिजाइन का सबसे सामान्य रूप है।
वोटिंग एक और प्रारंभिक विधि थी, जैसा कि ऊपर चर्चा की गई है, जिसमें कई निरर्थक बैकअप लगातार काम कर रहे हैं और एक दूसरे के परिणामों की जांच कर रहे हैं, इस परिणाम के साथ कि यदि, उदाहरण के लिए, चार घटकों ने 5 के उत्तर की सूचना दी और एक घटक ने 6 के उत्तर की सूचना दी, तो अन्य चार "वोट" करेंगे कि पाँचवाँ घटक दोषपूर्ण था और इसे सेवा से बाहर कर दिया गया था। इसे N बहुमत वाले मतदान में से M कहा जाता है।
ऐतिहासिक रूप से, गति हमेशा एन-मॉडल(N-model) से आगे बढ़ने के लिए और एन(N) से एम(M) से अधिक तक आगे बढ़ने के लिए रही है क्योंकि सिस्टम की जटिलता और संक्रमणीय स्थिति को गलती-नकारात्मक से गलती-सकारात्मक तक सुनिश्चित करने की कठिनाई ने संचालन को बाधित नहीं किया।
टेंडेम और स्ट्रैटस ऑनलाइन लेनदेन प्रोसेसिंग के लिए दोष-सहनशील कंप्यूटर सिस्टम के डिजाइन में विशेषज्ञता वाली पहली कंपनियों में से थे।
उदाहरण
हार्डवेयर दोष सहनशीलता के लिए कभी-कभी यह आवश्यक होता है कि टूटे हुए हिस्सों को बाहर निकाला जाए और सिस्टम के अभी भी चालू होने पर नए भागों के साथ बदल दिया जाए (कंप्यूटिंग में जिसे हॉट स्वैपिंग के रूप में जाना जाता है)। एकल बैकअप के साथ लागू की गई ऐसी प्रणाली को एकल बिंदु सहिष्णु ( सिंगल पॉइंट टॉलरेंट) के रूप में जाना जाता है और यह अधिकांश दोष-सहिष्णु प्रणालियों का प्रतिनिधित्व करता है। ऐसी प्रणालियों में विफलता के बीच का औसत समय इतना लंबा होना चाहिए कि इससे पहले कि बैकअप भी विफल हो जाए ऑपरेटर टूटे हुए उपकरणों को ठीक कर सकेे। यदि विफलताओं के बीच का समय यथासंभव लंबा हो तो यह सहायक होता है, लेकिन दोष-सहिष्णु प्रणाली में इसकी विशेष रूप से आवश्यकता नहीं होती है।
कंप्यूटर अनुप्रयोगों में दोष सहिष्णुता उल्लेखनीय रूप से सफल है। टेंडेम कंप्यूटर्स ने अपना पूरा व्यवसाय ऐसी मशीनों पर बनाया, जिन्होंने नॉनस्टॉप सिस्टम बनाने के लिए सिंगल-पॉइंट टॉलरेंस का इस्तेमाल किया, जिसमें अपटाइम मापा गया।
विफल-सुरक्षित आर्किटेक्चर में कंप्यूटर सॉफ़्टवेयर भी शामिल हो सकता है, उदाहरण के लिए प्रक्रिया प्रतिकृति द्वारा।
डेटा स्वरूपों को भी इनायत से नीचा दिखाने के लिए डिज़ाइन किया जा सकता है। उदाहरण के लिए एचटीएमएल , फॉरवर्ड संगत के लिए डिज़ाइन किया गया है, वेब ब्राउज़र एस को दस्तावेज़ के अनुपयोगी होने के बिना नए और असमर्थित एचटीएमएल इकाइयों को अनदेखा करने की इजाजत देता है। इसके अतिरिक्त, कुछ साइटें, जिनमें ट्विटर (दिसंबर 2020 तक) जैसे लोकप्रिय प्लेटफॉर्म शामिल हैं, एक वैकल्पिक हल्का फ्रंट एंड प्रदान करते हैं जो जावास्क्रिप्ट पर निर्भर नहीं है और इसमें न्यूनतम लेआउट है, जिससे व्यापक एक्सेसिबिलिटी और आउटरीच , जैसे गेम कंसोल एस पर सीमित वेब ब्राउज़िंग क्षमताओं के साथ[11][12]
शब्दावली
एक या अधिक घटक विफल होने पर भी एक अत्यधिक दोष-सहिष्णु प्रणाली प्रदर्शन के समान स्तर पर जारी रह सकती है। उदाहरण के लिए, एक बैकअप विद्युत जनरेटर वाला भवन दीवार के आउटलेट को समान वोल्टेज प्रदान करेगा, भले ही ग्रिड पावर विफल हो जाए।
एक सिस्टम जिसे के लिए डिज़ाइन किया गया है, विफल सुरक्षित , या असफल-सुरक्षित, या इनायत से विफल , चाहे वह कम स्तर पर कार्य करता हो या पूरी तरह से विफल हो, ऐसा इस तरह से करता है जो लोगों, संपत्ति या डेटा को चोट, क्षति से बचाता है। , घुसपैठ, या प्रकटीकरण। कंप्यूटर में, एक त्रुटि का अनुभव करने के बाद डेटा भ्रष्टाचार को रोकने के लिए ग्रेसफुल एग्जिट (एक अनियंत्रित क्रैश के विपरीत) को निष्पादित करके एक प्रोग्राम विफल-सुरक्षित हो सकता है। इसी तरह का अंतर कुएं के खराब होने और के खराब होने के बीच में किया गया है।
विफल-घातक विपरीत रणनीति है, जिसका उपयोग हथियार प्रणालियों में किया जा सकता है जो लक्ष्य को मारने या घायल करने के लिए डिज़ाइन किए गए हैं, भले ही सिस्टम का हिस्सा क्षतिग्रस्त या नष्ट हो गया हो।
एक प्रणाली जिसे सुंदर गिरावट का अनुभव करने के लिए डिज़ाइन किया गया है, या सॉफ्ट विफल (कंप्यूटिंग में उपयोग किया जाता है, असफल सुरक्षित के समान[13]) कुछ घटक विफलताओं के बाद प्रदर्शन के कम स्तर पर काम करता है। उदाहरण के लिए, एक इमारत कम स्तर पर प्रकाश और कम गति पर लिफ्ट संचालित कर सकती है यदि ग्रिड पावर विफल हो जाती है, बजाय या तो लोगों को पूरी तरह से अंधेरे में फंसाने या पूरी शक्ति से काम करना जारी रखने के बजाय। ग्रेसफुल डिग्रेडेशन के एक उदाहरण की गणना में यह है कि यदि ऑनलाइन वीडियो स्ट्रीम करने के लिए अपर्याप्त नेटवर्क बैंडविड्थ उपलब्ध है, तो उच्च-रिज़ॉल्यूशन संस्करण के स्थान पर कम-रिज़ॉल्यूशन संस्करण को स्ट्रीम किया जा सकता है। प्रोग्रेसिव एन्हांसमेंट कंप्यूटिंग में एक उदाहरण है, जहां वेब पेज पुराने, छोटे स्क्रीन या सीमित क्षमता वाले वेब ब्राउज़र के लिए एक बुनियादी कार्यात्मक प्रारूप में उपलब्ध हैं, लेकिन अतिरिक्त तकनीकों को संभालने में सक्षम ब्राउज़रों के लिए एक उन्नत संस्करण में उपलब्ध हैं या जिनके पास एक है बड़ा डिस्प्ले उपलब्ध है।
दोष-सहनशील कंप्यूटर सिस्टम एस में, स्ट्रांग माने जाने वाले प्रोग्राम पूरी तरह से क्रैश होने के बजाय त्रुटि, अपवाद या अमान्य इनपुट के बावजूद संचालन जारी रखने के लिए डिज़ाइन किए गए हैं। सॉफ्टवेयर भंगुरता मजबूती के विपरीत है। लचीला नेटवर्क कुछ लिंक या नोड्स की विफलता के बावजूद डेटा संचारित करना जारी रखता है; लचीला भवन और बुनियादी ढाँचा इसी तरह भूकंप, बाढ़, या टकराव जैसी स्थितियों में पूर्ण विफलता को रोकने की उम्मीद है।
उच्च विफलता पारदर्शिता के साथ एक प्रणाली उपयोगकर्ताओं को सचेत करेगी कि एक घटक विफलता हुई है, भले ही वह पूर्ण प्रदर्शन के साथ काम करना जारी रखे, ताकि विफलता की मरम्मत की जा सके या आसन्न पूर्ण विफलता प्रत्याशित हो[14] इसी तरह, एक फेल-फास्ट घटक को विफलता के पहले बिंदु पर रिपोर्ट करने के लिए डिज़ाइन किया गया है, बजाय इसके कि डाउनस्ट्रीम घटकों को विफल होने और रिपोर्ट उत्पन्न करने की अनुमति दी जाए। यह अंतर्निहित समस्या का आसान निदान करने की अनुमति देता है, और टूटी हुई स्थिति में अनुचित संचालन को रोक सकता है।
सिंगल फॉल्ट कंडीशन
एक एक गलती की स्थिति एक ऐसी स्थिति है जहां सुरक्षा के लिए खतरे के खिलाफ एक साधन दोषपूर्ण है। यदि एक एकल गलती की स्थिति अपरिहार्य रूप से एक और एकल गलती की स्थिति में होती है, तो दो विफलताओं को एक एकल दोष स्थिति के रूप में माना जाता है[15] एक स्रोत निम्नलिखित उदाहरण प्रस्तुत करता है:
A single-fault condition is a condition when a single means for protection against hazard in equipment is defective or a single external abnormal condition is present, e.g. short circuit between the live parts and the applied part.[16]
मानदंड
प्रत्येक घटक के लिए दोष-सहनशील डिज़ाइन प्रदान करना सामान्य रूप से एक विकल्प नहीं है। एसोसिएटेड रिडंडेंसी कई दंड लाता है: वजन, आकार, बिजली की खपत, लागत में वृद्धि, साथ ही डिजाइन, सत्यापन और परीक्षण के लिए समय। इसलिए, यह निर्धारित करने के लिए कई विकल्पों की जांच की जानी चाहिए कि कौन से घटक दोष सहिष्णु होना चाहिए[17]
- कंपोनेंट कितना क्रिटिकल है? कार में रेडियो क्रिटिकल नहीं होता है, इसलिए इस कंपोनेंट में फॉल्ट टॉलरेंस की जरूरत कम होती है।
- घटक के विफल होने की कितनी संभावना है? कार में ड्राइव शाफ्ट जैसे कुछ घटकों के विफल होने की संभावना नहीं है, इसलिए किसी दोष सहिष्णुता की आवश्यकता नहीं है।
- कंपोनेंट फॉल्ट टॉलरेंट बनाना कितना महंगा है? एक निरर्थक कार इंजन की आवश्यकता, उदाहरण के लिए, आर्थिक रूप से और वजन और स्थान दोनों के मामले में बहुत महंगा होगा, जिस पर विचार किया जा सकता है।
एक घटक का एक उदाहरण जो सभी परीक्षण पास करता है वह एक कार की अधिभोगी संयम प्रणाली है। जबकि हम आम तौर पर 'प्राथमिक' अधिभोग संयम प्रणाली के बारे में नहीं सोचते हैं, यह गुरुत्वाकर्षण है। यदि वाहन लुढ़कता है या गंभीर जी-बलों से गुजरता है, तो अधिभोगी संयम की यह प्राथमिक विधि विफल हो सकती है। इस तरह की दुर्घटना के दौरान रहने वालों को रोकना सुरक्षा के लिए अत्यंत महत्वपूर्ण है, इसलिए हम पहली परीक्षा पास करते हैं। सीट बेल्ट सेकेंड से पहले ऑक्यूपेंट इजेक्शन के कारण दुर्घटनाएं काफी आम थीं, इसलिए हम दूसरा टेस्ट पास करते हैं। सीट बेल्ट जैसी अनावश्यक संयम पद्धति की लागत आर्थिक रूप से और वजन और स्थान दोनों के मामले में काफी कम है, इसलिए हम तीसरी परीक्षा पास करते हैं। इसलिए, सभी वाहनों में सीट बेल्ट जोड़ना एक उत्कृष्ट विचार है। अन्य पूरक संयम प्रणालियां, जैसे एयरबैग एस, अधिक महंगी हैं और इसलिए उस परीक्षा को एक छोटे अंतर से पास करें।
इस सिद्धांत का एक और उत्कृष्ट और दीर्घकालिक उदाहरण व्यवहार में लाया जा रहा है ब्रेकिंग सिस्टम: जबकि वास्तविक ब्रेक तंत्र महत्वपूर्ण हैं, वे विशेष रूप से अचानक (बल्कि प्रगतिशील) विफलता के लिए प्रवण नहीं हैं, और किसी भी मामले में अनुमति देने के लिए आवश्यक रूप से दोहराया गया है सभी पहियों पर ब्रेक बल का सम और संतुलित अनुप्रयोग। मुख्य घटकों को और दोगुना करना भी निषेधात्मक रूप से महंगा होगा और वे काफी वजन जोड़ देंगे। हालांकि, ड्राइवर नियंत्रण के तहत ब्रेक को सक्रिय करने के लिए समान रूप से महत्वपूर्ण प्रणालियां स्वाभाविक रूप से कम मजबूत होती हैं, आम तौर पर एक केबल (जंग, खिंचाव, जाम, स्नैप) या हाइड्रोलिक तरल पदार्थ (रिसाव कर सकते हैं, उबाल सकते हैं और बुलबुले विकसित कर सकते हैं, पानी को अवशोषित कर सकते हैं और इस प्रकार प्रभावशीलता खो सकते हैं) ) इस प्रकार अधिकांश आधुनिक कारों में फुटब्रेक हाइड्रोलिक ब्रेक सर्किट को तिरछे रूप से विभाजित किया जाता है ताकि विफलता के दो छोटे बिंदु दिए जा सकें, या तो केवल ब्रेक पावर को 50% तक कम करने का नुकसान और सीधे फ्रंट-बैक या लेफ्ट-राइट जितना खतरनाक ब्रेकफोर्स असंतुलन पैदा नहीं करता है। विभाजित, और हाइड्रोलिक सर्किट पूरी तरह से विफल हो जाना चाहिए (एक अपेक्षाकृत बहुत ही दुर्लभ घटना), केबल-एक्ट्यूएटेड पार्किंग ब्रेक के रूप में एक फेलसेफ है जो अन्यथा अपेक्षाकृत कमजोर रियर ब्रेक को संचालित करता है, लेकिन फिर भी वाहन को सुरक्षित पड़ाव पर ला सकता है ट्रांसमिशन/इंजन ब्रेकिंग के संयोजन के साथ, जब तक कि उस पर मांग सामान्य यातायात प्रवाह के अनुरूप हो। एक आपात स्थिति में कठोर ब्रेकिंग की आवश्यकता के साथ कुल फुट ब्रेक विफलता के संचयी रूप से असंभावित संयोजन के परिणामस्वरूप टकराव हो सकता है, लेकिन फिर भी कम गति पर एक की तुलना में अन्यथा मामला होता।
फुट पेडल सक्रिय सर्विस ब्रेक की तुलना में, पार्किंग ब्रेक अपने आप में एक कम महत्वपूर्ण वस्तु है, और जब तक इसे फुटब्रेक के लिए एक बार के बैकअप के रूप में उपयोग नहीं किया जाता है, तब तक तत्काल खतरा नहीं होगा यदि यह गैर-कार्यात्मक पाया जाता है। आवेदन का क्षण। इसलिए, इसमें कोई अतिरेक नहीं बनाया गया है (और यह आमतौर पर एक सस्ता, हल्का, लेकिन कम कठोर केबल एक्ट्यूएशन सिस्टम का उपयोग करता है), और यह पर्याप्त हो सकता है, अगर यह एक पहाड़ी पर होता है, तो फुटब्रेक का उपयोग करने के लिए पल भर में वीएहिकल स्टिल, गाड़ी चलाने से पहले सड़क का एक सपाट टुकड़ा खोजने के लिए जिस पर रुकना है। वैकल्पिक रूप से, उथले ग्रेडिएंट्स पर, ट्रांसमिशन को पार्क, रिवर्स या फर्स्ट गियर में स्थानांतरित किया जा सकता है, और ट्रांसमिशन लॉक/इंजन संपीड़न इसे स्थिर रखने के लिए उपयोग किया जाता है, क्योंकि उन्हें पहले इसे रोकने के लिए परिष्कार को शामिल करने की कोई आवश्यकता नहीं है। .
मोटरसाइकिलों पर, समान स्तर की विफलता-सुरक्षा सरल विधियों द्वारा प्रदान की जाती है; सबसे पहले आगे और पीछे के ब्रेक सिस्टम पूरी तरह से अलग हैं, भले ही उनकी सक्रियता की विधि (जो केबल, रॉड या हाइड्रोलिक हो सकती है) की परवाह किए बिना, एक को पूरी तरह से विफल होने की अनुमति देता है जबकि दूसरे को अप्रभावित छोड़ देता है। दूसरे, अपने ऑटोमोटिव चचेरे भाई की तुलना में पिछला ब्रेक अपेक्षाकृत मजबूत है, यहां तक कि स्पोर्ट्स मॉडल पर एक शक्तिशाली डिस्क होने के बावजूद, सामान्य इरादा फ्रंट सिस्टम के लिए ब्रेकिंग बल का विशाल बहुमत प्रदान करना है; चूंकि समग्र वाहन का वजन अधिक केंद्रीय होता है, पिछला टायर आम तौर पर बड़ा और ग्रिपियर होता है, और सवार उस पर अधिक भार डालने के लिए पीछे की ओर झुक सकता है, इसलिए पहिया के लॉक होने से पहले अधिक ब्रेक बल लगाने की अनुमति देता है। सस्ती, धीमी उपयोगिता-श्रेणी की मशीनों पर, भले ही फ्रंट व्हील को अतिरिक्त ब्रेक बल और आसान पैकेजिंग के लिए हाइड्रोलिक डिस्क का उपयोग करना चाहिए, रियर आमतौर पर एक आदिम, कुछ हद तक अक्षम, लेकिन असाधारण रूप से मजबूत रॉड-एक्ट्यूएटेड ड्रम होगा, आसानी के लिए धन्यवाद इस तरह से फुटपेडल को पहिया से जोड़ने और, इससे भी महत्वपूर्ण बात, विनाशकारी विफलता की लगभग असंभवता, भले ही बाकी मशीन, जैसे कि उनके पहले कुछ वर्षों के उपयोग के बाद बहुत कम कीमत वाली बाइक, के बिंदु पर है उपेक्षित रखरखाव से पतन।
आवश्यकताएँ
दोष सहिष्णुता की बुनियादी विशेषताओं की आवश्यकता है:
- नहीं विफलता का एकल बिंदु - यदि कोई सिस्टम विफलता का अनुभव करता है, तो उसे मरम्मत प्रक्रिया के दौरान बिना किसी रुकावट के काम करना जारी रखना चाहिए।
- फॉल्ट आइसोलेशन फेलिंग कंपोनेंट के लिए - जब कोई विफलता होती है, तो सिस्टम को विफल घटक को अलग करने में सक्षम होना चाहिए। इसके लिए समर्पित विफलता पहचान तंत्र को जोड़ने की आवश्यकता है जो केवल दोष अलगाव के उद्देश्य से मौजूद है। एक गलती की स्थिति से वसूली के लिए गलती या असफल घटक को वर्गीकृत करने की आवश्यकता होती है। राष्ट्रीय मानक और प्रौद्योगिकी संस्थान (एनआईएसटी) इलाके, कारण, अवधि और प्रभाव के आधार पर दोषों को वर्गीकृत करता है[where?][clarification needed]
- विफलता के प्रसार को रोकने के लिए दोष नियंत्रण - कुछ विफलता तंत्र बाकी सिस्टम में विफलता का प्रचार करके सिस्टम को विफल कर सकते हैं। इस तरह की विफलता का एक उदाहरण दुष्ट ट्रांसमीटर है जो एक सिस्टम में वैध संचार को दलदल कर सकता है और समग्र सिस्टम विफलता का कारण बन सकता है। फ़ायरवॉल एस या अन्य तंत्र जो सिस्टम की सुरक्षा के लिए एक दुष्ट ट्रांसमीटर या विफल घटक को अलग करते हैं, की आवश्यकता होती है।
- [[प्रत्यावर्तन (सॉफ्टवेयर विकास) | प्रत्यावर्तन मोड की उपलब्धता][clarification needed]
इसके अलावा, दोष-सहिष्णु प्रणालियों को नियोजित सेवा आउटेज और अनियोजित सेवा आउटेज दोनों के संदर्भ में चित्रित किया गया है। इन्हें आमतौर पर एप्लिकेशन स्तर पर मापा जाता है, न कि केवल हार्डवेयर स्तर पर। योग्यता के आंकड़े को उपलब्धता कहा जाता है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, फाइव नाइन प्रणाली सांख्यिकीय रूप से 99.999% उपलब्धता प्रदान करेगी।
दोष-सहिष्णु प्रणालियाँ आमतौर पर अतिरेक की अवधारणा पर आधारित होती हैं।
दोष सहिष्णुता तकनीक
महत्वपूर्ण प्रणालियों के लिए आवश्यक सहिष्णुता के प्रकार में अनुसंधान में बड़ी मात्रा में अंतःविषय कार्य शामिल हैं। प्रणाली जितनी अधिक जटिल होगी, उतनी ही सावधानी से सभी संभावित अंतःक्रियाओं पर विचार करना होगा और इसके लिए तैयार रहना होगा। परिवहन में उच्च मूल्य प्रणालियों के महत्व को ध्यान में रखते हुए, सार्वजनिक उपयोगिताओं और सेना, अनुसंधान पर स्पर्श करने वाले विषयों का क्षेत्र बहुत व्यापक है: इसमें सॉफ्टवेयर मॉडलिंग और विश्वसनीयता, या हार्डवेयर डिजाइन जैसे स्पष्ट विषय शामिल हो सकते हैं। , स्टोकेस्टिक मॉडल, ग्राफ सिद्धांत , औपचारिक या बहिष्करण तर्क, समानांतर प्रसंस्करण , दूरस्थ डेटा ट्रांसमिशन , और अधिक जैसे रहस्यमय तत्वों के लिए[18]
प्रतिकृति
स्पेयर कंपोनेंट्स फॉल्ट टॉलरेंस की पहली मूलभूत विशेषता को तीन तरीकों से संबोधित करते हैं:
- प्रतिकृति : एक ही प्रणाली या उपप्रणाली के कई समान उदाहरण प्रदान करना, समानांतर में उन सभी को कार्यों या अनुरोधों को निर्देशित करना, और कोरम के आधार पर सही परिणाम चुनना ;
- अतिरेक : एक ही प्रणाली के कई समान उदाहरण प्रदान करना और विफलता के मामले में शेष उदाहरणों में से एक पर स्विच करना ( विफलता );
- विविधता: एक ही विनिर्देश के कई 'अलग' कार्यान्वयन प्रदान करना, और एक विशिष्ट कार्यान्वयन में त्रुटियों से निपटने के लिए प्रतिकृति प्रणालियों की तरह उनका उपयोग करना।
RAID , के सभी कार्यान्वयन स्वतंत्र डिस्क के निरर्थक सरणी, RAID 0 को छोड़कर, एक दोष-सहिष्णु स्टोरेज डिवाइस के उदाहरण हैं जो डेटा रिडंडेंसी का उपयोग करता है।
एक लॉकस्टेप दोष-सहिष्णु मशीन समानांतर में चल रहे प्रतिकृति तत्वों का उपयोग करती है। किसी भी समय, प्रत्येक तत्व की सभी प्रतिकृति एक ही अवस्था में होनी चाहिए। प्रत्येक प्रतिकृति को समान इनपुट प्रदान किए जाते हैं, और समान आउटपुट की अपेक्षा की जाती है। प्रतिकृति के आउटपुट की तुलना वोटिंग सर्किट का उपयोग करके की जाती है। प्रत्येक तत्व की दो प्रतिकृति वाली मशीन को दोहरी मॉड्यूलर निरर्थक (डीएमआर) कहा जाता है। तब वोटिंग सर्किट केवल एक बेमेल का पता लगा सकता है और वसूली अन्य तरीकों पर निर्भर करती है। प्रत्येक तत्व की तीन प्रतिकृति वाली मशीन को ट्रिपल मॉड्यूलर रिडंडेंट (TMR) कहा जाता है। वोटिंग सर्किट यह निर्धारित कर सकता है कि दो-से-एक वोट देखे जाने पर कौन सी प्रतिकृति त्रुटि में है। इस मामले में, वोटिंग सर्किट सही परिणाम आउटपुट कर सकता है, और गलत संस्करण को त्याग सकता है। इसके बाद, गलत प्रतिकृति की आंतरिक स्थिति को अन्य दो से अलग माना जाता है, और वोटिंग सर्किट डीएमआर मोड में बदल सकता है। इस मॉडल को किसी भी बड़ी संख्या में प्रतिकृति पर लागू किया जा सकता है।
लॉकस्टेप दोष-सहिष्णु मशीनें सबसे आसानी से पूरी तरह से पूरी तरह से बनाई जाती हैं सिंक्रोनस , प्रत्येक प्रतिकृति के प्रत्येक गेट के साथ घड़ी के एक ही किनारे पर एक ही राज्य संक्रमण होता है, और घड़ियां प्रतिकृति बिल्कुल चरण में है। हालांकि, इस आवश्यकता के बिना लॉकस्टेप सिस्टम बनाना संभव है। प्रतिकृतियों को समकालिकता में लाने के लिए उनकी आंतरिक संग्रहीत अवस्थाओं को समान बनाने की आवश्यकता होती है। उन्हें एक निश्चित प्रारंभिक स्थिति से शुरू किया जा सकता है, जैसे कि रीसेट स्थिति। वैकल्पिक रूप से, एक प्रतिकृति की आंतरिक स्थिति को दूसरी प्रतिकृति में कॉपी किया जा सकता है।
डीएमआर का एक प्रकार जोड़ी और अतिरिक्त है। दो प्रतिकृति तत्व लॉकस्टेप में एक जोड़ी के रूप में काम करते हैं, एक वोटिंग सर्किट के साथ जो उनके संचालन के बीच किसी भी बेमेल का पता लगाता है और एक संकेत आउटपुट करता है जो दर्शाता है कि कोई त्रुटि है। एक और जोड़ी ठीक उसी तरह काम करती है। एक अंतिम सर्किट जोड़ी के आउटपुट का चयन करता है जो यह घोषणा नहीं करता है कि यह त्रुटि में है। जोड़ी और अतिरिक्त टीएमआर के तीन के बजाय चार प्रतिकृतियों की आवश्यकता होती है, लेकिन व्यावसायिक रूप से इसका उपयोग किया गया है।
विफलता-अनभिज्ञ कंप्यूटिंग
विफलता-अनभिज्ञ कंप्यूटिंग एक ऐसी तकनीक है जो कंप्यूटर प्रोग्राम को त्रुटियों के बावजूद निष्पादन जारी रखने में सक्षम बनाती है[19] तकनीक को विभिन्न संदर्भों में लागू किया जा सकता है। सबसे पहले, यह प्रोग्राम में निर्मित मूल्य लौटाकर अमान्य मेमोरी रीड को संभाल सकता है[20] जो बदले में, निर्मित मूल्य का उपयोग करता है और पूर्व मेमोरी मान को एक्सेस करने का प्रयास करता है, यह विशिष्ट मेमोरी चेकर्स के विपरीत है, जो त्रुटि के कार्यक्रम को सूचित करता है या निरस्त करता है कार्यक्रम। दूसरा, इसे उन अपवादों पर लागू किया जा सकता है जहां अप्रत्याशित अपवादों को पकड़ने के लिए कुछ कैच ब्लॉक लिखे या संश्लेषित किए जाते हैं[21] इसके अलावा, ऐसा होता है कि कैस्केडिंग विफलताओं को रोकने के लिए निष्पादन को लगातार कई बार संशोधित किया जाता है[22]
दृष्टिकोण में प्रदर्शन लागत है: क्योंकि तकनीक पते की वैधता के लिए गतिशील जांच डालने के लिए कोड को फिर से लिखती है, निष्पादन समय 80% से 500% तक बढ़ जाएगा[23]
वसूली चरवाहा
पुनर्प्राप्ति चरवाहा एक हल्की तकनीक है जो सॉफ़्टवेयर प्रोग्राम को अन्यथा घातक त्रुटियों से पुनर्प्राप्त करने में सक्षम बनाती है जैसे कि नल पॉइंटर डीरेफरेंस और शून्य से विभाजित करना[24] विफलता बेखबर कंप्यूटिंग तकनीक की तुलना में, पुनर्प्राप्ति चरवाहा सीधे संकलित प्रोग्राम बाइनरी पर काम करता है और इसे प्रोग्राम में पुन: संकलित करने की आवश्यकता नहीं होती है।
यह जस्ट-इन-टाइम बाइनरी इंस्ट्रूमेंटेशन फ्रेमवर्क पिन का उपयोग करता है। यह त्रुटि होने पर आवेदन प्रक्रिया से जुड़ जाता है, निष्पादन की मरम्मत करता है, निष्पादन जारी रहने पर मरम्मत प्रभावों को ट्रैक करता है, आवेदन प्रक्रिया के भीतर मरम्मत प्रभाव समाहित करता है, और प्रक्रिया की स्थिति से सभी मरम्मत प्रभावों को फ़्लश करने के बाद प्रक्रिया से अलग हो जाता है। यह कार्यक्रम के सामान्य निष्पादन में हस्तक्षेप नहीं करता है और इसलिए नगण्य उपरि खर्च करता है[24] 18 में से 17 के लिए व्यवस्थित रूप से एकत्रित वास्तविक दुनिया नल-डीरेफरेंस और डिवाइड-बाय-जीरो त्रुटियों के लिए, एक प्रोटोटाइप कार्यान्वयन एप्लिकेशन को त्रुटि-ट्रिगर इनपुट पर अपने उपयोगकर्ताओं को स्वीकार्य आउटपुट और सेवा प्रदान करने के लिए निष्पादित करना जारी रखता है।[24]
सर्किट ब्रेकर
सर्किट ब्रेकर डिजाइन पैटर्न वितरित प्रणालियों में भयावह विफलताओं से बचने के लिए एक तकनीक है।
अतिरेक
अतिरेक कार्यात्मक क्षमताओं का प्रावधान है जो एक दोष मुक्त वातावरण में अनावश्यक होगा[25] इसमें बैकअप घटक शामिल हो सकते हैं जो एक घटक के विफल होने पर स्वचालित रूप से किक करते हैं। उदाहरण के लिए, बड़े मालवाहक ट्रक बिना किसी बड़े परिणाम के एक टायर खो सकते हैं। उनके पास कई टायर हैं, और कोई भी टायर महत्वपूर्ण नहीं है (सामने के टायरों के अपवाद के साथ, जो चलाने के लिए उपयोग किए जाते हैं, लेकिन आम तौर पर कम भार उठाते हैं, प्रत्येक और कुल मिलाकर, अन्य चार से 16 की तुलना में, इसलिए विफल होने की संभावना कम होती है ) एक प्रणाली की विश्वसनीयता में सुधार के लिए अतिरेक को शामिल करने का विचार जॉन वॉन न्यूमैन द्वारा 1950 के दशक में पेश किया गया था।[26]
दो प्रकार की अतिरेक संभव है[27] अंतरिक्ष अतिरेक और समय अतिरेक। अंतरिक्ष अतिरेक अतिरिक्त घटक, कार्य या डेटा आइटम प्रदान करता है जो दोष मुक्त संचालन के लिए अनावश्यक हैं। अंतरिक्ष अतिरेक को आगे हार्डवेयर, सॉफ्टवेयर और सूचना अतिरेक में वर्गीकृत किया जाता है, जो सिस्टम में जोड़े गए अनावश्यक संसाधनों के प्रकार पर निर्भर करता है। समय के अतिरेक में गणना या डेटा ट्रांसमिशन दोहराया जाता है और परिणाम की तुलना पिछले परिणाम की एक संग्रहीत प्रति से की जाती है। इस तरह के परीक्षण के लिए वर्तमान शब्दावली को 'इन सर्विस फॉल्ट टॉलरेंस टेस्टिंग या ISFTT संक्षेप में' कहा जाता है।
नुकसान
दोष-सहिष्णु डिजाइन के फायदे स्पष्ट हैं, जबकि इसके कई नुकसान नहीं हैं:
- एक ही घटक में खराबी का पता लगाने में हस्तक्षेप। उपरोक्त यात्री वाहन उदाहरण को जारी रखने के लिए, किसी भी दोष-सहिष्णु प्रणाली के साथ यह ड्राइवर के लिए स्पष्ट नहीं हो सकता है कि टायर पंचर हो गया है। यह आमतौर पर एक अलग स्वचालित गलती-पहचान प्रणाली के साथ नियंत्रित किया जाता है। टायर के मामले में, एक एयर प्रेशर मॉनिटर दबाव के नुकसान का पता लगाता है और ड्राइवर को सूचित करता है। विकल्प एक मैनुअल गलती-पहचान प्रणाली है, जैसे प्रत्येक स्टॉप पर सभी टायरों का मैन्युअल रूप से निरीक्षण करना।
- दूसरे घटक में गलती का पता लगाने में हस्तक्षेप। इस समस्या का एक और बदलाव तब होता है जब एक घटक में गलती सहनशीलता एक अलग घटक में गलती का पता लगाने से रोकती है। उदाहरण के लिए, यदि घटक बी घटक ए से आउटपुट के आधार पर कुछ ऑपरेशन करता है, तो बी में गलती सहनशीलता ए के साथ एक समस्या छुपा सकती है। यदि घटक बी को बाद में बदल दिया जाता है (कम गलती-सहिष्णु डिजाइन के लिए) तो सिस्टम अचानक विफल हो सकता है, यह प्रकट करना कि नया घटक बी समस्या है। सिस्टम की सावधानीपूर्वक जांच करने के बाद ही यह स्पष्ट होगा कि मूल समस्या वास्तव में घटक ए के साथ है।
- गलती सुधार की प्राथमिकता में कमी। भले ही ऑपरेटर को गलती के बारे में पता हो, एक दोष-सहिष्णु प्रणाली होने से गलती की मरम्मत के महत्व को कम करने की संभावना है। यदि दोषों को ठीक नहीं किया जाता है, तो यह अंततः सिस्टम विफलता की ओर ले जाएगा, जब दोष-सहिष्णु घटक पूरी तरह से विफल हो जाता है या जब सभी निरर्थक घटक भी विफल हो जाते हैं।
- परीक्षण कठिनाई। परमाणु रिएक्टर जैसे कुछ महत्वपूर्ण दोष-सहिष्णु प्रणालियों के लिए, यह सत्यापित करने का कोई आसान तरीका नहीं है कि बैकअप घटक कार्यात्मक हैं। इसका सबसे कुख्यात उदाहरण चेरनोबिल है, जहां ऑपरेटरों ने प्राथमिक और माध्यमिक शीतलन को अक्षम करके आपातकालीन बैकअप कूलिंग का परीक्षण किया। बैकअप विफल हो गया, जिसके परिणामस्वरूप कोर मेल्टडाउन और विकिरण की बड़े पैमाने पर रिहाई हुई।
- लागत। दोष-सहनशील घटकों और निरर्थक घटकों दोनों की लागत में वृद्धि होती है। यह पूरी तरह से आर्थिक लागत हो सकती है या इसमें वजन जैसे अन्य उपाय शामिल हो सकते हैं। मानवयुक्त अंतरिक्ष यान , उदाहरण के लिए, इतने अनावश्यक और दोष-सहिष्णु घटक हैं कि उनका वजन मानव रहित प्रणालियों पर नाटकीय रूप से बढ़ जाता है, जिन्हें समान स्तर की सुरक्षा की आवश्यकता नहीं होती है।
- अवर घटक। एक दोष-सहिष्णु डिज़ाइन निम्न घटकों के उपयोग की अनुमति दे सकता है, जो अन्यथा सिस्टम को निष्क्रिय बना देता। हालांकि इस अभ्यास में लागत वृद्धि को कम करने की क्षमता है, कई निम्न घटकों का उपयोग सिस्टम की विश्वसनीयता को एक तुलनीय गैर-गलती-सहिष्णु प्रणाली के बराबर या उससे भी बदतर स्तर तक कम कर सकता है।
संबंधित शब्द
दोष सहिष्णुता और उन प्रणालियों के बीच अंतर है जिनमें शायद ही कभी समस्याएं होती हैं। उदाहरण के लिए, वेस्टर्न इलेक्ट्रिक क्रॉसबार सिस्टम की विफलता दर प्रति चालीस वर्षों में दो घंटे थी, और इसलिए अत्यधिक "गलती प्रतिरोधी" थी। लेकिन जब कोई गलती हुई तो उन्होंने पूरी तरह से काम करना बंद कर दिया, और इसलिए 'गलती सहिष्णु' नहीं थे।
See also
- Byzantine fault tolerance
- Control reconfiguration
- Damage tolerance
- Data redundancy
- Defence in depth
- Elegant degradation
- Error detection and correction
- Error-tolerant design (human error-tolerant design)
- Failure semantics
- Fall back and forward
- Graceful exit
- Intrusion tolerance
- List of system quality attributes
- Resilience (ecology)
- Progressive enhancement
- Resilience (network)
- Robustness (computer science)
- Rollback (data management)
- Safe-life design
- Self-management (computer science)
- Software diversity
{{Div col end }
- ↑ अडैप्टिव फॉल्ट टॉलरेंस एंड ग्रेसफुल डिग्रेडेशन, ऑस्कर गोंजालेज एट अल।, 1997, मैसाचुसेट्स विश्वविद्यालय - एम्हेर्स
- ↑ जॉनसन, बी. डब्ल्यू. (1984)। फॉल्ट-टॉलरेंट माइक्रोप्रोसेसर-आधारित सिस्टम्स, आईईईई माइक्रो, वॉल्यूम। 4, नहीं। 6, पीपी. 6-2
- ↑ 3.0 3.1 3.2 Daniel P. Siewiorek; C. Gordon Bell; Allen Newell (1982). Computer Structures: Principles and Examples. McGraw-Hill. ISBN 0-07-057302-6.
- ↑ Algirdas Avižienis; George C. Gilley; Francis P. Mathur; David A. Rennels; John A. Rohr; David K. Rubin. "The STAR (Self-Testing And Repairing) Computer: An Investigation Of the Theory and Practice Of Fault-tolerant Computer Design" (PDF).
- ↑ "Voyager Mission state (more often than not at least three months out of date)". NASA (in English). Retrieved 2022-04-01.
- ↑ Randell, Brian; Lee, P.A.; Treleaven, P. C. (June 1978). "Reliability Issues in Computing System Design". ACM Computing Surveys. 10 (2): 123–165. doi:10.1145/356725.356729. ISSN 0360-0300. S2CID 16909447.
- ↑ {{उद्धरण जर्नल | लेखक = पी. जे. डेनिंग | लेखक-लिंक = पी. जे. डेनिंग | शीर्षक = दोष सहिष्णु ऑपरेटिंग सिस्टम | जर्नल = एसीएम कम्प्यूटिंग सुरveys | पेज=359–389 | वॉल्यूम =8 | अंक = 4 | तारीख=दिसंबर 1976 | यूआरएल = http://portal.acm.org/citation.cfm?id=356680&dl=ACM&coll=&CFID=15151515&CFTOKEN=6184618 | doi =10.1145/356678.356680 | s2cid=207736773 | issn= 0360-0300}
- ↑ Theodore A. Linden (December 1976). "Operating System Structures to Support Security and Reliable Software". ACM Computing Surveys. 8 (4): 409–445. doi:10.1145/356678.356682. hdl:2027/mdp.39015086560037. ISSN 0360-0300. S2CID 16720589.
- ↑ रे होल्ट। F14A सेंट्रल एयर डेटा कंप्यूटर, और 1968 में एलएसआई टेक्नोलॉजी स्टेट-ऑफ-द-आर्ट।
- ↑ कंप्यूटर डिजाइन में दोष सहिष्णु कंप्यूटिंग नीलफोरोशन, एम.आर जर्नल ऑफ कंप्यूटिंग साइंसेज इन कॉलेज आर्काइव खंड 18, अंक 4 (अप्रैल 2003) पृष्ठ: 213 - 220, ISSN 1937-4771
- ↑ "Why your website should work without JavaScript". DEV Community (in English). Retrieved 2021-05-16.
- ↑ Fairfax, Zackerie (2020-11-28). "Legacy Twitter Shutdown Means You Can't Tweet From The 3DS Anymore". ScreenRant (in English). Retrieved 2021-07-01.
{{cite web}}
: CS1 maint: url-status (link) - ↑ स्टालिंग्स, डब्ल्यू (2009): ऑपरेटिंग सिस्टम। आंतरिक और डिजाइन सिद्धांत , छठा संस्करण
- ↑ Thampi, Sabu M. (2009-11-23). "Introduction to Distributed Systems". arXiv:0911.4395 [cs.DC].
- ↑ "Control". Grouper.ieee.org. Archived from the original on 1999-10-08. Retrieved 2016-04-06.
- ↑ Baha Al-Shaikh, Simon G. Stacey, Essentials of Equipment in Anaesthesia, Critical Care, and Peri-Operative Medicine (2017), p. 247.
- ↑ डबरोवा, ई। (2013)। दोष-सहिष्णु डिजाइन, स्प्रिंगर, 2013, ISBN 978-1-4614-2112-2
- ↑ Reliability evaluation of some fault-tolerant computer architectures. Springer-Verlag. November 1980. ISBN 978-3-540-10274-8.
- ↑ Herzberg, Amir; Shulman, Haya (2012). "Oblivious and Fair Server-Aided Two-Party Computation". 2012 Seventh International Conference on Availability, Reliability and Security. IEEE: 75–84. doi:10.1109/ares.2012.28. ISBN 978-1-4673-2244-7. S2CID 6579295.
- ↑ Rigger, Manuel; Pekarek, Daniel; Mössenböck, Hanspeter (2018), "Context-Aware Failure-Oblivious Computing as a Means of Preventing Buffer Overflows", Network and System Security, Cham: Springer International Publishing, pp. 376–390, arXiv:1806.09026, doi:10.1007/978-3-030-02744-5_28, ISBN 978-3-030-02743-8, retrieved 2020-10-07
- ↑ Zhang, Long; Monperrus, Martin (2019). "TripleAgent: Monitoring, Perturbation and Failure-Obliviousness for Automated Resilience Improvement in Java Applications". 2019 IEEE 30th International Symposium on Software Reliability Engineering (ISSRE). Berlin, Germany: IEEE: 116–127. arXiv:1812.10706. doi:10.1109/ISSRE.2019.00021. ISBN 978-1-7281-4982-0. S2CID 57189195.
- ↑ Durieux, Thomas; Hamadi, Youssef; Yu, Zhongxing; Baudry, Benoit; Monperrus, Martin (2018). "Exhaustive Exploration of the Failure-Oblivious Computing Search Space". 2018 IEEE 11th International Conference on Software Testing, Verification and Validation (ICST). pp. 139–149. arXiv:1710.09722. doi:10.1109/ICST.2018.00023. ISBN 978-1-5386-5012-7. S2CID 4304123.
- ↑ Keromytis, Angelos D. (2007), "Characterizing Software Self-Healing Systems", in Gorodetski, Vladimir I.; Kotenko, Igor; Skormin, Victor A. (eds.), Characterizing Software Self-Healing Systems, Computer network security: Fourth International Conference on Mathematical Methods, Models, and Architectures for Computer Network Security, Springer, ISBN 978-3-540-73985-2
- ↑ 24.0 24.1 24.2 Long, Fan; Sidiroglou-Douskos, Stelios; Rinard, Martin (2014). "Automatic Runtime Error Repair and Containment via Recovery Shepherding". Proceedings of the 35th ACM SIGPLAN Conference on Programming Language Design and Implementation. PLDI '14'. New York, NY, USA: ACM. pp. 227–238. doi:10.1145/2594291.2594337. ISBN 978-1-4503-2784-8. S2CID 6252501.
- ↑ लैप्री, जे.सी. (1985)। डिपेंडेबल कंप्यूटिंग एंड फॉल्ट टॉलरेंस: कॉन्सेप्ट्स एंड टर्मिनोलॉजी, फॉल्ट-टॉलरेंट कंप्यूटिंग (FTSC-15) पर 15वें अंतर्राष्ट्रीय संगोष्ठी की कार्यवाही, पीपी 2–1
- ↑ वॉन न्यूमैन, जे। (1956)। [http://www.cyclify.com/wiki/images/a/af/Von_Neumann_Probabilistic_Logics_and_the_Synthesis_of_Reliable_Organisms_from_Unreliable_Components.pdf प्रोबेबिलिस्टिक लॉजिक्स एंड सिंथेसिस ऑफ रिलायबल कंपोनेंट्स फ्रॉम अनरिलायबल कंपोनेंट्स स्टडीज, एड। सी. शैनन और जे. मैकार्थी, प्रिंसटन यूनिवर्सिटी प्रेस, पीपी. 43–9
- ↑ एविज़िएनिस, ए। (1976)। फॉल्ट-टॉलरेंट सिस्टम्स , कंप्यूटर पर आईईईई लेनदेन, वॉल्यूम। 25, नहीं। 12, पीपी. 1304–131