अमूर्त व्याख्या: Difference between revisions
m (added Category:Vigyan Ready using HotCat) |
m (3 revisions imported from alpha:सार_व्याख्या) |
(No difference)
|
Revision as of 17:00, 1 March 2023
कंप्यूटर विज्ञान में, अमूर्त व्याख्या प्रोग्रामिंग भाषाओं के शब्दार्थ की ध्वनि का एक सिद्धांत है, जो मोनोटोनिक फ़ंक्शन मोनोटोनिकिटी के आधार पर आदेशित सेट, विशेष रूप से जाली (आदेश) के सिद्धांतों पर आधारित है। इसे एक कंप्यूटर प्रोग्राम के आंशिक निष्पादन (कंप्यूटर) के रूप में देखा जा सकता है जो सभी गणना किए बिना इसके शब्दार्थ (जैसे, नियंत्रण-प्रवाह विश्लेषण नियंत्रण-प्रवाह, डेटा-प्रवाह विश्लेषण डेटा-प्रवाह) के बारे में जानकारी प्राप्त करता है।
इसका मुख्य ठोस अनुप्रयोग औपचारिक स्थिर कोड विश्लेषण है, कंप्यूटर प्रोग्राम के संभावित निष्पादन के बारे में स्वचालित सूचना निष्कर्षण; ऐसे विश्लेषणों के दो मुख्य उपयोग हैं:
- संकलक के अंदर, यह तय करने के लिए प्रोग्राम का विश्लेषण करने के लिए कि कुछ अनुकूलन (कंप्यूटर विज्ञान) या प्रोग्राम परिवर्तन लागू हैं या नहीं;
- डिबगिंग या यहां तक कि बग की कक्षाओं के खिलाफ कार्यक्रमों के प्रमाणन के लिए।
1970 के दशक के अंत में फ्रांसीसी कंप्यूटर वैज्ञानिक कामकाजी युगल पैट्रिक कूसोट और राधिया कुसोट द्वारा अमूर्त व्याख्या को औपचारिक रूप दिया गया था।[1][2]
अंतर्ज्ञान
यह खंड वास्तविक दुनिया, गैर-कंप्यूटिंग उदाहरणों के माध्यम से अमूर्त व्याख्या को दर्शाता है।
एक सम्मेलन कक्ष में लोगों पर विचार करें। कमरे में प्रत्येक व्यक्ति के लिए एक विशिष्ट पहचानकर्ता मान लें, जैसे संयुक्त राज्य अमेरिका में एक सामाजिक सुरक्षा संख्या। यह साबित करने के लिए कि कोई मौजूद नहीं है, सभी को यह देखने की जरूरत है कि क्या उनकी सामाजिक सुरक्षा संख्या सूची में नहीं है। चूँकि दो अलग-अलग लोगों की संख्या समान नहीं हो सकती है, इसलिए किसी प्रतिभागी की उपस्थिति को केवल उसकी संख्या देखकर ही सिद्ध या असिद्ध करना संभव है।
हालाँकि यह संभव है कि केवल उपस्थित लोगों के नाम ही पंजीकृत किए गए हों। यदि किसी व्यक्ति का नाम सूची में नहीं मिलता है, तो हम सुरक्षित रूप से यह निष्कर्ष निकाल सकते हैं कि वह व्यक्ति उपस्थित नहीं था; लेकिन अगर ऐसा है, तो हम आगे की पूछताछ के बिना निश्चित रूप से निष्कर्ष नहीं निकाल सकते हैं, समलैंगिकों की संभावना के कारण (उदाहरण के लिए, जॉन स्मिथ नाम के दो लोग)। ध्यान दें कि यह सटीक जानकारी अभी भी अधिकांश उद्देश्यों के लिए पर्याप्त होगी, क्योंकि समानार्थी व्यवहार में दुर्लभ हैं। हालाँकि, सभी कठोरता में, हम निश्चित रूप से यह नहीं कह सकते कि कोई कमरे में मौजूद था; हम केवल इतना कह सकते हैं कि वह संभवतः यहाँ था। हम जिस व्यक्ति की तलाश कर रहे हैं यदि वह अपराधी है, तो हम एक अलार्म जारी करेंगे; लेकिन निश्चित रूप से गलत अलार्म जारी करने की संभावना है। इसी तरह की घटनाएं कार्यक्रमों के विश्लेषण में घटित होंगी।
यदि हम केवल कुछ विशिष्ट जानकारी में रुचि रखते हैं, तो क्या कमरे में n आयु का कोई व्यक्ति था?, सभी नामों और जन्मतिथियों की सूची रखना अनावश्यक है। हम सुरक्षित रूप से और बिना सटीकता खोए खुद को प्रतिभागियों की उम्र की सूची रखने तक सीमित कर सकते हैं। यदि यह पहले से ही संभालने के लिए बहुत अधिक है, तो हम केवल सबसे छोटे, मी और सबसे बुजुर्ग व्यक्ति, एम की आयु रख सकते हैं। यदि प्रश्न पूरी तरह से मी से कम या एम से सख्ती से अधिक है, तो हम सुरक्षित रूप से जवाब दे सकते हैं कि नहीं ऐसे प्रतिभागी मौजूद रहे। अन्यथा, हम केवल इतना ही कह पाएंगे कि हम नहीं जानते।
कंप्यूटिंग के मामले में, ठोस, सटीक जानकारी सामान्य रूप से परिमित समय और स्मृति के भीतर गणना योग्य नहीं होती है (राइस की प्रमेय और हॉल्टिंग समस्या देखें)। अमूर्तता का उपयोग प्रश्नों के सामान्यीकृत उत्तरों की अनुमति देने के लिए किया जाता है (उदाहरण के लिए, शायद हाँ/नहीं प्रश्न का उत्तर देना, जिसका अर्थ हाँ या नहीं है, जब हम (अमूर्त व्याख्या का एक एल्गोरिदम) निश्चित उत्तर के साथ सटीक उत्तर की गणना नहीं कर सकते हैं); यह समस्याओं को सरल करता है, उन्हें स्वत: समाधान के लिए उत्तरदायी बनाता है। एक महत्वपूर्ण आवश्यकता पर्याप्त अस्पष्टता जोड़ना है ताकि महत्वपूर्ण प्रश्नों (जैसे प्रोग्राम क्रैश हो सकता है?) के उत्तर देने के लिए अभी भी पर्याप्त सटीकता बनाए रखते हुए समस्याओं को प्रबंधनीय बनाया जा सके।
कंप्यूटर प्रोग्राम की सार व्याख्या
एक प्रोग्रामिंग या विनिर्देश भाषा को देखते हुए, अमूर्त व्याख्या में अमूर्तता के संबंधों से जुड़े कई शब्दार्थ देने होते हैं। एक शब्दार्थ कार्यक्रम के संभावित व्यवहार का एक गणितीय लक्षण वर्णन है। सबसे सटीक शब्दार्थ, जो कार्यक्रम के वास्तविक निष्पादन का बहुत बारीकी से वर्णन करता है, को ठोस शब्दार्थ कहा जाता है। उदाहरण के लिए, एक अनिवार्य प्रोग्रामिंग भाषा का ठोस शब्दार्थ प्रत्येक प्रोग्राम को निष्पादन निशान के सेट से जोड़ सकता है जो इसे उत्पन्न कर सकता है - एक निष्पादन ट्रेस कार्यक्रम के निष्पादन के संभावित लगातार राज्यों का एक क्रम है; एक राज्य में सामान्यतः प्रोग्राम काउंटर और मेमोरी लोकेशन (ग्लोबल्स, स्टैक और हीप) का मान होता है। अधिक अमूर्त शब्दार्थ तब व्युत्पन्न होते हैं; उदाहरण के लिए, कोई निष्पादन में केवल पहुंच योग्य राज्यों के सेट पर विचार कर सकता है (जो परिमित राज्यों में अंतिम राज्यों पर विचार करने के बराबर है)।
स्थैतिक विश्लेषण का लक्ष्य किसी बिंदु पर एक संगणनीय शब्दार्थ व्याख्या प्राप्त करना है। उदाहरण के लिए, कोई चर के वास्तविक मानों को भूलकर और केवल उनके चिह्नों (+, - या 0) को रखकर पूर्णांक चरों में हेरफेर करने वाले प्रोग्राम की स्थिति का प्रतिनिधित्व करना चुन सकता है। कुछ प्राथमिक संक्रियाओं के लिए, जैसे कि गुणन, इस तरह के अमूर्तन से कोई सटीकता नहीं खोती है: किसी गुणनफल का चिह्न प्राप्त करने के लिए, संकार्यों के चिह्न को जानना पर्याप्त है। कुछ अन्य परिचालनों के लिए, अमूर्तता सटीकता खो सकती है: उदाहरण के लिए, उस राशि के चिन्ह को जानना असंभव है जिसका संचालन क्रमशः सकारात्मक और नकारात्मक है।
शब्दार्थ को निर्णायक बनाने के लिए कभी-कभी परिशुद्धता का नुकसान आवश्यक होता है (चावल की प्रमेय और हॉल्टिंग समस्या देखें)। सामान्यतः, विश्लेषण की शुद्धता और इसकी निर्णायकता (संगणनीयता सिद्धांत (गणना)कम्प्यूटेशन)), या ट्रैक्टेबिलिटी (कम्प्यूटेशनल जटिलता) के बीच एक समझौता करना पड़ता है।
व्यवहार में परिभाषित किए गए सार दोनों कार्यक्रम गुणों के अनुरूप होते हैं, जिनका विश्लेषण करने की इच्छा होती है, और लक्ष्य कार्यक्रमों के सेट के लिए। सार व्याख्या के साथ कंप्यूटर प्रोग्राम का पहला बड़े पैमाने पर स्वचालित विश्लेषण उस दुर्घटना से प्रेरित था जिसके परिणामस्वरूप 1996 में एरियन 5 फ्लाइट 501 रॉकेट नष्ट हो गया था।[3]
औपचारिकता
मान लीजिए कि L एक क्रमित समुच्चय है, जिसे मूर्त समुच्चय कहते हैं और L′ एक अन्य क्रमित समुच्चय है, जिसे अमूर्त समुच्चय कहते हैं। तत्वों को एक से दूसरे में मैप करने वाले कुल कार्यों को परिभाषित करके ये दो सेट एक दूसरे से संबंधित हैं।
एक फ़ंक्शन α को अमूर्त फ़ंक्शन कहा जाता है यदि यह कंक्रीट सेट L में एक तत्व x को सार सेट L' में एक तत्व α(x) में मैप करता है। अर्थात्, एल' में तत्व α(x) एल में एक्स का सार है।
एक फ़ंक्शन γ को कंक्रीटेशन फ़ंक्शन कहा जाता है यदि यह कंक्रीट सेट एल में एक तत्व γ(x′) के अमूर्त सेट L′ में एक तत्व x′ को मैप करता है। अर्थात, एल में तत्व γ(x′) का एक ठोसकरण है एक्स' एल' में।
चलो एल1, एल2, एल'1 और मैं'2 सेट का आदेश दिया जाए। ठोस शब्दार्थ f, L से एक मोनोटोनिक कार्य है1 एल के लिए2. L' से फलन f'1 एल' के लिए2 f का एक मान्य सार कहा जाता है यदि L' में सभी x' के लिए1, (च ∘ γ)(x′) ≤ (γ ∘ f′)(x′)।
लूप या पुनरावर्ती प्रक्रियाओं की उपस्थिति में प्रोग्राम सिमेंटिक्स को सामान्यतः निश्चित बिंदु (गणित) का उपयोग करके वर्णित किया जाता है। आइए हम मान लें कि L एक पूर्ण जाली है और f को L से L तक एक मोनोटोनिक फ़ंक्शन होने दें। फिर, कोई भी x′ ऐसा है कि f(x′) ≤ x′, f के कम से कम निश्चित-बिंदु का एक सार है, जो मौजूद है नास्टर-टार्स्की प्रमेय के अनुसार।
कठिनाई अब ऐसा x' प्राप्त करना है। यदि L' परिमित ऊंचाई का है, या कम से कम आरोही श्रृंखला की स्थिति की पुष्टि करता है (सभी आरोही क्रम अंततः स्थिर हैं), तो ऐसे x' को आरोही अनुक्रम x' की स्थिर सीमा के रूप में प्राप्त किया जा सकता है।n आगमन द्वारा परिभाषित इस प्रकार है: x′0=⊥ (L′ का सबसे छोटा अवयव) और x′n+1=च'(एक्स'n).
अन्य मामलों में, इस तरह के एक एक्स 'को एक विस्तार (कंप्यूटर विज्ञान) के माध्यम से प्राप्त करना अभी भी संभव है[4] ∇: सभी x और y के लिए, x ∇ y, x और y दोनों से बड़ा या बराबर होना चाहिए, और किसी भी अनुक्रम y' के लिएn, x′ द्वारा परिभाषित अनुक्रम0=⊥ और एक्स′n+1= एक्स'n ∇y'n अन्ततः स्थिर है। फिर हम y' ले सकते हैंn=च'(एक्स'n).
कुछ मामलों में, गाल्वा कनेक्शन (α, γ) का उपयोग करके सार को परिभाषित करना संभव है, जहां α L से L' तक है और γ L' से L तक है। यह सर्वोत्तम सार के अस्तित्व को मानता है, जो जरूरी नहीं कि मामला हो। उदाहरण के लिए, यदि हम उत्तल बहुतल को घेरकर वास्तविक संख्याओं के जोड़े (x, y) का अमूर्त सेट करते हैं, तो x द्वारा परिभाषित डिस्क के लिए कोई इष्टतम अमूर्तता नहीं है।2+y2 ≤ 1.
अमूर्त डोमेन के उदाहरण
संख्यात्मक सार डोमेन
कोई दिए गए प्रोग्राम बिंदु पर उपलब्ध प्रत्येक चर x को एक अंतराल [L] निर्दिष्ट कर सकता हैx, एचx]। चर x को मान v(x) निर्दिष्ट करने वाला राज्य इन अंतरालों का एक ठोसकरण होगा यदि सभी x के लिए, v(x) [L] में हैx, एचx]। अंतराल से [एलx, एचx] और मैंy, एचy] चर x और y के लिए, कोई आसानी से x+y के लिए अंतराल प्राप्त कर सकता है ([Lx+एलy, एचx+ एचy]) और x−y के लिए ([Lx-एचy, एचx-एलy]); ध्यान दें कि ये सटीक सार हैं, क्योंकि x+y के लिए संभावित परिणामों का सेट ठीक अंतराल है ([Lx+एलy, एचx+ एचy])। गुणा, भाग आदि के लिए अधिक जटिल सूत्र प्राप्त किए जा सकते हैं, तथाकथित अंतराल अंकगणित उत्पन्न करते हैं।[5] आइए अब निम्नलिखित अत्यंत सरल प्रोग्राम पर विचार करें: <पूर्व> वाई = एक्स; जेड = एक्स - वाई; </पूर्व>
उचित अंकगणितीय प्रकारों के साथ, के लिए परिणाम z शून्य होना चाहिए। लेकिन अगर हम अंतराल अंकगणित से प्रारम्भ करते हैं x [0, 1] में, एक मिलता है z [−1, +1] में। जबकि व्यक्तिगत रूप से लिए गए प्रत्येक ऑपरेशन बिल्कुल सारगर्भित थे, उनकी संरचना नहीं है।
समस्या स्पष्ट है: हमने बीच समानता संबंध का ट्रैक नहीं रखा x और y; वास्तव में, अंतराल का यह डोमेन चर के बीच किसी भी संबंध को ध्यान में नहीं रखता है, और इस प्रकार यह एक गैर-संबंधपरक डोमेन है। गैर-संबंधपरक डोमेन लागू करने के लिए तेज़ और सरल होते हैं, लेकिन सटीक नहीं होते हैं।
संबंधपरक संख्यात्मक सार डोमेन के कुछ उदाहरण हैं:
- सर्वांगसमता संबंध#पूर्णांकों पर मूल उदाहरण[6][7]
- उत्तल बहुकोणीय आकृति[8] (cf. बाईं तस्वीर) - कुछ उच्च कम्प्यूटेशनल लागत के साथ
- अंतर-बाध्य मेट्रिसेस[9]
- अष्टकोना[10][11][12]
- रैखिक समानताएं[13]
और उसके संयोजन (जैसे कम उत्पाद,[2]सी एफ सही चित्र)।
जब कोई एक सार डोमेन चुनता है, तो उसे विशिष्ट रूप से ठीक-ठाक संबंध रखने और उच्च कम्प्यूटेशनल लागत के बीच संतुलन बनाना पड़ता है।
मशीन शब्द सार डोमेन
जबकि उच्च-स्तरीय भाषाएँ जैसे कि पायथन (प्रोग्रामिंग भाषा) या हास्केल (प्रोग्रामिंग भाषा) डिफ़ॉल्ट रूप से असीमित पूर्णांक का उपयोग करती हैं, निचले स्तर की प्रोग्रामिंग भाषाएँ जैसे C (प्रोग्रामिंग भाषा) या असेंबली भाषा सामान्यतः छोटे आकार के वर्ड (कंप्यूटर आर्किटेक्चर) पर काम करती हैं।, जो इंटीजर मॉडुलो n|इंटीजर मोडुलो का उपयोग करके अधिक उपयुक्त रूप से तैयार किए गए हैं (जहाँ n मशीन शब्द की बिट चौड़ाई है)। ऐसे चरों के विभिन्न विश्लेषणों के लिए उपयुक्त कई अमूर्त डोमेन हैं।
बिटफ़ील्ड डोमेन प्रत्येक बिट को मशीन शब्द में अलग से मानता है, अर्थात, चौड़ाई n के एक शब्द को n सार मानों की एक सरणी के रूप में माना जाता है। अमूर्त मान सेट से लिए गए हैं , और अमूर्तता और कंक्रीटीकरण कार्य इसके द्वारा दिए गए हैं:[14][15]
इन सार मूल्यों पर बिटवाइज़ संचालन कुछ तीन-मूल्यवान तर्कों में संबंधित तार्किक संचालन के समान हैं। तीन-मूल्यवान तर्क:[16]
|
|
|
यह भी देखें
- मॉडल जाँच
- प्रतीकात्मक अनुकरण
- प्रतीकात्मक निष्पादन
- स्थैतिक कोड विश्लेषण के लिए उपकरणों की सूची - सार-व्याख्या आधारित (ध्वनि) और तदर्थ (अस्वस्थ) उपकरण दोनों सम्मिलित हैं
- स्थैतिक कार्यक्रम विश्लेषण - विश्लेषण विधियों का अवलोकन, जिसमें अमूर्त व्याख्या सम्मिलित है, लेकिन यह सीमित नहीं है
- दुभाषिया (कंप्यूटिंग)
संदर्भ
- ↑ Cousot, Patrick; Cousot, Radhia (1977). "Abstract Interpretation: A Unified Lattice Model for Static Analysis of Programs by Construction or Approximation of Fixpoints" (PDF). Conference Record of the Fourth ACM Symposium on Principles of Programming Languages, Los Angeles, California, USA, January 1977. ACM Press. pp. 238–252. doi:10.1145/512950.512973. S2CID 207614632.
- ↑ 2.0 2.1 Cousot, Patrick; Cousot, Radhia (1979). "Systematic Design of Program Analysis Frameworks" (PDF). Conference Record of the Sixth Annual ACM Symposium on Principles of Programming Languages, San Antonio, Texas, USA, January 1979. ACM Press. pp. 269–282. doi:10.1145/567752.567778. S2CID 1547466.
- ↑ Faure, Christèle. "PolySpace Technologies History". Retrieved 3 October 2010.
- ↑ Cousot, P.; Cousot, R. (August 1992). "Comparing the Galois Connection and Widening / Narrowing Approaches to Abstract Interpretation" (PDF). In Bruynooghe, Maurice; Wirsing, Martin (eds.). Proc. 4th Int. Symp. on Programming Language Implementation and Logic Programming (PLILP). Lecture Notes in Computer Science. Vol. 631. Springer. pp. 269–296. ISBN 978-0-387-55844-8.
- ↑ Cousot, Patrick; Cousot, Radhia (1976). "Static determination of dynamic properties of programs" (PDF). Proceedings of the Second International Symposium on Programming. Dunod, Paris, France. pp. 106–130.
- ↑ Granger, Philippe (1989). "Static Analysis of Arithmetical Congruences". International Journal of Computer Mathematics. 30 (3–4): 165–190. doi:10.1080/00207168908803778.
- ↑ Philippe Granger (1991). "Static Analysis of Linear Congruence Equalities Among Variables of a Program". In Abramsky, S.; Maibaum, T.S.E. (eds.). Proc. Int. J. Conf. on Theory and Practice of Software Development (TAPSOFT). Lecture Notes in Computer Science. Vol. 493. Springer. pp. 169–192.
- ↑ Cousot, Patrick; Halbwachs, Nicolas (January 1978). "Automatic Discovery of Linear Restraints Among Variables of a Program" (PDF). Conf. Rec. 5th ACM Symp. on Principles of Programming Languages (POPL). pp. 84–97.
- ↑ Miné, Antoine (2001). "A New Numerical Abstract Domain Based on Difference-Bound Matrices". In Danvy, Olivier; Filinski, Andrzej (eds.). Programs as Data Objects, Second Symposium, (PADO). Lecture Notes in Computer Science. Vol. 2053. Springer. pp. 155–172. arXiv:cs/0703073.
- ↑ Miné, Antoine (Dec 2004). Weakly Relational Numerical Abstract Domains (PDF) (Ph.D. thesis). Laboratoire d'Informatique de l'École Normale Supérieure.
- ↑ Antoine Miné (2006). "The Octagon Abstract Domain". Higher Order Symbol. Comput. 19 (1): 31–100. arXiv:cs/0703084. doi:10.1007/s10990-006-8609-1.
- ↑ Clarisó, Robert; Cortadella, Jordi (2007). "The Octahedron Abstract Domain". Science of Computer Programming. 64: 115–139. doi:10.1016/j.scico.2006.03.009. hdl:10609/109823.
- ↑ Michael Karr (1976). "Affine Relationships Among Variables of a Program". Acta Informatica. 6 (2): 133–151. doi:10.1007/BF00268497. S2CID 376574.
- ↑ Miné, Antoine (Jun 2012). "Abstract domains for bit-level machine integer and floating-point operations". WING'12 - 4th International Workshop on Invariant Generation. Manchester, United Kingdom: 16.
- ↑ Regehr, John; Duongsaa, Usit (Jun 2006). "Deriving abstract transfer functions for analyzing embedded software". Proceedings of the 2006 ACM SIGPLAN/SIGBED Conference on Language, Compilers, and Tool Support for Embedded Systems. LCTES '06. New York, NY, USA: Association for Computing Machinery: 34–43. doi:10.1145/1134650.1134657. ISBN 978-1-59593-362-1. S2CID 13221224.
- ↑ Reps, T.; Loginov, A.; Sagiv, M. (Jul 2002). "Semantic minimization of 3-valued propositional formulae". Proceedings 17th Annual IEEE Symposium on Logic in Computer Science: 40–51. doi:10.1109/LICS.2002.1029816. ISBN 0-7695-1483-9. S2CID 8451238.
बाहरी संबंध
- A web-page on Abstract Interpretation maintained by Patrick Cousot
- Roberto Bagnara's paper showing how it is possible to implement an abstract-interpretation based static analyzer for a C-like programming language
- The Static Analysis Symposia, proceedings appearing in the Springer LNCS series
- Conference on Verification, Model-Checking, and Abstract Interpretation (VMCAI), affiliated at the POPL conference, proceedings appearing in the Springer LNCS series
- Lecture notes
- Abstract Interpretation. Patrick Cousot. MIT.
- David Schmidt's lecture notes on abstract interpretation
- Møller and Schwarzbach's lecture notes on Static Program Analysis
- Agostino Cortesi's lecture notes on Program Analysis and Verification
- Slides by Grégoire Sutre going through every step of Abstract Interpretation with many examples - also introducing Galois connections