लॉग विश्लेषण

From Vigyanwiki

कंप्यूटर लॉग प्रबंधन और इंटेलिजेंस में, लॉग विश्लेषण (या सिस्टम और नेटवर्क लॉग विश्लेषण) कला और विज्ञान है जो कंप्यूटर जनित रिकॉर्ड (जिसे लॉग या अंकेक्षण ट्रेल रिकॉर्ड भी कहा जाता है) को समझने का प्रयत्न करता है। ऐसे रिकॉर्ड निर्मित करने की प्रक्रिया को डेटा लॉगिंग कहा जाता है।

लोग लॉग विश्लेषण क्यों करते हैं इसके विशिष्ट कारण हैं:

लॉग नेटवर्क उपकरणों, ऑपरेटिंग सिस्टम, एप्लिकेशन और सभी प्रकार के इंटेलिजेंस या प्रोग्राम करने योग्य उपकरणों द्वारा उत्सर्जित होते हैं। समय क्रम में संदेशों की एक धारा में प्रायः एक लॉग सम्मलित होता है। लॉग फ़ाइलों को निर्देशित किया जा सकता है और डिस्क पर संग्रहीत किया जा सकता है या लॉग संग्रहण को नेटवर्क स्ट्रीम के रूप में निर्देशित किया जा सकता है।

लॉग संदेशों को साधारणतया इसके स्रोत (जैसे, एप्लिकेशन) की आंतरिक स्थिति के संबंध में व्याख्या की जानी चाहिए और सुरक्षा-प्रासंगिक या संचालन-प्रासंगिक घटनाओं (जैसे, उपयोगकर्ता लॉगिन या सिस्टम त्रुटि) की घोषणा करनी चाहिए।

लॉग प्रायः सॉफ्टवेयर डेवलपर्स द्वारा किसी एप्लिकेशन के संचालन के डिबगिंग में सहायता के लिए या यह समझने के लिए बनाए जाते हैं कि उपयोगकर्ता सिस्टम के साथ कैसे प्रभावित कर रहे हैं, जैसे कि सर्च इंजन। लॉग संदेशों के अंदर डेटा का सिंटैक्स और शब्दार्थ साधारणतया एप्लिकेशन या विक्रेता-विशिष्ट होते हैं। शब्दावली भी भिन्न हो सकती है; उदाहरण के लिए, किसी एप्लिकेशन के लिए उपयोगकर्ता के प्रमाणीकरण को लॉग इन, लॉगऑन, उपयोगकर्ता कनेक्शन या प्रमाणीकरण घटना के रूप में वर्णित किया जा सकता है। इसलिए, लॉग विश्लेषण को विभिन्न लॉग स्रोतों से संदेशों की उपयोगी तुलना करने के लिए एप्लिकेशन, वेंडर, सिस्टम या कॉन्फ़िगरेशन के संदर्भ में संदेशों की व्याख्या करनी चाहिए।

लॉग संदेश प्रारूप या सामग्री हमेशा पूर्ण रूप से प्रलेखित नहीं हो सकती है। लॉग विश्लेषक का कार्य सिस्टम को संदेशों की पूरी श्रृंखला को उत्सर्जित करने के लिए प्रेरित करना है जिससे की संपूर्ण डोमेन को समझा जा सके जिससे संदेशों की व्याख्या किया जाता हैं।

एक लॉग विश्लेषक अलग-अलग लॉग स्रोतों से अलग-अलग शब्दावली को एक समान, सामान्यीकृत शब्दावली में माप सकता है जिससे की एक विषम वातावरण से रिपोर्ट और आंकड़े प्राप्त किए जा सकें। उदाहरण के लिए, विंडोज, यूनिक्स, नेटवर्क फायरवॉल और डेटाबेस से लॉग संदेशों को ऑडिटर के लिए सामान्यीकृत रिपोर्ट में एकत्रित किया जा सकता है। अलग-अलग प्रणालियां अलग-अलग शब्दावली के साथ अलग-अलग संदेश प्राथमिकताओं को संकेत दे सकती हैं, जैसे त्रुटि और अधिसूचना बनाम त्रुटि, अधिसूचना और महत्वपूर्ण होता हैं।

इसलिए, सॉफ़्टवेयर की रिवर्स इंजीनियरिंग के लिए पाठ पुनर्प्राप्ति से निरंतरता पर लॉग विश्लेषण अभ्यास उपस्थित हैं।

कार्य और प्रौद्योगिकियां

पैटर्न पहचान आने वाले संदेशों का चयन करने और विभिन्न तरीकों को फ़िल्टर करने या संभालने के लिए पैटर्न बुक के साथ तुलना करने का एक कार्य है।

सामान्यीकरण संदेश भागों को एक ही प्रारूप (जैसे सामान्य दिनांक प्रारूप या सामान्यीकृत आईपी पता) में परिवर्तित करने का कार्य है।

वर्गीकरण और टैगिंग संदेशों को विभिन्न वर्गों में क्रमित करना या उन्हें बाद में उपयोग के लिए अलग-अलग कीवर्ड के साथ टैग करना है (जैसे फ़िल्टरिंग या प्रदर्शन)।

सहसंबंध विश्लेषण विभिन्न प्रणालियों से संदेश एकत्र करने और एक ही घटना से संबंधित सभी संदेशों को खोजने की एक तकनीक है (उदाहरण के लिए, विभिन्न प्रणालियों पर दुर्भावनापूर्ण गतिविधि द्वारा उत्पन्न संदेश: नेटवर्क डिवाइस, फायरवॉल, सर्वर आदि)। यह आमतौर पर अलर्टिंग सिस्टम से जुड़ा होता है।

आर्टिफिशियल इग्नोरेंस एक प्रकार की यंत्र अधिगम है जो लॉग प्रविष्टियों को हटाने की एक प्रक्रिया है जो कि अरुचिकर होने के लिए जानी जाती है। कृत्रिम अज्ञान एक कार्य प्रणाली में विसंगतियों का पता लगाने की एक विधि है। लॉग विश्लेषण में, इसका मतलब नियमित, सामान्य लॉग संदेशों को पहचानना और अनदेखा करना है जो सिस्टम के सामान्य संचालन से उत्पन्न होते हैं, और इसलिए बहुत दिलचस्प नहीं होते हैं। हालांकि, नए संदेश जो लॉग में पहले नहीं दिखाई दिए हैं, महत्वपूर्ण घटनाओं को संकेत दे सकते हैं, और इसलिए इसकी जांच की जानी चाहिए।[1][2] विसंगतियों के अलावा, एल्गोरिथ्म उन सामान्य घटनाओं की पहचान करेगा जो घटित नहीं हुई थीं। उदाहरण के लिए, एक सिस्टम अपडेट जो हर हफ्ते चलता है, चलाने में विफल रहा है।

लॉग एनालिसिस की तुलना अक्सर अन्य एनालिटिक्स टूल जैसे आवेदन प्रदर्शन प्रबंधन (APM) और एरर मॉनिटरिंग से की जाती है। जबकि उनकी अधिकांश कार्यक्षमता स्पष्ट ओवरलैप है, अंतर प्रक्रिया में निहित है। एपीएम का प्रदर्शन पर जोर है और इसका उत्पादन में सबसे अधिक उपयोग किया जाता है। त्रुटि निगरानी डेवलपर्स बनाम संचालन द्वारा संचालित होती है, और अपवाद हैंडलिंग ब्लॉक में कोड में एकीकृत होती है।

यह भी देखें

संदर्भ

  1. "artificial ignorance: how-to guide". www.ranum.com.
  2. "Log message classification with syslog-ng [LWN.net]". lwn.net.