यूनिसिटी दूरी
This article needs additional citations for verification. (October 2007) (Learn how and when to remove this template message) |
क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक नीच प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके कूटलेख को तोड़ने के लिए आवश्यकता होती है। यानी, हर संभव कुंजी (क्रिप्टोग्राफी) को आज़माने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, यानी कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा, यह मानते हुए कि अंतर्निहित संदेश में अतिरेक है।[1] क्लाउड शैनन ने अपने 1949 के पेपर गोपनीयता प्रणालियों का संचार सिद्धांत में यूनिसिटी दूरी को परिभाषित किया।
पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW पर हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं हैं। यह क्रिप्ट विश्लेषण का एक सामान्य नियम है: बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव है।
निःसंदेह, इस मामले में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होगी। सभी संभावित कुंजियाँ आज़माने से हमें न केवल नदी और पानी मिलेगा, बल्कि SXOOS और KHDOP भी मिलेंगे। कार्यशील कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होगी। समस्या यह जानने की है कि इनमें से कौन सी कार्यशील कुंजी सही है; बाकी सब नकली हैं.
कुंजी आकार और संभावित सादेपाठ के साथ संबंध
सामान्य तौर पर, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत कूटलिखित आँकड़े लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करेगी। उपरोक्त उदाहरण में हम केवल अपरकेस अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि सादे पाठ का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर हैं। इसी प्रकार यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26 हैं5संभावित कुंजियाँ, जिनमें से अधिकांश काम नहीं करेंगी।
संभावित संदेशों की एक जबरदस्त संख्या, एन, वर्णों के इस सीमित सेट का उपयोग करके भी उत्पन्न की जा सकती है: एन = 26L, जहां L संदेश की लंबाई है। हालाँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय है, शायद उनमें से एम, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।
चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध
यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।[1]
तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:[1]
जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2 के लिए 128)128 समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।
अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।5). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है log2(N), जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है log2(26) = 4.7 जानकारी के अंश।
हालाँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।[1]
मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है , जो वन-टाइम पैड के अटूट होने के अनुरूप है।
प्रतिस्थापन सिफर की एकसिटी दूरी
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है 26! = 4.0329 × 1026 = 288.4, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, H(k) = log2(26!) = 88.4 बिट्स. अंग्रेजी पाठ के लिए D = 3.2, इस प्रकार U = 88.4/3.2 = 28.
इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।
व्यावहारिक अनुप्रयोग
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन कूटलिखित आँकड़े ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।
प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।
यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े आवश्यक है,[why?] लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता है।
संदर्भ
- ↑ 1.0 1.1 1.2 1.3 Alfred J. Menezes, Paul C. van Oorschot, Scott A. Vanstone. "Chapter 7 - Block Ciphers" (PDF). एप्लाइड क्रिप्टोग्राफी की हैंडबुक. p. 246.
{{cite book}}
: CS1 maint: uses authors parameter (link)
बाहरी संबंध
- Bruce Schneier: How to Recognize Plaintext (Crypto-Gram Newsletter December 15, 1998)
- Unicity Distance computed for common ciphers