यूनिसिटी दूरी
This article needs additional citations for verification. (October 2007) (Learn how and when to remove this template message) |
क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल सिफरटेक्स्ट की लंबाई है जो एक क्रूर बल के हमले में संभावित नकली कुंजियों की संख्या को शून्य तक कम करके सिफर को तोड़ने के लिए आवश्यक है। यानी, हर संभव कुंजी (क्रिप्टोग्राफी) को आज़माने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, यानी कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक सिफरटेक्स्ट की अपेक्षित मात्रा, यह मानते हुए कि अंतर्निहित संदेश में अतिरेक है।[1] क्लाउड शैनन ने अपने 1949 के पेपर गोपनीयता प्रणालियों का संचार सिद्धांत में यूनिसिटी दूरी को परिभाषित किया।
पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड सिफरटेक्स्ट स्ट्रिंग WNAIW पर हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं हैं। यह क्रिप्ट विश्लेषण का एक सामान्य नियम है: बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव है।
निःसंदेह, इस मामले में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होगी। सभी संभावित कुंजियाँ आज़माने से हमें न केवल नदी और पानी मिलेगा, बल्कि SXOOS और KHDOP भी मिलेंगे। कार्यशील कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होगी। समस्या यह जानने की है कि इनमें से कौन सी कार्यशील कुंजी सही है; बाकी सब नकली हैं.
कुंजी आकार और संभावित सादेपाठ के साथ संबंध
सामान्य तौर पर, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करेगी। उपरोक्त उदाहरण में हम केवल अपरकेस अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि सादे पाठ का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर हैं। इसी प्रकार यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26 हैं5संभावित कुंजियाँ, जिनमें से अधिकांश काम नहीं करेंगी।
संभावित संदेशों की एक जबरदस्त संख्या, एन, वर्णों के इस सीमित सेट का उपयोग करके भी उत्पन्न की जा सकती है: एन = 26L, जहां L संदेश की लंबाई है। हालाँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय है, शायद उनमें से एम, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।
चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध
यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक सिफरटेक्स्ट की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।[1]
तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:[1]
जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2 के लिए 128)128 समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।
अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।5). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है log2(N), जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है log2(26) = 4.7 जानकारी के अंश।
हालाँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।[1]
मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है , जो वन-टाइम पैड के अटूट होने के अनुरूप है।
प्रतिस्थापन सिफर की एकसिटी दूरी
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है 26! = 4.0329 × 1026 = 288.4, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, H(k) = log2(26!) = 88.4 बिट्स. अंग्रेजी पाठ के लिए D = 3.2, इस प्रकार U = 88.4/3.2 = 28.
इसलिए सिफरटेक्स्ट के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।
व्यावहारिक अनुप्रयोग
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।
प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।
यूनिसिटी दूरी से अधिक सिफरटेक्स्ट को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे सिफरटेक्स्ट में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना सिफरटेक्स्ट आवश्यक है,[why?] लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने सिफरटेक्स्ट की आवश्यकता है।
संदर्भ
- ↑ 1.0 1.1 1.2 1.3 Alfred J. Menezes, Paul C. van Oorschot, Scott A. Vanstone. "Chapter 7 - Block Ciphers" (PDF). एप्लाइड क्रिप्टोग्राफी की हैंडबुक. p. 246.
{{cite book}}
: CS1 maint: uses authors parameter (link)
बाहरी संबंध
- Bruce Schneier: How to Recognize Plaintext (Crypto-Gram Newsletter December 15, 1998)
- Unicity Distance computed for common ciphers