यूनिसिटी दूरी: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(8 intermediate revisions by 4 users not shown)
Line 2: Line 2:
{{Refimprove|date=October 2007}}
{{Refimprove|date=October 2007}}


[[क्रिप्टोग्राफी]] में, यूनिसिटी दूरी एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके कूटलेख को विभाजित करने की आवश्यकता होती है। अर्थात, प्रत्येक संभव [[कुंजी (क्रिप्टोग्राफी)|कुंजी]] को प्रयास करने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, अर्थात कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा मे, यह धृष्ट रूप से अंतर्निहित संदेश में अतिरेक होता है।<ref name=hac>{{Cite book |title=एप्लाइड क्रिप्टोग्राफी की हैंडबुक|authors=[[Alfred J. Menezes]], [[Paul C. van Oorschot]], [[Scott A. Vanstone]] |chapter=Chapter 7 - Block Ciphers |pages=246 |url=http://cacr.uwaterloo.ca/hac/ |chapter-url=http://cacr.uwaterloo.ca/hac/about/chap7.pdf }}</ref>
[[क्रिप्टोग्राफी]] में, '''यूनिसिटी दूरी''' एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके सिफ़र को ब्रेक करने के लिए आवश्यक होता है। अर्थात, प्रत्येक संभव [[कुंजी (क्रिप्टोग्राफी)|कुंजी]] का प्रयास करने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, अर्थात कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा मे, यह मानते हुए कि अंतर्निहित संदेश में अतिरेक होता है।<ref name=hac>{{Cite book |title=एप्लाइड क्रिप्टोग्राफी की हैंडबुक|authors=[[Alfred J. Menezes]], [[Paul C. van Oorschot]], [[Scott A. Vanstone]] |chapter=Chapter 7 - Block Ciphers |pages=246 |url=http://cacr.uwaterloo.ca/hac/ |chapter-url=http://cacr.uwaterloo.ca/hac/about/chap7.pdf }}</ref>


[[क्लाउड शैनन]] ने अपने 1949 के पेपर [[गोपनीयता प्रणालियों का संचार सिद्धांत|'''"कम्युनिकेशन थ्योरी ऑफ सीक्रेसी सिस्टम्स"''']] में यूनिसिटी दूरी को परिभाषित किया था।
[[क्लाउड शैनन]] ने अपने 1949 के पेपर [[गोपनीयता प्रणालियों का संचार सिद्धांत|'''"कम्युनिकेशन थ्योरी ऑफ सीक्रेसी सिस्टम्स"''']] में यूनिसिटी दूरी को परिभाषित किया था।
Line 8: Line 8:
पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं होती हैं। यह [[क्रिप्ट विश्लेषण|क्रिप्टोएनालिसिस]] का एक सामान्य नियम है: जो बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव होता है।
पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं होती हैं। यह [[क्रिप्ट विश्लेषण|क्रिप्टोएनालिसिस]] का एक सामान्य नियम है: जो बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव होता है।


निःसंदेह, इस स्थिति में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होती है। सभी संभावित कुंजियाँ प्रयास से हमें न केवल नदी और पानी मिलेगा, जबकि SXOOS और KHDOP भी मिलेंगे। "कार्यशील" कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होती है। समस्या यह जानने की है कि इनमें से कौन सी "कार्यशील" कुंजी सही है; बाकी सब नकली होते हैं।
निःसंदेह, इस स्थिति में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होती है। सभी संभावित कुंजियाँ प्रयास से हमें न केवल नदी और पानी मिलेगा, जबकि SXOOS और KHDOP भी मिलेंगे। "कार्यशील" कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के समुच्चय से बहुत कम होती है। समस्या यह जानने की है कि इनमें से कौन सी "कार्यशील" कुंजी सही है; बाकी सब नकली होते हैं।


==कुंजी आकार और संभावित सादेपाठ के साथ संबंध==
==कुंजी आकार और संभावित सादेपाठ के साथ संबंध==
सामान्य तौर पर, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत कूटलिखित आँकड़े लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करेगी। उपरोक्त उदाप्रत्येक ण में हम केवल [[ अपरकेस ]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर हैं। इसी प्रकार यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26 हैं<sup>5</sup>संभावित कुंजियाँ, जिनमें से अधिकांश काम नहीं करेंगी।
सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल [[ अपरकेस |अपरकेस]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ|प्लेनटेक्स्ट]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=26<sup>5</sup> संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।


संभावित संदेशों की एक जबरदस्त संख्या, एन, वर्णों के इस सीमित सेट का उपयोग करके भी उत्पन्न की जा सकती है: एन = 26<sup>L</sup>, जहां L संदेश की लंबाई है। हालाँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय है, शायद उनमें से एम, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।
वर्णों के इस सीमित समुच्चय का उपयोग करके भी भारी संख्या में संभावित संदेश, N उत्पन्न किए जा सकते हैं: N = 26<sup>L</sup>, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा समुच्चय ही पठनीय होता है, संभवतः उनमें से M, जहां M N की तुलना में बहुत छोटे होने की संभावना होती है। इसके अतिरिक्त, M का काम करने वाली कुंजियों की संख्या के साथ एक-से-एक संबंध होता है, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही "काम" करते हैं। इनमें से एक सही कुंजी है, बाकी सब नकली होती हैं।


चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
चूंकि संदेश की लंबाई L बढ़ने पर M/N यादृच्छिक रूप से छोटे हो जाते है, अंततः कुछ L होते है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। सामान्यतः कहें तो, यह वह L है जो KM/N=1 बनाता है। यह L यूनिसिटी दूरी होती है।


==कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध==
==कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध==
यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।<ref name=hac />
यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए संगणनात्मक रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।<ref name=hac />


तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:<ref name=hac />
तब अपेक्षित यूनिसिटी दूरी को इस प्रकार दिखाया जा सकता है:<ref name=hac />


: <math>U = H(k) / D</math>
: <math>U = H(k) / D</math>
जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाप्रत्येक ण के लिए 2 के लिए 128)<sup>128</sup> समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।
जहां U यूनिसिटी दूरी होती है, H(k) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2<sup>128</sup> समसंभाव्य कुंजियों के लिए 128, यदि कुंजी एक स्मरण किया गया संकेत- वाक्यांश होता है)। D को प्रति वर्ण बिट्स में प्लेनटेक्स्ट आँकड़ा अतिरिक्तता के रूप में परिभाषित किया गया है।


अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।<sup>5</sup>). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है  {{math|log<sub>2</sub>(N)}}, जहां N वर्णमाला में वर्णों की संख्या है और {{math|log<sub>2</sub>}} बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है {{math|log<sub>2</sub>(26) {{=}} 4.7}} जानकारी के अंश।
अब 32 अक्षरों की एक वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2<sup>5</sup>)सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या log2(N) है, जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक होता है। तो अंग्रेजी के लिए प्रत्येक अक्षर log2(26) = 4.7 बिट संप्रेषित कर सकता है।


हालाँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।<ref name=hac />
चूँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो प्लेनटेक्स्ट अतिरेक D = 4.7 − 1.5 = 3.2 होता है।<ref name=hac />


मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है <math>U = \infty</math>, जो वन-टाइम पैड के अटूट होने के अनुरूप है।
मूलतः यूनिसिटी दूरी जितनी बड़ी होगी उतना ही बेहतर होता है। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास <math>U = \infty</math>, जो वन-टाइम पैड ने के अनुरूप होते है।


=== [[प्रतिस्थापन सिफर]] की एकसिटी दूरी ===
=== [[प्रतिस्थापन सिफर]] की यूनिसिटी दूरी ===
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है {{math|26! {{=}} 4.0329 × 10<sup>26</sup> {{=}} 2<sup>88.4</sup>}}, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, {{math|''H''(''k'') {{=}} log<sub>2</sub>(26!) {{=}} 88.4}} बिट्स. अंग्रेजी पाठ के लिए {{math|''D'' {{=}} 3.2}}, इस प्रकार {{math|''U'' {{=}} 88.4/3.2 {{=}} 28}}.
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है {{math|26! {{=}} 4.0329 × 10<sup>26</sup> {{=}} 2<sup>88.4</sup>}} होती है, उन विधियों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित होती हैं, {{math|''H''(''k'') {{=}} log<sub>2</sub>(26!) {{=}} 88.4}} बिट्स होती है। अंग्रेजी पाठ के लिए {{math|''D'' {{=}} 3.2}}, इस प्रकार {{math|''U'' {{=}} 88.4/3.2 {{=}} 28}} होते है।


इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।
इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।


==व्यावहारिक अनुप्रयोग==
==व्यावहारिक अनुप्रयोग==
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन कूटलिखित आँकड़े ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, किन्तु दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए संगणनात्मक रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में संगणनात्मक रूप से असंभव हो सकता है।


प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाप्रत्येक ण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।
प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने की एक विधि एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को परिनियोजित करती है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।


यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े आवश्यक है,{{why|date=November 2014}} लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता है।
यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का मापता नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े की आवश्यकता होती है,{{why|date=November 2014}} जबकि क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता होती है।


==संदर्भ==
==संदर्भ==
Line 50: Line 50:
*[[Bruce Schneier]]: [http://www.schneier.com/crypto-gram-9812.html#plaintext How to Recognize Plaintext] (Crypto-Gram Newsletter December 15, 1998)
*[[Bruce Schneier]]: [http://www.schneier.com/crypto-gram-9812.html#plaintext How to Recognize Plaintext] (Crypto-Gram Newsletter December 15, 1998)
*[http://www.practicalcryptography.com/cryptanalysis/text-characterisation/statistics/#unicity-distance Unicity Distance computed for common ciphers]
*[http://www.practicalcryptography.com/cryptanalysis/text-characterisation/statistics/#unicity-distance Unicity Distance computed for common ciphers]
[[Category: क्रिप्टोग्राफ़िक हमले]] [[Category: सूचना सिद्धांत]]


 
[[Category:CS1 maint]]
 
[[Category: Machine Translated Page]]
[[Category:Created On 10/08/2023]]
[[Category:Created On 10/08/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Short description with empty Wikidata description]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia articles needing clarification from November 2014]]
[[Category:क्रिप्टोग्राफ़िक हमले]]
[[Category:सूचना सिद्धांत]]

Latest revision as of 09:39, 22 August 2023

क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके सिफ़र को ब्रेक करने के लिए आवश्यक होता है। अर्थात, प्रत्येक संभव कुंजी का प्रयास करने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, अर्थात कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा मे, यह मानते हुए कि अंतर्निहित संदेश में अतिरेक होता है।[1]

क्लाउड शैनन ने अपने 1949 के पेपर "कम्युनिकेशन थ्योरी ऑफ सीक्रेसी सिस्टम्स" में यूनिसिटी दूरी को परिभाषित किया था।

पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं होती हैं। यह क्रिप्टोएनालिसिस का एक सामान्य नियम है: जो बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव होता है।

निःसंदेह, इस स्थिति में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होती है। सभी संभावित कुंजियाँ प्रयास से हमें न केवल नदी और पानी मिलेगा, जबकि SXOOS और KHDOP भी मिलेंगे। "कार्यशील" कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के समुच्चय से बहुत कम होती है। समस्या यह जानने की है कि इनमें से कौन सी "कार्यशील" कुंजी सही है; बाकी सब नकली होते हैं।

कुंजी आकार और संभावित सादेपाठ के साथ संबंध

सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल अपरकेस अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि प्लेनटेक्स्ट का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=265 संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।

वर्णों के इस सीमित समुच्चय का उपयोग करके भी भारी संख्या में संभावित संदेश, N उत्पन्न किए जा सकते हैं: N = 26L, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा समुच्चय ही पठनीय होता है, संभवतः उनमें से M, जहां M N की तुलना में बहुत छोटे होने की संभावना होती है। इसके अतिरिक्त, M का काम करने वाली कुंजियों की संख्या के साथ एक-से-एक संबंध होता है, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही "काम" करते हैं। इनमें से एक सही कुंजी है, बाकी सब नकली होती हैं।

चूंकि संदेश की लंबाई L बढ़ने पर M/N यादृच्छिक रूप से छोटे हो जाते है, अंततः कुछ L होते है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। सामान्यतः कहें तो, यह वह L है जो KM/N=1 बनाता है। यह L यूनिसिटी दूरी होती है।

कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध

यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए संगणनात्मक रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।[1]

तब अपेक्षित यूनिसिटी दूरी को इस प्रकार दिखाया जा सकता है:[1]

जहां U यूनिसिटी दूरी होती है, H(k) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2128 समसंभाव्य कुंजियों के लिए 128, यदि कुंजी एक स्मरण किया गया संकेत- वाक्यांश होता है)। D को प्रति वर्ण बिट्स में प्लेनटेक्स्ट आँकड़ा अतिरिक्तता के रूप में परिभाषित किया गया है।

अब 32 अक्षरों की एक वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 25)। सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या log2(N) है, जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक होता है। तो अंग्रेजी के लिए प्रत्येक अक्षर log2(26) = 4.7 बिट संप्रेषित कर सकता है।

चूँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो प्लेनटेक्स्ट अतिरेक D = 4.7 − 1.5 = 3.2 होता है।[1]

मूलतः यूनिसिटी दूरी जितनी बड़ी होगी उतना ही बेहतर होता है। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास , जो वन-टाइम पैड ने के अनुरूप होते है।

प्रतिस्थापन सिफर की यूनिसिटी दूरी

एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है 26! = 4.0329 × 1026 = 288.4 होती है, उन विधियों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित होती हैं, H(k) = log2(26!) = 88.4 बिट्स होती है। अंग्रेजी पाठ के लिए D = 3.2, इस प्रकार U = 88.4/3.2 = 28 होते है।

इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।

व्यावहारिक अनुप्रयोग

यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, किन्तु दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए संगणनात्मक रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में संगणनात्मक रूप से असंभव हो सकता है।

प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने की एक विधि एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को परिनियोजित करती है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।

यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का मापता नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े की आवश्यकता होती है,[why?] जबकि क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता होती है।

संदर्भ

  1. 1.0 1.1 1.2 1.3 Alfred J. Menezes, Paul C. van Oorschot, Scott A. Vanstone. "Chapter 7 - Block Ciphers" (PDF). एप्लाइड क्रिप्टोग्राफी की हैंडबुक. p. 246.{{cite book}}: CS1 maint: uses authors parameter (link)


बाप्रत्येक ी संबंध