यूनिसिटी दूरी: Difference between revisions

From Vigyanwiki
Line 13: Line 13:
सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल [[ अपरकेस |अपरकेस]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ|प्लेनटेक्स्ट]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो  K=26<sup>5</sup> संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।
सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल [[ अपरकेस |अपरकेस]] अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि [[सादे पाठ|प्लेनटेक्स्ट]] का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो  K=26<sup>5</sup> संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।


वर्णों के इस सीमित सेट का उपयोग करके भी भारी संख्या में संभावित संदेश, N, उत्पन्न किए जा सकते हैं: N = 26<sup>L</sup>, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय होता है, संभवतः उनमें से M, जहां एम एन की तुलना में बहुत छोटा होने की संभावना है। इसके अलावा, एम का संख्या के साथ एक-से-एक संबंध है काम करने वाली कुंजियों की संख्या, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही काम करेगी। इनमें से एक सही कुंजी है, बाकी सब नकली हैं।
वर्णों के इस सीमित सेट का उपयोग करके भी भारी संख्या में संभावित संदेश, N उत्पन्न किए जा सकते हैं: N = 26<sup>L</sup>, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय होता है, संभवतः उनमें से M, जहां M  N की तुलना में बहुत छोटे होने की संभावना होती है। इसके अतिरिक्त, M का काम करने वाली कुंजियों की संख्या के साथ एक-से-एक संबंध होता है, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही "काम" करते हैं। इनमें से एक सही कुंजी है, बाकी सब नकली होती हैं।


चूंकि संदेश की लंबाई एल बढ़ने पर एम/एन मनमाने ढंग से छोटा हो जाता है, अंततः कुछ एल होता है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। मोटे तौर पर कहें तो, यह वह L है जो KM/N=1 बनाता है। यह एल एकसिटी दूरी है।
चूंकि संदेश की लंबाई L बढ़ने पर M/N यादृच्छिक रूप से छोटे हो जाते है, अंततः कुछ L होते है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। सामान्यतः कहें तो, यह वह L है जो KM/N=1 बनाता है। यह L एकनगरीय दूरी होती है।


==कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध==
==कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध==
Line 23: Line 23:


: <math>U = H(k) / D</math>
: <math>U = H(k) / D</math>
जहां यू एकसिटी दूरी है, एच(के) मुख्य स्थान की एन्ट्रापी है (उदाप्रत्येक ण के लिए 2 के लिए 128)<sup>128</sup> समसंभाव्य कुंजियाँ, बल्कि कम यदि कुंजी एक याद किया गया पास-वाक्यांश है)। डी को प्रति वर्ण बिट्स में प्लेनटेक्स्ट रिडंडेंसी के रूप में परिभाषित किया गया है।
जहां U एकनगरीय दूरी होती है, H(k) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2<sup>128</sup> समसंभाव्य कुंजियों के लिए 128, यदि कुंजी एक स्मरण किया गया संकेत- वाक्यांश होता है)। D को प्रति वर्ण बिट्स में प्लेनटेक्स्ट आँकड़ा अतिरिक्तता के रूप में परिभाषित किया गया है।


अब 32 अक्षरों की वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2)।<sup>5</sup>). सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या होती है  {{math|log<sub>2</sub>(N)}}, जहां N वर्णमाला में वर्णों की संख्या है और {{math|log<sub>2</sub>}} बाइनरी लघुगणक है. इसलिए अंग्रेजी के लिए प्रत्येक अक्षर संप्रेषित कर सकता है {{math|log<sub>2</sub>(26) {{=}} 4.7}} जानकारी के अंश।
अब 32 अक्षरों की एक वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 2<sup>5</sup>)सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या log2(N) है, जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक होता है। तो अंग्रेजी के लिए प्रत्येक अक्षर log2(26) = 4.7 बिट संप्रेषित कर सकता है।


चूँकि   , सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो सादा पाठ अतिरेक D = 4.7 − 1.5 = 3.2 है।<ref name=hac />
चूँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो प्लेनटेक्स्ट अतिरेक D = 4.7 − 1.5 = 3.2 होता है।<ref name=hac />


मूलतः एकसिटी की दूरी जितनी बड़ी होगी उतना बेहतर होगा। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास है <math>U = \infty</math>, जो वन-टाइम पैड के अटूट होने के अनुरूप है।
मूलतः यूनिसिटी दूरी जितनी बड़ी होगी उतना ही बेहतर होता है। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास <math>U = \infty</math>, जो वन-टाइम पैड ने के अनुरूप होते है।


=== [[प्रतिस्थापन सिफर]] की एकसिटी दूरी ===
=== [[प्रतिस्थापन सिफर]] की यूनिसिटी दूरी ===
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है {{math|26! {{=}} 4.0329 × 10<sup>26</sup> {{=}} 2<sup>88.4</sup>}}, उन तरीकों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित हैं, {{math|''H''(''k'') {{=}} log<sub>2</sub>(26!) {{=}} 88.4}} बिट्स. अंग्रेजी पाठ के लिए {{math|''D'' {{=}} 3.2}}, इस प्रकार {{math|''U'' {{=}} 88.4/3.2 {{=}} 28}}.
एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है {{math|26! {{=}} 4.0329 × 10<sup>26</sup> {{=}} 2<sup>88.4</sup>}} होती है, उन विधियों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित होती हैं, {{math|''H''(''k'') {{=}} log<sub>2</sub>(26!) {{=}} 88.4}} बिट्स होती है। अंग्रेजी पाठ के लिए {{math|''D'' {{=}} 3.2}}, इस प्रकार {{math|''U'' {{=}} 88.4/3.2 {{=}} 28}} होते है।


इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और इसलिए कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।
इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।


==व्यावहारिक अनुप्रयोग==
==व्यावहारिक अनुप्रयोग==
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, लेकिन वास्तविक दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन कूटलिखित आँकड़े ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।
यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, किन्तु दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।


प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने का एक तरीका एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को तैनात करना है, उदाप्रत्येक ण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।
प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने की एक विधि एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को परिनियोजित करती है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।


यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का माप नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े आवश्यक है,{{why|date=November 2014}} लेकिन क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता है।
यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का मापता नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े की आवश्यकता होती है,{{why|date=November 2014}} जबकि  क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता होती है।


==संदर्भ==
==संदर्भ==

Revision as of 00:23, 11 August 2023

क्रिप्टोग्राफी में, यूनिसिटी दूरी एक मूल कूटलिखित आँकड़े की लंबाई होती है जो एक प्रवृति के आवेग में संभावित अवांछित कुंजियों की संख्या को शून्य तक कम करके कूटलेख को विभाजित करने की आवश्यकता होती है। अर्थात, प्रत्येक संभव कुंजी को प्रयास करने के बाद, केवल एक डिक्रिप्शन होना चाहिए जो समझ में आता है, अर्थात कुंजी को पूरी तरह से निर्धारित करने के लिए आवश्यक कूटलिखित आँकड़े की अपेक्षित मात्रा मे, यह धृष्ट रूप से अंतर्निहित संदेश में अतिरेक होता है।[1]

क्लाउड शैनन ने अपने 1949 के पेपर "कम्युनिकेशन थ्योरी ऑफ सीक्रेसी सिस्टम्स" में यूनिसिटी दूरी को परिभाषित किया था।

पांच अक्षर वाली कुंजी के साथ विगेनियर सिफर का उपयोग करके एन्क्रिप्टेड कूटलिखित आँकड़े स्ट्रिंग WNAIW हमले पर विचार करें। संभवतः, इस स्ट्रिंग को किसी अन्य स्ट्रिंग में समझा जा सकता है - नदी और पानी दोनों कुछ कुंजियों के लिए संभावनाएं होती हैं। यह क्रिप्टोएनालिसिस का एक सामान्य नियम है: जो बिना किसी अतिरिक्त जानकारी के इस संदेश को डिकोड करना असंभव होता है।

निःसंदेह, इस स्थिति में भी, अंग्रेजी शब्दों में केवल पांच अक्षर वाली कुंजियों की एक निश्चित संख्या ही परिणामित होती है। सभी संभावित कुंजियाँ प्रयास से हमें न केवल नदी और पानी मिलेगा, जबकि SXOOS और KHDOP भी मिलेंगे। "कार्यशील" कुंजियों की संख्या संभवतः सभी संभावित कुंजियों के सेट से बहुत कम होती है। समस्या यह जानने की है कि इनमें से कौन सी "कार्यशील" कुंजी सही है; बाकी सब नकली होते हैं।

कुंजी आकार और संभावित सादेपाठ के साथ संबंध

सामान्यतः, कुंजी के आकार और संभावित संदेशों की संख्या के बारे में विशेष धारणाओं को देखते हुए, एक औसत सिफरटेक्स्ट लंबाई होती है जहां केवल एक कुंजी होती है (औसतन) जो एक पढ़ने योग्य संदेश उत्पन्न करती है। उपरोक्त उदाहरण में हम केवल अपरकेस अंग्रेजी वर्ण देखते हैं, इसलिए यदि हम मान लें कि प्लेनटेक्स्ट का यह रूप है, तो स्ट्रिंग में प्रत्येक स्थिति के लिए 26 संभावित अक्षर होते हैं। इसी तरह यदि हम पाँच-वर्ण वाली अपर केस कुंजियाँ मान लें, तो K=265 संभावित कुंजियाँ हैं, जिनमें से अधिकांश "काम" नहीं करती है।

वर्णों के इस सीमित सेट का उपयोग करके भी भारी संख्या में संभावित संदेश, N उत्पन्न किए जा सकते हैं: N = 26L, जहां L संदेश की लंबाई होती है। चूँकि, भाषा के नियमों के कारण उनमें से केवल एक छोटा सेट ही पठनीय होता है, संभवतः उनमें से M, जहां M N की तुलना में बहुत छोटे होने की संभावना होती है। इसके अतिरिक्त, M का काम करने वाली कुंजियों की संख्या के साथ एक-से-एक संबंध होता है, इसलिए K संभावित कुंजियाँ दी गई हैं, उनमें से केवल K × (M/N) ही "काम" करते हैं। इनमें से एक सही कुंजी है, बाकी सब नकली होती हैं।

चूंकि संदेश की लंबाई L बढ़ने पर M/N यादृच्छिक रूप से छोटे हो जाते है, अंततः कुछ L होते है जो इतना बड़ा होता है कि नकली कुंजियों की संख्या शून्य के बराबर हो जाती है। सामान्यतः कहें तो, यह वह L है जो KM/N=1 बनाता है। यह L एकनगरीय दूरी होती है।

कुंजी एन्ट्रापी और प्लेनटेक्स्ट अतिरेक के साथ संबंध

यूनिसिटी दूरी को समान रूप से अद्वितीय एन्क्रिप्शन कुंजी को पुनर्प्राप्त करने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी को अनुमति देने के लिए आवश्यक कूटलिखित आँकड़े की न्यूनतम मात्रा के रूप में परिभाषित किया जा सकता है।[1]

तब अपेक्षित एकत्व दूरी को इस प्रकार दिखाया जा सकता है:[1]

जहां U एकनगरीय दूरी होती है, H(k) मुख्य स्थान की एन्ट्रापी है (उदाहरण के लिए 2128 समसंभाव्य कुंजियों के लिए 128, यदि कुंजी एक स्मरण किया गया संकेत- वाक्यांश होता है)। D को प्रति वर्ण बिट्स में प्लेनटेक्स्ट आँकड़ा अतिरिक्तता के रूप में परिभाषित किया गया है।

अब 32 अक्षरों की एक वर्णमाला में प्रति अक्षर 5 बिट जानकारी हो सकती है (जैसे 32 = 25)। सामान्यतः प्रति वर्ण सूचना के बिट्स की संख्या log2(N) है, जहां N वर्णमाला में वर्णों की संख्या है और log2 बाइनरी लघुगणक होता है। तो अंग्रेजी के लिए प्रत्येक अक्षर log2(26) = 4.7 बिट संप्रेषित कर सकता है।

चूँकि, सार्थक अंग्रेजी पाठ में प्रति वर्ण वास्तविक जानकारी की औसत मात्रा केवल 1.5 बिट प्रति वर्ण है। तो प्लेनटेक्स्ट अतिरेक D = 4.7 − 1.5 = 3.2 होता है।[1]

मूलतः यूनिसिटी दूरी जितनी बड़ी होगी उतना ही बेहतर होता है। असीमित आकार के वन टाइम पैड के लिए, मुख्य स्थान की असीमित एन्ट्रॉपी को देखते हुए, हमारे पास , जो वन-टाइम पैड ने के अनुरूप होते है।

प्रतिस्थापन सिफर की यूनिसिटी दूरी

एक साधारण प्रतिस्थापन सिफर के लिए, संभावित कुंजियों की संख्या है 26! = 4.0329 × 1026 = 288.4 होती है, उन विधियों की संख्या जिनसे वर्णमाला को क्रमबद्ध किया जा सकता है। यह मानते हुए कि सभी कुंजियाँ समान रूप से संभावित होती हैं, H(k) = log2(26!) = 88.4 बिट्स होती है। अंग्रेजी पाठ के लिए D = 3.2, इस प्रकार U = 88.4/3.2 = 28 होते है।

इसलिए कूटलिखित आँकड़े के 28 अक्षरों को देखते हुए एक अंग्रेजी प्लेनटेक्स्ट और कुंजी पर काम करना सैद्धांतिक रूप से संभव होना चाहिए।

व्यावहारिक अनुप्रयोग

यूनिसिटी दूरी एक उपयोगी सैद्धांतिक माप है, किन्तु दुनिया (सीमित) संसाधनों वाले किसी प्रतिद्वंद्वी द्वारा हमला किए जाने पर यह ब्लॉक सिफर की सुरक्षा के बारे में बहुत कुछ नहीं कहता है। तीन सिफरटेक्स्ट ब्लॉकों की यूनिसिटी दूरी वाले एक ब्लॉक सिफर पर विचार करें। यद्यपि सही कुंजी (सरल विस्तृत खोज) खोजने के लिए कम्प्यूटेशनल रूप से असीमित प्रतिद्वंद्वी के लिए स्पष्ट रूप से पर्याप्त जानकारी है, यह व्यवहार में कम्प्यूटेशनल रूप से असंभव हो सकता है।

प्लेनटेक्स्ट अतिरेक को कम करके यूनिसिटी दूरी को बढ़ाया जा सकता है। ऐसा करने की एक विधि एन्क्रिप्शन से पहले डेटा संपीड़न तकनीकों को परिनियोजित करती है, उदाहरण के लिए पठनीयता बनाए रखते हुए अनावश्यक स्वरों को हटाकर। वैसे भी यह एक अच्छा विचार है, क्योंकि यह एन्क्रिप्ट किए जाने वाले डेटा की मात्रा को कम कर देता है।

यूनिसिटी दूरी से अधिक कूटलिखित आँकड़े को केवल एक सार्थक डिक्रिप्शन माना जा सकता है। यूनिसिटी दूरी से छोटे कूटलिखित आँकड़े में कई प्रशंसनीय डिक्रिप्शन हो सकते हैं। यूनिसिटी दूरी इस बात का मापता नहीं है कि क्रिप्टोएनालिसिस के लिए कितना कूटलिखित आँकड़े की आवश्यकता होती है,[why?] जबकि क्रिप्टोएनालिसिस के लिए केवल एक उचित समाधान होने के लिए कितने कूटलिखित आँकड़े की आवश्यकता होती है।

संदर्भ

  1. 1.0 1.1 1.2 1.3 Alfred J. Menezes, Paul C. van Oorschot, Scott A. Vanstone. "Chapter 7 - Block Ciphers" (PDF). एप्लाइड क्रिप्टोग्राफी की हैंडबुक. p. 246.{{cite book}}: CS1 maint: uses authors parameter (link)


बाप्रत्येक ी संबंध