सांख्यिकीय यादृच्छिकता: Difference between revisions

From Vigyanwiki
(Created page with "एक संख्यात्मक अनुक्रम को सांख्यिकीय रूप से यादृच्छिक कहा जाता ह...")
 
No edit summary
Line 1: Line 1:
एक संख्यात्मक [[अनुक्रम]] को सांख्यिकीय रूप से यादृच्छिक कहा जाता है जब इसमें कोई पहचानने योग्य [[ नमूना ]] या नियमितता नहीं होती है; अनुक्रम जैसे एक आदर्श [[पासा]] के परिणाम या pi|π के अंक सांख्यिकीय यादृच्छिकता प्रदर्शित करते हैं।<ref>[https://www.purdue.edu/uns/html4ever/2005/050426.Fischbach.pi.html Pi seems a good random number generator – but not always the best], Chad Boutin, [[Purdue University]]</ref>
एक संख्यात्मक [[अनुक्रम]] को सांख्यिकीय रूप से यादृच्छिक कहा जाता है जब इसमें कोई पहचानने योग्य [[ नमूना ]] या नियमितता नहीं होती है; अनुक्रम जैसे एक आदर्श [[पासा]] के परिणाम या pi|π के अंक सांख्यिकीय यादृच्छिकता प्रदर्शित करते हैं।<ref>[https://www.purdue.edu/uns/html4ever/2005/050426.Fischbach.pi.html Pi seems a good random number generator – but not always the best], Chad Boutin, [[Purdue University]]</ref>
सांख्यिकीय यादृच्छिकता आवश्यक रूप से वास्तविक यादृच्छिकता, यानी वस्तुनिष्ठ अप्रत्याशितता का संकेत नहीं देती है। [[छद्म यादृच्छिकता]] कई उपयोगों के लिए पर्याप्त है, जैसे आँकड़े, इसलिए नाम सांख्यिकीय यादृच्छिकता।


वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि लंबे समय में एक क्रम वास्तव में यादृच्छिक दिखता है, भले ही कुछ उप-अनुक्रम यादृच्छिक न दिखें। पर्याप्त लंबाई की संख्याओं के वास्तव में यादृच्छिक अनुक्रम में, उदाहरण के लिए, यह संभव है कि संख्याओं को दोहराने के अलावा कुछ भी नहीं होगा, हालांकि पूरे क्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित होते हैं। समान संख्याओं के लंबे खंड, यहां तक ​​​​कि वास्तव में यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न किए गए, एक नमूने की स्थानीय यादृच्छिकता को कम कर देंगे (यह केवल 10,000 संख्याओं के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना बिल्कुल भी यादृच्छिक नहीं लग सकता है, के लिए उदाहरण)।
सांख्यिकीय यादृच्छिकता आवश्यक रूप से वास्तविक यादृच्छिकता, अर्थात वस्तुनिष्ठ अप्रत्याशितता का संकेत नहीं देती है। [[छद्म यादृच्छिकता]] कई उपयोगों के लिए पर्याप्त है, जैसे आँकड़े, इसलिए नाम सांख्यिकीय यादृच्छिकता है।


एक पैटर्न प्रदर्शित करने वाला अनुक्रम इस प्रकार सांख्यिकीय रूप से यादृच्छिक नहीं साबित होता है। [[रैमसे सिद्धांत]] के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से एक दी गई संरचना होनी चाहिए (पूर्ण विकार असंभव है)।
वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि लंबे समय में एक क्रम वास्तव में यादृच्छिक दिखता है, तथापि  कुछ उप-अनुक्रम यादृच्छिक न दिखें। पर्याप्त लंबाई की संख्याओं के वास्तव में यादृच्छिक अनुक्रम में, उदाहरण के लिए, यह संभव है कि संख्याओं को दोहराने के अतिरिक्त कुछ भी नहीं होगा, चूँकि पूरे क्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित होते हैं। समान संख्याओं के लंबे खंड, यहां तक ​​​​कि वास्तव में यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न किए गए, एक नमूने की स्थानीय यादृच्छिकता को कम कर देंगे (यह केवल 10,000 संख्याओं के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना बिल्कुल भी यादृच्छिक नहीं लग सकता है, के लिए उदाहरण)।


जुए से संबंधित कानून [[स्लॉट मशीन]]ों पर सांख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।
एक पैटर्न प्रदर्शित करने वाला अनुक्रम इस प्रकार सांख्यिकीय रूप से यादृच्छिक नहीं सिद्ध होता है। [[रैमसे सिद्धांत]] के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से एक दी गई संरचना होनी चाहिए (पूर्ण विकार असंभव है)।
 
जुए से संबंधित कानून [[स्लॉट मशीन]] पर सांख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।
 
'''ख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।'''


== टेस्ट ==
== टेस्ट ==
Line 23: Line 26:
चूंकि यादृच्छिक संख्या सेट अधिक से अधिक सामान्य हो गए, बढ़ते परिष्कार के अधिक परीक्षणों का उपयोग किया गया। कुछ आधुनिक परीक्षण यादृच्छिक अंकों को त्रि-आयामी विमान पर अंक के रूप में प्लॉट करते हैं, जिसे छिपे हुए पैटर्न को देखने के लिए घुमाया जा सकता है। 1995 में, सांख्यिकीविद् [[जॉर्ज मार्सग्लिया]] ने परीक्षणों का एक सेट बनाया, जिसे [[कठोर परीक्षण]]ों के रूप में जाना जाता है, जिसे वह 5 अरब छद्म यादृच्छिक संख्याओं के [[ सीडी रॉम ]] के साथ वितरित करता है। 2015 में, [[योंग वांग]] ने एक जावा सॉफ्टवेयर पैकेज वितरित किया <ref>Yongge Wang. Statistical Testing Techniques For Pseudorandom generation. http://webpages.uncc.edu/yonwang/liltest/</ref> सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण के लिए।
चूंकि यादृच्छिक संख्या सेट अधिक से अधिक सामान्य हो गए, बढ़ते परिष्कार के अधिक परीक्षणों का उपयोग किया गया। कुछ आधुनिक परीक्षण यादृच्छिक अंकों को त्रि-आयामी विमान पर अंक के रूप में प्लॉट करते हैं, जिसे छिपे हुए पैटर्न को देखने के लिए घुमाया जा सकता है। 1995 में, सांख्यिकीविद् [[जॉर्ज मार्सग्लिया]] ने परीक्षणों का एक सेट बनाया, जिसे [[कठोर परीक्षण]]ों के रूप में जाना जाता है, जिसे वह 5 अरब छद्म यादृच्छिक संख्याओं के [[ सीडी रॉम ]] के साथ वितरित करता है। 2015 में, [[योंग वांग]] ने एक जावा सॉफ्टवेयर पैकेज वितरित किया <ref>Yongge Wang. Statistical Testing Techniques For Pseudorandom generation. http://webpages.uncc.edu/yonwang/liltest/</ref> सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण के लिए।


[[छद्म यादृच्छिक संख्या जनरेटर]] को उनकी यादृच्छिकता के लिए विशेष सत्यापन के रूप में परीक्षणों की आवश्यकता होती है, क्योंकि वे निश्चित रूप से यादृच्छिक प्रक्रियाओं द्वारा नहीं बल्कि नियतात्मक एल्गोरिदम द्वारा निर्मित होते हैं। यादृच्छिक संख्या पीढ़ी के इतिहास में, संख्या के कई स्रोत जो परीक्षण के तहत यादृच्छिक प्रतीत होते थे, बाद में कुछ प्रकार के परीक्षणों के अधीन होने पर बहुत गैर-यादृच्छिक होने की खोज की गई। अर्ध-यादृच्छिक संख्याओं की धारणा को इन समस्याओं में से कुछ को दूर करने के लिए विकसित किया गया था, हालांकि कई अनुप्रयोगों में छद्म यादृच्छिक संख्या जनरेटर अभी भी बड़े पैमाने पर उपयोग किए जाते हैं (यहां तक ​​​​कि जिन्हें अत्यधिक गैर-यादृच्छिक भी कहा जाता है), क्योंकि वे अधिकांश अनुप्रयोगों के लिए पर्याप्त हैं।
[[छद्म यादृच्छिक संख्या जनरेटर]] को उनकी यादृच्छिकता के लिए विशेष सत्यापन के रूप में परीक्षणों की आवश्यकता होती है, क्योंकि वे निश्चित रूप से यादृच्छिक प्रक्रियाओं द्वारा नहीं बल्कि नियतात्मक एल्गोरिदम द्वारा निर्मित होते हैं। यादृच्छिक संख्या पीढ़ी के इतिहास में, संख्या के कई स्रोत जो परीक्षण के तहत यादृच्छिक प्रतीत होते थे, बाद में कुछ प्रकार के परीक्षणों के अधीन होने पर बहुत गैर-यादृच्छिक होने की खोज की गई। अर्ध-यादृच्छिक संख्याओं की धारणा को इन समस्याओं में से कुछ को दूर करने के लिए विकसित किया गया था, चूँकि कई अनुप्रयोगों में छद्म यादृच्छिक संख्या जनरेटर अभी भी बड़े पैमाने पर उपयोग किए जाते हैं (यहां तक ​​​​कि जिन्हें अत्यधिक गैर-यादृच्छिक भी कहा जाता है), क्योंकि वे अधिकांश अनुप्रयोगों के लिए पर्याप्त हैं।


अन्य परीक्षण:
अन्य परीक्षण:
Line 59: Line 62:
==संदर्भ==
==संदर्भ==
{{reflist}}
{{reflist}}
==बाहरी संबंध==
==बाहरी संबंध==
* [http://www.phy.duke.edu/~rgb/General/rand_rate.php DieHarder]: A free ([[GNU General Public License|GPL]]) [[C (programming language)|C]] Random Number Test Suite.
* [http://www.phy.duke.edu/~rgb/General/rand_rate.php DieHarder]: A free ([[GNU General Public License|GPL]]) [[C (programming language)|C]] Random Number Test Suite.

Revision as of 19:28, 27 March 2023

एक संख्यात्मक अनुक्रम को सांख्यिकीय रूप से यादृच्छिक कहा जाता है जब इसमें कोई पहचानने योग्य नमूना या नियमितता नहीं होती है; अनुक्रम जैसे एक आदर्श पासा के परिणाम या pi|π के अंक सांख्यिकीय यादृच्छिकता प्रदर्शित करते हैं।[1]

सांख्यिकीय यादृच्छिकता आवश्यक रूप से वास्तविक यादृच्छिकता, अर्थात वस्तुनिष्ठ अप्रत्याशितता का संकेत नहीं देती है। छद्म यादृच्छिकता कई उपयोगों के लिए पर्याप्त है, जैसे आँकड़े, इसलिए नाम सांख्यिकीय यादृच्छिकता है।

वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि लंबे समय में एक क्रम वास्तव में यादृच्छिक दिखता है, तथापि कुछ उप-अनुक्रम यादृच्छिक न दिखें। पर्याप्त लंबाई की संख्याओं के वास्तव में यादृच्छिक अनुक्रम में, उदाहरण के लिए, यह संभव है कि संख्याओं को दोहराने के अतिरिक्त कुछ भी नहीं होगा, चूँकि पूरे क्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित होते हैं। समान संख्याओं के लंबे खंड, यहां तक ​​​​कि वास्तव में यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न किए गए, एक नमूने की स्थानीय यादृच्छिकता को कम कर देंगे (यह केवल 10,000 संख्याओं के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना बिल्कुल भी यादृच्छिक नहीं लग सकता है, के लिए उदाहरण)।

एक पैटर्न प्रदर्शित करने वाला अनुक्रम इस प्रकार सांख्यिकीय रूप से यादृच्छिक नहीं सिद्ध होता है। रैमसे सिद्धांत के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से एक दी गई संरचना होनी चाहिए (पूर्ण विकार असंभव है)।

जुए से संबंधित कानून स्लॉट मशीन पर सांख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।

ख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।

टेस्ट

यादृच्छिक संख्याओं के लिए पहला परीक्षण एम.जी. द्वारा प्रकाशित किया गया था। 1938 में रॉयल स्टैटिस्टिकल सोसाइटी के जर्नल में केंडल और बर्नार्ड बबिंगटन स्मिथ[2] वे पियर्सन के ची-स्क्वेर्ड टेस्ट जैसे सांख्यिकीय उपकरणों पर बनाए गए थे जिन्हें यह भेद करने के लिए विकसित किया गया था कि प्रायोगिक घटनाएं उनकी सैद्धांतिक संभावनाओं से मेल खाती हैं या नहीं। पियर्सन ने अपने परीक्षण को मूल रूप से यह दिखाते हुए विकसित किया कि W.F.R द्वारा कई पासा प्रयोग। वेल्डन ने यादृच्छिक व्यवहार प्रदर्शित नहीं किया।

केंडल और स्मिथ के मूल चार परीक्षण सांख्यिकीय परिकल्पना परीक्षण थे, जिन्होंने अपनी शून्य परिकल्पना के रूप में इस विचार को लिया कि किसी दिए गए यादृच्छिक अनुक्रम में प्रत्येक संख्या के होने की समान संभावना थी, और यह कि डेटा में विभिन्न अन्य पैटर्न भी समान रूप से वितरित किए जाने चाहिए।

  • आवृत्ति परीक्षण, बहुत ही बुनियादी था: यह सुनिश्चित करने के लिए जाँच करना कि 0s, 1s, 2s, 3s, आदि की संख्या लगभग समान थी।
  • धारावाहिक परीक्षण, एक ही काम किया लेकिन एक समय में दो अंकों के अनुक्रमों के लिए (00, 01, 02, आदि), उनकी देखी गई आवृत्तियों की तुलना उनके काल्पनिक भविष्यवाणियों से करते हुए वे समान रूप से वितरित किए गए थे।
  • पोकर परीक्षण, गेम पोकर में हाथों के आधार पर एक समय में पांच नंबरों के कुछ अनुक्रमों (AAAAA, AAAAB, AAABB, आदि) के लिए परीक्षण किया गया।
  • अंतराल परीक्षण, शून्य के बीच की दूरी पर देखा गया (00 0 की दूरी होगी, 030 1 की दूरी होगी, 02250 3 की दूरी होगी, आदि)।

यदि एक दिया गया अनुक्रम इन सभी परीक्षणों को महत्व की डिग्री (आमतौर पर 5%) के भीतर पारित करने में सक्षम था, तो यह उनके शब्दों में स्थानीय रूप से यादृच्छिक होने का फैसला किया गया था। केंडल और स्मिथ ने स्थानीय यादृच्छिकता को वास्तविक यादृच्छिकता से अलग किया, जिसमें वास्तव में यादृच्छिक विधियों से उत्पन्न कई अनुक्रम स्थानीय यादृच्छिकता को किसी दिए गए डिग्री तक प्रदर्शित नहीं कर सकते - बहुत बड़े अनुक्रमों में एक अंक की कई पंक्तियाँ हो सकती हैं। यह पूरे अनुक्रम के पैमाने पर यादृच्छिक हो सकता है, लेकिन एक छोटे ब्लॉक में यह यादृच्छिक नहीं होगा (यह उनके परीक्षण पास नहीं करेगा), और कई सांख्यिकीय अनुप्रयोगों के लिए बेकार होगा।

चूंकि यादृच्छिक संख्या सेट अधिक से अधिक सामान्य हो गए, बढ़ते परिष्कार के अधिक परीक्षणों का उपयोग किया गया। कुछ आधुनिक परीक्षण यादृच्छिक अंकों को त्रि-आयामी विमान पर अंक के रूप में प्लॉट करते हैं, जिसे छिपे हुए पैटर्न को देखने के लिए घुमाया जा सकता है। 1995 में, सांख्यिकीविद् जॉर्ज मार्सग्लिया ने परीक्षणों का एक सेट बनाया, जिसे कठोर परीक्षणों के रूप में जाना जाता है, जिसे वह 5 अरब छद्म यादृच्छिक संख्याओं के सीडी रॉम के साथ वितरित करता है। 2015 में, योंग वांग ने एक जावा सॉफ्टवेयर पैकेज वितरित किया [3] सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण के लिए।

छद्म यादृच्छिक संख्या जनरेटर को उनकी यादृच्छिकता के लिए विशेष सत्यापन के रूप में परीक्षणों की आवश्यकता होती है, क्योंकि वे निश्चित रूप से यादृच्छिक प्रक्रियाओं द्वारा नहीं बल्कि नियतात्मक एल्गोरिदम द्वारा निर्मित होते हैं। यादृच्छिक संख्या पीढ़ी के इतिहास में, संख्या के कई स्रोत जो परीक्षण के तहत यादृच्छिक प्रतीत होते थे, बाद में कुछ प्रकार के परीक्षणों के अधीन होने पर बहुत गैर-यादृच्छिक होने की खोज की गई। अर्ध-यादृच्छिक संख्याओं की धारणा को इन समस्याओं में से कुछ को दूर करने के लिए विकसित किया गया था, चूँकि कई अनुप्रयोगों में छद्म यादृच्छिक संख्या जनरेटर अभी भी बड़े पैमाने पर उपयोग किए जाते हैं (यहां तक ​​​​कि जिन्हें अत्यधिक गैर-यादृच्छिक भी कहा जाता है), क्योंकि वे अधिकांश अनुप्रयोगों के लिए पर्याप्त हैं।

अन्य परीक्षण:

  • मोनोबिट परीक्षण यादृच्छिक संख्या जनरेटर के प्रत्येक आउटपुट बिट को एक सिक्का फ्लिप परीक्षण के रूप में मानता है, और यह निर्धारित करता है कि हेड और टेल की देखी गई संख्या अपेक्षित 50% आवृत्ति के करीब है या नहीं। एक सिक्का फ्लिप ट्रेल में प्रमुखों की संख्या एक द्विपद वितरण बनाती है।
  • वाल्ड-वोल्फोवित्ज़ 0 बिट्स और 1 बिट्स के बीच बिट ट्रांज़िशन की संख्या के लिए परीक्षण परीक्षण चलाता है, एक यादृच्छिक बिट अनुक्रम की अपेक्षित आवृत्ति के साथ प्रेक्षित आवृत्तियों की तुलना करता है।
  • सूचना एन्ट्रापी
  • स्वतः सहसंबंध परीक्षण
  • कोलमोगोरोव-स्मिर्नोव परीक्षण
  • सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण। योंगगे वांग ने दिखाया [4][5] कि NIST SP800-22 परीक्षण मानक यादृच्छिकता जनरेटर और प्रस्तावित सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण में कुछ कमजोरी का पता लगाने के लिए पर्याप्त नहीं हैं।
  • वर्णक्रमीय घनत्व अनुमान[6] - गैर-यादृच्छिक दोहराव वाले रुझानों का पता लगाने के लिए एक यादृच्छिक संकेत पर एक फूरियर रूपांतरण करना इसे आवधिक कार्यों के योग में बदल देता है
  • मौरर का सार्वभौमिक सांख्यिकीय परीक्षण
  • द डेडहार्ड टेस्ट

यह भी देखें

संदर्भ

  1. Pi seems a good random number generator – but not always the best, Chad Boutin, Purdue University
  2. Kendall, M.G.; Smith, B. Babington (1938). "यादृच्छिकता और यादृच्छिक नमूना संख्या". Journal of the Royal Statistical Society. 101 (1): 147–166. doi:10.2307/2980655. JSTOR 2980655.
  3. Yongge Wang. Statistical Testing Techniques For Pseudorandom generation. http://webpages.uncc.edu/yonwang/liltest/
  4. Yongge Wang: On the Design of LIL Tests for (Pseudo) Random Generators and Some Experimental Results. PDF
  5. Wang, Yongge; Nicol, Tony (2015). "Pseudo Random Sequences के सांख्यिकीय गुण और PHP और Debian OpenSSL के साथ प्रयोग". Computers and Security. 53: 44–64. doi:10.1016/j.cose.2015.05.005.
  6. Knuth, Donald (1998). The Art of Computer Programming Vol. 2 : Seminumerical Algorithms. Addison Wesley. pp. 93–118. ISBN 978-0-201-89684-8.

बाहरी संबंध