सांख्यिकीय यादृच्छिकता
एक संख्यात्मक अनुक्रम को सांख्यिकीय रूप से यादृच्छिक कहा जाता है जब इसमें कोई पहचानने योग्य पैटर्न या नियमितता नहीं होती है; अनुक्रम जैसे आदर्श पासा के परिणाम या pi|π के अंक सांख्यिकीय यादृच्छिकता प्रदर्शित करते हैं।[1]
सांख्यिकीय यादृच्छिकता आवश्यक रूप से वास्तविक यादृच्छिकता, अर्थात वस्तुनिष्ठ अप्रत्याशितता का संकेत नहीं देती है। छद्म यादृच्छिकता कई उपयोगों के लिए पर्याप्त है, जैसे आँकड़े, इसलिए नाम सांख्यिकीय यादृच्छिकता है।
वैश्विक यादृच्छिकता और स्थानीय यादृच्छिकता अलग हैं। यादृच्छिकता की अधिकांश दार्शनिक अवधारणाएं वैश्विक हैं - क्योंकि वे इस विचार पर आधारित हैं कि लंबे समय में क्रम वास्तव में यादृच्छिक दिखता है, तथापि कुछ उप-अनुक्रम यादृच्छिक न दिखें। पर्याप्त लंबाई की संख्याओं के वास्तव में यादृच्छिक अनुक्रम में, उदाहरण के लिए, यह संभव है कि संख्याओं को दोहराने के अतिरिक्त कुछ भी नहीं होगा, चूँकि पूरे क्रम में यादृच्छिक हो सकता है। स्थानीय यादृच्छिकता इस विचार को संदर्भित करती है कि न्यूनतम अनुक्रम लंबाई हो सकती है जिसमें यादृच्छिक वितरण अनुमानित होते हैं। समान संख्याओं के लंबे खंड, यहां तक कि वास्तव में यादृच्छिक प्रक्रियाओं द्वारा उत्पन्न किए गए, नमूने की स्थानीय यादृच्छिकता को कम कर देंगे (यह केवल 10,000 संख्याओं के अनुक्रम के लिए स्थानीय रूप से यादृच्छिक हो सकता है; 1,000 से कम के अनुक्रम लेना बिल्कुल भी यादृच्छिक नहीं लग सकता है, के लिए उदाहरण)।
एक पैटर्न प्रदर्शित करने वाला अनुक्रम इस प्रकार सांख्यिकीय रूप से यादृच्छिक नहीं सिद्ध होता है। रैमसे सिद्धांत के सिद्धांतों के अनुसार, पर्याप्त रूप से बड़ी वस्तुओं में आवश्यक रूप से दी गई संरचना होनी चाहिए (पूर्ण विकार असंभव है)।
जुए से संबंधित कानून स्लॉट मशीन पर सांख्यिकीय यादृच्छिकता के कुछ मानकों को लागू करता है।
टेस्ट
यादृच्छिक संख्याओं के लिए पहला परीक्षण एम.जी. द्वारा प्रकाशित किया गया था। 1938 में रॉयल स्टैटिस्टिकल सोसाइटी के जर्नल में केंडल और बर्नार्ड बबिंगटन स्मिथ।[2] वे पियर्सन के ची-स्क्वेर्ड टेस्ट जैसे सांख्यिकीय उपकरणों पर बनाए गए थे जिन्हें यह भेद करने के लिए विकसित किया गया था कि प्रायोगिक घटनाएं उनकी सैद्धांतिक संभावनाओं से मेल खाती हैं या नहीं। पियर्सन ने अपने परीक्षण को मूल रूप से यह दिखाते हुए विकसित किया कि W.F.R द्वारा कई पासा प्रयोग। वेल्डन ने यादृच्छिक व्यवहार प्रदर्शित नहीं किया।
केंडल और स्मिथ के मूल चार परीक्षण सांख्यिकीय परिकल्पना परीक्षण थे, जिन्होंने अपनी शून्य परिकल्पना के रूप में इस विचार को लिया कि किसी दिए गए यादृच्छिक अनुक्रम में प्रत्येक संख्या के होने की समान संभावना थी, और यह कि डेटा में विभिन्न अन्य पैटर्न भी समान रूप से वितरित किए जाने चाहिए।
- आवृत्ति परीक्षण, बहुत ही मूलभूत था: यह सुनिश्चित करने के लिए जाँच करना कि 0s, 1s, 2s, 3s, आदि की संख्या लगभग समान थी।
- धारावाहिक परीक्षण, एक ही काम किया किंतु समय में दो अंकों के अनुक्रमों के लिए (00, 01, 02, आदि), उनकी देखी गई आवृत्तियों की तुलना उनके काल्पनिक भविष्यवाणियों से करते हुए वे समान रूप से वितरित किए गए थे।
- पोकर परीक्षण, गेम पोकर में हाथों के आधार पर एक समय में पांच नंबरों के कुछ अनुक्रमों (AAAAA, AAAAB, AAABB, आदि) के लिए परीक्षण किया गया।
- अंतराल परीक्षण, शून्य के बीच की दूरी पर देखा गया (00 0 की दूरी होगी, 030 1 की दूरी होगी, 02250 3 की दूरी होगी, आदि)।
यदि दिया गया अनुक्रम इन सभी परीक्षणों को महत्व की डिग्री (सामान्यतः 5%) के अन्दर पारित करने में सक्षम था, तो यह उनके शब्दों में स्थानीय रूप से यादृच्छिक होने का निर्णय किया गया था। केंडल और स्मिथ ने स्थानीय यादृच्छिकता को वास्तविक यादृच्छिकता से अलग किया, जिसमें वास्तव में यादृच्छिक विधियों से उत्पन्न कई अनुक्रम स्थानीय यादृच्छिकता को किसी दिए गए डिग्री तक प्रदर्शित नहीं कर सकते - बहुत बड़े अनुक्रमों में एक अंक की कई पंक्तियाँ हो सकती हैं। यह पूरे अनुक्रम के पैमाने पर यादृच्छिक हो सकता है, किंतु छोटे ब्लॉक में यह यादृच्छिक नहीं होगा (यह उनके परीक्षण पास नहीं करेगा), और कई सांख्यिकीय अनुप्रयोगों के लिए निष्क्रिय होगा।
चूंकि यादृच्छिक संख्या सेट अधिक से अधिक सामान्य हो गए, बढ़ते परिष्कार के अधिक परीक्षणों का उपयोग किया गया। कुछ आधुनिक परीक्षण यादृच्छिक अंकों को त्रि-आयामी विमान पर अंक के रूप में प्लॉट करते हैं, जिसे छिपे हुए पैटर्न को देखने के लिए घुमाया जा सकता है। 1995 में, सांख्यिकीविद् जॉर्ज मार्सग्लिया ने परीक्षणों का सेट बनाया, जिसे कठोर परीक्षण के रूप में जाना जाता है, जिसे वह 5 अरब छद्म यादृच्छिक संख्याओं के सीडी रॉम के साथ वितरित करता है। 2015 में, योंग वांग ने जावा सॉफ्टवेयर पैकेज वितरित किया [3] सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण के लिए।
छद्म यादृच्छिक संख्या जनरेटर को उनकी यादृच्छिकता के लिए विशेष सत्यापन के रूप में परीक्षणों की आवश्यकता होती है, क्योंकि वे निश्चित रूप से यादृच्छिक प्रक्रियाओं द्वारा नहीं किंतु नियतात्मक एल्गोरिदम द्वारा निर्मित होते हैं। यादृच्छिक संख्या पीढ़ी के इतिहास में, संख्या के कई स्रोत जो परीक्षण के अनुसार यादृच्छिक प्रतीत होते थे, बाद में कुछ प्रकार के परीक्षणों के अधीन होने पर बहुत गैर-यादृच्छिक होने की खोज की गई। अर्ध-यादृच्छिक संख्याओं की धारणा को इन समस्याओं में से कुछ को दूर करने के लिए विकसित किया गया था, चूँकि कई अनुप्रयोगों में छद्म यादृच्छिक संख्या जनरेटर अभी भी बड़े पैमाने पर उपयोग किए जाते हैं (यहां तक कि जिन्हें अत्यधिक गैर-यादृच्छिक भी कहा जाता है), क्योंकि वे अधिकांश अनुप्रयोगों के लिए पर्याप्त हैं।
अन्य परीक्षण:
- मोनोबिट परीक्षण यादृच्छिक संख्या जनरेटर के प्रत्येक आउटपुट बिट को सिक्का फ्लिप परीक्षण के रूप में मानता है, और यह निर्धारित करता है कि हेड और टेल की देखी गई संख्या अपेक्षित 50% आवृत्ति के निकट है या नहीं। सिक्का फ्लिप ट्रेल में प्रमुखों की संख्या द्विपद वितरण बनाती है।
- वाल्ड-वोल्फोवित्ज़ 0 बिट्स और 1 बिट्स के बीच बिट ट्रांज़िशन की संख्या के लिए परीक्षण परीक्षण चलाता है, यादृच्छिक बिट अनुक्रम की अपेक्षित आवृत्ति के साथ प्रेक्षित आवृत्तियों की तुलना करता है।
- सूचना एन्ट्रापी
- स्वतः सहसंबंध परीक्षण
- कोलमोगोरोव-स्मिर्नोव परीक्षण
- सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण। योंगगे वांग ने दिखाया [4][5] कि NIST SP800-22 परीक्षण मानक यादृच्छिकता जनरेटर और प्रस्तावित सांख्यिकीय रूप से दूरी आधारित यादृच्छिकता परीक्षण में कुछ कमजोरी का पता लगाने के लिए पर्याप्त नहीं हैं।
- वर्णक्रमीय घनत्व अनुमान[6] - गैर-यादृच्छिक दोहराव वाले रुझानों का पता लगाने के लिए यादृच्छिक संकेत पर फूरियर रूपांतरण करना इसे आवधिक कार्यों के योग में बदल देता है
- मौरर का सार्वभौमिक सांख्यिकीय परीक्षण
- द डेडहार्ड टेस्ट
यह भी देखें
- एल्गोरिथम यादृच्छिकता
- चेक (यूनिट टेस्टिंग फ्रेमवर्क) आईएनजी
- पूर्ण स्थानिक यादृच्छिकता
- सामान्य संख्या
- एक समय पैड
- कोई भी त्रुटि
- यादृच्छिकता
- यादृच्छिकता परीक्षण
- सांख्यिकीय परिकल्पना परीक्षण
- यादृच्छिकता की सात अवस्थाएँ
- परीक्षणU01
संदर्भ
- ↑ Pi seems a good random number generator – but not always the best, Chad Boutin, Purdue University
- ↑ Kendall, M.G.; Smith, B. Babington (1938). "यादृच्छिकता और यादृच्छिक नमूना संख्या". Journal of the Royal Statistical Society. 101 (1): 147–166. doi:10.2307/2980655. JSTOR 2980655.
- ↑ Yongge Wang. Statistical Testing Techniques For Pseudorandom generation. http://webpages.uncc.edu/yonwang/liltest/
- ↑ Yongge Wang: On the Design of LIL Tests for (Pseudo) Random Generators and Some Experimental Results. PDF
- ↑ Wang, Yongge; Nicol, Tony (2015). "Pseudo Random Sequences के सांख्यिकीय गुण और PHP और Debian OpenSSL के साथ प्रयोग". Computers and Security. 53: 44–64. doi:10.1016/j.cose.2015.05.005.
- ↑ Knuth, Donald (1998). The Art of Computer Programming Vol. 2 : Seminumerical Algorithms. Addison Wesley. pp. 93–118. ISBN 978-0-201-89684-8.
बाहरी संबंध
- DieHarder: A free (GPL) C Random Number Test Suite.
- Generating Normal Distributed Random Numbers