कम्प्यूटेशनल आँकड़े: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(3 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{for|the journal|Computational Statistics (journal)}}
{{Short description|Interface between statistics and computer science}}
{{Short description|Interface between statistics and computer science}}
[[File:London School of Economics Statistics Machine Room 1964.jpg|thumb|right|1964 में [[लंदन स्कूल ऑफ इकोनॉमिक्स]] की सांख्यिकी [[कंप्यूटर लैब]] में काम करने वाले छात्र]]
[[File:London School of Economics Statistics Machine Room 1964.jpg|thumb|right|1964 में [[लंदन स्कूल ऑफ इकोनॉमिक्स]] की सांख्यिकी [[कंप्यूटर लैब]] में काम करने वाले छात्र]]




कम्प्यूटेशनल सांख्यिकी, या [[सांख्यिकीय आंकड़ा प्रकार|सांख्यिकीय]] कंप्यूटिंग, सांख्यिकी और [[कंप्यूटर]] विज्ञान के बीच का बंधन है। इसका अर्थ यह है कि सांख्यिकीय विधियाँ जो कम्प्यूटेशनल विधियों का उपयोग करके सक्षम की जाती हैं। यह सांख्यिकी के गणितीय विज्ञान के लिए विशिष्ट [[कम्प्यूटेशनल विज्ञान]] (या वैज्ञानिक कंप्यूटिंग) का क्षेत्र है। यह क्षेत्र भी तेजी से विकसित हो रहा है, जिसके कारण यह मांग उठने लगी है कि कंप्यूटिंग की व्यापक अवधारणा को सामान्य सांख्यिकीय शिक्षा के हिस्से के रूप में पढ़ाया जाना चाहिए।<ref>[[Deborah A. Nolan|Nolan, D.]] & Temple Lang, D. (2010). "Computing in the Statistics Curricula", ''[[The American Statistician]]'' '''64''' (2), pp.97-107.</ref>
 
'''कम्प्यूटेशनल सांख्यिकी, या [[सांख्यिकीय आंकड़ा प्रकार|सांख्यिकीय]] कंप्यूटिंग''', सांख्यिकी और [[कंप्यूटर]] विज्ञान के बीच का बंधन है। इसका अर्थ यह है कि सांख्यिकीय विधियाँ जो कम्प्यूटेशनल विधियों का उपयोग करके सक्षम की जाती हैं। यह सांख्यिकी के गणितीय विज्ञान के लिए विशिष्ट [[कम्प्यूटेशनल विज्ञान]] (या वैज्ञानिक कंप्यूटिंग) का क्षेत्र है। यह क्षेत्र भी तेजी से विकसित हो रहा है, जिसके कारण यह मांग उठने लगी है कि कंप्यूटिंग की व्यापक अवधारणा को सामान्य सांख्यिकीय शिक्षा के हिस्से के रूप में पढ़ाया जाना चाहिए।<ref>[[Deborah A. Nolan|Nolan, D.]] & Temple Lang, D. (2010). "Computing in the Statistics Curricula", ''[[The American Statistician]]'' '''64''' (2), pp.97-107.</ref>




मौलिक सांख्यिकी की तरह लक्ष्य को असंसाधित्र आँकड़ा (रॉ डाटा) को ज्ञान में बदलना है,<ref name=":0">[[Edward Wegman|Wegman, Edward]] J. “[https://www.jstor.org/stable/24536995 Computational Statistics: A New Agenda for Statistical Theory and Practice.]” ''[http://www.washacadsci.org/journal/ Journal of the Washington Academy of Sciences]'', vol. 78, no. 4, 1988, pp. 310–322. ''JSTOR''</ref> परन्तु यहाँ ध्यान कंप्यूटर-गहन सांख्यिकीय तरीकों पर है, जैसे कि बहुत बड़े प्रतिदर्श आमाप (सैंपल साइज) और गैर-सजातीय [[डेटा सेट]] वाले मामले में हैं।<ref name=":0" />
मौलिक सांख्यिकी की तरह लक्ष्य को असंसाधित्र आँकड़ा (रॉ डाटा) को ज्ञान में बदलना है,<ref name=":0">[[Edward Wegman|Wegman, Edward]] J. “[https://www.jstor.org/stable/24536995 Computational Statistics: A New Agenda for Statistical Theory and Practice.]” ''[http://www.washacadsci.org/journal/ Journal of the Washington Academy of Sciences]'', vol. 78, no. 4, 1988, pp. 310–322. ''JSTOR''</ref> परन्तु यहाँ ध्यान कंप्यूटर-गहन सांख्यिकीय तरीकों पर है, जैसे कि बहुत बड़े प्रतिदर्श आमाप (सैंपल साइज) और गैर-सजातीय [[डेटा सेट]] वाले मामले में हैं।<ref name=":0" />


शब्द 'कम्प्यूटेशनल स्टैटिस्टिक्स' और 'स्टैटिस्टिकल कंप्यूटिंग' का प्रयोग अक्सर एक दूसरे के स्थान पर किया जाता है, हालांकि कार्लो लॉरो (सांख्यिकीय कंप्यूटिंग के लिए इंटरनेशनल एसोसिएशन के एक पूर्व अध्यक्ष) ने सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग के रूप में 'सांख्यिकीय कंप्यूटिंग' को परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया था।
शब्द 'कम्प्यूटेशनल स्टैटिस्टिक्स' और 'स्टैटिस्टिकल कंप्यूटिंग' का प्रयोग प्रायः एक दूसरे के स्थान पर किया जाता है, हालांकि कार्लो लॉरो (सांख्यिकीय कंप्यूटिंग के लिए इंटरनेशनल एसोसिएशन के एक पूर्व अध्यक्ष) ने सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग के रूप में 'सांख्यिकीय कंप्यूटिंग' को परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया था।
और 'कम्प्यूटेशनल सांख्यिकी' को लागू करने के लिए एल्गोरिथम के डिजाइन के लक्ष्य के रूप में
और 'कम्प्यूटेशनल सांख्यिकी' को लागू करने के लिए एल्गोरिथम के डिजाइन के लक्ष्य के रूप में
कंप्यूटर पर सांख्यिकीय तरीके, कंप्यूटर से पहले अकल्पनीय सहित
कंप्यूटर पर सांख्यिकीय तरीके, कंप्यूटर से पहले अकल्पनीय सहित
उम्र (जैसे [[बूटस्ट्रैपिंग (सांख्यिकी)]], मोंटे कार्लो सिमुलेशन), साथ ही साथ विश्लेषणात्मक रूप से जटिल समस्याओं से निपटने के लिए [[[sic]]]।<ref name=":1">{{Citation| first=Carlo|last=Lauro| title=Computational statistics or statistical computing, is that the question?| journal= Computational Statistics & Data Analysis| volume=23| issue=1| year=1996| pages=191–193| doi=10.1016/0167-9473(96)88920-1}}</ref>
उम्र (जैसे [[बूटस्ट्रैपिंग (सांख्यिकी)]], मोंटे कार्लो सिमुलेशन), साथ ही साथ विश्लेषणात्मक रूप से जटिल समस्याओं से निपटने के लिए [[[sic]]]।<ref name=":1">{{Citation| first=Carlo|last=Lauro| title=Computational statistics or statistical computing, is that the question?| journal= Computational Statistics & Data Analysis| volume=23| issue=1| year=1996| pages=191–193| doi=10.1016/0167-9473(96)88920-1}}</ref>


'कम्प्यूटेशनल सांख्यिकी' और 'सांख्यिकीय कंप्यूटिंग' शब्द अक्सर एक दूसरे के स्थान पर उपयोग किए जाते हैं, हालांकि कार्लो लॉरो (इंटरनेशनल एसोसिएशन फॉर स्टैटिस्टिकल कंप्यूटिंग के पूर्व अध्यक्ष) ने 'सांख्यिकीय कंप्यूटिंग' को "सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग" के रूप में परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया। ", और 'कम्प्यूटेशनल आँकड़े' का उद्देश्य "कंप्यूटर पर सांख्यिकीय तरीकों को लागू करने के लिए एक एल्गोरिदम के डिजाइन का लक्ष्य रखना है, जिसमें कंप्यूटर युग से पहले अकल्पनीय (जैसे [[बूटस्ट्रैपिंग (सांख्यिकी)]], सिमुलेशन) शामिल हैं, साथ ही विश्लेषणात्मक रूप से कठिन समस्याओं से निपटना भी शामिल है" [[[sic]]]।<ref name=":1" />
'कम्प्यूटेशनल सांख्यिकी' और 'सांख्यिकीय कंप्यूटिंग' शब्द प्रायः एक दूसरे के स्थान पर उपयोग किए जाते हैं, हालांकि कार्लो लॉरो (इंटरनेशनल एसोसिएशन फॉर स्टैटिस्टिकल कंप्यूटिंग के पूर्व अध्यक्ष) ने 'सांख्यिकीय कंप्यूटिंग' को "सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग" के रूप में परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया। ", और 'कम्प्यूटेशनल आँकड़े' का उद्देश्य "कंप्यूटर पर सांख्यिकीय तरीकों को लागू करने के लिए एक एल्गोरिदम के डिजाइन का लक्ष्य रखना है, जिसमें कंप्यूटर युग से पहले अकल्पनीय (जैसे [[बूटस्ट्रैपिंग (सांख्यिकी)]], सिमुलेशन) सम्मिलित हैं, साथ ही विश्लेषणात्मक रूप से कठिन समस्याओं से निपटना भी सम्मिलित है" [[[sic]]]।<ref name=":1" />




'कम्प्यूटेशनल सांख्यिकी' शब्द का उपयोग कम्प्यूटेशनल रूप से गहन सांख्यिकीय तरीकों को संदर्भित करने के लिए भी किया जा सकता है, जिसमें पुनः प्रतिचयन विधियां, [[मार्कोव चेन मोंटे कार्लो]], स्थानीय प्रतिगमन, [[कर्नेल घनत्व अनुमान]], कृत्रिम तंत्रिका नेटवर्क और सामान्यीकृत योजक मॉडल शामिल हैं।
'कम्प्यूटेशनल सांख्यिकी' शब्द का उपयोग कम्प्यूटेशनल रूप से गहन सांख्यिकीय तरीकों को संदर्भित करने के लिए भी किया जा सकता है, जिसमें पुनः प्रतिचयन विधियां, [[मार्कोव चेन मोंटे कार्लो]], स्थानीय प्रतिगमन, [[कर्नेल घनत्व अनुमान]], कृत्रिम तंत्रिका नेटवर्क और सामान्यीकृत योजक मॉडल सम्मिलित हैं।


== इतिहास ==
== इतिहास ==
हालाँकि कम्प्यूटेशनल आँकड़ों का आज व्यापक रूप से उपयोग किया जाता है, लेकिन वास्तव में सांख्यिकी समुदाय में इसकी स्वीकृति का इतिहास अपेक्षाकृत छोटा है। अधिकांश भाग के लिए, सांख्यिकी के क्षेत्र के संस्थापक कम्प्यूटेशनल सांख्यिकीय पद्धति के विकास में गणित और स्पर्शोन्मुख अनुमानों पर निर्भर थे।<ref>{{Cite journal|last=Watnik|first=Mitchell|date=2011|title=प्रारंभिक कम्प्यूटेशनल सांख्यिकी|url=http://www.tandfonline.com/doi/abs/10.1198/jcgs.2011.204b|journal=Journal of Computational and Graphical Statistics|language=en|volume=20|issue=4|pages=811–817|doi=10.1198/jcgs.2011.204b|s2cid=120111510 |issn=1061-8600}}</ref>  
हालाँकि कम्प्यूटेशनल आँकड़ों का आज व्यापक रूप से उपयोग किया जाता है, लेकिन वास्तव में सांख्यिकी समुदाय में इसकी स्वीकृति का इतिहास अपेक्षाकृत छोटा है। अधिकांश भाग के लिए, सांख्यिकी के क्षेत्र के संस्थापक कम्प्यूटेशनल सांख्यिकीय पद्धति के विकास में गणित और स्पर्शोन्मुख अनुमानों पर निर्भर थे।<ref>{{Cite journal|last=Watnik|first=Mitchell|date=2011|title=प्रारंभिक कम्प्यूटेशनल सांख्यिकी|url=http://www.tandfonline.com/doi/abs/10.1198/jcgs.2011.204b|journal=Journal of Computational and Graphical Statistics|language=en|volume=20|issue=4|pages=811–817|doi=10.1198/jcgs.2011.204b|s2cid=120111510 |issn=1061-8600}}</ref>  


सांख्यिकीय क्षेत्र में, "कंप्यूटर" शब्द का पहला उपयोग 1891 में रॉबर्ट पी. पोर्टर द्वारा जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन आर्काइव्स के एक लेख में मिलता है। लेख में 11वीं जनगणना में हरमन होलेरिथ की मशीन के उपयोग पर चर्चा की गई है।हरमन होलेरिथ की मशीन, जिसे टेबुलेटिंग मशीन भी कहा जाता है, एक इलेक्ट्रोमैकेनिकल मशीन थी जिसे छिद्रित कार्डों पर संग्रहीत जानकारी को संक्षेप में प्रस्तुत करने में सहायता के लिए डिज़ाइन किया गया था। इसका आविष्कार एक अमेरिकी व्यवसायी, आविष्कारक और सांख्यिकीविद् हरमन होलेरिथ (29 फरवरी, 1860 - 17 नवंबर, 1929) द्वारा किया गया था। पंच कार्ड टेबुलेटिंग मशीन के उनके आविष्कार का 1884 में पेटेंट कराया गया था, और बाद में संयुक्त राज्य अमेरिका की 1890 की जनगणना में इसका इस्तेमाल किया गया था। प्रौद्योगिकी के लाभ तुरंत स्पष्ट हो गए। 1880 की जनगणना, लगभग 50 मिलियन लोगों के साथ, और इसे सारणीबद्ध करने में 7 साल से अधिक का समय लगा। जबकि 1890 की जनगणना में 62 मिलियन से अधिक लोगों को शामिल करने में एक वर्ष से भी कम समय लगा। यह मशीनीकृत कम्प्यूटेशनल सांख्यिकी और अर्धस्वचालित डेटा प्रोसेसिंग सिस्टम के युग की शुरुआत का प्रतीक है।
सांख्यिकीय क्षेत्र में, "कंप्यूटर" शब्द का पहला उपयोग 1891 में रॉबर्ट पी. पोर्टर द्वारा जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन आर्काइव्स के एक लेख में मिलता है। लेख में 11वीं जनगणना में हरमन होलेरिथ की मशीन के उपयोग पर चर्चा की गई है। हरमन होलेरिथ की मशीन, जिसे टेबुलेटिंग मशीन भी कहा जाता है, एक इलेक्ट्रोमैकेनिकल मशीन थी जिसे छिद्रित कार्डों पर संग्रहीत जानकारी को संक्षेप में प्रस्तुत करने में सहायता के लिए डिज़ाइन किया गया था। इसका आविष्कार एक अमेरिकी व्यवसायी, आविष्कारक और सांख्यिकीविद् हरमन होलेरिथ (29 फरवरी, 1860 - 17 नवंबर, 1929) द्वारा किया गया था। पंच कार्ड टेबुलेटिंग मशीन के उनके आविष्कार का 1884 में पेटेंट कराया गया था, और बाद में संयुक्त राज्य अमेरिका की 1890 की जनगणना में इसका इस्तेमाल किया गया था। प्रौद्योगिकी के लाभ तुरंत स्पष्ट हो गए। 1880 की जनगणना, लगभग 50 मिलियन लोगों के साथ, और इसे सारणीबद्ध करने में 7 साल से अधिक का समय लगा। जबकि 1890 की जनगणना में 62 मिलियन से अधिक लोगों को सम्मिलित करने में एक वर्ष से भी कम समय लगा। यह मशीनीकृत कम्प्यूटेशनल सांख्यिकी और अर्धस्वचालित डेटा प्रोसेसिंग सिस्टम के युग की प्रारंभ का प्रतीक है।


1908 में, विलियम सीली गॉसेट ने अपनी अब तक की प्रसिद्ध मोंटे कार्लो पद्धति का अनुकरण किया, जिसके परिणामस्वरूप छात्र के टी-वितरण की खोज हुई।<ref>{{Cite journal|last="Student" <nowiki>[</nowiki>[[William Sealy Gosset]]<nowiki>]</nowiki>|date=1908|title=माध्य की संभावित त्रुटि|url=http://www.york.ac.uk/depts/maths/histstat/student.pdf|journal=[[Biometrika]]|volume=6|issue=1|pages=1–25|doi=10.1093/biomet/6.1.1|jstor=2331554|hdl=10338.dmlcz/143545}}</ref> कम्प्यूटेशनल तरीकों की मदद से, उनके पास संबंधित सैद्धांतिक वितरणों पर आच्छादित अनुभवजन्य वितरणों के प्लॉट भी हैं। कंप्यूटर ने सिमुलेशन में क्रांति ला दी है और गॉसेट के प्रयोग की प्रतिकृति को एक अभ्यास से थोड़ा अधिक बना दिया है।<ref>{{Cite journal|last=Trahan|first=Travis John|date=2019-10-03|title=लॉस एलामोस नेशनल लेबोरेटरी में मोंटे कार्लो मेथड्स में हालिया एडवांस|doi=10.2172/1569710 |osti=1569710 |url=http://dx.doi.org/10.2172/1569710}}</ref><ref>{{Cite journal|last1=Metropolis|first1=Nicholas|last2=Ulam|first2=S.|date=1949|title=मोंटे कार्लो विधि|url=http://dx.doi.org/10.1080/01621459.1949.10483310|journal=Journal of the American Statistical Association|volume=44|issue=247|pages=335–341|doi=10.1080/01621459.1949.10483310|pmid=18139350 |issn=0162-1459}}</ref>  
1908 में, विलियम सीली गॉसेट ने अपनी अब तक की प्रसिद्ध मोंटे कार्लो पद्धति का अनुकरण किया, जिसके परिणामस्वरूप छात्र के टी-वितरण की खोज हुई।<ref>{{Cite journal|last="Student" <nowiki>[</nowiki>[[William Sealy Gosset]]<nowiki>]</nowiki>|date=1908|title=माध्य की संभावित त्रुटि|url=http://www.york.ac.uk/depts/maths/histstat/student.pdf|journal=[[Biometrika]]|volume=6|issue=1|pages=1–25|doi=10.1093/biomet/6.1.1|jstor=2331554|hdl=10338.dmlcz/143545}}</ref> कम्प्यूटेशनल तरीकों की मदद से, उनके पास संबंधित सैद्धांतिक वितरणों पर आच्छादित अनुभवजन्य वितरणों के प्लॉट भी हैं। कंप्यूटर ने सिमुलेशन में क्रांति ला दी है और गॉसेट के प्रयोग की प्रतिकृति को एक अभ्यास से थोड़ा अधिक बना दिया है।<ref>{{Cite journal|last=Trahan|first=Travis John|date=2019-10-03|title=लॉस एलामोस नेशनल लेबोरेटरी में मोंटे कार्लो मेथड्स में हालिया एडवांस|doi=10.2172/1569710 |osti=1569710 |url=http://dx.doi.org/10.2172/1569710}}</ref><ref>{{Cite journal|last1=Metropolis|first1=Nicholas|last2=Ulam|first2=S.|date=1949|title=मोंटे कार्लो विधि|url=http://dx.doi.org/10.1080/01621459.1949.10483310|journal=Journal of the American Statistical Association|volume=44|issue=247|pages=335–341|doi=10.1080/01621459.1949.10483310|pmid=18139350 |issn=0162-1459}}</ref>  


बाद में, वैज्ञानिकों ने छद्म-यादृच्छिक विचलन उत्पन्न करने के कम्प्यूटेशनल तरीकों को सामने रखा, व्युत्क्रम संचयी वितरण फ़ंक्शन या स्वीकृति-अस्वीकृति विधियों का उपयोग करके समान विचलन को अन्य वितरण रूपों में परिवर्तित करने के तरीकों का प्रदर्शन किया, और मार्कोव श्रृंखला मोंटे कार्लो के लिए स्थिति-अंतरिक्ष पद्धति विकसित की थी।<ref>{{Cite journal|last1=Robert|first1=Christian|last2=Casella|first2=George|date=2011-02-01|title=A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data|journal=Statistical Science|volume=26|issue=1|doi=10.1214/10-sts351|s2cid=2806098 |issn=0883-4237|doi-access=free}}</ref> पूरी तरह से स्वचालित तरीके से यादृच्छिक अंक उत्पन्न करने के पहले प्रयासों में से एक 1947 में रैंड कॉपोरेशन (RAND Corporation) द्वारा किया गया था। उत्पादित तालिकाओं को 1955 में एक पुस्तक के रूप में और पंच कार्ड की एक श्रृंखला के रूप में भी प्रकाशित किया गया था।
बाद में, वैज्ञानिकों ने छद्म-यादृच्छिक विचलन उत्पन्न करने के कम्प्यूटेशनल तरीकों को सामने रखा, व्युत्क्रम संचयी वितरण फलन या स्वीकृति-अस्वीकृति विधियों का उपयोग करके समान विचलन को अन्य वितरण रूपों में परिवर्तित करने के तरीकों का प्रदर्शन किया, और मार्कोव श्रृंखला मोंटे कार्लो के लिए स्थिति-अंतरिक्ष पद्धति विकसित की थी।<ref>{{Cite journal|last1=Robert|first1=Christian|last2=Casella|first2=George|date=2011-02-01|title=A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data|journal=Statistical Science|volume=26|issue=1|doi=10.1214/10-sts351|s2cid=2806098 |issn=0883-4237|doi-access=free}}</ref> पूरी तरह से स्वचालित तरीके से यादृच्छिक अंक उत्पन्न करने के पहले प्रयासों में से एक 1947 में रैंड कॉपोरेशन (RAND Corporation) द्वारा किया गया था। उत्पादित तालिकाओं को 1955 में एक पुस्तक के रूप में और पंच कार्ड की एक श्रृंखला के रूप में भी प्रकाशित किया गया था।




Line 35: Line 35:
== तरीके ==
== तरीके ==


=== [[अधिकतम संभावना अनुमान]] ===
=== अधिकतम संभावना अनुमान ===
 
 


अधिकतम संभावना अनुमान का उपयोग कुछ देखे गए डेटा को देखते हुए, अनुमानित संभाव्यता वितरण के मापदंडों का अनुमान लगाने के लिए किया जाता है। यह एक संभाविता फलन को अधिकतम करके प्राप्त किया जाता है ताकि अनुमानित [[सांख्यिकीय मॉडल]]  के तहत मनाया गया डेटा सबसे अधिक संभावित हो।
अधिकतम संभावना अनुमान का उपयोग कुछ देखे गए डेटा को देखते हुए, अनुमानित संभाव्यता वितरण के मापदंडों का अनुमान लगाने के लिए किया जाता है। यह एक संभाविता फलन को अधिकतम करके प्राप्त किया जाता है ताकि अनुमानित [[सांख्यिकीय मॉडल]]  के तहत मनाया गया डेटा सबसे अधिक संभावित हो।
Line 44: Line 42:




मोंटे कार्लो एक सांख्यिकीय विधि है जो संख्यात्मक परिणाम प्राप्त करने के लिए बार-बार यादृच्छिक नमूने पर निर्भर करती है। अवधारणा यह है कि उन समस्याओं को हल करने के लिए यादृच्छिकता का उपयोग किया जाए जो सिद्धांत रूप में नियतात्मक हो सकती हैं। इन्हें अक्सर भौतिक और गणितीय समस्याओं में उपयोग किया जाता है और जब अन्य तरीकों का उपयोग करना मुश्किल होता है तो ये सबसे उपयोगी होते हैं। मोंटे कार्लो विधियों का उपयोग मुख्य रूप से तीन समस्या वर्गों में किया जाता है: अनुकूलन, [[संख्यात्मक एकीकरण]], और संभाव्यता वितरण से ड्रॉ उत्पन्न करना है।
मोंटे कार्लो एक सांख्यिकीय विधि है जो संख्यात्मक परिणाम प्राप्त करने के लिए बार-बार यादृच्छिक नमूने पर निर्भर करती है। अवधारणा यह है कि उन समस्याओं को हल करने के लिए यादृच्छिकता का उपयोग किया जाए जो सिद्धांत रूप में नियतात्मक हो सकती हैं। इन्हें प्रायः भौतिक और गणितीय समस्याओं में उपयोग किया जाता है और जब अन्य तरीकों का उपयोग करना मुश्किल होता है तो ये सबसे उपयोगी होते हैं। मोंटे कार्लो विधियों का उपयोग मुख्य रूप से तीन समस्या वर्गों में किया जाता है: अनुकूलन, [[संख्यात्मक एकीकरण]], और संभाव्यता वितरण से ड्रॉ उत्पन्न करना है।


=== मार्कोव चेन मोंटे कार्लो ===
=== मार्कोव चेन मोंटे कार्लो ===
मार्कोव श्रृंखला मोंटे कार्लो विधि एक निरंतर यादृच्छिक चर से नमूने बनाती है, जिसमें संभाव्यता घनत्व एक ज्ञात फ़ंक्शन के लिए आनुपातिक होता है। इन नमूनों का उपयोग उस चर पर एक अभिन्न अंग का उसके अपेक्षित मूल्य या भिन्नता के रूप में मूल्यांकन करने के लिए किया जा सकता है। जितने अधिक चरण शामिल किए जाते हैं, नमूने का वितरण वास्तविक वांछित वितरण से उतना ही अधिक मेल खाता है।
मार्कोव श्रृंखला मोंटे कार्लो विधि एक निरंतर यादृच्छिक चर से नमूने बनाती है, जिसमें संभाव्यता घनत्व एक ज्ञात फलन के लिए आनुपातिक होता है। इन नमूनों का उपयोग उस चर पर एक अभिन्न अंग का उसके अपेक्षित मूल्य या भिन्नता के रूप में मूल्यांकन करने के लिए किया जा सकता है। जितने अधिक चरण सम्मिलित किए जाते हैं, नमूने का वितरण वास्तविक वांछित वितरण से उतना ही अधिक मेल खाता है।


== अनुप्रयोग ==
== अनुप्रयोग ==


* [[कम्प्यूटेशनल बायोलॉजी]]
* [[कम्प्यूटेशनल बायोलॉजी]]
* [[अभिकलनात्मक भाषाविज्ञान]]
* अभिकलनात्मक भाषाविज्ञान
* [[कम्प्यूटेशनल भौतिकी]]
* [[कम्प्यूटेशनल भौतिकी]]
* [[कम्प्यूटेशनल गणित]]
* [[कम्प्यूटेशनल गणित]]
Line 58: Line 56:


== [[कम्प्यूटेशनल सांख्यिकी]] जर्नल ==
== [[कम्प्यूटेशनल सांख्यिकी]] जर्नल ==
*[[सांख्यिकी में संचार]]|सांख्यिकी में संचार - अनुकरण और संगणना
*सांख्यिकी में संचार - अनुकरण और संगणना
* कम्प्यूटेशनल सांख्यिकी
* कम्प्यूटेशनल सांख्यिकी
*कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण
*कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण
*[[कम्प्यूटेशनल और ग्राफिकल सांख्यिकी का जर्नल]]
*कम्प्यूटेशनल और ग्राफिकल सांख्यिकी का जर्नल
*[[जर्नल ऑफ स्टैटिस्टिकल कंप्यूटेशन एंड सिमुलेशन]]
*जर्नल ऑफ स्टैटिस्टिकल कंप्यूटेशन एंड सिमुलेशन
*[[जर्नल ऑफ स्टैटिस्टिकल सॉफ्टवेयर]]
*जर्नल ऑफ स्टैटिस्टिकल सॉफ्टवेयर
* द [[आर जर्नल]]
* द [[आर जर्नल]]
[[द स्टाटा जर्नल]]
 
*[[सांख्यिकी और कम्प्यूटिंग]]
* द स्टाटा जर्नल
 
*सांख्यिकी और कम्प्यूटिंग
*विले अंतःविषय समीक्षा कम्प्यूटेशनल सांख्यिकी
*विले अंतःविषय समीक्षा कम्प्यूटेशनल सांख्यिकी


Line 73: Line 73:


== यह भी देखें ==
== यह भी देखें ==
* [[सांख्यिकीय वर्गीकरण के लिए एल्गोरिदम]]
* सांख्यिकीय वर्गीकरण के लिए एल्गोरिदम
* [[डेटा विज्ञान]]
* [[डेटा विज्ञान]]
*आर्टिफिशियल इंटेलिजेंस#सांख्यिकीय
*आर्टिफिशियल इंटेलिजेंस#सांख्यिकीय
*[[मुफ्त सांख्यिकीय सॉफ्टवेयर]]
*मुफ्त सांख्यिकीय सॉफ्टवेयर
*एल्गोरिदम की सूची#सांख्यिकी
*सांख्यिकीय एल्गोरिदम की सूची
*[[सांख्यिकीय पैकेजों की सूची]]
*सांख्यिकीय पैकेजों की सूची
*[[यंत्र अधिगम]]
*[[यंत्र अधिगम]]


Line 86: Line 86:


==अग्रिम पठन==
==अग्रिम पठन==




Line 118: Line 117:
*[https://web.archive.org/web/20160919090854/http://www.amstat.org/publications/JCGS Journal of Computational & Graphical Statistics]  
*[https://web.archive.org/web/20160919090854/http://www.amstat.org/publications/JCGS Journal of Computational & Graphical Statistics]  
*[https://www.springer.com/statistics/computational/journal/11222 Statistics and Computing]
*[https://www.springer.com/statistics/computational/journal/11222 Statistics and Computing]
[[Category: कम्प्यूटेशनल सांख्यिकी | कम्प्यूटेशनल सांख्यिकी ]] [[Category: संख्यात्मक विश्लेषण]] [[Category: अध्ययन के कम्प्यूटेशनल क्षेत्र]] [[Category: कंप्यूटिंग का गणित]]


[[Category: Machine Translated Page]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors]]
[[Category:Created On 16/06/2023]]
[[Category:Created On 16/06/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:अध्ययन के कम्प्यूटेशनल क्षेत्र]]
[[Category:कंप्यूटिंग का गणित]]
[[Category:कम्प्यूटेशनल सांख्यिकी| कम्प्यूटेशनल सांख्यिकी ]]
[[Category:संख्यात्मक विश्लेषण]]

Latest revision as of 11:27, 14 July 2023

1964 में लंदन स्कूल ऑफ इकोनॉमिक्स की सांख्यिकी कंप्यूटर लैब में काम करने वाले छात्र


कम्प्यूटेशनल सांख्यिकी, या सांख्यिकीय कंप्यूटिंग, सांख्यिकी और कंप्यूटर विज्ञान के बीच का बंधन है। इसका अर्थ यह है कि सांख्यिकीय विधियाँ जो कम्प्यूटेशनल विधियों का उपयोग करके सक्षम की जाती हैं। यह सांख्यिकी के गणितीय विज्ञान के लिए विशिष्ट कम्प्यूटेशनल विज्ञान (या वैज्ञानिक कंप्यूटिंग) का क्षेत्र है। यह क्षेत्र भी तेजी से विकसित हो रहा है, जिसके कारण यह मांग उठने लगी है कि कंप्यूटिंग की व्यापक अवधारणा को सामान्य सांख्यिकीय शिक्षा के हिस्से के रूप में पढ़ाया जाना चाहिए।[1]


मौलिक सांख्यिकी की तरह लक्ष्य को असंसाधित्र आँकड़ा (रॉ डाटा) को ज्ञान में बदलना है,[2] परन्तु यहाँ ध्यान कंप्यूटर-गहन सांख्यिकीय तरीकों पर है, जैसे कि बहुत बड़े प्रतिदर्श आमाप (सैंपल साइज) और गैर-सजातीय डेटा सेट वाले मामले में हैं।[2]

शब्द 'कम्प्यूटेशनल स्टैटिस्टिक्स' और 'स्टैटिस्टिकल कंप्यूटिंग' का प्रयोग प्रायः एक दूसरे के स्थान पर किया जाता है, हालांकि कार्लो लॉरो (सांख्यिकीय कंप्यूटिंग के लिए इंटरनेशनल एसोसिएशन के एक पूर्व अध्यक्ष) ने सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग के रूप में 'सांख्यिकीय कंप्यूटिंग' को परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया था। और 'कम्प्यूटेशनल सांख्यिकी' को लागू करने के लिए एल्गोरिथम के डिजाइन के लक्ष्य के रूप में कंप्यूटर पर सांख्यिकीय तरीके, कंप्यूटर से पहले अकल्पनीय सहित उम्र (जैसे बूटस्ट्रैपिंग (सांख्यिकी), मोंटे कार्लो सिमुलेशन), साथ ही साथ विश्लेषणात्मक रूप से जटिल समस्याओं से निपटने के लिए [[[sic]]]।[3]

'कम्प्यूटेशनल सांख्यिकी' और 'सांख्यिकीय कंप्यूटिंग' शब्द प्रायः एक दूसरे के स्थान पर उपयोग किए जाते हैं, हालांकि कार्लो लॉरो (इंटरनेशनल एसोसिएशन फॉर स्टैटिस्टिकल कंप्यूटिंग के पूर्व अध्यक्ष) ने 'सांख्यिकीय कंप्यूटिंग' को "सांख्यिकी के लिए कंप्यूटर विज्ञान के अनुप्रयोग" के रूप में परिभाषित करते हुए एक अंतर बनाने का प्रस्ताव दिया। ", और 'कम्प्यूटेशनल आँकड़े' का उद्देश्य "कंप्यूटर पर सांख्यिकीय तरीकों को लागू करने के लिए एक एल्गोरिदम के डिजाइन का लक्ष्य रखना है, जिसमें कंप्यूटर युग से पहले अकल्पनीय (जैसे बूटस्ट्रैपिंग (सांख्यिकी), सिमुलेशन) सम्मिलित हैं, साथ ही विश्लेषणात्मक रूप से कठिन समस्याओं से निपटना भी सम्मिलित है" [[[sic]]]।[3]


'कम्प्यूटेशनल सांख्यिकी' शब्द का उपयोग कम्प्यूटेशनल रूप से गहन सांख्यिकीय तरीकों को संदर्भित करने के लिए भी किया जा सकता है, जिसमें पुनः प्रतिचयन विधियां, मार्कोव चेन मोंटे कार्लो, स्थानीय प्रतिगमन, कर्नेल घनत्व अनुमान, कृत्रिम तंत्रिका नेटवर्क और सामान्यीकृत योजक मॉडल सम्मिलित हैं।

इतिहास

हालाँकि कम्प्यूटेशनल आँकड़ों का आज व्यापक रूप से उपयोग किया जाता है, लेकिन वास्तव में सांख्यिकी समुदाय में इसकी स्वीकृति का इतिहास अपेक्षाकृत छोटा है। अधिकांश भाग के लिए, सांख्यिकी के क्षेत्र के संस्थापक कम्प्यूटेशनल सांख्यिकीय पद्धति के विकास में गणित और स्पर्शोन्मुख अनुमानों पर निर्भर थे।[4]

सांख्यिकीय क्षेत्र में, "कंप्यूटर" शब्द का पहला उपयोग 1891 में रॉबर्ट पी. पोर्टर द्वारा जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन आर्काइव्स के एक लेख में मिलता है। लेख में 11वीं जनगणना में हरमन होलेरिथ की मशीन के उपयोग पर चर्चा की गई है। हरमन होलेरिथ की मशीन, जिसे टेबुलेटिंग मशीन भी कहा जाता है, एक इलेक्ट्रोमैकेनिकल मशीन थी जिसे छिद्रित कार्डों पर संग्रहीत जानकारी को संक्षेप में प्रस्तुत करने में सहायता के लिए डिज़ाइन किया गया था। इसका आविष्कार एक अमेरिकी व्यवसायी, आविष्कारक और सांख्यिकीविद् हरमन होलेरिथ (29 फरवरी, 1860 - 17 नवंबर, 1929) द्वारा किया गया था। पंच कार्ड टेबुलेटिंग मशीन के उनके आविष्कार का 1884 में पेटेंट कराया गया था, और बाद में संयुक्त राज्य अमेरिका की 1890 की जनगणना में इसका इस्तेमाल किया गया था। प्रौद्योगिकी के लाभ तुरंत स्पष्ट हो गए। 1880 की जनगणना, लगभग 50 मिलियन लोगों के साथ, और इसे सारणीबद्ध करने में 7 साल से अधिक का समय लगा। जबकि 1890 की जनगणना में 62 मिलियन से अधिक लोगों को सम्मिलित करने में एक वर्ष से भी कम समय लगा। यह मशीनीकृत कम्प्यूटेशनल सांख्यिकी और अर्धस्वचालित डेटा प्रोसेसिंग सिस्टम के युग की प्रारंभ का प्रतीक है।

1908 में, विलियम सीली गॉसेट ने अपनी अब तक की प्रसिद्ध मोंटे कार्लो पद्धति का अनुकरण किया, जिसके परिणामस्वरूप छात्र के टी-वितरण की खोज हुई।[5] कम्प्यूटेशनल तरीकों की मदद से, उनके पास संबंधित सैद्धांतिक वितरणों पर आच्छादित अनुभवजन्य वितरणों के प्लॉट भी हैं। कंप्यूटर ने सिमुलेशन में क्रांति ला दी है और गॉसेट के प्रयोग की प्रतिकृति को एक अभ्यास से थोड़ा अधिक बना दिया है।[6][7]

बाद में, वैज्ञानिकों ने छद्म-यादृच्छिक विचलन उत्पन्न करने के कम्प्यूटेशनल तरीकों को सामने रखा, व्युत्क्रम संचयी वितरण फलन या स्वीकृति-अस्वीकृति विधियों का उपयोग करके समान विचलन को अन्य वितरण रूपों में परिवर्तित करने के तरीकों का प्रदर्शन किया, और मार्कोव श्रृंखला मोंटे कार्लो के लिए स्थिति-अंतरिक्ष पद्धति विकसित की थी।[8] पूरी तरह से स्वचालित तरीके से यादृच्छिक अंक उत्पन्न करने के पहले प्रयासों में से एक 1947 में रैंड कॉपोरेशन (RAND Corporation) द्वारा किया गया था। उत्पादित तालिकाओं को 1955 में एक पुस्तक के रूप में और पंच कार्ड की एक श्रृंखला के रूप में भी प्रकाशित किया गया था।


वर्ष 1950 के दशक के मध्य तक, यादृच्छिक संख्या जनरेटर के लिए उपकरणों के लिए कई लेख और पेटेंट प्रस्तावित किए गए थे।।[9] इन उपकरणों का विकास सांख्यिकीय विश्लेषण में सिमुलेशन और अन्य मूलभूत घटकों को निष्पादित करने के लिए यादृच्छिक अंकों का उपयोग करने की आवश्यकता से प्रेरित था। ऐसे उपकरणों में सबसे प्रसिद्ध में से एक ERNIE है, जो यादृच्छिक संख्याएँ उत्पन्न करता है जो यूनाइटेड किंगडम में जारी लॉटरी बांड, प्रीमियम बॉन्ड के विजेताओं का निर्धारण करता है। 1958 में, जॉन टुकी का जैकनाइफ़ विकसित किया गया था। यह गैर-मानक परिस्थितियों में नमूनों में पैरामीटर अनुमानों के पूर्वाग्रह को कम करने की एक विधि के रूप में है।[10] इसके व्यावहारिक कार्यान्वयन के लिए कंप्यूटर की आवश्यकता होती है। अब तक, कंप्यूटर ने कई कठिन सांख्यिकीय अध्ययनों को संभव बना दिया है।[11]


तरीके

अधिकतम संभावना अनुमान

अधिकतम संभावना अनुमान का उपयोग कुछ देखे गए डेटा को देखते हुए, अनुमानित संभाव्यता वितरण के मापदंडों का अनुमान लगाने के लिए किया जाता है। यह एक संभाविता फलन को अधिकतम करके प्राप्त किया जाता है ताकि अनुमानित सांख्यिकीय मॉडल के तहत मनाया गया डेटा सबसे अधिक संभावित हो।

मोंटे कार्लो विधि

मोंटे कार्लो एक सांख्यिकीय विधि है जो संख्यात्मक परिणाम प्राप्त करने के लिए बार-बार यादृच्छिक नमूने पर निर्भर करती है। अवधारणा यह है कि उन समस्याओं को हल करने के लिए यादृच्छिकता का उपयोग किया जाए जो सिद्धांत रूप में नियतात्मक हो सकती हैं। इन्हें प्रायः भौतिक और गणितीय समस्याओं में उपयोग किया जाता है और जब अन्य तरीकों का उपयोग करना मुश्किल होता है तो ये सबसे उपयोगी होते हैं। मोंटे कार्लो विधियों का उपयोग मुख्य रूप से तीन समस्या वर्गों में किया जाता है: अनुकूलन, संख्यात्मक एकीकरण, और संभाव्यता वितरण से ड्रॉ उत्पन्न करना है।

मार्कोव चेन मोंटे कार्लो

मार्कोव श्रृंखला मोंटे कार्लो विधि एक निरंतर यादृच्छिक चर से नमूने बनाती है, जिसमें संभाव्यता घनत्व एक ज्ञात फलन के लिए आनुपातिक होता है। इन नमूनों का उपयोग उस चर पर एक अभिन्न अंग का उसके अपेक्षित मूल्य या भिन्नता के रूप में मूल्यांकन करने के लिए किया जा सकता है। जितने अधिक चरण सम्मिलित किए जाते हैं, नमूने का वितरण वास्तविक वांछित वितरण से उतना ही अधिक मेल खाता है।

अनुप्रयोग

कम्प्यूटेशनल सांख्यिकी जर्नल

  • सांख्यिकी में संचार - अनुकरण और संगणना
  • कम्प्यूटेशनल सांख्यिकी
  • कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण
  • कम्प्यूटेशनल और ग्राफिकल सांख्यिकी का जर्नल
  • जर्नल ऑफ स्टैटिस्टिकल कंप्यूटेशन एंड सिमुलेशन
  • जर्नल ऑफ स्टैटिस्टिकल सॉफ्टवेयर
  • आर जर्नल
  • द स्टाटा जर्नल
  • सांख्यिकी और कम्प्यूटिंग
  • विले अंतःविषय समीक्षा कम्प्यूटेशनल सांख्यिकी

एसोसिएशन

  • सांख्यिकीय कंप्यूटिंग के लिए अंतर्राष्ट्रीय संघ

यह भी देखें

  • सांख्यिकीय वर्गीकरण के लिए एल्गोरिदम
  • डेटा विज्ञान
  • आर्टिफिशियल इंटेलिजेंस#सांख्यिकीय
  • मुफ्त सांख्यिकीय सॉफ्टवेयर
  • सांख्यिकीय एल्गोरिदम की सूची
  • सांख्यिकीय पैकेजों की सूची
  • यंत्र अधिगम

संदर्भ

  1. Nolan, D. & Temple Lang, D. (2010). "Computing in the Statistics Curricula", The American Statistician 64 (2), pp.97-107.
  2. 2.0 2.1 Wegman, Edward J. “Computational Statistics: A New Agenda for Statistical Theory and Practice.Journal of the Washington Academy of Sciences, vol. 78, no. 4, 1988, pp. 310–322. JSTOR
  3. 3.0 3.1 Lauro, Carlo (1996), "Computational statistics or statistical computing, is that the question?", Computational Statistics & Data Analysis, 23 (1): 191–193, doi:10.1016/0167-9473(96)88920-1
  4. Watnik, Mitchell (2011). "प्रारंभिक कम्प्यूटेशनल सांख्यिकी". Journal of Computational and Graphical Statistics (in English). 20 (4): 811–817. doi:10.1198/jcgs.2011.204b. ISSN 1061-8600. S2CID 120111510.
  5. "Student" [William Sealy Gosset] (1908). "माध्य की संभावित त्रुटि" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554.
  6. Trahan, Travis John (2019-10-03). "लॉस एलामोस नेशनल लेबोरेटरी में मोंटे कार्लो मेथड्स में हालिया एडवांस". doi:10.2172/1569710. OSTI 1569710. {{cite journal}}: Cite journal requires |journal= (help)
  7. Metropolis, Nicholas; Ulam, S. (1949). "मोंटे कार्लो विधि". Journal of the American Statistical Association. 44 (247): 335–341. doi:10.1080/01621459.1949.10483310. ISSN 0162-1459. PMID 18139350.
  8. Robert, Christian; Casella, George (2011-02-01). "A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data". Statistical Science. 26 (1). doi:10.1214/10-sts351. ISSN 0883-4237. S2CID 2806098.
  9. Pierre L'Ecuyer (2017). "समान यादृच्छिक संख्या पीढ़ी का इतिहास" (PDF). 2017 Winter Simulation Conference (WSC): 202–230. doi:10.1109/WSC.2017.8247790. ISBN 978-1-5386-3428-8. S2CID 4567651.
  10. QUENOUILLE, M. H. (1956). "अनुमान में पूर्वाग्रह पर नोट्स". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353. ISSN 0006-3444.
  11. Teichroew, Daniel (1965). "कंप्यूटर के युग से पहले वितरण नमूनाकरण का इतिहास और सिमुलेशन के लिए इसकी प्रासंगिकता". Journal of the American Statistical Association. 60 (309): 27–49. doi:10.1080/01621459.1965.10480773. ISSN 0162-1459.


अग्रिम पठन

लेख

पुस्तकें

बाहरी संबंध

एसोसिएशन

पत्रिकाओं