कर्नेल घनत्व अनुमान: Difference between revisions
No edit summary |
No edit summary |
||
(7 intermediate revisions by 3 users not shown) | |||
Line 1: | Line 1: | ||
{{Short description|Estimator}} | {{Short description|Estimator}} | ||
[[File:Kernel density.svg|thumb|right|250px|विभिन्न कर्नेल बैंडविड्थ का उपयोग करके 100 [[सामान्य वितरण]] यादृच्छिक संख्या संचालक का कर्नेल घनत्व आकलन।]]सांख्यिकी में, कर्नेल घनत्व [[अनुमान|आकलन]] (केडीई) प्रायिकता घनत्व आकलन के लिए [[गिरी चौरसाई|कर्नेल समरेखण]] का अनुप्रयोग है, अर्थात, | [[File:Kernel density.svg|thumb|right|250px|विभिन्न कर्नेल बैंडविड्थ का उपयोग करके 100 [[सामान्य वितरण]] यादृच्छिक संख्या संचालक का कर्नेल घनत्व आकलन।]]सांख्यिकी में, कर्नेल घनत्व [[अनुमान|आकलन]] (केडीई) प्रायिकता घनत्व आकलन के लिए [[गिरी चौरसाई|कर्नेल समरेखण]] का अनुप्रयोग है, अर्थात, गैर-पैरामीट्रिक सांख्यिकी विधि ''[[कर्नेल (सांख्यिकी)]] के आधार पर यादृच्छिक चर के प्रायिकता घनत्व फलन का आकलन लगाने के लिए'' [[वजन समारोह|भार फलन]] के रूप में केडीई मौलिक डेटा समरेखण समस्या का उत्तर देता है | जहां परिमित डेटा सांख्यिकीय नमूने के आधार पर सांख्यिकीय जनसंख्या के बारे में आकलन लगाया जाता है। [[अर्थमिति]] जैसे कुछ क्षेत्रों में इसे [[एमानुएल परजेन]] और [[मरे रोसेनब्लैट]] के बाद पारजेन-रोसेनब्लैट विंडो विधि भी कहा जाता है | जिन्हें सामान्यतः स्वतंत्र रूप से इसके वर्तमान रूप में बनाने का श्रेय दिया जाता है।<ref name="Ros1956">{{Cite journal | last1 = Rosenblatt | first1 = M. |author-link = Murray Rosenblatt| title = घनत्व समारोह के कुछ गैर पैरामीट्रिक अनुमानों पर टिप्पणियां| doi = 10.1214/aoms/1177728190 | journal = The Annals of Mathematical Statistics | volume = 27 | issue = 3 | pages = 832–837 | year = 1956 | doi-access = free }}</ref><ref name="Par1962">{{Cite journal | last1 = Parzen | first1 = E. | author-link = Emanuel Parzen| title = संभावना घनत्व समारोह और मोड के अनुमान पर| doi = 10.1214/aoms/1177704472 | journal = [[The Annals of Mathematical Statistics]]| volume = 33 | issue = 3 | pages = 1065–1076 | year = 1962 | jstor = 2237880| doi-access = free }}</ref> कर्नेल घनत्व आकलन के प्रसिद्ध अनुप्रयोगों में से वर्ग-सशर्त सीमांत वितरण का आकलन लगाने में है | [[भोली बेयस वर्गीकारक|नैव बेयस वर्गीकारक]] का उपयोग करते समय डेटा की सीमांत संभाव्यता घनत्व फलन है |<ref name=":0">{{Cite journal|last1=Piryonesi S. Madeh|last2=El-Diraby Tamer E.|date=2020-06-01|title=Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems|journal=Journal of Transportation Engineering, Part B: Pavements|volume=146|issue=2|pages=04020022|doi=10.1061/JPEODX.0000175}}</ref><ref>{{Cite book|last1=Hastie|first1=Trevor|author-link1=Trevor Hastie|last2=Tibshirani|first2=Robert|author-link2=Robert Tibshirani|last3=Friedman|first3=Jerome H.|author-link3=Jerome H. Friedman|title=The Elements of Statistical Learning : Data Mining, Inference, and Prediction : with 200 full-color illustrations|date=2001|publisher=Springer|isbn=0-387-95284-5|location=New York|oclc=46809224}}</ref> जो इसकी पूर्वानुमान स्पष्टता में सुधार कर सकता है।<ref name=":0" /> | ||
== परिभाषा == | == परिभाषा == | ||
माना (x1, x2, ..., xn) किसी भी बिंदु x पर | माना (x1, x2, ..., xn) किसी भी बिंदु x पर अज्ञात घनत्व के साथ कुछ अविभाज्य वितरण से खींचे गए [[स्वतंत्र और समान रूप से वितरित यादृच्छिक चर]] नमूने हैं। हम इस फलन ƒ के आकार का अनुमान लगाने में रुचि रखते हैं। इसका कर्नेल घनत्व आकलनकर्ता है | | ||
: <math> | : <math> | ||
\widehat{f}_h(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big), | \widehat{f}_h(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big), | ||
</math> | </math> | ||
जहाँ K कर्नेल (सांख्यिकी) है | गैर-पैरामीट्रिक सांख्यिकी में | जहाँ K कर्नेल (सांख्यिकी) है | गैर-पैरामीट्रिक सांख्यिकी में गैर-नकारात्मक कार्य और {{nowrap|''h'' > 0}} [[ चौरसाई |कर्नेल]] मापदंड है | जिसे बैंडविड्थ कहा जाता है। सबस्क्रिप्ट h वाले कर्नेल को स्केल्ड कर्नेल कहा जाता है और इसे {{nowrap|''K<sub>h</sub>''(''x'') {{=}} 1/''h K''(''x''/''h'')}} परिभाषित किया जाता है | सहज रूप से कोई h को उतना ही छोटा चुनना चाहता है | जितना डेटा अनुमति देता है | चूँकि, आकलनकर्ता के पूर्वाग्रह और इसके विचरण के बीच सदैव समझौता होता है। बैंडविड्थ पर नीचे और अधिक विस्तार से चर्चा की गई है। | ||
कर्नेल (सांख्यिकी) की | कर्नेल (सांख्यिकी) की श्रृंखला सामान्य उपयोग में कर्नेल फलन सामान्यतः उपयोग किए जाते हैं | त्रिकोणीय, द्विभाजित, ट्राइवेट, एपेनेक्निकोव, सामान्य, और अन्य एपेनेक्निकोव कर्नेल औसत वर्ग त्रुटि अर्थ में इष्टतम है | <ref>{{cite journal |doi=10.1137/1114019 |author=Epanechnikov, V.A. |title=एक बहुभिन्नरूपी संभाव्यता घनत्व का गैर-पैरामीट्रिक अनुमान|journal=Theory of Probability and Its Applications |volume=14 |pages=153–158 |year=1969}}</ref> चूँकि पहले सूचीबद्ध कर्नेल के लिए दक्षता का हानि छोटा है।<ref name="WJ1995">{{Cite book| author1=Wand, M.P |author2=Jones, M.C. |title=कर्नेल स्मूथिंग|publisher=Chapman & Hall/CRC |location=London |year=1995 |isbn=978-0-412-55270-0}}</ref> इसके सुविधाजनक गणितीय गुणों के कारण, सामान्य कर्नेल का अधिकांशतः उपयोग किया जाता है, जिसका {{nowrap|''K''(''x'') {{=}} ''ϕ''(''x'')}} अर्थ है | जहां ϕ [[मानक सामान्य]] घनत्व फलन है। | ||
कर्नेल घनत्व आकलन का निर्माण घनत्व आकलन के बाहर के क्षेत्रों में व्याख्या पाता है।<ref name="bo07">{{cite techreport |first=Zdravko |last=Botev |title=प्रसार मिश्रण के माध्यम से गैर पैरामीट्रिक घनत्व अनुमान|url=https://espace.library.uq.edu.au/view/UQ:120006 |institution=University of Queensland |year=2007 }}</ref> उदाहरण के लिए, [[ऊष्मप्रवैगिकी]] में, यह उत्पन्न होने वाली ऊष्मा की मात्रा के समान है | जब ऊष्मा कर्नेल (ऊष्मा समीकरण का मूल समाधान) प्रत्येक डेटा बिंदु स्थानों x<sub>i</sub> पर रखी जाती है | मैनिफोल्ड सीखने (जैसे [[प्रसार मानचित्र]]) के लिए बिंदु बादलों पर [[असतत लाप्लास ऑपरेटर]] के निर्माण के लिए इसी तरह के विधियों का उपयोग किया जाता है। | कर्नेल घनत्व आकलन का निर्माण घनत्व आकलन के बाहर के क्षेत्रों में व्याख्या पाता है।<ref name="bo07">{{cite techreport |first=Zdravko |last=Botev |title=प्रसार मिश्रण के माध्यम से गैर पैरामीट्रिक घनत्व अनुमान|url=https://espace.library.uq.edu.au/view/UQ:120006 |institution=University of Queensland |year=2007 }}</ref> उदाहरण के लिए, [[ऊष्मप्रवैगिकी]] में, यह उत्पन्न होने वाली ऊष्मा की मात्रा के समान है | जब ऊष्मा कर्नेल (ऊष्मा समीकरण का मूल समाधान) प्रत्येक डेटा बिंदु स्थानों x<sub>i</sub> पर रखी जाती है | मैनिफोल्ड सीखने (जैसे [[प्रसार मानचित्र]]) के लिए बिंदु बादलों पर [[असतत लाप्लास ऑपरेटर|असतत लाप्लास संचालक]] के निर्माण के लिए इसी तरह के विधियों का उपयोग किया जाता है। | ||
== उदाहरण == | == उदाहरण == | ||
कर्नेल घनत्व आकलन [[हिस्टोग्राम]] से निकटता से संबंधित हैं | किन्तु | कर्नेल घनत्व आकलन [[हिस्टोग्राम]] से निकटता से संबंधित हैं | किन्तु उपयुक्त कर्नेल का उपयोग करके चिकनाई या निरंतरता जैसे गुणों से संपन्न किया जा सकता है। इन 6 डेटा बिंदुओं पर आधारित नीचे दिया गया आरेख इस संबंध को दर्शाता है | | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! | ! सैंपल | ||
| 1 | | 1 | ||
| 2 | | 2 | ||
Line 25: | Line 25: | ||
| 6 | | 6 | ||
|- | |- | ||
! | ! मूल्य | ||
| -2.1 | | -2.1 | ||
| -1.3 | | -1.3 | ||
Line 33: | Line 33: | ||
| 6.2 | | 6.2 | ||
|} | |} | ||
हिस्टोग्राम के लिए, सबसे पहले, क्षैतिज अक्ष को उप-अंतराल या डिब्बे में विभाजित किया जाता है | जो डेटा की सीमा को कवर करता है | इस स्थिति में, प्रत्येक चौड़ाई 2 के छह डिब्बे जब भी कोई डेटा बिंदु इस अंतराल के अंदर आता है | ऊंचाई 1 का | हिस्टोग्राम के लिए, सबसे पहले, क्षैतिज अक्ष को उप-अंतराल या डिब्बे में विभाजित किया जाता है | जो डेटा की सीमा को कवर करता है | इस स्थिति में, प्रत्येक चौड़ाई 2 के छह डिब्बे जब भी कोई डेटा बिंदु इस अंतराल के अंदर आता है | ऊंचाई 1 का बॉक्स /12 वहां रखा गया है। यदि एक ही बिन में से अधिक डेटा पॉइंट गिरते हैं, तो बॉक्स एक दूसरे के ऊपर ढेर हो जाते हैं। | ||
कर्नेल घनत्व आकलन के लिए, 2.25 प्रसरण वाले सामान्य कर्नेल (लाल धराशायी रेखाओं द्वारा संकेत) प्रत्येक डेटा बिंदु x<sub>i</sub> पर रखे जाते हैं | कर्नेल घनत्व आकलन (ठोस नीला वक्र) बनाने के लिए कर्नेल का योग किया जाता है। कर्नेल घनत्व आकलन की चिकनाई (हिस्टोग्राम की असततता की तुलना में) दर्शाती है कि कैसे कर्नेल घनत्व आकलन निरंतर यादृच्छिक चर के लिए वास्तविक अंतर्निहित घनत्व में तेज़ी से अभिसरण करता है।<ref>{{cite journal |author=Scott, D. |title=इष्टतम और डेटा-आधारित हिस्टोग्राम पर|journal=Biometrika |year=1979 |volume=66 |pages=605–610 |doi=10.1093/biomet/66.3.605 |issue=3}}</ref> | कर्नेल घनत्व आकलन के लिए, 2.25 प्रसरण वाले सामान्य कर्नेल (लाल धराशायी रेखाओं द्वारा संकेत) प्रत्येक डेटा बिंदु x<sub>i</sub> पर रखे जाते हैं | कर्नेल घनत्व आकलन (ठोस नीला वक्र) बनाने के लिए कर्नेल का योग किया जाता है। कर्नेल घनत्व आकलन की चिकनाई (हिस्टोग्राम की असततता की तुलना में) दर्शाती है कि कैसे कर्नेल घनत्व आकलन निरंतर यादृच्छिक चर के लिए वास्तविक अंतर्निहित घनत्व में तेज़ी से अभिसरण करता है।<ref>{{cite journal |author=Scott, D. |title=इष्टतम और डेटा-आधारित हिस्टोग्राम पर|journal=Biometrika |year=1979 |volume=66 |pages=605–610 |doi=10.1093/biomet/66.3.605 |issue=3}}</ref> | ||
Line 41: | Line 41: | ||
== बैंडविड्थ चयन == | == बैंडविड्थ चयन == | ||
[[File:Comparison of 1D bandwidth selectors.png|thumb|मानक सामान्य वितरण से 100 अंकों के यादृच्छिक नमूने के विभिन्न बैंडविड्थ के साथ कर्नेल घनत्व आकलन (केडीई)। ग्रे: वास्तविक घनत्व (मानक सामान्य)। लाल: h = 0.05 के साथ केडीई। काला: केडीई h = 0.337 के साथ। हरा: केडीई h = 2 के साथ।]]कर्नेल की [[बैंडविड्थ (कंप्यूटिंग)]] | [[File:Comparison of 1D bandwidth selectors.png|thumb|मानक सामान्य वितरण से 100 अंकों के यादृच्छिक नमूने के विभिन्न बैंडविड्थ के साथ कर्नेल घनत्व आकलन (केडीई)। ग्रे: वास्तविक घनत्व (मानक सामान्य)। लाल: h = 0.05 के साथ केडीई। काला: केडीई h = 0.337 के साथ। हरा: केडीई h = 2 के साथ।]]कर्नेल की [[बैंडविड्थ (कंप्यूटिंग)]] [[मुक्त पैरामीटर|मुक्त मापदंड]] है | जो परिणामी आकलन पर शक्तिशाली प्रभाव प्रदर्शित करता है। इसके प्रभाव को स्पष्ट करने के लिए, हम मानक सामान्य वितरण (क्षैतिज अक्ष पर गलीचा भूखंड में नीले स्पाइक्स पर प्लॉट किए गए) से सिम्युलेटेड रैंडम नंबर संचालक लेते हैं। धूसर वक्र वास्तविक घनत्व है (औसत 0 और विचरण 1 के साथ सामान्य घनत्व)। इसकी तुलना में, लाल वक्र कम चिकना है | क्योंकि इसमें बैंडविड्थ h = 0.05 का उपयोग करने से उत्पन्न होने वाले बहुत से नकली डेटा आर्टिफैक्ट हैं | जो बहुत छोटा है। बैंडविड्थ h = 2 का उपयोग करने के बाद से हरे रंग की वक्र बहुत अधिक अंतर्निहित संरचना को अस्पष्ट करती है। h = 0.337 की बैंडविड्थ के साथ काले वक्र को इष्टतम रूप से चिकना माना जाता है | क्योंकि इसका घनत्व आकलन वास्तविक घनत्व के निकट है। विकट स्थिति का सामना करना पड़ता है <math>h \to 0</math> (कोई समरेखण नहीं), जहां आकलन विश्लेषित नमूनों के निर्देशांक पर केंद्रित एन [[डिराक डेल्टा समारोह|डिराक डेल्टा फलन]] का योग है। दूसरी चरम सीमा में <math>h \to \infty</math> आकलन उपयोग किए गए कर्नेल के आकार को बरकरार रखता है | जो नमूनों के माध्य (पूरी तरह से चिकनी) पर केंद्रित होता है। | ||
इस मापदंड का चयन करने के लिए उपयोग किया जाने वाला सबसे सामान्य इष्टतमता मानदंड अपेक्षित L<sub>2</sub> है | कठिन परिस्थिति कार्य, जिसे माध्य एकीकृत चुकता त्रुटि भी कहा जाता है | | इस मापदंड का चयन करने के लिए उपयोग किया जाने वाला सबसे सामान्य इष्टतमता मानदंड अपेक्षित L<sub>2</sub> है | कठिन परिस्थिति कार्य, जिसे माध्य एकीकृत चुकता त्रुटि भी कहा जाता है | | ||
Line 49: | Line 49: | ||
:<math>\operatorname{MISE}(h) = \operatorname{AMISE}(h) + \mathcal{o}((nh)^{-1} + h^4)</math> | :<math>\operatorname{MISE}(h) = \operatorname{AMISE}(h) + \mathcal{o}((nh)^{-1} + h^4)</math> | ||
जहां oi | जहां oi [[थोड़ा ओ नोटेशन|नोटेशन]] है, और एन नमूना आकार (ऊपर के रूप में) एमिस स्पर्शोन्मुख एमआईएसई है। दो प्रमुख शब्द, | ||
:<math>\operatorname{AMISE}(h) = \frac{R(K)}{nh} + \frac{1}{4} m_2(K)^2 h^4 R(f'')</math> | :<math>\operatorname{AMISE}(h) = \frac{R(K)}{nh} + \frac{1}{4} m_2(K)^2 h^4 R(f'')</math> | ||
Line 58: | Line 58: | ||
:<math>h_{\operatorname{AMISE}} = \frac{ R(K)^{1/5}}{m_2(K)^{2/5}R(f'')^{1/5} } n^{-1/5} = C n^{-1/5}</math> | :<math>h_{\operatorname{AMISE}} = \frac{ R(K)^{1/5}}{m_2(K)^{2/5}R(f'')^{1/5} } n^{-1/5} = C n^{-1/5}</math> | ||
न तो एमिस और न ही h<sub>एमिस</sub> सूत्रों का सीधे उपयोग किया जा सकता है | क्योंकि वे अज्ञात घनत्व फलन को सम्मिलित करते हैं | <math>f</math> या इसका दूसरा व्युत्पन्न <math>f''</math>. उस कठिनाई को दूर करने के लिए, बैंडविड्थ का चयन करने के लिए विभिन्न प्रकार की स्वचालित, डेटा-आधारित विधियाँ विकसित की गई हैं। उनकी प्रभावशीलता की तुलना करने के लिए कई समीक्षा अध्ययन किए गए हैं,<ref>{{cite journal |author1=Park, B.U. |author2=Marron, J.S. |year=1990 |title=डेटा-संचालित बैंडविड्थ चयनकर्ताओं की तुलना|journal=Journal of the American Statistical Association |volume=85 |issue=409 |pages=66–72 |jstor=2289526 |doi=10.1080/01621459.1990.10475307|citeseerx=10.1.1.154.7321 }}</ref><ref>{{cite journal |author1=Park, B.U. |author2=Turlach, B.A. |year=1992 |title=कई डेटा चालित बैंडविड्थ चयनकर्ताओं का व्यावहारिक प्रदर्शन (चर्चा के साथ)|journal=Computational Statistics |volume=7 |pages=251–270|url=https://ideas.repec.org/p/cor/louvco/1992005.html}}</ref><ref>{{cite journal|author1=Cao, R. |author2=Cuevas, A. |author3=Manteiga, W. G. |year=1994 |title=घनत्व अनुमान में कई चौरसाई विधियों का तुलनात्मक अध्ययन|journal=Computational Statistics and Data Analysis |volume=17 |pages=153–176 |doi=10.1016/0167-9473(92)00066-Z|issue=2}}</ref><ref>{{cite journal |doi=10.2307/2291420 |author1=Jones, M.C. |author2=Marron, J.S. |author3=Sheather, S. J. |year=1996 |title=घनत्व अनुमान के लिए बैंडविड्थ चयन का एक संक्षिप्त सर्वेक्षण| journal=Journal of the American Statistical Association |volume=91 |issue=433 |pages=401–407 |jstor=2291420}}</ref><ref>{{cite journal |author=Sheather, S.J. |year=1992 |title=कुछ वास्तविक डेटा सेटों पर छह लोकप्रिय बैंडविड्थ चयन विधियों का प्रदर्शन (चर्चा के साथ)|journal=Computational Statistics |volume=7 |pages=225–250, 271–281}}</ref><ref>{{cite journal |author1=Agarwal, N. |author2=Aluru, N.R. |year=2010 |title=एमईएमएस में अनिश्चितता मात्रा का ठहराव के लिए एक डेटा-संचालित स्टोकेस्टिक सहस्थापन दृष्टिकोण|journal=International Journal for Numerical Methods in Engineering |volume=83 |issue=5 |pages=575–597 |doi=10.1002/nme.2844 |bibcode=2010IJNME..83..575A |url=https://webhost.engr.illinois.edu/~aluru/Journals/IJNME10.pdf}}</ref><ref>{{cite journal |author1=Xu, X. |author2=Yan, Z. |author3=Xu, S. |year=2015 |title=विसरण आधारित कर्नेल घनत्व विधि द्वारा पवन गति संभाव्यता वितरण का अनुमान लगाना|journal=Electric Power Systems Research|volume=121 |pages=28–37 |doi=10.1016/j.epsr.2014.11.029 }}</ref> सामान्य सहमति के साथ कि प्लग-इन चयनकर्ता <ref name="bo07"/><ref name="bo10">{{Cite journal |author1=Botev, Z.I. |author2=Grotowski, J.F. |author3=Kroese, D.P. |title=प्रसार के माध्यम से कर्नेल घनत्व का अनुमान|journal=[[Annals of Statistics]] |volume= 38 |issue=5 |pages=2916–2957 |year=2010 |doi=10.1214/10-AOS799|arxiv=1011.2602 |s2cid=41350591 }}</ref><ref name="SJ91">{{cite journal |author1=Sheather, S.J. |author2=Jones, M.C. |year=1991 |title=कर्नेल घनत्व अनुमान के लिए एक विश्वसनीय डेटा-आधारित बैंडविड्थ चयन विधि|journal=Journal of the Royal Statistical Society, Series B |volume=53 |issue=3 |pages=683–690 |jstor=2345597 |doi=10.1111/j.2517-6161.1991.tb01857.x}}</ref> और [[क्रॉस-सत्यापन (सांख्यिकी)]] चयनकर्ता <ref>{{cite journal |author=Rudemo, M. |year=1982 |title=हिस्टोग्राम और कर्नेल घनत्व अनुमानक का अनुभवजन्य विकल्प|journal=Scandinavian Journal of Statistics |volume=9 |issue=2 |pages=65–78 |jstor=4615859}}</ref><ref>{{cite journal |author=Bowman, A.W. |year=1984 |title=घनत्व अनुमानों के चौरसाई के लिए क्रॉस-वैलिडेशन का एक वैकल्पिक तरीका|journal=Biometrika |volume=71 |pages=353–360 |doi=10.1093/biomet/71.2.353 |issue=2}}</ref><ref>{{cite journal |author1=Hall, P. |author2=Marron, J.S. |author3=Park, B.U. |year=1992 |title=चिकना क्रॉस-सत्यापन|journal=Probability Theory and Related Fields |volume=92 |pages=1–20 |doi=10.1007/BF01205233|s2cid=121181481 |doi-access=free }}</ref> डेटा समुच्चय की | न तो एमिस और न ही h<sub>एमिस</sub> सूत्रों का सीधे उपयोग किया जा सकता है | क्योंकि वे अज्ञात घनत्व फलन को सम्मिलित करते हैं | <math>f</math> या इसका दूसरा व्युत्पन्न <math>f''</math>. उस कठिनाई को दूर करने के लिए, बैंडविड्थ का चयन करने के लिए विभिन्न प्रकार की स्वचालित, डेटा-आधारित विधियाँ विकसित की गई हैं। उनकी प्रभावशीलता की तुलना करने के लिए कई समीक्षा अध्ययन किए गए हैं,<ref>{{cite journal |author1=Park, B.U. |author2=Marron, J.S. |year=1990 |title=डेटा-संचालित बैंडविड्थ चयनकर्ताओं की तुलना|journal=Journal of the American Statistical Association |volume=85 |issue=409 |pages=66–72 |jstor=2289526 |doi=10.1080/01621459.1990.10475307|citeseerx=10.1.1.154.7321 }}</ref><ref>{{cite journal |author1=Park, B.U. |author2=Turlach, B.A. |year=1992 |title=कई डेटा चालित बैंडविड्थ चयनकर्ताओं का व्यावहारिक प्रदर्शन (चर्चा के साथ)|journal=Computational Statistics |volume=7 |pages=251–270|url=https://ideas.repec.org/p/cor/louvco/1992005.html}}</ref><ref>{{cite journal|author1=Cao, R. |author2=Cuevas, A. |author3=Manteiga, W. G. |year=1994 |title=घनत्व अनुमान में कई चौरसाई विधियों का तुलनात्मक अध्ययन|journal=Computational Statistics and Data Analysis |volume=17 |pages=153–176 |doi=10.1016/0167-9473(92)00066-Z|issue=2}}</ref><ref>{{cite journal |doi=10.2307/2291420 |author1=Jones, M.C. |author2=Marron, J.S. |author3=Sheather, S. J. |year=1996 |title=घनत्व अनुमान के लिए बैंडविड्थ चयन का एक संक्षिप्त सर्वेक्षण| journal=Journal of the American Statistical Association |volume=91 |issue=433 |pages=401–407 |jstor=2291420}}</ref><ref>{{cite journal |author=Sheather, S.J. |year=1992 |title=कुछ वास्तविक डेटा सेटों पर छह लोकप्रिय बैंडविड्थ चयन विधियों का प्रदर्शन (चर्चा के साथ)|journal=Computational Statistics |volume=7 |pages=225–250, 271–281}}</ref><ref>{{cite journal |author1=Agarwal, N. |author2=Aluru, N.R. |year=2010 |title=एमईएमएस में अनिश्चितता मात्रा का ठहराव के लिए एक डेटा-संचालित स्टोकेस्टिक सहस्थापन दृष्टिकोण|journal=International Journal for Numerical Methods in Engineering |volume=83 |issue=5 |pages=575–597 |doi=10.1002/nme.2844 |bibcode=2010IJNME..83..575A |url=https://webhost.engr.illinois.edu/~aluru/Journals/IJNME10.pdf}}</ref><ref>{{cite journal |author1=Xu, X. |author2=Yan, Z. |author3=Xu, S. |year=2015 |title=विसरण आधारित कर्नेल घनत्व विधि द्वारा पवन गति संभाव्यता वितरण का अनुमान लगाना|journal=Electric Power Systems Research|volume=121 |pages=28–37 |doi=10.1016/j.epsr.2014.11.029 }}</ref> सामान्य सहमति के साथ कि प्लग-इन चयनकर्ता <ref name="bo07"/><ref name="bo10">{{Cite journal |author1=Botev, Z.I. |author2=Grotowski, J.F. |author3=Kroese, D.P. |title=प्रसार के माध्यम से कर्नेल घनत्व का अनुमान|journal=[[Annals of Statistics]] |volume= 38 |issue=5 |pages=2916–2957 |year=2010 |doi=10.1214/10-AOS799|arxiv=1011.2602 |s2cid=41350591 }}</ref><ref name="SJ91">{{cite journal |author1=Sheather, S.J. |author2=Jones, M.C. |year=1991 |title=कर्नेल घनत्व अनुमान के लिए एक विश्वसनीय डेटा-आधारित बैंडविड्थ चयन विधि|journal=Journal of the Royal Statistical Society, Series B |volume=53 |issue=3 |pages=683–690 |jstor=2345597 |doi=10.1111/j.2517-6161.1991.tb01857.x}}</ref> और [[क्रॉस-सत्यापन (सांख्यिकी)]] चयनकर्ता <ref>{{cite journal |author=Rudemo, M. |year=1982 |title=हिस्टोग्राम और कर्नेल घनत्व अनुमानक का अनुभवजन्य विकल्प|journal=Scandinavian Journal of Statistics |volume=9 |issue=2 |pages=65–78 |jstor=4615859}}</ref><ref>{{cite journal |author=Bowman, A.W. |year=1984 |title=घनत्व अनुमानों के चौरसाई के लिए क्रॉस-वैलिडेशन का एक वैकल्पिक तरीका|journal=Biometrika |volume=71 |pages=353–360 |doi=10.1093/biomet/71.2.353 |issue=2}}</ref><ref>{{cite journal |author1=Hall, P. |author2=Marron, J.S. |author3=Park, B.U. |year=1992 |title=चिकना क्रॉस-सत्यापन|journal=Probability Theory and Related Fields |volume=92 |pages=1–20 |doi=10.1007/BF01205233|s2cid=121181481 |doi-access=free }}</ref> डेटा समुच्चय की विस्तृत श्रृंखला में सबसे उपयोगी हैं। | ||
एमिस में एएमआईएसई के रूप में समान स्पर्शोन्मुख क्रम n<sup>−1/5</sup> वाले किसी भी बैंडविड्थ h को प्रतिस्थापित करने से एमिस (h) = O(n<sup>-4/5</sup>) मिलता है | जहाँ O बड़ा o अंकन है। यह दिखाया जा सकता है कि अशक्त धारणाओं के अनुसार | एमिस में एएमआईएसई के रूप में समान स्पर्शोन्मुख क्रम n<sup>−1/5</sup> वाले किसी भी बैंडविड्थ h को प्रतिस्थापित करने से एमिस (h) = O(n<sup>-4/5</sup>) मिलता है | जहाँ O बड़ा o अंकन है। यह दिखाया जा सकता है कि अशक्त धारणाओं के अनुसार गैर-पैरामीट्रिक अनुमानक उपस्थित नहीं हो सकता है | जो कर्नेल अनुमानक की तुलना में तेज गति से अभिसरण करता है। <ref>{{Cite journal|doi=10.1214/aos/1176342997|last=Wahba|first=G.|title=घनत्व अनुमान के लिए चर गाँठ, कर्नेल और ऑर्थोगोनल श्रृंखला विधियों के इष्टतम अभिसरण गुण|journal=[[Annals of Statistics]]|year=1975|volume=3|issue=1|pages=15–29|doi-access=free}}</ref> ध्यान दें कि n<sup>−4/5</sup> दर पैरामीट्रिक विधियों की विशिष्ट n<sup>−1</sup> अभिसरण दर से धीमी है। | ||
यदि बैंडविड्थ को निश्चित नहीं रखा गया है | किन्तु आकलन (बैलून आकलनकर्ता) या नमूने (बिंदुवार आकलनकर्ता) के स्थान के आधार पर भिन्न होता है, तो यह | यदि बैंडविड्थ को निश्चित नहीं रखा गया है | किन्तु आकलन (बैलून आकलनकर्ता) या नमूने (बिंदुवार आकलनकर्ता) के स्थान के आधार पर भिन्न होता है, तो यह विशेष रूप से शक्तिशाली विधि का उत्पादन करता है | जिसे चर कर्नेल घनत्व आकलन कहा जाता है। | ||
हेवी-टेल्ड डिस्ट्रीब्यूशन के कर्नेल घनत्व आकलन के लिए बैंडविड्थ चयन अपेक्षाकृत कठिन है।<ref name="Buch2005">{{Cite journal | last1 = Buch-Larsen | first1 = TINE | title = चेम्परनाउन परिवर्तन का उपयोग करते हुए भारी-पूंछ वाले वितरण के लिए कर्नेल घनत्व का अनुमान| doi = 10.1080/02331880500439782 | journal = Statistics | volume = 39 | issue = 6 | pages = 503–518 | year = 2005 | citeseerx = 10.1.1.457.1544 | s2cid = 219697435 }}</ref> | हेवी-टेल्ड डिस्ट्रीब्यूशन के कर्नेल घनत्व आकलन के लिए बैंडविड्थ चयन अपेक्षाकृत कठिन है।<ref name="Buch2005">{{Cite journal | last1 = Buch-Larsen | first1 = TINE | title = चेम्परनाउन परिवर्तन का उपयोग करते हुए भारी-पूंछ वाले वितरण के लिए कर्नेल घनत्व का अनुमान| doi = 10.1080/02331880500439782 | journal = Statistics | volume = 39 | issue = 6 | pages = 503–518 | year = 2005 | citeseerx = 10.1.1.457.1544 | s2cid = 219697435 }}</ref> | ||
=== सामान्य बैंडविड्थ आकलनकर्ता=== | === सामान्य बैंडविड्थ आकलनकर्ता=== | ||
Line 74: | Line 72: | ||
:<math>A = \min\left(\hat{\sigma}, \frac{IQR}{1.34}\right)</math> जहाँ [[अन्तःचतुर्थक श्रेणी]] इंटरक्वेर्टाइल स्तर है। | :<math>A = \min\left(\hat{\sigma}, \frac{IQR}{1.34}\right)</math> जहाँ [[अन्तःचतुर्थक श्रेणी]] इंटरक्वेर्टाइल स्तर है। | ||
[[File:Kernel density estimation, comparison between rule of thumb and solve-the-equation bandwidth.png|thumb|upright=1.25|alt=Comparison between rule of thumb and solve-द-इक्वेशन बैंडविड्थ|रूल ऑफ थंब और सॉल्व-द-इक्वेशन बैंडविड्थ के बीच तुलना।]]मॉडल में सुधार करने वाला | [[File:Kernel density estimation, comparison between rule of thumb and solve-the-equation bandwidth.png|thumb|upright=1.25|alt=Comparison between rule of thumb and solve-द-इक्वेशन बैंडविड्थ|रूल ऑफ थंब और सॉल्व-द-इक्वेशन बैंडविड्थ के बीच तुलना।]]मॉडल में सुधार करने वाला और संशोधन कारक को 1.06 से 0.9 तक कम करना है। तब अंतिम सूत्र होगा | | ||
:<math>h = 0.9\, \min\left(\hat{\sigma}, \frac{IQR}{1.34}\right)\, n^{-\frac{1}{5}}</math> | :<math>h = 0.9\, \min\left(\hat{\sigma}, \frac{IQR}{1.34}\right)\, n^{-\frac{1}{5}}</math> | ||
Line 83: | Line 81: | ||
उदाहरण के लिए, बिमॉडल [[गॉसियन मिश्रण मॉडल]] का आकलन करते समय होता है | | उदाहरण के लिए, बिमॉडल [[गॉसियन मिश्रण मॉडल]] का आकलन करते समय होता है | | ||
:<math>\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{2}(x-10)^2}+\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{2}(x+10)^2}</math> | :<math>\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{2}(x-10)^2}+\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{2}(x+10)^2}</math> | ||
200 बिंदुओं के | 200 बिंदुओं के नमूने से, दाईं ओर का आंकड़ा सही घनत्व और दो कर्नेल घनत्व आकलन दिखाता है | रूल ऑफ़ थंब बैंडविड्थ का उपयोग करके, और दूसरा समीकरण-समीकरण बैंडविड्थ का उपयोग करके <ref name="bo07" /><ref name="SJ91" /> रूल-ऑफ-थंब बैंडविड्थ पर आधारित आकलन अधिक सीमा तक ओवरस्मूथ किया गया है। | ||
विशेषता फलन घनत्व आकलनकर्ता से संबंध दिया गया नमूना (''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x<sub>n</sub>''), विशिष्ट कार्य (संभावना सिद्धांत) {{nowrap|''φ''(''t'') {{=}} E[''e''<sup>''itX''</sup>]}} का आकलन लगाना स्वाभाविक है | जैसा | विशेषता फलन घनत्व आकलनकर्ता से संबंध दिया गया नमूना (''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x<sub>n</sub>''), विशिष्ट कार्य (संभावना सिद्धांत) {{nowrap|''φ''(''t'') {{=}} E[''e''<sup>''itX''</sup>]}} का आकलन लगाना स्वाभाविक है | जैसा | ||
Line 89: | Line 87: | ||
\widehat\varphi(t) = \frac{1}{n} \sum_{j=1}^n e^{itx_j} | \widehat\varphi(t) = \frac{1}{n} \sum_{j=1}^n e^{itx_j} | ||
</math> | </math> | ||
विशेषता फलन को जानने के बाद, [[फूरियर रूपांतरण]] सूत्र के माध्यम से संबंधित प्रायिकता घनत्व फलन को खोजना संभव है। इस व्युत्क्रम सूत्र को प्रयुक्त करने में | विशेषता फलन को जानने के बाद, [[फूरियर रूपांतरण]] सूत्र के माध्यम से संबंधित प्रायिकता घनत्व फलन को खोजना संभव है। इस व्युत्क्रम सूत्र को प्रयुक्त करने में कठिनाई यह है कि यह आकलन के बाद से अपसारी अभिन्न की ओर जाता है | <math style="vertical-align:-.3em">\scriptstyle\widehat\varphi(t)</math> बड़े t के लिए अविश्वसनीय है। इस समस्या को दरकिनार करने के लिए, आकलनकर्ता <math style="vertical-align:-.3em">\scriptstyle\widehat\varphi(t)</math> फलन से गुणा किया जाता है |{{nowrap|''ψ<sub>h</sub>''(''t'') {{=}} ''ψ''(''ht'')}}, जो मूल बिंदु पर 1 के समान है और फिर अनंत पर 0 तक गिर जाता है। "बैंडविड्थ मापदंड" h नियंत्रित करता है कि हम कितनी तेजी से फलन <math style="vertical-align:-.3em">\scriptstyle\widehat\varphi(t)</math> को कम करने की प्रयास करते हैं | विशेष रूप से जब h छोटा होता है, तब ψ<sub>h</sub> (t) t की बड़ी श्रृंखला के लिए लगभग एक होगा, जिसका अर्थ है कि <math style="vertical-align:-.3em">\scriptstyle\widehat\varphi(t)</math> t के सबसे महत्वपूर्ण क्षेत्र में व्यावहारिक रूप से अपरिवर्तित रहता है। | ||
फलन ψ{{nowrap|''ψ''(''t'') {{=}} '''1'''{−1 ≤ ''t'' ≤ 1}} के लिए सबसे सामान्य विकल्प या तो एकसमान फलन है | जिसका प्रभावी अर्थ उलटा सूत्र में एकीकरण के अंतराल को छोटा करना है | {{nowrap|[−1/''h'', 1/''h'']}}, या [[गाऊसी समारोह|गाऊसी फलन]] {{nowrap|''ψ''(''t'') {{=}} ''e''<sup>''−{{pi}}t''<sup>2</sup></sup>}}. एक बार फलन ψ चुने जाने के बाद, व्युत्क्रम सूत्र प्रयुक्त किया जा सकता है | | फलन ψ{{nowrap|''ψ''(''t'') {{=}} '''1'''{−1 ≤ ''t'' ≤ 1}} के लिए सबसे सामान्य विकल्प या तो एकसमान फलन है | जिसका प्रभावी अर्थ उलटा सूत्र में एकीकरण के अंतराल को छोटा करना है | {{nowrap|[−1/''h'', 1/''h'']}}, या [[गाऊसी समारोह|गाऊसी फलन]] {{nowrap|''ψ''(''t'') {{=}} ''e''<sup>''−{{pi}}t''<sup>2</sup></sup>}}. एक बार फलन ψ चुने जाने के बाद, व्युत्क्रम सूत्र प्रयुक्त किया जा सकता है | | ||
Line 105: | Line 103: | ||
:<math>M = \{ x:g(x)=0, \lambda_1(x)<0 \}</math> | :<math>M = \{ x:g(x)=0, \lambda_1(x)<0 \}</math> | ||
अर्थात्, <math>M</math> उन बिंदुओं का संग्रह है | जिनके लिए घनत्व फलन स्थानीय रूप से अधिकतम होता है। जिसका | अर्थात्, <math>M</math> उन बिंदुओं का संग्रह है | जिनके लिए घनत्व फलन स्थानीय रूप से अधिकतम होता है। जिसका प्राकृतिक आकलनकर्ता <math>M</math> केडीई का प्लग-इन है |<ref>{{Cite journal|last1=Chen|first1=Yen-Chi|last2=Genovese|first2=Christopher R.|last3=Wasserman|first3=Larry|date=2016|title=मोड क्लस्टरिंग के लिए एक व्यापक दृष्टिकोण|journal=Electronic Journal of Statistics|volume=10|issue=1|pages=210–241|doi=10.1214/15-ejs1102|issn=1935-7524|doi-access=free}}</ref><ref>{{Cite journal|last1=Chazal|first1=Frédéric|last2=Fasy|first2=Brittany Terese|last3=Lecci|first3=Fabrizio|last4=Rinaldo|first4=Alessandro|last5=Wasserman|first5=Larry|date=2014|title=दृढ़ता परिदृश्य और सिल्हूट का स्टोकेस्टिक अभिसरण|journal=Annual Symposium on Computational Geometry - SOCG'14|volume=6|issue=2|pages=474–483|location=New York, New York, USA|publisher=ACM Press|doi=10.1145/2582112.2582128|isbn=978-1-4503-2594-3|s2cid=6029340|url=https://jocg.org/index.php/jocg/article/view/2982}}</ref> जहाँ <math>g(x)</math> और <math>\lambda_1(x) | ||
</math> केडीई संस्करण हैं | <math>g(x)</math> और <math>\lambda_1(x)</math>. आकलनों के अनुसार, <math>M_c</math> का | </math> केडीई संस्करण हैं | <math>g(x)</math> और <math>\lambda_1(x)</math>. आकलनों के अनुसार, <math>M_c</math> का सतत <math>M</math> आकलनकर्ता है | ध्यान दें कि कोई औसत बदलाव कलन विधि का उपयोग कर सकता है |<ref>{{Cite journal|last1=Fukunaga|first1=K.|last2=Hostetler|first2=L.|date=January 1975|title=पैटर्न पहचान में अनुप्रयोगों के साथ घनत्व फ़ंक्शन के ढाल का अनुमान|journal=IEEE Transactions on Information Theory|volume=21|issue=1|pages=32–40|doi=10.1109/tit.1975.1055330|issn=0018-9448}}</ref><ref>{{Cite journal|last=Yizong Cheng|date=1995|title=मीन शिफ्ट, मोड सीकिंग और क्लस्टरिंग|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=17|issue=8|pages=790–799|doi=10.1109/34.400568|issn=0162-8828}}</ref><ref>{{Cite journal|last1=Comaniciu|first1=D.|last2=Meer|first2=P.|date=May 2002|title=Mean shift: a robust approach toward feature space analysis|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=24|issue=5|pages=603–619|doi=10.1109/34.1000236|issn=0162-8828}}</ref> आकलनकर्ता की गणना करने के लिए <math>M_c</math> संख्यात्मक रूप से होता है । | ||
== सांख्यिकीय कार्यान्वयन == | == सांख्यिकीय कार्यान्वयन == | ||
Line 112: | Line 110: | ||
कर्नेल घनत्व आकलनकर्ताों के सॉफ्टवेयर कार्यान्वयन की गैर-विस्तृत सूची में सम्मिलित हैं | | कर्नेल घनत्व आकलनकर्ताों के सॉफ्टवेयर कार्यान्वयन की गैर-विस्तृत सूची में सम्मिलित हैं | | ||
* [[एनालिटिका (सॉफ्टवेयर)]] रिलीज 4.4 में, पीडीf परिणामों के लिए समरेखण विकल्प केडीई का उपयोग करता है, और एक्सप्रेशंस से यह बिल्ट-इन के माध्यम से उपलब्ध है | <code>Pdf</code> फलन | * [[एनालिटिका (सॉफ्टवेयर)]] रिलीज 4.4 में, पीडीf परिणामों के लिए समरेखण विकल्प केडीई का उपयोग करता है, और एक्सप्रेशंस से यह बिल्ट-इन के माध्यम से उपलब्ध है | <code>Pdf</code> फलन | ||
* C (प्रोग्रामिंग लैंग्वेज)/[[C++]] में, [http://www.umiacs.umd.edu/~morariu/figtree/ FIGTree] | * C (प्रोग्रामिंग लैंग्वेज)/[[C++]] में, [http://www.umiacs.umd.edu/~morariu/figtree/ FIGTree] लाइब्रेरी है | जिसका उपयोग सामान्य कर्नेल का उपयोग करके कर्नेल घनत्व आकलनों की गणना करने के लिए किया जा सकता है। मैटलैब इंटरफ़ेस उपलब्ध है। | ||
* C++ में, [http://libagf.sf.net libagf] परिवर्तनीय कर्नेल घनत्व आकलन के लिए | * C++ में, [http://libagf.sf.net libagf] परिवर्तनीय कर्नेल घनत्व आकलन के लिए लाइब्रेरी है। | ||
* C++ में, [[mlpack|मायपैक]] | * C++ में, [[mlpack|मायपैक]] लाइब्रेरी है | जो कई अलग-अलग कर्नेल का उपयोग करके केडीई की गणना कर सकता है। यह तेजी से संगणना के लिए त्रुटि सहिष्णुता समुच्चय करने की अनुमति देता है। [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)]] इंटरफेस उपलब्ध हैं। | ||
* C शार्प (प्रोग्रामिंग लैंग्वेज) में | * C शार्प (प्रोग्रामिंग लैंग्वेज) में C और f शार्प (प्रोग्रामिंग लैंग्वेज) f, मैथ.नेट न्यूमेरिक्स संख्यात्मक संगणना के लिए ओपन सोर्स लाइब्रेरी है | जिसमें [https://numerics.mathdotnet.com/api/MathNet.Numerics सम्मिलित है .Statistics/KernelDensity.htm कर्नेल घनत्व आकलन] | ||
* [[क्राइमस्टैट]] में, कर्नेल घनत्व आकलन पांच अलग-अलग कर्नेल कार्यों का उपयोग करके कार्यान्वित किया जाता है | सामान्य, समान, क्वार्टिक, नकारात्मक घातीय और त्रिकोणीय एकल और दोहरे कर्नेल घनत्व आकलन | * [[क्राइमस्टैट]] में, कर्नेल घनत्व आकलन पांच अलग-अलग कर्नेल कार्यों का उपयोग करके कार्यान्वित किया जाता है | सामान्य, समान, क्वार्टिक, नकारात्मक घातीय और त्रिकोणीय एकल और दोहरे कर्नेल घनत्व आकलन दोनों उपलब्ध हैं। कर्नेल घनत्व आकलन का उपयोग हेड बैंग को प्रक्षेपित करने में भी किया जाता है, द्वि-आयामी जर्नी-टू-क्राइम घनत्व फलन का आकलन लगाने में, और त्रि-आयामी बायेसियन जर्नी-टू-क्राइम आकलन लगाने में होता है । | ||
* एल्की में, कर्नेल घनत्व कार्य पैकेज में पाए जा सकते हैं | <code>de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions</code> | * एल्की में, कर्नेल घनत्व कार्य पैकेज में पाए जा सकते हैं | <code>de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions</code> | ||
* [[पर्यावरण प्रणाली अनुसंधान संस्थान]] के उत्पादों में, कर्नेल घनत्व मानचित्रण को स्थानिक विश्लेषक टूलबॉक्स से प्रबंधित किया जाता है और क्वार्टिक (बायवेट) कर्नेल का उपयोग करता है। | * [[पर्यावरण प्रणाली अनुसंधान संस्थान]] के उत्पादों में, कर्नेल घनत्व मानचित्रण को स्थानिक विश्लेषक टूलबॉक्स से प्रबंधित किया जाता है और क्वार्टिक (बायवेट) कर्नेल का उपयोग करता है। | ||
* [[ Microsoft Excel |माइक्रोसॉफ्ट एक्सेल]] में, रॉयल सोसायटी ऑफ केमिस्ट्री ने उनके [http://www.rsc.org/Membership/Networking/InterestGroups/Analytical/AMC/Software/kerneldensities.asp के आधार पर कर्नेल घनत्व आकलन चलाने के लिए | * [[ Microsoft Excel |माइक्रोसॉफ्ट एक्सेल]] में, रॉयल सोसायटी ऑफ केमिस्ट्री ने उनके [http://www.rsc.org/Membership/Networking/InterestGroups/Analytical/AMC/Software/kerneldensities.asp के आधार पर कर्नेल घनत्व आकलन चलाने के लिए ऐड-इन बनाया है। विश्लेषणात्मक विधि समिति विधि संक्षेप 4]। | ||
* [[gnuplot|कथानक]] में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | <code>smooth kdensity</code> विकल्प, डेटा फ़ाइल में प्रत्येक बिंदु के लिए भार और बैंडविड्थ हो सकता है, या बैंडविड्थ को स्वचालित रूप से समुच्चय किया जा सकता है <ref>{{cite book |last=Janert |first=Philipp K |title=Gnuplot in action : understanding data with graphs |year=2009 |publisher=Manning Publications |location=Connecticut, USA |isbn=978-1-933988-39-9 }} See section 13.2.2 entitled ''Kernel density estimates''.</ref> सिल्वरमैन के अंगूठे के नियम के अनुसार (ऊपर देखें)। | * [[gnuplot|कथानक]] में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | <code>smooth kdensity</code> विकल्प, डेटा फ़ाइल में प्रत्येक बिंदु के लिए भार और बैंडविड्थ हो सकता है, या बैंडविड्थ को स्वचालित रूप से समुच्चय किया जा सकता है <ref>{{cite book |last=Janert |first=Philipp K |title=Gnuplot in action : understanding data with graphs |year=2009 |publisher=Manning Publications |location=Connecticut, USA |isbn=978-1-933988-39-9 }} See section 13.2.2 entitled ''Kernel density estimates''.</ref> सिल्वरमैन के अंगूठे के नियम के अनुसार (ऊपर देखें)। | ||
* [[हास्केल (प्रोग्रामिंग भाषा)]] में, कर्नेल घनत्व [http://hackage.haskell.org/package/statistics सांख्यिकी] पैकेज में कार्यान्वित किया जाता है। | * [[हास्केल (प्रोग्रामिंग भाषा)]] में, कर्नेल घनत्व [http://hackage.haskell.org/package/statistics सांख्यिकी] पैकेज में कार्यान्वित किया जाता है। | ||
* [[इगोर प्रो]] में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | <code>Statsकेडीई</code> संचालन (इगोर प्रो 7.00 में जोड़ा गया) बैंडविड्थ उपयोगकर्ता निर्दिष्ट या सिल्वरमैन, स्कॉट या बोमन और अज़ालिनी के माध्यम से आकलन लगाया जा सकता है। कर्नेल प्रकार हैं | एपेनेक्निकोव, द्वि-भार, त्रि-भार, त्रिकोणीय, गाऊसी और आयताकार है। | * [[इगोर प्रो]] में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | <code>Statsकेडीई</code> संचालन (इगोर प्रो 7.00 में जोड़ा गया) बैंडविड्थ उपयोगकर्ता निर्दिष्ट या सिल्वरमैन, स्कॉट या बोमन और अज़ालिनी के माध्यम से आकलन लगाया जा सकता है। कर्नेल प्रकार हैं | एपेनेक्निकोव, द्वि-भार, त्रि-भार, त्रिकोणीय, गाऊसी और आयताकार है। | ||
* [[ जावा (प्रोग्रामिंग भाषा) ]] में, वीका (मशीन लर्निंग) पैकेज दूसरों के बीच [http://weka.sourceforge.net/doc.stable/weka/estimator/KernelEstimator.html weka.estimators.KernelEstimator] प्रदान करता है। | * [[ जावा (प्रोग्रामिंग भाषा) | जावा (प्रोग्रामिंग भाषा)]] में, वीका (मशीन लर्निंग) पैकेज दूसरों के बीच [http://weka.sourceforge.net/doc.stable/weka/estimator/KernelEstimator.html weka.estimators.KernelEstimator] प्रदान करता है। | ||
* [[जावास्क्रिप्ट]] में, विज़ुअलाइज़ेशन पैकेज D3js|D3.js अपने विज्ञान.आँकड़े पैकेज में | * [[जावास्क्रिप्ट]] में, विज़ुअलाइज़ेशन पैकेज D3js|D3.js अपने विज्ञान.आँकड़े पैकेज में केडीई पैकेज प्रदान करता है। | ||
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] में, ग्राफ बिल्डर प्लेटफॉर्म द्विभाजित घनत्व के लिए समोच्च भूखंड और उच्च घनत्व क्षेत्र (एचडीआर), और अविभाजित घनत्व के लिए वायलिन भूखंड और एचडीआर प्रदान करने के लिए कर्नेल घनत्व आकलन का उपयोग करता है। स्लाइडर्स उपयोगकर्ता को बैंडविड्थ बदलने की अनुमति देते हैं। द्विचर और अविभाज्य कर्नेल घनत्व आकलन भी क्रमशः फ़िट Y द्वारा X और वितरण प्लेटफ़ॉर्म द्वारा प्रदान किए जाते हैं। | * [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]] में, ग्राफ बिल्डर प्लेटफॉर्म द्विभाजित घनत्व के लिए समोच्च भूखंड और उच्च घनत्व क्षेत्र (एचडीआर), और अविभाजित घनत्व के लिए वायलिन भूखंड और एचडीआर प्रदान करने के लिए कर्नेल घनत्व आकलन का उपयोग करता है। स्लाइडर्स उपयोगकर्ता को बैंडविड्थ बदलने की अनुमति देते हैं। द्विचर और अविभाज्य कर्नेल घनत्व आकलन भी क्रमशः फ़िट Y द्वारा X और वितरण प्लेटफ़ॉर्म द्वारा प्रदान किए जाते हैं। | ||
* [[ जूलिया (प्रोग्रामिंग भाषा) ]] में, कर्नेल घनत्व आकलन [https://github.com/JuliaStats/KernelDensity.jl कर्नेल घनत्व.जेएल] पैकेज में कार्यान्वित किया जाता है। | * [[ जूलिया (प्रोग्रामिंग भाषा) | जूलिया (प्रोग्रामिंग भाषा)]] में, कर्नेल घनत्व आकलन [https://github.com/JuliaStats/KernelDensity.jl कर्नेल घनत्व.जेएल] पैकेज में कार्यान्वित किया जाता है। | ||
* [[MATLAB|मैटलैब]] में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | * [[MATLAB|मैटलैब]] में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | <code>ksdensity</code> फलन (सांख्यिकी टूलबॉक्स) मैटलैब की 2018a रिलीज़ के अनुसार, बैंडविड्थ और कर्नेल स्मूथ दोनों को निर्दिष्ट किया जा सकता है | जिसमें कर्नेल घनत्व की सीमा निर्दिष्ट करने जैसे अन्य विकल्प सम्मिलित हैं। <ref>{{Cite web|title=अविभाजित और द्विभाजित डेटा के लिए कर्नेल स्मूथिंग फ़ंक्शन अनुमान - MATLAB ksdensity|url=https://www.mathworks.com/help/stats/ksdensity.html|access-date=2020-11-05|website=www.mathworks.com}}</ref> वैकल्पिक रूप से, मुफ्त मैटलैब सॉफ़्टवेयर पैकेज जो स्वचालित बैंडविड्थ चयन पद्धति को प्रयुक्त करता है | <ref name="bo07"/> मैटलैब सेंट्रल फाइल एक्सचेंज के लिए उपलब्ध है | | ||
** [http://www.mathworks.com/matlabcentral/fileexchange/14034-kernel-density-estimator 1-आयामी डेटा] | ** [http://www.mathworks.com/matlabcentral/fileexchange/14034-kernel-density-estimator 1-आयामी डेटा] | ||
** [http://www.mathworks.com/matlabcentral/fileexchange/17204-kernel-density-estimation 2-आयामी डेटा] | ** [http://www.mathworks.com/matlabcentral/fileexchange/17204-kernel-density-estimation 2-आयामी डेटा] | ||
** [http://www.mathworks.com/matlabcentral/fileexchange/58312-kernel-density-estimator-for-high-dimensions n-आयामी डेटा] <br /> कर्नेल प्रतिगमन, कर्नेल के कार्यान्वयन के साथ | ** [http://www.mathworks.com/matlabcentral/fileexchange/58312-kernel-density-estimator-for-high-dimensions n-आयामी डेटा] <br /> कर्नेल प्रतिगमन, कर्नेल के कार्यान्वयन के साथ मुफ़्त मैटलैब टूलबॉक्स घनत्व का आकलन, खतरे के कार्य का कर्नेल आकलन और कई अन्य [http://www.math.muni.cz/english/science-and-research/Developed-software/232-matlab-toolbox.html इन पृष्ठों] पर उपलब्ध है ( यह टूलबॉक्स किताब का भाग है <ref name="HorKolZel">{{cite book|last1=Horová|first1=I.|last2=Koláček|first2=J.|last3=Zelinka|first3=J.|title=Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing|date=2012|publisher=World Scientific Publishing|location=Singapore|isbn=978-981-4405-48-5}}</ref>). | ||
* गणित में, संख्यात्मक कर्नेल घनत्व आकलन फलन द्वारा कार्यान्वित किया जाता है | <code>SmoothKernelDistribution</code><ref>{{Cite web|title=SmoothKernelDistribution—Wolfram Language Documentation|url=https://reference.wolfram.com/language/ref/SmoothKernelDistribution.html.en|access-date=2020-11-05|website=reference.wolfram.com}}</ref> और सांकेतिक आकलन फलन का उपयोग कर कार्यान्वित किया जाता है | <code>KernelMixtureDistribution</code><ref>{{Cite web|title=KernelMixtureDistribution—Wolfram Language Documentation|url=https://reference.wolfram.com/language/ref/KernelMixtureDistribution.html.en|access-date=2020-11-05|website=reference.wolfram.com}}</ref> दोनों ही डेटा-संचालित बैंडविथ प्रदान करते हैं। | * गणित में, संख्यात्मक कर्नेल घनत्व आकलन फलन द्वारा कार्यान्वित किया जाता है | <code>SmoothKernelDistribution</code><ref>{{Cite web|title=SmoothKernelDistribution—Wolfram Language Documentation|url=https://reference.wolfram.com/language/ref/SmoothKernelDistribution.html.en|access-date=2020-11-05|website=reference.wolfram.com}}</ref> और सांकेतिक आकलन फलन का उपयोग कर कार्यान्वित किया जाता है | <code>KernelMixtureDistribution</code><ref>{{Cite web|title=KernelMixtureDistribution—Wolfram Language Documentation|url=https://reference.wolfram.com/language/ref/KernelMixtureDistribution.html.en|access-date=2020-11-05|website=reference.wolfram.com}}</ref> दोनों ही डेटा-संचालित बैंडविथ प्रदान करते हैं। | ||
* [[मिनिटैब]] में, रॉयल सोसायटी ऑफ केमिस्ट्री ने अपनी एनालिटिकल मेथड्स कमिट टेक्निकल ब्रीफ 4 के आधार पर कर्नेल घनत्व आकलन चलाने के लिए | * [[मिनिटैब]] में, रॉयल सोसायटी ऑफ केमिस्ट्री ने अपनी एनालिटिकल मेथड्स कमिट टेक्निकल ब्रीफ 4 के आधार पर कर्नेल घनत्व आकलन चलाने के लिए मैक्रो बनाया है।<ref>{{Cite web|title=कर्नेल घनत्व की गणना के लिए सॉफ्टवेयर|url=https://www.rsc.org/Membership/Networking/InterestGroups/Analytical/AMC/Software/kerneldensities.asp|access-date=2020-11-05|website=www.rsc.org}}</ref> | ||
* [[एनएजी न्यूमेरिकल लाइब्रेरी]] में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | <code>g10ba</code> दिनचर्या (फोरट्रान दोनों में उपलब्ध है |<ref>{{cite web |last=The Numerical Algorithms Group |title=NAG Library Routine Document: nagf_smooth_kerndens_gauss (g10baf) |work=NAG Library Manual, Mark 23 |url=http://www.nag.co.uk/numeric/fl/nagdoc_fl23/pdf/G10/g10baf.pdf |access-date=2012-02-16 }}</ref> और c <ref>{{cite web |last=The Numerical Algorithms Group |title=NAG Library Routine Document: nag_kernel_density_estim (g10bac) |work=NAG Library Manual, Mark 9 |url=http://www.nag.co.uk/numeric/CL/nagdoc_cl09/pdf/G10/g10bac.pdf |access-date=2012-02-16 |archive-url=https://web.archive.org/web/20111124062333/http://nag.co.uk/numeric/cl/nagdoc_cl09/pdf/G10/g10bac.pdf |archive-date=2011-11-24 |url-status=dead }}</ref> लाइब्रेरी के संस्करण)। | * [[एनएजी न्यूमेरिकल लाइब्रेरी]] में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | <code>g10ba</code> दिनचर्या (फोरट्रान दोनों में उपलब्ध है |<ref>{{cite web |last=The Numerical Algorithms Group |title=NAG Library Routine Document: nagf_smooth_kerndens_gauss (g10baf) |work=NAG Library Manual, Mark 23 |url=http://www.nag.co.uk/numeric/fl/nagdoc_fl23/pdf/G10/g10baf.pdf |access-date=2012-02-16 }}</ref> और c <ref>{{cite web |last=The Numerical Algorithms Group |title=NAG Library Routine Document: nag_kernel_density_estim (g10bac) |work=NAG Library Manual, Mark 9 |url=http://www.nag.co.uk/numeric/CL/nagdoc_cl09/pdf/G10/g10bac.pdf |access-date=2012-02-16 |archive-url=https://web.archive.org/web/20111124062333/http://nag.co.uk/numeric/cl/nagdoc_cl09/pdf/G10/g10bac.pdf |archive-date=2011-11-24 |url-status=dead }}</ref> लाइब्रेरी के संस्करण)। | ||
* [http://nuklei.sourceforge.net/ नुक्लेई] में, C++ कर्नेल घनत्व विधियाँ विशेष यूक्लिडियन समूह <math>SE(3)</math> के डेटा पर ध्यान केंद्रित करती हैं | | * [http://nuklei.sourceforge.net/ नुक्लेई] में, C++ कर्नेल घनत्व विधियाँ विशेष यूक्लिडियन समूह <math>SE(3)</math> के डेटा पर ध्यान केंद्रित करती हैं | | ||
Line 139: | Line 137: | ||
* [[पर्ल]] में, कार्यान्वयन [http://search.cpan.org/~janert/Statistics-KernelEstimation-0.05 सांख्यिकी-कर्नेल आकलन मॉड्यूल] में पाया जा सकता है। | * [[पर्ल]] में, कार्यान्वयन [http://search.cpan.org/~janert/Statistics-KernelEstimation-0.05 सांख्यिकी-कर्नेल आकलन मॉड्यूल] में पाया जा सकता है। | ||
* [[PHP|पीएचपी]] में, कार्यान्वयन [https://github.com/markrogoyski/math-php Mathपीएचपी लाइब्रेरी] में पाया जा सकता है। | * [[PHP|पीएचपी]] में, कार्यान्वयन [https://github.com/markrogoyski/math-php Mathपीएचपी लाइब्रेरी] में पाया जा सकता है। | ||
* पायथन (प्रोग्रामिंग भाषा) में, कई कार्यान्वयन उपस्थित हैं: [http://pythonhosted.org/PyQt-Fit/mod_kde.html | * पायथन (प्रोग्रामिंग भाषा) में, कई कार्यान्वयन उपस्थित हैं: [http://pythonhosted.org/PyQt-Fit/mod_kde.html पीवाईक्युटी_फिट.केडीई मॉड्यूल] [https://pypi.python.org/packages/source/ में] P/PyQt-Fit/PyQt-Fit-1.3.4.tar.gz PyQt-Fit पैकेज, साइपी (<code>scipy.stats.gaussian_kde</code>), स्तर मॉडल (<code>KDEMultivariate</code> और <code>KDEMultivariate</code>), और [[scikit-सीखें|स्किट-सीखें]] (<code>KernelDensity</code>) (तुलना देखें <ref>{{cite web |last=Vanderplas|first=Jake|title=पायथन में कर्नेल घनत्व अनुमान|date=2013-12-01|url=https://jakevdp.github.io/blog/2013/12/01/kernel-density-estimation/|access-date=2014-03-12}}</ref>). [https://kdepy.readthedocs.io/en/latest/ केडीईpy] भारित डेटा का समर्थन करता है और इसका एफएफटी कार्यान्वयन अन्य कार्यान्वयनों की तुलना में बहुत अधिक तेज़ है। सामान्यतः उपयोग की जाने वाली पांडा लाइब्रेरी [https://pandas.pydata.org/] प्लॉट विधि के माध्यम से केडीई प्लॉटिंग के लिए समर्थन प्रदान करती है (<code>df.plot(kind='kde')</code>[https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.kde.html]) भारित और सहसंबद्ध एमसीएमसी नमूनों के लिए [https://getdist.readthedocs.io जीडिस्ट] पैकेज 1D और 2D वितरण के लिए अनुकूलित बैंडविड्थ, सीमा सुधार और उच्च-क्रम विधियों का समर्थन करता है। कर्नेल घनत्व आकलन के लिए नया उपयोग किया जाने वाला पैकेज सीबॉर्न है | ( <code>import seaborn as sns</code> , <code>sns.kdeplot()</code> ).<ref>{{Cite web|title=seaborn.kdeplot — seaborn 0.10.1 documentation|url=https://seaborn.pydata.org/generated/seaborn.kdeplot.html|website=seaborn.pydata.org|access-date=2020-05-12}}</ref> केडीई का जीपीयू कार्यान्वयन भी उपस्थित है।<ref>{{Cite web|url=https://pypi.org/project/kde-gpu/#description|title=Kde-gpu: We implemented nadaraya waston kernel density and kernel conditional probability estimator using cuda through cupy. It is much faster than cpu version but it requires GPU with high memory}}</ref> | ||
*R (प्रोग्रामिंग लैंग्वेज) में इसके द्वारा इम्प्लीमेंट किया जाता है | <code>density</code> आधार वितरण में, और <code>bw.nrd0</code> फलन का उपयोग सांख्यिकी पैकेज में किया जाता है | यह फलन सिल्वरमैन की पुस्तक में अनुकूलित सूत्र का उपयोग करता है। <code>bkde</code> [https://cran.r-project.org/web/packages/KernSmooth/index.html | *R (प्रोग्रामिंग लैंग्वेज) में इसके द्वारा इम्प्लीमेंट किया जाता है | <code>density</code> आधार वितरण में, और <code>bw.nrd0</code> फलन का उपयोग सांख्यिकी पैकेज में किया जाता है | यह फलन सिल्वरमैन की पुस्तक में अनुकूलित सूत्र का उपयोग करता है। <code>bkde</code> [https://cran.r-project.org/web/packages/KernSmooth/index.html केर्नस्मूथ लाइब्रेरी] में, <code>ParetoDensityEstimation</code> [https://CRAN.R-project.org/package=DataVisualizations डेटा विज़ुअलाइज़ेशन लाइब्रेरी] में (पेरेटो वितरण घनत्व आकलन के लिए), <code>kde</code> [https://cran.r-project.org/web/packages/ks/index.html ks लाइब्रेरी] में, <code>dkden</code> और <code>dbckden</code> [https://cran.r-project.org/web/packages/evmix/index.html एवमिक्स लाइब्रेरी] में (बाउंडेड समर्थन के लिए बाउंड्री करेक्टेड कर्नेल घनत्व एस्tमेशन के लिए बाद में), <code>npudens</code> [https://cran.r-project.org/web/packages/np/index.html np लाइब्रेरी] (संख्यात्मक और श्रेणीबद्ध चर) में, <code>sm.density</code> एसएम [https://cran.r-project.org/web/packages/sm/index.html लाइब्रेरी] में। के क्रियान्वयन के लिए <code>kde.R</code> फलन, जिसे किसी पैकेज या लाइब्रेरी को स्थापित करने की आवश्यकता नहीं है | [http://web.maths.unsw.edu.au/~zdravkobotev/kde.R केडीई.आर] देखें। [https://cran.r-project.org/web/packages/btb/index.html btb लाइब्रेरी], विश्लेषण के लिए समर्पित, कर्नेल घनत्व आकलन को प्रयुक्त करता है | <code>kernel_smoothing</code>. | ||
* [[एसएएस (सॉफ्टवेयर)]] में, <code>proc kde</code> अविभाजित और द्विभाजित कर्नेल घनत्व का आकलन लगाने के लिए उपयोग किया जा सकता है। | * [[एसएएस (सॉफ्टवेयर)]] में, <code>proc kde</code> अविभाजित और द्विभाजित कर्नेल घनत्व का आकलन लगाने के लिए उपयोग किया जा सकता है। | ||
* [[अपाचे स्पार्क]] में, <code>KernelDensity()</code> कक्षा <ref>{{Cite web|title=Basic Statistics - RDD-based API - Spark 3.0.1 Documentation|url=http://spark.apache.org/docs/latest/mllib-statistics.html#kernel-density-estimation|access-date=2020-11-05|website=spark.apache.org}}</ref> | * [[अपाचे स्पार्क]] में, <code>KernelDensity()</code> कक्षा <ref>{{Cite web|title=Basic Statistics - RDD-based API - Spark 3.0.1 Documentation|url=http://spark.apache.org/docs/latest/mllib-statistics.html#kernel-density-estimation|access-date=2020-11-05|website=spark.apache.org}}</ref> [[था]] में, इसे किसके द्वारा कार्यान्वित किया जाता है <code>kdensity</code><ref>https://www.stata.com/manuals15/rkdensity.pdf {{Bare URL PDF|date=March 2022}}</ref> उदाहरण के लिए <code>histogram x, kdensity</code>. वैकल्पिक रूप से मुफ़्त स्टाटा मॉड्यूल केडीईएनएस उपलब्ध है | <ref>{{Citation |last=Jann |first=Ben |title=KDENS: Stata module for univariate kernel density estimation |date=2008-05-26 |url=https://ideas.repec.org/c/boc/bocode/s456410.html |publisher=Boston College Department of Economics |access-date=2022-10-15}}</ref> उपयोगकर्ता को 1डी या 2डी घनत्व कार्यों का आकलन लगाने की अनुमति देता है। | ||
*[[स्विफ्ट (प्रोग्रामिंग भाषा)]] में इसके <code>स्विफ्टस्टैट्स.KernelDensityEstimation</code> ओपन-सोर्स स्टैटिस्टिक्स लाइब्रेरी | *[[स्विफ्ट (प्रोग्रामिंग भाषा)]] में इसके <code>स्विफ्टस्टैट्स.KernelDensityEstimation</code> ओपन-सोर्स स्टैटिस्टिक्स लाइब्रेरी [https://github.com/r0fls/swiftstats स्विफ्टस्टैट्स] में द्वारा क्रियान्वित किया जाता है । | ||
== यह भी देखें == | == यह भी देखें == | ||
Line 171: | Line 169: | ||
* [http://pcarvalho.com/things/kerneldensityestimation/index.html Kernel Density Estimation Applet] An online interactive example of kernel density estimation. Requires .NET 3.0 or later. | * [http://pcarvalho.com/things/kerneldensityestimation/index.html Kernel Density Estimation Applet] An online interactive example of kernel density estimation. Requires .NET 3.0 or later. | ||
{{DEFAULTSORT:Kernel density estimation}} | {{DEFAULTSORT:Kernel density estimation}} | ||
[[Category: | [[Category:All articles with bare URLs for citations]] | ||
[[Category:Created On 13/05/2023]] | [[Category:Articles with PDF format bare URLs for citations]] | ||
[[Category:Articles with bare URLs for citations from March 2022]] | |||
[[Category:Commons category link is locally defined|Kernel density estimation]] | |||
[[Category:Created On 13/05/2023|Kernel density estimation]] | |||
[[Category:Lua-based templates|Kernel density estimation]] | |||
[[Category:Machine Translated Page|Kernel density estimation]] | |||
[[Category:Pages with script errors|Kernel density estimation]] | |||
[[Category:Templates Vigyan Ready|Kernel density estimation]] | |||
[[Category:Templates that add a tracking category|Kernel density estimation]] | |||
[[Category:Templates that generate short descriptions|Kernel density estimation]] | |||
[[Category:Templates using TemplateData|Kernel density estimation]] | |||
[[Category:गैर पैरामीट्रिक आँकड़े|Kernel density estimation]] | |||
[[Category:घनत्व का अनुमान|Kernel density estimation]] | |||
[[Category:यंत्र अधिगम|Kernel density estimation]] |
Latest revision as of 14:49, 12 June 2023
सांख्यिकी में, कर्नेल घनत्व आकलन (केडीई) प्रायिकता घनत्व आकलन के लिए कर्नेल समरेखण का अनुप्रयोग है, अर्थात, गैर-पैरामीट्रिक सांख्यिकी विधि कर्नेल (सांख्यिकी) के आधार पर यादृच्छिक चर के प्रायिकता घनत्व फलन का आकलन लगाने के लिए भार फलन के रूप में केडीई मौलिक डेटा समरेखण समस्या का उत्तर देता है | जहां परिमित डेटा सांख्यिकीय नमूने के आधार पर सांख्यिकीय जनसंख्या के बारे में आकलन लगाया जाता है। अर्थमिति जैसे कुछ क्षेत्रों में इसे एमानुएल परजेन और मरे रोसेनब्लैट के बाद पारजेन-रोसेनब्लैट विंडो विधि भी कहा जाता है | जिन्हें सामान्यतः स्वतंत्र रूप से इसके वर्तमान रूप में बनाने का श्रेय दिया जाता है।[1][2] कर्नेल घनत्व आकलन के प्रसिद्ध अनुप्रयोगों में से वर्ग-सशर्त सीमांत वितरण का आकलन लगाने में है | नैव बेयस वर्गीकारक का उपयोग करते समय डेटा की सीमांत संभाव्यता घनत्व फलन है |[3][4] जो इसकी पूर्वानुमान स्पष्टता में सुधार कर सकता है।[3]
परिभाषा
माना (x1, x2, ..., xn) किसी भी बिंदु x पर अज्ञात घनत्व के साथ कुछ अविभाज्य वितरण से खींचे गए स्वतंत्र और समान रूप से वितरित यादृच्छिक चर नमूने हैं। हम इस फलन ƒ के आकार का अनुमान लगाने में रुचि रखते हैं। इसका कर्नेल घनत्व आकलनकर्ता है |
जहाँ K कर्नेल (सांख्यिकी) है | गैर-पैरामीट्रिक सांख्यिकी में गैर-नकारात्मक कार्य और h > 0 कर्नेल मापदंड है | जिसे बैंडविड्थ कहा जाता है। सबस्क्रिप्ट h वाले कर्नेल को स्केल्ड कर्नेल कहा जाता है और इसे Kh(x) = 1/h K(x/h) परिभाषित किया जाता है | सहज रूप से कोई h को उतना ही छोटा चुनना चाहता है | जितना डेटा अनुमति देता है | चूँकि, आकलनकर्ता के पूर्वाग्रह और इसके विचरण के बीच सदैव समझौता होता है। बैंडविड्थ पर नीचे और अधिक विस्तार से चर्चा की गई है।
कर्नेल (सांख्यिकी) की श्रृंखला सामान्य उपयोग में कर्नेल फलन सामान्यतः उपयोग किए जाते हैं | त्रिकोणीय, द्विभाजित, ट्राइवेट, एपेनेक्निकोव, सामान्य, और अन्य एपेनेक्निकोव कर्नेल औसत वर्ग त्रुटि अर्थ में इष्टतम है | [5] चूँकि पहले सूचीबद्ध कर्नेल के लिए दक्षता का हानि छोटा है।[6] इसके सुविधाजनक गणितीय गुणों के कारण, सामान्य कर्नेल का अधिकांशतः उपयोग किया जाता है, जिसका K(x) = ϕ(x) अर्थ है | जहां ϕ मानक सामान्य घनत्व फलन है।
कर्नेल घनत्व आकलन का निर्माण घनत्व आकलन के बाहर के क्षेत्रों में व्याख्या पाता है।[7] उदाहरण के लिए, ऊष्मप्रवैगिकी में, यह उत्पन्न होने वाली ऊष्मा की मात्रा के समान है | जब ऊष्मा कर्नेल (ऊष्मा समीकरण का मूल समाधान) प्रत्येक डेटा बिंदु स्थानों xi पर रखी जाती है | मैनिफोल्ड सीखने (जैसे प्रसार मानचित्र) के लिए बिंदु बादलों पर असतत लाप्लास संचालक के निर्माण के लिए इसी तरह के विधियों का उपयोग किया जाता है।
उदाहरण
कर्नेल घनत्व आकलन हिस्टोग्राम से निकटता से संबंधित हैं | किन्तु उपयुक्त कर्नेल का उपयोग करके चिकनाई या निरंतरता जैसे गुणों से संपन्न किया जा सकता है। इन 6 डेटा बिंदुओं पर आधारित नीचे दिया गया आरेख इस संबंध को दर्शाता है |
सैंपल | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
मूल्य | -2.1 | -1.3 | -0.4 | 1.9 | 5.1 | 6.2 |
हिस्टोग्राम के लिए, सबसे पहले, क्षैतिज अक्ष को उप-अंतराल या डिब्बे में विभाजित किया जाता है | जो डेटा की सीमा को कवर करता है | इस स्थिति में, प्रत्येक चौड़ाई 2 के छह डिब्बे जब भी कोई डेटा बिंदु इस अंतराल के अंदर आता है | ऊंचाई 1 का बॉक्स /12 वहां रखा गया है। यदि एक ही बिन में से अधिक डेटा पॉइंट गिरते हैं, तो बॉक्स एक दूसरे के ऊपर ढेर हो जाते हैं।
कर्नेल घनत्व आकलन के लिए, 2.25 प्रसरण वाले सामान्य कर्नेल (लाल धराशायी रेखाओं द्वारा संकेत) प्रत्येक डेटा बिंदु xi पर रखे जाते हैं | कर्नेल घनत्व आकलन (ठोस नीला वक्र) बनाने के लिए कर्नेल का योग किया जाता है। कर्नेल घनत्व आकलन की चिकनाई (हिस्टोग्राम की असततता की तुलना में) दर्शाती है कि कैसे कर्नेल घनत्व आकलन निरंतर यादृच्छिक चर के लिए वास्तविक अंतर्निहित घनत्व में तेज़ी से अभिसरण करता है।[8]
बैंडविड्थ चयन
कर्नेल की बैंडविड्थ (कंप्यूटिंग) मुक्त मापदंड है | जो परिणामी आकलन पर शक्तिशाली प्रभाव प्रदर्शित करता है। इसके प्रभाव को स्पष्ट करने के लिए, हम मानक सामान्य वितरण (क्षैतिज अक्ष पर गलीचा भूखंड में नीले स्पाइक्स पर प्लॉट किए गए) से सिम्युलेटेड रैंडम नंबर संचालक लेते हैं। धूसर वक्र वास्तविक घनत्व है (औसत 0 और विचरण 1 के साथ सामान्य घनत्व)। इसकी तुलना में, लाल वक्र कम चिकना है | क्योंकि इसमें बैंडविड्थ h = 0.05 का उपयोग करने से उत्पन्न होने वाले बहुत से नकली डेटा आर्टिफैक्ट हैं | जो बहुत छोटा है। बैंडविड्थ h = 2 का उपयोग करने के बाद से हरे रंग की वक्र बहुत अधिक अंतर्निहित संरचना को अस्पष्ट करती है। h = 0.337 की बैंडविड्थ के साथ काले वक्र को इष्टतम रूप से चिकना माना जाता है | क्योंकि इसका घनत्व आकलन वास्तविक घनत्व के निकट है। विकट स्थिति का सामना करना पड़ता है (कोई समरेखण नहीं), जहां आकलन विश्लेषित नमूनों के निर्देशांक पर केंद्रित एन डिराक डेल्टा फलन का योग है। दूसरी चरम सीमा में आकलन उपयोग किए गए कर्नेल के आकार को बरकरार रखता है | जो नमूनों के माध्य (पूरी तरह से चिकनी) पर केंद्रित होता है।
इस मापदंड का चयन करने के लिए उपयोग किया जाने वाला सबसे सामान्य इष्टतमता मानदंड अपेक्षित L2 है | कठिन परिस्थिति कार्य, जिसे माध्य एकीकृत चुकता त्रुटि भी कहा जाता है |
ƒ और K पर अशक्त मान्यताओं के अनुसार, (ƒ सामान्यतः अज्ञात, वास्तविक घनत्व फलन है),[1][2]
जहां oi नोटेशन है, और एन नमूना आकार (ऊपर के रूप में) एमिस स्पर्शोन्मुख एमआईएसई है। दो प्रमुख शब्द,
जहाँ फलन जी के लिए, और का दूसरा व्युत्पन्न है और कर्नेल है। इस एमिस का न्यूनतम इस अवकल समीकरण का हल है |
या
न तो एमिस और न ही hएमिस सूत्रों का सीधे उपयोग किया जा सकता है | क्योंकि वे अज्ञात घनत्व फलन को सम्मिलित करते हैं | या इसका दूसरा व्युत्पन्न . उस कठिनाई को दूर करने के लिए, बैंडविड्थ का चयन करने के लिए विभिन्न प्रकार की स्वचालित, डेटा-आधारित विधियाँ विकसित की गई हैं। उनकी प्रभावशीलता की तुलना करने के लिए कई समीक्षा अध्ययन किए गए हैं,[9][10][11][12][13][14][15] सामान्य सहमति के साथ कि प्लग-इन चयनकर्ता [7][16][17] और क्रॉस-सत्यापन (सांख्यिकी) चयनकर्ता [18][19][20] डेटा समुच्चय की विस्तृत श्रृंखला में सबसे उपयोगी हैं।
एमिस में एएमआईएसई के रूप में समान स्पर्शोन्मुख क्रम n−1/5 वाले किसी भी बैंडविड्थ h को प्रतिस्थापित करने से एमिस (h) = O(n-4/5) मिलता है | जहाँ O बड़ा o अंकन है। यह दिखाया जा सकता है कि अशक्त धारणाओं के अनुसार गैर-पैरामीट्रिक अनुमानक उपस्थित नहीं हो सकता है | जो कर्नेल अनुमानक की तुलना में तेज गति से अभिसरण करता है। [21] ध्यान दें कि n−4/5 दर पैरामीट्रिक विधियों की विशिष्ट n−1 अभिसरण दर से धीमी है।
यदि बैंडविड्थ को निश्चित नहीं रखा गया है | किन्तु आकलन (बैलून आकलनकर्ता) या नमूने (बिंदुवार आकलनकर्ता) के स्थान के आधार पर भिन्न होता है, तो यह विशेष रूप से शक्तिशाली विधि का उत्पादन करता है | जिसे चर कर्नेल घनत्व आकलन कहा जाता है।
हेवी-टेल्ड डिस्ट्रीब्यूशन के कर्नेल घनत्व आकलन के लिए बैंडविड्थ चयन अपेक्षाकृत कठिन है।[22]
सामान्य बैंडविड्थ आकलनकर्ता
यदि गॉसियन आधार फलन का उपयोग लगभग एकतरफा डेटा के लिए किया जाता है, और अंतर्निहित घनत्व का आकलन गॉसियन है, तो h के लिए इष्टतम विकल्प (अर्थात, बैंडविड्थ जो औसत एकीकृत चुकता त्रुटि को कम करता है) है |[23]
मूल्य को और अधिक शक्तिशाली माना जाता है | जब यह लंबी-टेल वाले और तिरछे वितरण के लिए या बिमोडल मिश्रण वितरण के लिए फिट में सुधार करता है। यह अधिकांशतः अनुभभार्य रूप से मानक विचलन को बदलकर किया जाता है | मापदंड द्वारा नीचे है |
- जहाँ अन्तःचतुर्थक श्रेणी इंटरक्वेर्टाइल स्तर है।
मॉडल में सुधार करने वाला और संशोधन कारक को 1.06 से 0.9 तक कम करना है। तब अंतिम सूत्र होगा |
जहाँ नमूना आकार है।
इस सन्निकटन को सामान्य वितरण सन्निकटन, गॉसियन सन्निकटन या बर्नार्ड सिल्वरमैन के अंगूठे का नियम कहा जाता है।[23] जबकि अंगूठे के इस नियम की गणना करना सरल है | इसे सावधानी के साथ प्रयोग किया जाना चाहिए | क्योंकि घनत्व सामान्य होने के निकट नहीं होने पर यह व्यापक रूप से गलत आकलन लगा सकता है।
उदाहरण के लिए, बिमॉडल गॉसियन मिश्रण मॉडल का आकलन करते समय होता है |
200 बिंदुओं के नमूने से, दाईं ओर का आंकड़ा सही घनत्व और दो कर्नेल घनत्व आकलन दिखाता है | रूल ऑफ़ थंब बैंडविड्थ का उपयोग करके, और दूसरा समीकरण-समीकरण बैंडविड्थ का उपयोग करके [7][17] रूल-ऑफ-थंब बैंडविड्थ पर आधारित आकलन अधिक सीमा तक ओवरस्मूथ किया गया है।
विशेषता फलन घनत्व आकलनकर्ता से संबंध दिया गया नमूना (x1, x2, ..., xn), विशिष्ट कार्य (संभावना सिद्धांत) φ(t) = E[eitX] का आकलन लगाना स्वाभाविक है | जैसा
विशेषता फलन को जानने के बाद, फूरियर रूपांतरण सूत्र के माध्यम से संबंधित प्रायिकता घनत्व फलन को खोजना संभव है। इस व्युत्क्रम सूत्र को प्रयुक्त करने में कठिनाई यह है कि यह आकलन के बाद से अपसारी अभिन्न की ओर जाता है | बड़े t के लिए अविश्वसनीय है। इस समस्या को दरकिनार करने के लिए, आकलनकर्ता फलन से गुणा किया जाता है |ψh(t) = ψ(ht), जो मूल बिंदु पर 1 के समान है और फिर अनंत पर 0 तक गिर जाता है। "बैंडविड्थ मापदंड" h नियंत्रित करता है कि हम कितनी तेजी से फलन को कम करने की प्रयास करते हैं | विशेष रूप से जब h छोटा होता है, तब ψh (t) t की बड़ी श्रृंखला के लिए लगभग एक होगा, जिसका अर्थ है कि t के सबसे महत्वपूर्ण क्षेत्र में व्यावहारिक रूप से अपरिवर्तित रहता है।
फलन ψψ(t) = 1{−1 ≤ t ≤ 1 के लिए सबसे सामान्य विकल्प या तो एकसमान फलन है | जिसका प्रभावी अर्थ उलटा सूत्र में एकीकरण के अंतराल को छोटा करना है | [−1/h, 1/h], या गाऊसी फलन ψ(t) = e−πt2. एक बार फलन ψ चुने जाने के बाद, व्युत्क्रम सूत्र प्रयुक्त किया जा सकता है |
जहां K डंपिंग फलन ψ का फूरियर रूपांतरण है। इस प्रकार कर्नेल घनत्व आकलनकर्ता विशेषता फलन घनत्व आकलनकर्ता के साथ मेल खाता है।
ज्यामितीय और सामयिक विशेषताएं
हम (वैश्विक) मोड की परिभाषा को स्थानीय अर्थ में बढ़ा सकते हैं और स्थानीय मोड को परिभाषित कर सकते हैं |
अर्थात्, उन बिंदुओं का संग्रह है | जिनके लिए घनत्व फलन स्थानीय रूप से अधिकतम होता है। जिसका प्राकृतिक आकलनकर्ता केडीई का प्लग-इन है |[24][25] जहाँ और केडीई संस्करण हैं | और . आकलनों के अनुसार, का सतत आकलनकर्ता है | ध्यान दें कि कोई औसत बदलाव कलन विधि का उपयोग कर सकता है |[26][27][28] आकलनकर्ता की गणना करने के लिए संख्यात्मक रूप से होता है ।
सांख्यिकीय कार्यान्वयन
कर्नेल घनत्व आकलनकर्ताों के सॉफ्टवेयर कार्यान्वयन की गैर-विस्तृत सूची में सम्मिलित हैं |
- एनालिटिका (सॉफ्टवेयर) रिलीज 4.4 में, पीडीf परिणामों के लिए समरेखण विकल्प केडीई का उपयोग करता है, और एक्सप्रेशंस से यह बिल्ट-इन के माध्यम से उपलब्ध है |
Pdf
फलन - C (प्रोग्रामिंग लैंग्वेज)/C++ में, FIGTree लाइब्रेरी है | जिसका उपयोग सामान्य कर्नेल का उपयोग करके कर्नेल घनत्व आकलनों की गणना करने के लिए किया जा सकता है। मैटलैब इंटरफ़ेस उपलब्ध है।
- C++ में, libagf परिवर्तनीय कर्नेल घनत्व आकलन के लिए लाइब्रेरी है।
- C++ में, मायपैक लाइब्रेरी है | जो कई अलग-अलग कर्नेल का उपयोग करके केडीई की गणना कर सकता है। यह तेजी से संगणना के लिए त्रुटि सहिष्णुता समुच्चय करने की अनुमति देता है। पायथन (प्रोग्रामिंग भाषा) और आर (प्रोग्रामिंग भाषा) इंटरफेस उपलब्ध हैं।
- C शार्प (प्रोग्रामिंग लैंग्वेज) में C और f शार्प (प्रोग्रामिंग लैंग्वेज) f, मैथ.नेट न्यूमेरिक्स संख्यात्मक संगणना के लिए ओपन सोर्स लाइब्रेरी है | जिसमें सम्मिलित है .Statistics/KernelDensity.htm कर्नेल घनत्व आकलन
- क्राइमस्टैट में, कर्नेल घनत्व आकलन पांच अलग-अलग कर्नेल कार्यों का उपयोग करके कार्यान्वित किया जाता है | सामान्य, समान, क्वार्टिक, नकारात्मक घातीय और त्रिकोणीय एकल और दोहरे कर्नेल घनत्व आकलन दोनों उपलब्ध हैं। कर्नेल घनत्व आकलन का उपयोग हेड बैंग को प्रक्षेपित करने में भी किया जाता है, द्वि-आयामी जर्नी-टू-क्राइम घनत्व फलन का आकलन लगाने में, और त्रि-आयामी बायेसियन जर्नी-टू-क्राइम आकलन लगाने में होता है ।
- एल्की में, कर्नेल घनत्व कार्य पैकेज में पाए जा सकते हैं |
de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions
- पर्यावरण प्रणाली अनुसंधान संस्थान के उत्पादों में, कर्नेल घनत्व मानचित्रण को स्थानिक विश्लेषक टूलबॉक्स से प्रबंधित किया जाता है और क्वार्टिक (बायवेट) कर्नेल का उपयोग करता है।
- माइक्रोसॉफ्ट एक्सेल में, रॉयल सोसायटी ऑफ केमिस्ट्री ने उनके के आधार पर कर्नेल घनत्व आकलन चलाने के लिए ऐड-इन बनाया है। विश्लेषणात्मक विधि समिति विधि संक्षेप 4।
- कथानक में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है |
smooth kdensity
विकल्प, डेटा फ़ाइल में प्रत्येक बिंदु के लिए भार और बैंडविड्थ हो सकता है, या बैंडविड्थ को स्वचालित रूप से समुच्चय किया जा सकता है [29] सिल्वरमैन के अंगूठे के नियम के अनुसार (ऊपर देखें)। - हास्केल (प्रोग्रामिंग भाषा) में, कर्नेल घनत्व सांख्यिकी पैकेज में कार्यान्वित किया जाता है।
- इगोर प्रो में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है |
Statsकेडीई
संचालन (इगोर प्रो 7.00 में जोड़ा गया) बैंडविड्थ उपयोगकर्ता निर्दिष्ट या सिल्वरमैन, स्कॉट या बोमन और अज़ालिनी के माध्यम से आकलन लगाया जा सकता है। कर्नेल प्रकार हैं | एपेनेक्निकोव, द्वि-भार, त्रि-भार, त्रिकोणीय, गाऊसी और आयताकार है। - जावा (प्रोग्रामिंग भाषा) में, वीका (मशीन लर्निंग) पैकेज दूसरों के बीच weka.estimators.KernelEstimator प्रदान करता है।
- जावास्क्रिप्ट में, विज़ुअलाइज़ेशन पैकेज D3js|D3.js अपने विज्ञान.आँकड़े पैकेज में केडीई पैकेज प्रदान करता है।
- जेएमपी (सांख्यिकीय सॉफ्टवेयर) में, ग्राफ बिल्डर प्लेटफॉर्म द्विभाजित घनत्व के लिए समोच्च भूखंड और उच्च घनत्व क्षेत्र (एचडीआर), और अविभाजित घनत्व के लिए वायलिन भूखंड और एचडीआर प्रदान करने के लिए कर्नेल घनत्व आकलन का उपयोग करता है। स्लाइडर्स उपयोगकर्ता को बैंडविड्थ बदलने की अनुमति देते हैं। द्विचर और अविभाज्य कर्नेल घनत्व आकलन भी क्रमशः फ़िट Y द्वारा X और वितरण प्लेटफ़ॉर्म द्वारा प्रदान किए जाते हैं।
- जूलिया (प्रोग्रामिंग भाषा) में, कर्नेल घनत्व आकलन कर्नेल घनत्व.जेएल पैकेज में कार्यान्वित किया जाता है।
- मैटलैब में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है |
ksdensity
फलन (सांख्यिकी टूलबॉक्स) मैटलैब की 2018a रिलीज़ के अनुसार, बैंडविड्थ और कर्नेल स्मूथ दोनों को निर्दिष्ट किया जा सकता है | जिसमें कर्नेल घनत्व की सीमा निर्दिष्ट करने जैसे अन्य विकल्प सम्मिलित हैं। [30] वैकल्पिक रूप से, मुफ्त मैटलैब सॉफ़्टवेयर पैकेज जो स्वचालित बैंडविड्थ चयन पद्धति को प्रयुक्त करता है | [7] मैटलैब सेंट्रल फाइल एक्सचेंज के लिए उपलब्ध है |- 1-आयामी डेटा
- 2-आयामी डेटा
- n-आयामी डेटा
कर्नेल प्रतिगमन, कर्नेल के कार्यान्वयन के साथ मुफ़्त मैटलैब टूलबॉक्स घनत्व का आकलन, खतरे के कार्य का कर्नेल आकलन और कई अन्य इन पृष्ठों पर उपलब्ध है ( यह टूलबॉक्स किताब का भाग है [31]).
- गणित में, संख्यात्मक कर्नेल घनत्व आकलन फलन द्वारा कार्यान्वित किया जाता है |
SmoothKernelDistribution
[32] और सांकेतिक आकलन फलन का उपयोग कर कार्यान्वित किया जाता है |KernelMixtureDistribution
[33] दोनों ही डेटा-संचालित बैंडविथ प्रदान करते हैं। - मिनिटैब में, रॉयल सोसायटी ऑफ केमिस्ट्री ने अपनी एनालिटिकल मेथड्स कमिट टेक्निकल ब्रीफ 4 के आधार पर कर्नेल घनत्व आकलन चलाने के लिए मैक्रो बनाया है।[34]
- एनएजी न्यूमेरिकल लाइब्रेरी में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है |
g10ba
दिनचर्या (फोरट्रान दोनों में उपलब्ध है |[35] और c [36] लाइब्रेरी के संस्करण)। - नुक्लेई में, C++ कर्नेल घनत्व विधियाँ विशेष यूक्लिडियन समूह के डेटा पर ध्यान केंद्रित करती हैं |
- जीएनयू ऑक्टेव में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है |
kernel_density
विकल्प (अर्थमिति पैकेज)। - उत्पत्ति (डेटा विश्लेषण सॉफ़्टवेयर) में, इसके उपयोगकर्ता इंटरफ़ेस से 2 डी कर्नेल घनत्व प्लॉट बनाया जा सकता है और दो फलन, 1D के लिए Ks घनत्व और 2D के लिए Ks2 घनत्व इसके [1] से उपयोग किए जा सकते हैं /ltwiki/index.php?title=Category:LabTalk_Programming LabTalk], पाइथन (प्रोग्रामिंग भाषा), या C (प्रोग्रामिंग भाषा) कोड होती है ।
- पर्ल में, कार्यान्वयन सांख्यिकी-कर्नेल आकलन मॉड्यूल में पाया जा सकता है।
- पीएचपी में, कार्यान्वयन Mathपीएचपी लाइब्रेरी में पाया जा सकता है।
- पायथन (प्रोग्रामिंग भाषा) में, कई कार्यान्वयन उपस्थित हैं: पीवाईक्युटी_फिट.केडीई मॉड्यूल में P/PyQt-Fit/PyQt-Fit-1.3.4.tar.gz PyQt-Fit पैकेज, साइपी (
scipy.stats.gaussian_kde
), स्तर मॉडल (KDEMultivariate
औरKDEMultivariate
), और स्किट-सीखें (KernelDensity
) (तुलना देखें [37]). केडीईpy भारित डेटा का समर्थन करता है और इसका एफएफटी कार्यान्वयन अन्य कार्यान्वयनों की तुलना में बहुत अधिक तेज़ है। सामान्यतः उपयोग की जाने वाली पांडा लाइब्रेरी [2] प्लॉट विधि के माध्यम से केडीई प्लॉटिंग के लिए समर्थन प्रदान करती है (df.plot(kind='kde')
[3]) भारित और सहसंबद्ध एमसीएमसी नमूनों के लिए जीडिस्ट पैकेज 1D और 2D वितरण के लिए अनुकूलित बैंडविड्थ, सीमा सुधार और उच्च-क्रम विधियों का समर्थन करता है। कर्नेल घनत्व आकलन के लिए नया उपयोग किया जाने वाला पैकेज सीबॉर्न है | (import seaborn as sns
,sns.kdeplot()
).[38] केडीई का जीपीयू कार्यान्वयन भी उपस्थित है।[39] - R (प्रोग्रामिंग लैंग्वेज) में इसके द्वारा इम्प्लीमेंट किया जाता है |
density
आधार वितरण में, औरbw.nrd0
फलन का उपयोग सांख्यिकी पैकेज में किया जाता है | यह फलन सिल्वरमैन की पुस्तक में अनुकूलित सूत्र का उपयोग करता है।bkde
केर्नस्मूथ लाइब्रेरी में,ParetoDensityEstimation
डेटा विज़ुअलाइज़ेशन लाइब्रेरी में (पेरेटो वितरण घनत्व आकलन के लिए),kde
ks लाइब्रेरी में,dkden
औरdbckden
एवमिक्स लाइब्रेरी में (बाउंडेड समर्थन के लिए बाउंड्री करेक्टेड कर्नेल घनत्व एस्tमेशन के लिए बाद में),npudens
np लाइब्रेरी (संख्यात्मक और श्रेणीबद्ध चर) में,sm.density
एसएम लाइब्रेरी में। के क्रियान्वयन के लिएkde.R
फलन, जिसे किसी पैकेज या लाइब्रेरी को स्थापित करने की आवश्यकता नहीं है | केडीई.आर देखें। btb लाइब्रेरी, विश्लेषण के लिए समर्पित, कर्नेल घनत्व आकलन को प्रयुक्त करता है |kernel_smoothing
. - एसएएस (सॉफ्टवेयर) में,
proc kde
अविभाजित और द्विभाजित कर्नेल घनत्व का आकलन लगाने के लिए उपयोग किया जा सकता है। - अपाचे स्पार्क में,
KernelDensity()
कक्षा [40] था में, इसे किसके द्वारा कार्यान्वित किया जाता हैkdensity
[41] उदाहरण के लिएhistogram x, kdensity
. वैकल्पिक रूप से मुफ़्त स्टाटा मॉड्यूल केडीईएनएस उपलब्ध है | [42] उपयोगकर्ता को 1डी या 2डी घनत्व कार्यों का आकलन लगाने की अनुमति देता है। - स्विफ्ट (प्रोग्रामिंग भाषा) में इसके
स्विफ्टस्टैट्स.KernelDensityEstimation
ओपन-सोर्स स्टैटिस्टिक्स लाइब्रेरी स्विफ्टस्टैट्स में द्वारा क्रियान्वित किया जाता है ।
यह भी देखें
- कर्नेल (सांख्यिकी)
- कर्नेल कर्नेल
- कर्नेल प्रतिगमन
- घनत्व का आकलन (अन्य उदाहरणों की प्रस्तुति के साथ)
- मीन-शिफ्ट
- स्केल स्पेस: त्रिक {(x, h, केडीई बैंडविड्थ h के साथ x पर मूल्यांकित: सभी x, h > 0} डेटा का स्केल स्पेस प्रतिनिधित्व बनाते हैं।
- बहुभिन्नरूपी कर्नेल घनत्व आकलन
- परिवर्तनीय कर्नेल घनत्व आकलन
- सिर/टेल टूटना। सिर/टेल टूटना
अग्रिम पठन
- Härdle, Müller, Sperlich, Werwatz, Nonparametric and Semiparametric Methods, Springer-Verlag Berlin Heidelberg 2004, pp. 39–83
संदर्भ
- ↑ 1.0 1.1 Rosenblatt, M. (1956). "घनत्व समारोह के कुछ गैर पैरामीट्रिक अनुमानों पर टिप्पणियां". The Annals of Mathematical Statistics. 27 (3): 832–837. doi:10.1214/aoms/1177728190.
- ↑ 2.0 2.1 Parzen, E. (1962). "संभावना घनत्व समारोह और मोड के अनुमान पर". The Annals of Mathematical Statistics. 33 (3): 1065–1076. doi:10.1214/aoms/1177704472. JSTOR 2237880.
- ↑ 3.0 3.1 Piryonesi S. Madeh; El-Diraby Tamer E. (2020-06-01). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/JPEODX.0000175.
- ↑ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. (2001). The Elements of Statistical Learning : Data Mining, Inference, and Prediction : with 200 full-color illustrations. New York: Springer. ISBN 0-387-95284-5. OCLC 46809224.
- ↑ Epanechnikov, V.A. (1969). "एक बहुभिन्नरूपी संभाव्यता घनत्व का गैर-पैरामीट्रिक अनुमान". Theory of Probability and Its Applications. 14: 153–158. doi:10.1137/1114019.
- ↑ Wand, M.P; Jones, M.C. (1995). कर्नेल स्मूथिंग. London: Chapman & Hall/CRC. ISBN 978-0-412-55270-0.
- ↑ 7.0 7.1 7.2 7.3 Botev, Zdravko (2007). प्रसार मिश्रण के माध्यम से गैर पैरामीट्रिक घनत्व अनुमान (Technical report). University of Queensland.
- ↑ Scott, D. (1979). "इष्टतम और डेटा-आधारित हिस्टोग्राम पर". Biometrika. 66 (3): 605–610. doi:10.1093/biomet/66.3.605.
- ↑ Park, B.U.; Marron, J.S. (1990). "डेटा-संचालित बैंडविड्थ चयनकर्ताओं की तुलना". Journal of the American Statistical Association. 85 (409): 66–72. CiteSeerX 10.1.1.154.7321. doi:10.1080/01621459.1990.10475307. JSTOR 2289526.
- ↑ Park, B.U.; Turlach, B.A. (1992). "कई डेटा चालित बैंडविड्थ चयनकर्ताओं का व्यावहारिक प्रदर्शन (चर्चा के साथ)". Computational Statistics. 7: 251–270.
- ↑ Cao, R.; Cuevas, A.; Manteiga, W. G. (1994). "घनत्व अनुमान में कई चौरसाई विधियों का तुलनात्मक अध्ययन". Computational Statistics and Data Analysis. 17 (2): 153–176. doi:10.1016/0167-9473(92)00066-Z.
- ↑ Jones, M.C.; Marron, J.S.; Sheather, S. J. (1996). "घनत्व अनुमान के लिए बैंडविड्थ चयन का एक संक्षिप्त सर्वेक्षण". Journal of the American Statistical Association. 91 (433): 401–407. doi:10.2307/2291420. JSTOR 2291420.
- ↑ Sheather, S.J. (1992). "कुछ वास्तविक डेटा सेटों पर छह लोकप्रिय बैंडविड्थ चयन विधियों का प्रदर्शन (चर्चा के साथ)". Computational Statistics. 7: 225–250, 271–281.
- ↑ Agarwal, N.; Aluru, N.R. (2010). "एमईएमएस में अनिश्चितता मात्रा का ठहराव के लिए एक डेटा-संचालित स्टोकेस्टिक सहस्थापन दृष्टिकोण" (PDF). International Journal for Numerical Methods in Engineering. 83 (5): 575–597. Bibcode:2010IJNME..83..575A. doi:10.1002/nme.2844.
- ↑ Xu, X.; Yan, Z.; Xu, S. (2015). "विसरण आधारित कर्नेल घनत्व विधि द्वारा पवन गति संभाव्यता वितरण का अनुमान लगाना". Electric Power Systems Research. 121: 28–37. doi:10.1016/j.epsr.2014.11.029.
- ↑ Botev, Z.I.; Grotowski, J.F.; Kroese, D.P. (2010). "प्रसार के माध्यम से कर्नेल घनत्व का अनुमान". Annals of Statistics. 38 (5): 2916–2957. arXiv:1011.2602. doi:10.1214/10-AOS799. S2CID 41350591.
- ↑ 17.0 17.1 Sheather, S.J.; Jones, M.C. (1991). "कर्नेल घनत्व अनुमान के लिए एक विश्वसनीय डेटा-आधारित बैंडविड्थ चयन विधि". Journal of the Royal Statistical Society, Series B. 53 (3): 683–690. doi:10.1111/j.2517-6161.1991.tb01857.x. JSTOR 2345597.
- ↑ Rudemo, M. (1982). "हिस्टोग्राम और कर्नेल घनत्व अनुमानक का अनुभवजन्य विकल्प". Scandinavian Journal of Statistics. 9 (2): 65–78. JSTOR 4615859.
- ↑ Bowman, A.W. (1984). "घनत्व अनुमानों के चौरसाई के लिए क्रॉस-वैलिडेशन का एक वैकल्पिक तरीका". Biometrika. 71 (2): 353–360. doi:10.1093/biomet/71.2.353.
- ↑ Hall, P.; Marron, J.S.; Park, B.U. (1992). "चिकना क्रॉस-सत्यापन". Probability Theory and Related Fields. 92: 1–20. doi:10.1007/BF01205233. S2CID 121181481.
- ↑ Wahba, G. (1975). "घनत्व अनुमान के लिए चर गाँठ, कर्नेल और ऑर्थोगोनल श्रृंखला विधियों के इष्टतम अभिसरण गुण". Annals of Statistics. 3 (1): 15–29. doi:10.1214/aos/1176342997.
- ↑ Buch-Larsen, TINE (2005). "चेम्परनाउन परिवर्तन का उपयोग करते हुए भारी-पूंछ वाले वितरण के लिए कर्नेल घनत्व का अनुमान". Statistics. 39 (6): 503–518. CiteSeerX 10.1.1.457.1544. doi:10.1080/02331880500439782. S2CID 219697435.
- ↑ 23.0 23.1 Silverman, B.W. (1986). सांख्यिकी और डेटा विश्लेषण के लिए घनत्व आकलन. London: Chapman & Hall/CRC. p. 45. ISBN 978-0-412-24620-3.
- ↑ Chen, Yen-Chi; Genovese, Christopher R.; Wasserman, Larry (2016). "मोड क्लस्टरिंग के लिए एक व्यापक दृष्टिकोण". Electronic Journal of Statistics. 10 (1): 210–241. doi:10.1214/15-ejs1102. ISSN 1935-7524.
- ↑ Chazal, Frédéric; Fasy, Brittany Terese; Lecci, Fabrizio; Rinaldo, Alessandro; Wasserman, Larry (2014). "दृढ़ता परिदृश्य और सिल्हूट का स्टोकेस्टिक अभिसरण". Annual Symposium on Computational Geometry - SOCG'14. New York, New York, USA: ACM Press. 6 (2): 474–483. doi:10.1145/2582112.2582128. ISBN 978-1-4503-2594-3. S2CID 6029340.
- ↑ Fukunaga, K.; Hostetler, L. (January 1975). "पैटर्न पहचान में अनुप्रयोगों के साथ घनत्व फ़ंक्शन के ढाल का अनुमान". IEEE Transactions on Information Theory. 21 (1): 32–40. doi:10.1109/tit.1975.1055330. ISSN 0018-9448.
- ↑ Yizong Cheng (1995). "मीन शिफ्ट, मोड सीकिंग और क्लस्टरिंग". IEEE Transactions on Pattern Analysis and Machine Intelligence. 17 (8): 790–799. doi:10.1109/34.400568. ISSN 0162-8828.
- ↑ Comaniciu, D.; Meer, P. (May 2002). "Mean shift: a robust approach toward feature space analysis". IEEE Transactions on Pattern Analysis and Machine Intelligence. 24 (5): 603–619. doi:10.1109/34.1000236. ISSN 0162-8828.
- ↑ Janert, Philipp K (2009). Gnuplot in action : understanding data with graphs. Connecticut, USA: Manning Publications. ISBN 978-1-933988-39-9. See section 13.2.2 entitled Kernel density estimates.
- ↑ "अविभाजित और द्विभाजित डेटा के लिए कर्नेल स्मूथिंग फ़ंक्शन अनुमान - MATLAB ksdensity". www.mathworks.com. Retrieved 2020-11-05.
- ↑ Horová, I.; Koláček, J.; Zelinka, J. (2012). Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing. Singapore: World Scientific Publishing. ISBN 978-981-4405-48-5.
- ↑ "SmoothKernelDistribution—Wolfram Language Documentation". reference.wolfram.com. Retrieved 2020-11-05.
- ↑ "KernelMixtureDistribution—Wolfram Language Documentation". reference.wolfram.com. Retrieved 2020-11-05.
- ↑ "कर्नेल घनत्व की गणना के लिए सॉफ्टवेयर". www.rsc.org. Retrieved 2020-11-05.
- ↑ The Numerical Algorithms Group. "NAG Library Routine Document: nagf_smooth_kerndens_gauss (g10baf)" (PDF). NAG Library Manual, Mark 23. Retrieved 2012-02-16.
- ↑ The Numerical Algorithms Group. "NAG Library Routine Document: nag_kernel_density_estim (g10bac)" (PDF). NAG Library Manual, Mark 9. Archived from the original (PDF) on 2011-11-24. Retrieved 2012-02-16.
- ↑ Vanderplas, Jake (2013-12-01). "पायथन में कर्नेल घनत्व अनुमान". Retrieved 2014-03-12.
- ↑ "seaborn.kdeplot — seaborn 0.10.1 documentation". seaborn.pydata.org. Retrieved 2020-05-12.
- ↑ "Kde-gpu: We implemented nadaraya waston kernel density and kernel conditional probability estimator using cuda through cupy. It is much faster than cpu version but it requires GPU with high memory".
- ↑ "Basic Statistics - RDD-based API - Spark 3.0.1 Documentation". spark.apache.org. Retrieved 2020-11-05.
- ↑ https://www.stata.com/manuals15/rkdensity.pdf[bare URL PDF]
- ↑ Jann, Ben (2008-05-26), KDENS: Stata module for univariate kernel density estimation, Boston College Department of Economics, retrieved 2022-10-15
बाहरी संबंध
- Introduction to kernel density estimation A short tutorial which motivates kernel density estimators as an improvement over histograms.
- Kernel Bandwidth Optimization A free online tool that generates an optimized kernel density estimate.
- Free Online Software (Calculator) computes the Kernel Density Estimation for a data series according to the following Kernels: Gaussian, एपेनेक्निकोव, Rectangular, Triangular, Biweight, Cosine, and Optcosine.
- Kernel Density Estimation Applet An online interactive example of kernel density estimation. Requires .NET 3.0 or later.