कर्नेल घनत्व अनुमान

From Vigyanwiki
विभिन्न कर्नेल बैंडविड्थ का उपयोग करके 100 सामान्य वितरण यादृच्छिक संख्या संचालक का कर्नेल घनत्व आकलन।

सांख्यिकी में, कर्नेल घनत्व आकलन (केडीई) प्रायिकता घनत्व आकलन के लिए कर्नेल समरेखण का अनुप्रयोग है, अर्थात, गैर-पैरामीट्रिक सांख्यिकी विधि कर्नेल (सांख्यिकी) के आधार पर यादृच्छिक चर के प्रायिकता घनत्व फलन का आकलन लगाने के लिए भार फलन के रूप में केडीई मौलिक डेटा समरेखण समस्या का उत्तर देता है | जहां परिमित डेटा सांख्यिकीय नमूने के आधार पर सांख्यिकीय जनसंख्या के बारे में आकलन लगाया जाता है। अर्थमिति जैसे कुछ क्षेत्रों में इसे एमानुएल परजेन और मरे रोसेनब्लैट के बाद पारजेन-रोसेनब्लैट विंडो विधि भी कहा जाता है | जिन्हें सामान्यतः स्वतंत्र रूप से इसके वर्तमान रूप में बनाने का श्रेय दिया जाता है।[1][2] कर्नेल घनत्व आकलन के प्रसिद्ध अनुप्रयोगों में से वर्ग-सशर्त सीमांत वितरण का आकलन लगाने में है | नैव बेयस वर्गीकारक का उपयोग करते समय डेटा की सीमांत संभाव्यता घनत्व फलन है |[3][4] जो इसकी पूर्वानुमान स्पष्टता में सुधार कर सकता है।[3]

परिभाषा

माना (x1, x2, ..., xn) किसी भी बिंदु x पर अज्ञात घनत्व के साथ कुछ अविभाज्य वितरण से खींचे गए स्वतंत्र और समान रूप से वितरित यादृच्छिक चर नमूने हैं। हम इस फलन ƒ के आकार का अनुमान लगाने में रुचि रखते हैं। इसका कर्नेल घनत्व आकलनकर्ता है |

जहाँ K कर्नेल (सांख्यिकी) है | गैर-पैरामीट्रिक सांख्यिकी में गैर-नकारात्मक कार्य और h > 0 कर्नेल मापदंड है | जिसे बैंडविड्थ कहा जाता है। सबस्क्रिप्ट h वाले कर्नेल को स्केल्ड कर्नेल कहा जाता है और इसे Kh(x) = 1/h K(x/h) परिभाषित किया जाता है | सहज रूप से कोई h को उतना ही छोटा चुनना चाहता है | जितना डेटा अनुमति देता है | चूँकि, आकलनकर्ता के पूर्वाग्रह और इसके विचरण के बीच सदैव समझौता होता है। बैंडविड्थ पर नीचे और अधिक विस्तार से चर्चा की गई है।

कर्नेल (सांख्यिकी) की श्रृंखला सामान्य उपयोग में कर्नेल फलन सामान्यतः उपयोग किए जाते हैं | त्रिकोणीय, द्विभाजित, ट्राइवेट, एपेनेक्निकोव, सामान्य, और अन्य एपेनेक्निकोव कर्नेल औसत वर्ग त्रुटि अर्थ में इष्टतम है | [5] चूँकि पहले सूचीबद्ध कर्नेल के लिए दक्षता का हानि छोटा है।[6] इसके सुविधाजनक गणितीय गुणों के कारण, सामान्य कर्नेल का अधिकांशतः उपयोग किया जाता है, जिसका K(x) = ϕ(x) अर्थ है | जहां ϕ मानक सामान्य घनत्व फलन है।

कर्नेल घनत्व आकलन का निर्माण घनत्व आकलन के बाहर के क्षेत्रों में व्याख्या पाता है।[7] उदाहरण के लिए, ऊष्मप्रवैगिकी में, यह उत्पन्न होने वाली ऊष्मा की मात्रा के समान है | जब ऊष्मा कर्नेल (ऊष्मा समीकरण का मूल समाधान) प्रत्येक डेटा बिंदु स्थानों xi पर रखी जाती है | मैनिफोल्ड सीखने (जैसे प्रसार मानचित्र) के लिए बिंदु बादलों पर असतत लाप्लास संचालक के निर्माण के लिए इसी तरह के विधियों का उपयोग किया जाता है।

उदाहरण

कर्नेल घनत्व आकलन हिस्टोग्राम से निकटता से संबंधित हैं | किन्तु उपयुक्त कर्नेल का उपयोग करके चिकनाई या निरंतरता जैसे गुणों से संपन्न किया जा सकता है। इन 6 डेटा बिंदुओं पर आधारित नीचे दिया गया आरेख इस संबंध को दर्शाता है |

सैंपल 1 2 3 4 5 6
मूल्य -2.1 -1.3 -0.4 1.9 5.1 6.2

हिस्टोग्राम के लिए, सबसे पहले, क्षैतिज अक्ष को उप-अंतराल या डिब्बे में विभाजित किया जाता है | जो डेटा की सीमा को कवर करता है | इस स्थिति में, प्रत्येक चौड़ाई 2 के छह डिब्बे जब भी कोई डेटा बिंदु इस अंतराल के अंदर आता है | ऊंचाई 1 का बॉक्स /12 वहां रखा गया है। यदि एक ही बिन में से अधिक डेटा पॉइंट गिरते हैं, तो बॉक्स एक दूसरे के ऊपर ढेर हो जाते हैं।

कर्नेल घनत्व आकलन के लिए, 2.25 प्रसरण वाले सामान्य कर्नेल (लाल धराशायी रेखाओं द्वारा संकेत) प्रत्येक डेटा बिंदु xi पर रखे जाते हैं | कर्नेल घनत्व आकलन (ठोस नीला वक्र) बनाने के लिए कर्नेल का योग किया जाता है। कर्नेल घनत्व आकलन की चिकनाई (हिस्टोग्राम की असततता की तुलना में) दर्शाती है कि कैसे कर्नेल घनत्व आकलन निरंतर यादृच्छिक चर के लिए वास्तविक अंतर्निहित घनत्व में तेज़ी से अभिसरण करता है।[8]

Comparison of the histogram (बाएं) और कर्नेल घनत्व अनुमान (दाएं) समान डेटा का उपयोग करके निर्मित। छह अलग-अलग गुठली लाल धराशायी वक्र हैं, कर्नेल घनत्व नीले घटता का अनुमान लगाता है। डेटा बिंदु क्षैतिज अक्ष पर गलीचा भूखंड हैं। समान डेटा का उपयोग करके निर्मित हिस्टोग्राम (बाएं) और कर्नेल घनत्व अनुमान (दाएं) की तुलना। छह अलग-अलग गुठली लाल धराशायी वक्र हैं, कर्नेल घनत्व नीले घटता का अनुमान लगाता है। डेटा बिंदु क्षैतिज अक्ष पर गलीचा प्लॉट हैं।

बैंडविड्थ चयन

मानक सामान्य वितरण से 100 अंकों के यादृच्छिक नमूने के विभिन्न बैंडविड्थ के साथ कर्नेल घनत्व आकलन (केडीई)। ग्रे: वास्तविक घनत्व (मानक सामान्य)। लाल: h = 0.05 के साथ केडीई। काला: केडीई h = 0.337 के साथ। हरा: केडीई h = 2 के साथ।

कर्नेल की बैंडविड्थ (कंप्यूटिंग) मुक्त मापदंड है | जो परिणामी आकलन पर शक्तिशाली प्रभाव प्रदर्शित करता है। इसके प्रभाव को स्पष्ट करने के लिए, हम मानक सामान्य वितरण (क्षैतिज अक्ष पर गलीचा भूखंड में नीले स्पाइक्स पर प्लॉट किए गए) से सिम्युलेटेड रैंडम नंबर संचालक लेते हैं। धूसर वक्र वास्तविक घनत्व है (औसत 0 और विचरण 1 के साथ सामान्य घनत्व)। इसकी तुलना में, लाल वक्र कम चिकना है | क्योंकि इसमें बैंडविड्थ h = 0.05 का उपयोग करने से उत्पन्न होने वाले बहुत से नकली डेटा आर्टिफैक्ट हैं | जो बहुत छोटा है। बैंडविड्थ h = 2 का उपयोग करने के बाद से हरे रंग की वक्र बहुत अधिक अंतर्निहित संरचना को अस्पष्ट करती है। h = 0.337 की बैंडविड्थ के साथ काले वक्र को इष्टतम रूप से चिकना माना जाता है | क्योंकि इसका घनत्व आकलन वास्तविक घनत्व के निकट है। विकट स्थिति का सामना करना पड़ता है (कोई समरेखण नहीं), जहां आकलन विश्लेषित नमूनों के निर्देशांक पर केंद्रित एन डिराक डेल्टा फलन का योग है। दूसरी चरम सीमा में आकलन उपयोग किए गए कर्नेल के आकार को बरकरार रखता है | जो नमूनों के माध्य (पूरी तरह से चिकनी) पर केंद्रित होता है।

इस मापदंड का चयन करने के लिए उपयोग किया जाने वाला सबसे सामान्य इष्टतमता मानदंड अपेक्षित L2 है | कठिन परिस्थिति कार्य, जिसे माध्य एकीकृत चुकता त्रुटि भी कहा जाता है |

ƒ और K पर अशक्त मान्यताओं के अनुसार, (ƒ सामान्यतः अज्ञात, वास्तविक घनत्व फलन है),[1][2]

जहां oi नोटेशन है, और एन नमूना आकार (ऊपर के रूप में) एमिस स्पर्शोन्मुख एमआईएसई है। दो प्रमुख शब्द,

जहाँ फलन जी के लिए, और का दूसरा व्युत्पन्न है और कर्नेल है। इस एमिस का न्यूनतम इस अवकल समीकरण का हल है |

या

न तो एमिस और न ही hएमिस सूत्रों का सीधे उपयोग किया जा सकता है | क्योंकि वे अज्ञात घनत्व फलन को सम्मिलित करते हैं | या इसका दूसरा व्युत्पन्न . उस कठिनाई को दूर करने के लिए, बैंडविड्थ का चयन करने के लिए विभिन्न प्रकार की स्वचालित, डेटा-आधारित विधियाँ विकसित की गई हैं। उनकी प्रभावशीलता की तुलना करने के लिए कई समीक्षा अध्ययन किए गए हैं,[9][10][11][12][13][14][15] सामान्य सहमति के साथ कि प्लग-इन चयनकर्ता [7][16][17] और क्रॉस-सत्यापन (सांख्यिकी) चयनकर्ता [18][19][20] डेटा समुच्चय की विस्तृत श्रृंखला में सबसे उपयोगी हैं।

एमिस में एएमआईएसई के रूप में समान स्पर्शोन्मुख क्रम n−1/5 वाले किसी भी बैंडविड्थ h को प्रतिस्थापित करने से एमिस (h) = O(n-4/5) मिलता है | जहाँ O बड़ा o अंकन है। यह दिखाया जा सकता है कि अशक्त धारणाओं के अनुसार गैर-पैरामीट्रिक अनुमानक उपस्थित नहीं हो सकता है | जो कर्नेल अनुमानक की तुलना में तेज गति से अभिसरण करता है। [21] ध्यान दें कि n−4/5 दर पैरामीट्रिक विधियों की विशिष्ट n−1 अभिसरण दर से धीमी है।

यदि बैंडविड्थ को निश्चित नहीं रखा गया है | किन्तु आकलन (बैलून आकलनकर्ता) या नमूने (बिंदुवार आकलनकर्ता) के स्थान के आधार पर भिन्न होता है, तो यह विशेष रूप से शक्तिशाली विधि का उत्पादन करता है | जिसे चर कर्नेल घनत्व आकलन कहा जाता है।

हेवी-टेल्ड डिस्ट्रीब्यूशन के कर्नेल घनत्व आकलन के लिए बैंडविड्थ चयन अपेक्षाकृत कठिन है।[22]

सामान्य बैंडविड्थ आकलनकर्ता

यदि गॉसियन आधार फलन का उपयोग लगभग एकतरफा डेटा के लिए किया जाता है, और अंतर्निहित घनत्व का आकलन गॉसियन है, तो h के लिए इष्टतम विकल्प (अर्थात, बैंडविड्थ जो औसत एकीकृत चुकता त्रुटि को कम करता है) है |[23]

मूल्य को और अधिक शक्तिशाली माना जाता है | जब यह लंबी-टेल वाले और तिरछे वितरण के लिए या बिमोडल मिश्रण वितरण के लिए फिट में सुधार करता है। यह अधिकांशतः अनुभभार्य रूप से मानक विचलन को बदलकर किया जाता है | मापदंड द्वारा नीचे है |

जहाँ अन्तःचतुर्थक श्रेणी इंटरक्वेर्टाइल स्तर है।
Comparison between rule of thumb and solve-द-इक्वेशन बैंडविड्थ
रूल ऑफ थंब और सॉल्व-द-इक्वेशन बैंडविड्थ के बीच तुलना।

मॉडल में सुधार करने वाला और संशोधन कारक को 1.06 से 0.9 तक कम करना है। तब अंतिम सूत्र होगा |

जहाँ नमूना आकार है।

इस सन्निकटन को सामान्य वितरण सन्निकटन, गॉसियन सन्निकटन या बर्नार्ड सिल्वरमैन के अंगूठे का नियम कहा जाता है।[23] जबकि अंगूठे के इस नियम की गणना करना सरल है | इसे सावधानी के साथ प्रयोग किया जाना चाहिए | क्योंकि घनत्व सामान्य होने के निकट नहीं होने पर यह व्यापक रूप से गलत आकलन लगा सकता है।

उदाहरण के लिए, बिमॉडल गॉसियन मिश्रण मॉडल का आकलन करते समय होता है |

200 बिंदुओं के नमूने से, दाईं ओर का आंकड़ा सही घनत्व और दो कर्नेल घनत्व आकलन दिखाता है | रूल ऑफ़ थंब बैंडविड्थ का उपयोग करके, और दूसरा समीकरण-समीकरण बैंडविड्थ का उपयोग करके [7][17] रूल-ऑफ-थंब बैंडविड्थ पर आधारित आकलन अधिक सीमा तक ओवरस्मूथ किया गया है।

विशेषता फलन घनत्व आकलनकर्ता से संबंध दिया गया नमूना (x1, x2, ..., xn), विशिष्ट कार्य (संभावना सिद्धांत) φ(t) = E[eitX] का आकलन लगाना स्वाभाविक है | जैसा

विशेषता फलन को जानने के बाद, फूरियर रूपांतरण सूत्र के माध्यम से संबंधित प्रायिकता घनत्व फलन को खोजना संभव है। इस व्युत्क्रम सूत्र को प्रयुक्त करने में कठिनाई यह है कि यह आकलन के बाद से अपसारी अभिन्न की ओर जाता है | बड़े t के लिए अविश्वसनीय है। इस समस्या को दरकिनार करने के लिए, आकलनकर्ता फलन से गुणा किया जाता है |ψh(t) = ψ(ht), जो मूल बिंदु पर 1 के समान है और फिर अनंत पर 0 तक गिर जाता है। "बैंडविड्थ मापदंड" h नियंत्रित करता है कि हम कितनी तेजी से फलन को कम करने की प्रयास करते हैं | विशेष रूप से जब h छोटा होता है, तब ψh (t) t की बड़ी श्रृंखला के लिए लगभग एक होगा, जिसका अर्थ है कि t के सबसे महत्वपूर्ण क्षेत्र में व्यावहारिक रूप से अपरिवर्तित रहता है।

फलन ψψ(t) = 1{−1 ≤ t ≤ 1 के लिए सबसे सामान्य विकल्प या तो एकसमान फलन है | जिसका प्रभावी अर्थ उलटा सूत्र में एकीकरण के अंतराल को छोटा करना है | [−1/h, 1/h], या गाऊसी फलन ψ(t) = eπt2. एक बार फलन ψ चुने जाने के बाद, व्युत्क्रम सूत्र प्रयुक्त किया जा सकता है |

जहां K डंपिंग फलन ψ का फूरियर रूपांतरण है। इस प्रकार कर्नेल घनत्व आकलनकर्ता विशेषता फलन घनत्व आकलनकर्ता के साथ मेल खाता है।

ज्यामितीय और सामयिक विशेषताएं

हम (वैश्विक) मोड की परिभाषा को स्थानीय अर्थ में बढ़ा सकते हैं और स्थानीय मोड को परिभाषित कर सकते हैं |

अर्थात्, उन बिंदुओं का संग्रह है | जिनके लिए घनत्व फलन स्थानीय रूप से अधिकतम होता है। जिसका प्राकृतिक आकलनकर्ता केडीई का प्लग-इन है |[24][25] जहाँ और केडीई संस्करण हैं | और . आकलनों के अनुसार, का सतत आकलनकर्ता है | ध्यान दें कि कोई औसत बदलाव कलन विधि का उपयोग कर सकता है |[26][27][28] आकलनकर्ता की गणना करने के लिए संख्यात्मक रूप से होता है ।

सांख्यिकीय कार्यान्वयन

कर्नेल घनत्व आकलनकर्ताों के सॉफ्टवेयर कार्यान्वयन की गैर-विस्तृत सूची में सम्मिलित हैं |

  • एनालिटिका (सॉफ्टवेयर) रिलीज 4.4 में, पीडीf परिणामों के लिए समरेखण विकल्प केडीई का उपयोग करता है, और एक्सप्रेशंस से यह बिल्ट-इन के माध्यम से उपलब्ध है | Pdf फलन
  • C (प्रोग्रामिंग लैंग्वेज)/C++ में, FIGTree लाइब्रेरी है | जिसका उपयोग सामान्य कर्नेल का उपयोग करके कर्नेल घनत्व आकलनों की गणना करने के लिए किया जा सकता है। मैटलैब इंटरफ़ेस उपलब्ध है।
  • C++ में, libagf परिवर्तनीय कर्नेल घनत्व आकलन के लिए लाइब्रेरी है।
  • C++ में, मायपैक लाइब्रेरी है | जो कई अलग-अलग कर्नेल का उपयोग करके केडीई की गणना कर सकता है। यह तेजी से संगणना के लिए त्रुटि सहिष्णुता समुच्चय करने की अनुमति देता है। पायथन (प्रोग्रामिंग भाषा) और आर (प्रोग्रामिंग भाषा) इंटरफेस उपलब्ध हैं।
  • C शार्प (प्रोग्रामिंग लैंग्वेज) में C और f शार्प (प्रोग्रामिंग लैंग्वेज) f, मैथ.नेट न्यूमेरिक्स संख्यात्मक संगणना के लिए ओपन सोर्स लाइब्रेरी है | जिसमें सम्मिलित है .Statistics/KernelDensity.htm कर्नेल घनत्व आकलन
  • क्राइमस्टैट में, कर्नेल घनत्व आकलन पांच अलग-अलग कर्नेल कार्यों का उपयोग करके कार्यान्वित किया जाता है | सामान्य, समान, क्वार्टिक, नकारात्मक घातीय और त्रिकोणीय एकल और दोहरे कर्नेल घनत्व आकलन दोनों उपलब्ध हैं। कर्नेल घनत्व आकलन का उपयोग हेड बैंग को प्रक्षेपित करने में भी किया जाता है, द्वि-आयामी जर्नी-टू-क्राइम घनत्व फलन का आकलन लगाने में, और त्रि-आयामी बायेसियन जर्नी-टू-क्राइम आकलन लगाने में होता है ।
  • एल्की में, कर्नेल घनत्व कार्य पैकेज में पाए जा सकते हैं | de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions
  • पर्यावरण प्रणाली अनुसंधान संस्थान के उत्पादों में, कर्नेल घनत्व मानचित्रण को स्थानिक विश्लेषक टूलबॉक्स से प्रबंधित किया जाता है और क्वार्टिक (बायवेट) कर्नेल का उपयोग करता है।
  • माइक्रोसॉफ्ट एक्सेल में, रॉयल सोसायटी ऑफ केमिस्ट्री ने उनके के आधार पर कर्नेल घनत्व आकलन चलाने के लिए ऐड-इन बनाया है। विश्लेषणात्मक विधि समिति विधि संक्षेप 4
  • कथानक में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | smooth kdensity विकल्प, डेटा फ़ाइल में प्रत्येक बिंदु के लिए भार और बैंडविड्थ हो सकता है, या बैंडविड्थ को स्वचालित रूप से समुच्चय किया जा सकता है [29] सिल्वरमैन के अंगूठे के नियम के अनुसार (ऊपर देखें)।
  • हास्केल (प्रोग्रामिंग भाषा) में, कर्नेल घनत्व सांख्यिकी पैकेज में कार्यान्वित किया जाता है।
  • इगोर प्रो में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | Statsकेडीई संचालन (इगोर प्रो 7.00 में जोड़ा गया) बैंडविड्थ उपयोगकर्ता निर्दिष्ट या सिल्वरमैन, स्कॉट या बोमन और अज़ालिनी के माध्यम से आकलन लगाया जा सकता है। कर्नेल प्रकार हैं | एपेनेक्निकोव, द्वि-भार, त्रि-भार, त्रिकोणीय, गाऊसी और आयताकार है।
  • जावा (प्रोग्रामिंग भाषा) में, वीका (मशीन लर्निंग) पैकेज दूसरों के बीच weka.estimators.KernelEstimator प्रदान करता है।
  • जावास्क्रिप्ट में, विज़ुअलाइज़ेशन पैकेज D3js|D3.js अपने विज्ञान.आँकड़े पैकेज में केडीई पैकेज प्रदान करता है।
  • जेएमपी (सांख्यिकीय सॉफ्टवेयर) में, ग्राफ बिल्डर प्लेटफॉर्म द्विभाजित घनत्व के लिए समोच्च भूखंड और उच्च घनत्व क्षेत्र (एचडीआर), और अविभाजित घनत्व के लिए वायलिन भूखंड और एचडीआर प्रदान करने के लिए कर्नेल घनत्व आकलन का उपयोग करता है। स्लाइडर्स उपयोगकर्ता को बैंडविड्थ बदलने की अनुमति देते हैं। द्विचर और अविभाज्य कर्नेल घनत्व आकलन भी क्रमशः फ़िट Y द्वारा X और वितरण प्लेटफ़ॉर्म द्वारा प्रदान किए जाते हैं।
  • जूलिया (प्रोग्रामिंग भाषा) में, कर्नेल घनत्व आकलन कर्नेल घनत्व.जेएल पैकेज में कार्यान्वित किया जाता है।
  • मैटलैब में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | ksdensity फलन (सांख्यिकी टूलबॉक्स) मैटलैब की 2018a रिलीज़ के अनुसार, बैंडविड्थ और कर्नेल स्मूथ दोनों को निर्दिष्ट किया जा सकता है | जिसमें कर्नेल घनत्व की सीमा निर्दिष्ट करने जैसे अन्य विकल्प सम्मिलित हैं। [30] वैकल्पिक रूप से, मुफ्त मैटलैब सॉफ़्टवेयर पैकेज जो स्वचालित बैंडविड्थ चयन पद्धति को प्रयुक्त करता है | [7] मैटलैब सेंट्रल फाइल एक्सचेंज के लिए उपलब्ध है |
  • गणित में, संख्यात्मक कर्नेल घनत्व आकलन फलन द्वारा कार्यान्वित किया जाता है | SmoothKernelDistribution[32] और सांकेतिक आकलन फलन का उपयोग कर कार्यान्वित किया जाता है | KernelMixtureDistribution[33] दोनों ही डेटा-संचालित बैंडविथ प्रदान करते हैं।
  • मिनिटैब में, रॉयल सोसायटी ऑफ केमिस्ट्री ने अपनी एनालिटिकल मेथड्स कमिट टेक्निकल ब्रीफ 4 के आधार पर कर्नेल घनत्व आकलन चलाने के लिए मैक्रो बनाया है।[34]
  • एनएजी न्यूमेरिकल लाइब्रेरी में, कर्नेल घनत्व आकलन के माध्यम से कार्यान्वित किया जाता है | g10ba दिनचर्या (फोरट्रान दोनों में उपलब्ध है |[35] और c [36] लाइब्रेरी के संस्करण)।
  • नुक्लेई में, C++ कर्नेल घनत्व विधियाँ विशेष यूक्लिडियन समूह के डेटा पर ध्यान केंद्रित करती हैं |
  • जीएनयू ऑक्टेव में, कर्नेल घनत्व आकलन किसके द्वारा कार्यान्वित किया जाता है | kernel_density विकल्प (अर्थमिति पैकेज)।
  • उत्पत्ति (डेटा विश्लेषण सॉफ़्टवेयर) में, इसके उपयोगकर्ता इंटरफ़ेस से 2 डी कर्नेल घनत्व प्लॉट बनाया जा सकता है और दो फलन, 1D के लिए Ks घनत्व और 2D के लिए Ks2 घनत्व इसके [1] से उपयोग किए जा सकते हैं /ltwiki/index.php?title=Category:LabTalk_Programming LabTalk], पाइथन (प्रोग्रामिंग भाषा), या C (प्रोग्रामिंग भाषा) कोड होती है ।
  • पर्ल में, कार्यान्वयन सांख्यिकी-कर्नेल आकलन मॉड्यूल में पाया जा सकता है।
  • पीएचपी में, कार्यान्वयन Mathपीएचपी लाइब्रेरी में पाया जा सकता है।
  • पायथन (प्रोग्रामिंग भाषा) में, कई कार्यान्वयन उपस्थित हैं: पीवाईक्युटी_फिट.केडीई मॉड्यूल में P/PyQt-Fit/PyQt-Fit-1.3.4.tar.gz PyQt-Fit पैकेज, साइपी (scipy.stats.gaussian_kde), स्तर मॉडल (KDEMultivariate और KDEMultivariate), और स्किट-सीखें (KernelDensity) (तुलना देखें [37]). केडीईpy भारित डेटा का समर्थन करता है और इसका एफएफटी कार्यान्वयन अन्य कार्यान्वयनों की तुलना में बहुत अधिक तेज़ है। सामान्यतः उपयोग की जाने वाली पांडा लाइब्रेरी [2] प्लॉट विधि के माध्यम से केडीई प्लॉटिंग के लिए समर्थन प्रदान करती है (df.plot(kind='kde')[3]) भारित और सहसंबद्ध एमसीएमसी नमूनों के लिए जीडिस्ट पैकेज 1D और 2D वितरण के लिए अनुकूलित बैंडविड्थ, सीमा सुधार और उच्च-क्रम विधियों का समर्थन करता है। कर्नेल घनत्व आकलन के लिए नया उपयोग किया जाने वाला पैकेज सीबॉर्न है | ( import seaborn as sns , sns.kdeplot() ).[38] केडीई का जीपीयू कार्यान्वयन भी उपस्थित है।[39]
  • R (प्रोग्रामिंग लैंग्वेज) में इसके द्वारा इम्प्लीमेंट किया जाता है | density आधार वितरण में, और bw.nrd0 फलन का उपयोग सांख्यिकी पैकेज में किया जाता है | यह फलन सिल्वरमैन की पुस्तक में अनुकूलित सूत्र का उपयोग करता है। bkde केर्नस्मूथ लाइब्रेरी में, ParetoDensityEstimation डेटा विज़ुअलाइज़ेशन लाइब्रेरी में (पेरेटो वितरण घनत्व आकलन के लिए), kde ks लाइब्रेरी में, dkden और dbckden एवमिक्स लाइब्रेरी में (बाउंडेड समर्थन के लिए बाउंड्री करेक्टेड कर्नेल घनत्व एस्tमेशन के लिए बाद में), npudens np लाइब्रेरी (संख्यात्मक और श्रेणीबद्ध चर) में, sm.density एसएम लाइब्रेरी में। के क्रियान्वयन के लिए kde.R फलन, जिसे किसी पैकेज या लाइब्रेरी को स्थापित करने की आवश्यकता नहीं है | केडीई.आर देखें। btb लाइब्रेरी, विश्लेषण के लिए समर्पित, कर्नेल घनत्व आकलन को प्रयुक्त करता है | kernel_smoothing.
  • एसएएस (सॉफ्टवेयर) में, proc kde अविभाजित और द्विभाजित कर्नेल घनत्व का आकलन लगाने के लिए उपयोग किया जा सकता है।
  • अपाचे स्पार्क में, KernelDensity() कक्षा [40] था में, इसे किसके द्वारा कार्यान्वित किया जाता है kdensity[41] उदाहरण के लिए histogram x, kdensity. वैकल्पिक रूप से मुफ़्त स्टाटा मॉड्यूल केडीईएनएस उपलब्ध है | [42] उपयोगकर्ता को 1डी या 2डी घनत्व कार्यों का आकलन लगाने की अनुमति देता है।
  • स्विफ्ट (प्रोग्रामिंग भाषा) में इसके स्विफ्टस्टैट्स.KernelDensityEstimation ओपन-सोर्स स्टैटिस्टिक्स लाइब्रेरी स्विफ्टस्टैट्स में द्वारा क्रियान्वित किया जाता है ।

यह भी देखें

अग्रिम पठन

  • Härdle, Müller, Sperlich, Werwatz, Nonparametric and Semiparametric Methods, Springer-Verlag Berlin Heidelberg 2004, pp. 39–83


संदर्भ

  1. Jump up to: 1.0 1.1 Rosenblatt, M. (1956). "घनत्व समारोह के कुछ गैर पैरामीट्रिक अनुमानों पर टिप्पणियां". The Annals of Mathematical Statistics. 27 (3): 832–837. doi:10.1214/aoms/1177728190.
  2. Jump up to: 2.0 2.1 Parzen, E. (1962). "संभावना घनत्व समारोह और मोड के अनुमान पर". The Annals of Mathematical Statistics. 33 (3): 1065–1076. doi:10.1214/aoms/1177704472. JSTOR 2237880.
  3. Jump up to: 3.0 3.1 Piryonesi S. Madeh; El-Diraby Tamer E. (2020-06-01). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/JPEODX.0000175.
  4. Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. (2001). The Elements of Statistical Learning : Data Mining, Inference, and Prediction : with 200 full-color illustrations. New York: Springer. ISBN 0-387-95284-5. OCLC 46809224.
  5. Epanechnikov, V.A. (1969). "एक बहुभिन्नरूपी संभाव्यता घनत्व का गैर-पैरामीट्रिक अनुमान". Theory of Probability and Its Applications. 14: 153–158. doi:10.1137/1114019.
  6. Wand, M.P; Jones, M.C. (1995). कर्नेल स्मूथिंग. London: Chapman & Hall/CRC. ISBN 978-0-412-55270-0.
  7. Jump up to: 7.0 7.1 7.2 7.3 Botev, Zdravko (2007). प्रसार मिश्रण के माध्यम से गैर पैरामीट्रिक घनत्व अनुमान (Technical report). University of Queensland.
  8. Scott, D. (1979). "इष्टतम और डेटा-आधारित हिस्टोग्राम पर". Biometrika. 66 (3): 605–610. doi:10.1093/biomet/66.3.605.
  9. Park, B.U.; Marron, J.S. (1990). "डेटा-संचालित बैंडविड्थ चयनकर्ताओं की तुलना". Journal of the American Statistical Association. 85 (409): 66–72. CiteSeerX 10.1.1.154.7321. doi:10.1080/01621459.1990.10475307. JSTOR 2289526.
  10. Park, B.U.; Turlach, B.A. (1992). "कई डेटा चालित बैंडविड्थ चयनकर्ताओं का व्यावहारिक प्रदर्शन (चर्चा के साथ)". Computational Statistics. 7: 251–270.
  11. Cao, R.; Cuevas, A.; Manteiga, W. G. (1994). "घनत्व अनुमान में कई चौरसाई विधियों का तुलनात्मक अध्ययन". Computational Statistics and Data Analysis. 17 (2): 153–176. doi:10.1016/0167-9473(92)00066-Z.
  12. Jones, M.C.; Marron, J.S.; Sheather, S. J. (1996). "घनत्व अनुमान के लिए बैंडविड्थ चयन का एक संक्षिप्त सर्वेक्षण". Journal of the American Statistical Association. 91 (433): 401–407. doi:10.2307/2291420. JSTOR 2291420.
  13. Sheather, S.J. (1992). "कुछ वास्तविक डेटा सेटों पर छह लोकप्रिय बैंडविड्थ चयन विधियों का प्रदर्शन (चर्चा के साथ)". Computational Statistics. 7: 225–250, 271–281.
  14. Agarwal, N.; Aluru, N.R. (2010). "एमईएमएस में अनिश्चितता मात्रा का ठहराव के लिए एक डेटा-संचालित स्टोकेस्टिक सहस्थापन दृष्टिकोण" (PDF). International Journal for Numerical Methods in Engineering. 83 (5): 575–597. Bibcode:2010IJNME..83..575A. doi:10.1002/nme.2844.
  15. Xu, X.; Yan, Z.; Xu, S. (2015). "विसरण आधारित कर्नेल घनत्व विधि द्वारा पवन गति संभाव्यता वितरण का अनुमान लगाना". Electric Power Systems Research. 121: 28–37. doi:10.1016/j.epsr.2014.11.029.
  16. Botev, Z.I.; Grotowski, J.F.; Kroese, D.P. (2010). "प्रसार के माध्यम से कर्नेल घनत्व का अनुमान". Annals of Statistics. 38 (5): 2916–2957. arXiv:1011.2602. doi:10.1214/10-AOS799. S2CID 41350591.
  17. Jump up to: 17.0 17.1 Sheather, S.J.; Jones, M.C. (1991). "कर्नेल घनत्व अनुमान के लिए एक विश्वसनीय डेटा-आधारित बैंडविड्थ चयन विधि". Journal of the Royal Statistical Society, Series B. 53 (3): 683–690. doi:10.1111/j.2517-6161.1991.tb01857.x. JSTOR 2345597.
  18. Rudemo, M. (1982). "हिस्टोग्राम और कर्नेल घनत्व अनुमानक का अनुभवजन्य विकल्प". Scandinavian Journal of Statistics. 9 (2): 65–78. JSTOR 4615859.
  19. Bowman, A.W. (1984). "घनत्व अनुमानों के चौरसाई के लिए क्रॉस-वैलिडेशन का एक वैकल्पिक तरीका". Biometrika. 71 (2): 353–360. doi:10.1093/biomet/71.2.353.
  20. Hall, P.; Marron, J.S.; Park, B.U. (1992). "चिकना क्रॉस-सत्यापन". Probability Theory and Related Fields. 92: 1–20. doi:10.1007/BF01205233. S2CID 121181481.
  21. Wahba, G. (1975). "घनत्व अनुमान के लिए चर गाँठ, कर्नेल और ऑर्थोगोनल श्रृंखला विधियों के इष्टतम अभिसरण गुण". Annals of Statistics. 3 (1): 15–29. doi:10.1214/aos/1176342997.
  22. Buch-Larsen, TINE (2005). "चेम्परनाउन परिवर्तन का उपयोग करते हुए भारी-पूंछ वाले वितरण के लिए कर्नेल घनत्व का अनुमान". Statistics. 39 (6): 503–518. CiteSeerX 10.1.1.457.1544. doi:10.1080/02331880500439782. S2CID 219697435.
  23. Jump up to: 23.0 23.1 Silverman, B.W. (1986). सांख्यिकी और डेटा विश्लेषण के लिए घनत्व आकलन. London: Chapman & Hall/CRC. p. 45. ISBN 978-0-412-24620-3.
  24. Chen, Yen-Chi; Genovese, Christopher R.; Wasserman, Larry (2016). "मोड क्लस्टरिंग के लिए एक व्यापक दृष्टिकोण". Electronic Journal of Statistics. 10 (1): 210–241. doi:10.1214/15-ejs1102. ISSN 1935-7524.
  25. Chazal, Frédéric; Fasy, Brittany Terese; Lecci, Fabrizio; Rinaldo, Alessandro; Wasserman, Larry (2014). "दृढ़ता परिदृश्य और सिल्हूट का स्टोकेस्टिक अभिसरण". Annual Symposium on Computational Geometry - SOCG'14. New York, New York, USA: ACM Press. 6 (2): 474–483. doi:10.1145/2582112.2582128. ISBN 978-1-4503-2594-3. S2CID 6029340.
  26. Fukunaga, K.; Hostetler, L. (January 1975). "पैटर्न पहचान में अनुप्रयोगों के साथ घनत्व फ़ंक्शन के ढाल का अनुमान". IEEE Transactions on Information Theory. 21 (1): 32–40. doi:10.1109/tit.1975.1055330. ISSN 0018-9448.
  27. Yizong Cheng (1995). "मीन शिफ्ट, मोड सीकिंग और क्लस्टरिंग". IEEE Transactions on Pattern Analysis and Machine Intelligence. 17 (8): 790–799. doi:10.1109/34.400568. ISSN 0162-8828.
  28. Comaniciu, D.; Meer, P. (May 2002). "Mean shift: a robust approach toward feature space analysis". IEEE Transactions on Pattern Analysis and Machine Intelligence. 24 (5): 603–619. doi:10.1109/34.1000236. ISSN 0162-8828.
  29. Janert, Philipp K (2009). Gnuplot in action : understanding data with graphs. Connecticut, USA: Manning Publications. ISBN 978-1-933988-39-9. See section 13.2.2 entitled Kernel density estimates.
  30. "अविभाजित और द्विभाजित डेटा के लिए कर्नेल स्मूथिंग फ़ंक्शन अनुमान - MATLAB ksdensity". www.mathworks.com. Retrieved 2020-11-05.
  31. Horová, I.; Koláček, J.; Zelinka, J. (2012). Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing. Singapore: World Scientific Publishing. ISBN 978-981-4405-48-5.
  32. "SmoothKernelDistribution—Wolfram Language Documentation". reference.wolfram.com. Retrieved 2020-11-05.
  33. "KernelMixtureDistribution—Wolfram Language Documentation". reference.wolfram.com. Retrieved 2020-11-05.
  34. "कर्नेल घनत्व की गणना के लिए सॉफ्टवेयर". www.rsc.org. Retrieved 2020-11-05.
  35. The Numerical Algorithms Group. "NAG Library Routine Document: nagf_smooth_kerndens_gauss (g10baf)" (PDF). NAG Library Manual, Mark 23. Retrieved 2012-02-16.
  36. The Numerical Algorithms Group. "NAG Library Routine Document: nag_kernel_density_estim (g10bac)" (PDF). NAG Library Manual, Mark 9. Archived from the original (PDF) on 2011-11-24. Retrieved 2012-02-16.
  37. Vanderplas, Jake (2013-12-01). "पायथन में कर्नेल घनत्व अनुमान". Retrieved 2014-03-12.
  38. "seaborn.kdeplot — seaborn 0.10.1 documentation". seaborn.pydata.org. Retrieved 2020-05-12.
  39. "Kde-gpu: We implemented nadaraya waston kernel density and kernel conditional probability estimator using cuda through cupy. It is much faster than cpu version but it requires GPU with high memory".
  40. "Basic Statistics - RDD-based API - Spark 3.0.1 Documentation". spark.apache.org. Retrieved 2020-11-05.
  41. https://www.stata.com/manuals15/rkdensity.pdf[bare URL PDF]
  42. Jann, Ben (2008-05-26), KDENS: Stata module for univariate kernel density estimation, Boston College Department of Economics, retrieved 2022-10-15


बाहरी संबंध