स्मूथिंग स्प्लिन: Difference between revisions

Revision as of 21:39, 7 August 2023

स्मूथिंग स्प्लिन फलन अनुमान हैं, ${\hat {f}}(x)$ , रव अवलोकनों के एक सेट से प्राप्त किया गया $y_{i}$ लक्ष्य का $f(x_{i})$ , फिट की अच्छाई के एक माप को संतुलित करने के लिए ${\hat {f}}(x_{i})$ को $y_{i}$ की चिकनाई के व्युत्पन्न आधारित माप के साथ ${\hat {f}}(x)$ . वे रव को कम करने का एक साधन प्रदान करते हैं $x_{i},y_{i}$ आंकड़े। सबसे परिचित उदाहरण क्यूबिक स्मूथिंग स्प्लाइन है, लेकिन इस स्थिति सहित कई अन्य संभावनाएं भी हैं $x$ एक सदिश राशि हैl

घन स्प्लिन परिभाषा

मान लीजिये $\{x_{i},Y_{i}:i=1,\dots ,n\}$ संबंध द्वारा प्रतिरूपित अवलोकनों का एक समूह बनें $Y_{i}=f(x_{i})+\epsilon _{i}$ जहां $\epsilon _{i}$ स्वतंत्र, शून्य माध्य यादृच्छिक चर हैं (सामान्यतः स्थिर विचरण माना जाता है)। घन स्मूथिंग स्प्लिनअनुमान ${\hat {f}}$ फलन का $f$ को न्यूनतम (दो बार भिन्न फलन के वर्ग पर) के रूप में परिभाषित किया गया है^[1]^[2]

\sum _{i=1}^{n}\{Y_{i}-{\hat {f}}(x_{i})\}^{2}+\lambda \int {\hat {f}}''(x)^{2}\,dx.

टिप्पणियां:

$\lambda \geq 0$ एक स्मूथिंग पैरामीटर है, जो डेटा के प्रति निष्ठा और फलन अनुमान के खुरदरेपन के बीच व्यापार-बंद को नियंत्रित करता है। इसका अनुमान प्रायः सामान्यीकृत क्रॉस-सत्यापन द्वारा लगाया जाता है,^[3] या प्रतिबंधित सीमांत संभावना (आरईएमएल) द्वारा जो स्प्लाइन स्मूथिंग और बायेसियन अनुमान के बीच लिंक का फायदा उठाता है (स्मूथिंग पेनल्टी को पूर्व में प्रेरित होने के रूप में देखा जा सकता है $f$ ).^[4]
इंटीग्रल का मूल्यांकन प्रायः संपूर्ण वास्तविक रेखा पर किया जाता है, हालांकि सीमा को उसी तक सीमित करना भी संभव है $x_{i}$ .
जैसा $\lambda \to 0$ (कोई स्मूथिंग नहीं), स्मूथिंग स्प्लाइन अंतर्वेशित स्प्लिनमें परिवर्तित हो जाती है।
जैसा $\lambda \to \infty$ (अनंत स्मूथिंग), खुरदरापन जुर्माना सर्वोपरि हो जाता है और अनुमान सामान्य न्यूनतम वर्ग अनुमान में परिवर्तित हो जाता है।
दूसरे व्युत्पन्न पर आधारित खुरदरापन दंड आधुनिक सांख्यिकी साहित्य में सबसे आम है, हालांकि इस पद्धति को अन्य व्युत्पन्न पर आधारित दंड के लिए आसानी से अपनाया जा सकता है।
प्रारंभिक साहित्य में, समान-स्थान वाले क्रम के साथ $x_{i}$ , डेरिवेटिव के बजाय दूसरे या तीसरे क्रम के अंतर का उपयोग दंड में किया गया था।^[5]
वर्गों के दण्डित योग को सुचारू करने वाले उद्देश्य को एक दण्डित संभाव्यता उद्देश्य द्वारा प्रतिस्थापित किया जा सकता है जिसमें वर्गों के पदों के योग को डेटा के प्रति निष्ठा के एक अन्य लॉग-संभावना आधारित माप द्वारा प्रतिस्थापित किया जाता है।^[1]वर्ग पद का योग गाऊसी धारणा के साथ दंडित संभावना से मेल खाता है $\epsilon _{i}$ .

घन स्मूथिंग स्प्लिन की व्युत्पत्ति

स्मूथिंग स्पलाइन को दो चरणों में फिट करने के बारे में सोचना उपयोगी है:

सबसे पहले, मान प्राप्त करें ${\hat {f}}(x_{i});i=1,\ldots ,n$ .
इन मूल्यों से निष्कर्ष निकालें ${\hat {f}}(x)$ सभी x के लिए

अब, पहले दूसरे चरण का इलाज करें।

सदिश को देखते हुए ${\hat {m}}=({\hat {f}}(x_{1}),\ldots ,{\hat {f}}(x_{n}))^{T}$ फिट किए गए मानों में, स्प्लिनमानदंड का योग-वर्ग भाग निश्चित होता है। यह केवल न्यूनतम करने के लिए ही रह गया है $\int {\hat {f}}''(x)^{2}\,dx$ , और मिनिमाइज़र एक प्राकृतिक क्यूबिक स्प्लाइन (गणित) है जो बिंदुओं को प्रक्षेपित करता है $(x_{i},{\hat {f}}(x_{i}))$ . यह इंटरपोलेटिंग स्पलाइन एक रैखिक ऑपरेटर है, और इसे फॉर्म में लिखा जा सकता है

{\hat {f}}(x)=\sum _{i=1}^{n}{\hat {f}}(x_{i})f_{i}(x)

जहां $f_{i}(x)$ स्प्लिनआधार फलन का एक सेट हैं। परिणामस्वरूप खुरदरापन दंड का रूप धारण कर लेता है

\int {\hat {f}}''(x)^{2}dx={\hat {m}}^{T}A{\hat {m}}.

जहां A के तत्व हैं $\int f_{i}''(x)f_{j}''(x)dx$ . आधार कार्य, और इसलिए आव्यूह A, भविष्यवक्ता चर के विन्यास पर निर्भर करता है $x_{i}$ , लेकिन प्रतिक्रियाओं पर नहीं $Y_{i}$ या ${\hat {m}}$ .

A, द्वारा दिया गया एक n×n आव्यूह है $A=\Delta ^{T}W^{-1}\Delta$ .

Δ तत्वों के साथ दूसरे अंतर का एक (n-2)×n आव्यूह है:

$\Delta _{ii}=1/h_{i}$ , $\Delta _{i,i+1}=-1/h_{i}-1/h_{i+1}$ , $\Delta _{i,i+2}=1/h_{i+1}$

W तत्वों के साथ एक (n-2)×(n-2) सममित त्रि-विकर्ण आव्यूह है:

$W_{i-1,i}=W_{i,i-1}=h_{i}/6$ , $W_{ii}=(h_{i}+h_{i+1})/3$ और $h_{i}=\xi _{i+1}-\xi _{i}$ , क्रमिक गांठों (नाट) (या x मान) के बीच की दूरी।

अब पहले चरण पर वापस जाएँ। दण्डित (पीनलाइज़) योग-वर्गों को इस प्रकार लिखा जा सकता है

\{Y-{\hat {m}}\}^{T}\{Y-{\hat {m}}\}+\lambda {\hat {m}}^{T}A{\hat {m}},

जहां $Y=(Y_{1},\ldots ,Y_{n})^{T}$ .

न्यूनतमीकरण करना ${\hat {m}}$ विरुद्ध भेद करके ${\hat {m}}$ . इस में यह परिणाम:

$-2\{Y-{\hat {m}}\}+2\lambda A{\hat {m}}=0$ ^[6] और

${\hat {m}}=(I+\lambda A)^{-1}Y.$

डी बूर का दृष्टिकोण

डी बूर का दृष्टिकोण एक ही विचार का उपयोग करता है, एक स्मूथ वक्र होने और दिए गए डेटा के करीब होने के बीच संतुलन खोजने का।^[7]

$p\sum _{i=1}^{n}\left({\frac {Y_{i}-{\hat {f}}\left(x_{i}\right)}{\delta _{i}}}\right)^{2}+\left(1-p\right)\int \left({\hat {f}}^{\left(m\right)}\left(x\right)\right)^{2}\,dx$ जहां $p$ एक पैरामीटर है जिसे स्मूथ कारक कहा जाता है और यह अंतराल से संबंधित है $[0,1]$ , और $\delta _{i};i=1,\dots ,n$ वे मात्राएँ हैं जो स्मूथिंग की सीमा को नियंत्रित करती हैं (वे वजन का प्रतिनिधित्व करती हैं $\delta _{i}^{-2}$ प्रत्येक बिंदु का $Y_{i}$ ). व्यवहार में, चूंकि घन विभाजन का अधिकतर उपयोग किया जाता है, $m$ सामान्यतः है $2$ . के लिए समाधान $m=2$ 1967 में रिंस्च द्वारा प्रस्तावित किया गया था।^[8]के लिए $m=2$ , कब $p$ दृष्टिकोण $1$ , ${\hat {f}}$ दिए गए डेटा के प्राकृतिक स्पलाइन इंटरपोलेंट में परिवर्तित हो जाता है।^[7]जैसा $p$ दृष्टिकोण $0$ , ${\hat {f}}$ एक सीधी रेखा (सबसे स्मूथ वक्र) में परिवर्तित हो जाती है। का उपयुक्त मान ज्ञात करने के बाद से $p$ परीक्षण और त्रुटि का कार्य है, एक निरर्थक स्थिरांक $S$ सुविधा के लिए पेश किया गया था।^[8]

$S$ का मान संख्यात्मक रूप से निर्धारित करने के लिए उपयोग किया जाता है $p$ ताकि फलन ${\hat {f}}$ निम्नलिखित शर्त को पूरा करता है:

$\sum _{i=1}^{n}\left({\frac {Y_{i}-{\hat {f}}\left(x_{i}\right)}{\delta _{i}}}\right)^{2}\leq S$

डी बूर द्वारा वर्णित एल्गोरिदम प्रांरम्भ होता है $p=0$ और बढ़ जाता है $p$ जब तक शर्त पूरी नहीं हो जाती.^[7]अगर $\delta _{i}$ के लिए मानक विचलन का एक अनुमान है $Y_{i}$ , स्थिरांक $S$ अंतराल में चुनने की अनुशंसा की जाती है $\left[n-{\sqrt {2n}},n+{\sqrt {2n}}\right]$ . रखना $S=0$ इसका तात्पर्य है कि समाधान प्राकृतिक स्पलाइन इंटरपोलेंट है।^[8]की बढ़ती $S$ इसका तात्पर्य है कि हम दिए गए डेटा से दूर जाकर एक चिकना वक्र प्राप्त करते हैं।

बहुआयामी विभाजन

एक अदिश राशि के संबंध में स्मूथिंग से सामान्यीकरण करने की विधि के दो मुख्य वर्ग हैं $x$ सदिश के संबंध में स्मूथिंग करने के लिए

 $x$ . पहला दृष्टिकोण बहुआयामी सेटिंग के लिए स्प्लाइन स्मूथिंग पेनल्टी को सामान्यीकृत करता है। उदाहरण के लिए, यदि अनुमान लगाने का प्रयास किया जा रहा है  $f(x,z)$  हम  पतली प्लेट स्प्लिन पेनाल्टी का उपयोग कर सकते हैं और इसका पता लगा सकते हैं  ${\hat {f}}(x,z)$  कम से कम

\sum _{i=1}^{n}\{y_{i}-{\hat {f}}(x_{i},z_{i})\}^{2}+\lambda \int \left[\left({\frac {\partial ^{2}{\hat {f}}}{\partial x^{2}}}\right)^{2}+2\left({\frac {\partial ^{2}{\hat {f}}}{\partial x\partial z}}\right)^{2}+\left({\frac {\partial ^{2}{\hat {f}}}{\partial z^{2}}}\right)^{2}\right]{\textrm {d}}x\,{\textrm {d}}z.

पतली प्लेट स्प्लिनदृष्टिकोण को दो से अधिक आयामों और दंड में विभेदन के अन्य आदेशों के संबंध में स्मूथिंग करने के लिए सामान्यीकृत किया जा सकता है।^[1]जैसे-जैसे आयाम बढ़ता है, अंतर के सबसे छोटे क्रम पर कुछ प्रतिबंध होते हैं जिनका उपयोग किया जा सकता है,^[1]लेकिन वास्तव में डचॉन का मूल पेपर,^[9] थोड़ा अधिक जटिल दंड देता है जिससे इस प्रतिबंध से बचा जा सकता है।

पतली प्लेट स्प्लिन आइसोट्रोपिक हैं, जिसका अर्थ है कि यदि हम घूमते हैं $x,z$ समन्वय प्रणाली का अनुमान नहीं बदलेगा, लेकिन यह भी हम मान रहे हैं कि सभी दिशाओं में समान स्तर का स्मूथिंग उपयुक्त है। स्थानिक स्थान के संबंध में समायोजन करते समय इसे प्रायः उचित माना जाता है, लेकिन कई अन्य स्थितियो में आइसोट्रॉपी एक उचित धारणा नहीं है और माप इकाइयों के स्पष्ट रूप से मनमाने विकल्पों के प्रति संवेदनशीलता पैदा कर सकता है। उदाहरण के लिए, यदि दूरी और समय के संबंध में स्मूथिंग की जाती है तो एक आइसोट्रोपिक स्मूथर अलग-अलग परिणाम देगा यदि दूरी मीटर में और समय सेकंड में मापा जाता है, तो क्या होगा यदि हम इकाइयों को सेंटीमीटर और घंटों में बदल दें।

बहु-आयामी स्मूथिंग के सामान्यीकरण का दूसरा वर्ग सीधे तौर पर टेंसर उत्पाद स्पलाइन निर्माणों का उपयोग करके इस पैमाने के अपरिवर्तनीय मुद्दे से संबंधित है।^[10]^[11]^[12] इस तरह के स्प्लिन में कई स्मूथिंग मापदंडों के साथ स्मूथिंग पेनल्टी होती है, जो वह कीमत है जिसे यह मानने के लिए भुगतान किया जाना चाहिए कि चिकनाई की समान डिग्री सभी दिशाओं में उपयुक्त है।

स्रोत कोड

स्प्लाइन (गणित) स्मूथिंग के लिए स्रोत कोड कार्ल आर. डी बूर|कार्ल डी बूर की पुस्तक ए प्रैक्टिकल गाइड टू स्प्लिंस के उदाहरणों में पाया जा सकता है। उदाहरण फोरट्रान प्रोग्रामिंग भाषा में हैं। अद्यतन स्रोत कार्ल डी बूर की आधिकारिक साइट [1] पर भी उपलब्ध हैं।

संदर्भ

↑ ^1.0 ^1.1 ^1.2 ^1.3 Green, P. J.; Silverman, B.W. (1994). Nonparametric Regression and Generalized Linear Models: A roughness penalty approach. Chapman and Hall.
↑ Hastie, T. J.; Tibshirani, R. J. (1990). सामान्यीकृत योजक मॉडल. Chapman and Hall. ISBN 978-0-412-34390-2.
↑ Craven, P.; Wahba, G. (1979). "स्प्लाइन फ़ंक्शंस के साथ शोर वाले डेटा को सुचारू करना". Numerische Mathematik. 31 (4): 377–403. doi:10.1007/bf01404567.
↑ Kimeldorf, G.S.; Wahba, G. (1970). "स्टोकेस्टिक प्रक्रियाओं पर बायेसियन अनुमान और स्प्लिंस द्वारा स्मूथिंग के बीच एक पत्राचार". The Annals of Mathematical Statistics. 41 (2): 495–502. doi:10.1214/aoms/1177697089.
↑ Whittaker, E.T. (1922). "ग्रेजुएशन की एक नई पद्धति पर". Proceedings of the Edinburgh Mathematical Society. 41: 63–75.
↑ Rodriguez, German (Spring 2001). "चौरसाई और गैर-पैरामीट्रिक प्रतिगमन" (PDF) (in English). 2.3.1 Computation. p. 12. Retrieved 28 August 2017.{{cite web}}: CS1 maint: location (link)
↑ ^7.0 ^7.1 ^7.2 De Boor, C. (2001). स्प्लिंस के लिए एक व्यावहारिक मार्गदर्शिका (संशोधित संस्करण). Springer. pp. 207–214. ISBN 978-0-387-90356-9.
↑ ^8.0 ^8.1 ^8.2 Reinsch, Christian H (1967). "स्प्लाइन फ़ंक्शंस द्वारा स्मूथिंग". Numerische Mathematik. 10 (3): 177–183. doi:10.1007/BF02162161.
↑ J. Duchon, 1976, Splines minimizing rotation invariant semi-norms in Sobolev spaces. pp 85–100, In: Constructive Theory of Functions of Several Variables, Oberwolfach 1976, W. Schempp and K. Zeller, eds., Lecture Notes in Math., Vol. 571, Springer, Berlin, 1977
↑ Wahba, Grace. अवलोकन डेटा के लिए तख़्ता मॉडल. SIAM.
↑ Gu, Chong (2013). Smoothing Spline ANOVA Models (2nd ed.). Springer.
↑ Wood, S. N. (2017). Generalized Additive Models: An Introduction with R (2nd ed). Chapman & Hall/CRC. ISBN 978-1-58488-474-3.
↑ Eilers, P.H.C. and Marx B. (1996). "बी-स्प्लिन और पेनाल्टी के साथ लचीली स्मूथिंग". Statistical Science. 11 (2): 89–121.
↑ Ruppert, David; Wand, M. P.; Carroll, R. J. (2003). सेमीपैरामीट्रिक रिग्रेशन. Cambridge University Press. ISBN 978-0-521-78050-6.

अग्रिम पठन

Wahba, G. (1990). Spline Models for Observational Data. SIAM, Philadelphia.
Green, P. J. and Silverman, B. W. (1994). Nonparametric Regression and Generalized Linear Models. CRC Press.
De Boor, C. (2001). A Practical Guide to Splines (Revised Edition). Springer.

[GS-1] 1.0 ^1.1 ^1.2 ^1.3 Green, P. J.; Silverman, B.W. (1994). Nonparametric Regression and Generalized Linear Models: A roughness penalty approach. Chapman and Hall.

[2] Hastie, T. J.; Tibshirani, R. J. (1990). सामान्यीकृत योजक मॉडल. Chapman and Hall. ISBN 978-0-412-34390-2.

[3] Craven, P.; Wahba, G. (1979). "स्प्लाइन फ़ंक्शंस के साथ शोर वाले डेटा को सुचारू करना". Numerische Mathematik. 31 (4): 377–403. doi:10.1007/bf01404567.

[4] Kimeldorf, G.S.; Wahba, G. (1970). "स्टोकेस्टिक प्रक्रियाओं पर बायेसियन अनुमान और स्प्लिंस द्वारा स्मूथिंग के बीच एक पत्राचार". The Annals of Mathematical Statistics. 41 (2): 495–502. doi:10.1214/aoms/1177697089.

[5] Whittaker, E.T. (1922). "ग्रेजुएशन की एक नई पद्धति पर". Proceedings of the Edinburgh Mathematical Society. 41: 63–75.

[Rodriguez-6] Rodriguez, German (Spring 2001). "चौरसाई और गैर-पैरामीट्रिक प्रतिगमन" (PDF) (in English). 2.3.1 Computation. p. 12. Retrieved 28 August 2017.{{cite web}}: CS1 maint: location (link)

[DeBoor2001-7] 7.0 ^7.1 ^7.2 De Boor, C. (2001). स्प्लिंस के लिए एक व्यावहारिक मार्गदर्शिका (संशोधित संस्करण). Springer. pp. 207–214. ISBN 978-0-387-90356-9.

[Reinsch1967-8] 8.0 ^8.1 ^8.2 Reinsch, Christian H (1967). "स्प्लाइन फ़ंक्शंस द्वारा स्मूथिंग". Numerische Mathematik. 10 (3): 177–183. doi:10.1007/BF02162161.

[9] J. Duchon, 1976, Splines minimizing rotation invariant semi-norms in Sobolev spaces. pp 85–100, In: Constructive Theory of Functions of Several Variables, Oberwolfach 1976, W. Schempp and K. Zeller, eds., Lecture Notes in Math., Vol. 571, Springer, Berlin, 1977

[Wahba1990-10] Wahba, Grace. अवलोकन डेटा के लिए तख़्ता मॉडल. SIAM.

[Gu2013-11] Gu, Chong (2013). Smoothing Spline ANOVA Models (2nd ed.). Springer.

[Wood2017-12] Wood, S. N. (2017). Generalized Additive Models: An Introduction with R (2nd ed). Chapman & Hall/CRC. ISBN 978-1-58488-474-3.

[EilersMarx1996-13] Eilers, P.H.C. and Marx B. (1996). "बी-स्प्लिन और पेनाल्टी के साथ लचीली स्मूथिंग". Statistical Science. 11 (2): 89–121.

[14] Ruppert, David; Wand, M. P.; Carroll, R. J. (2003). सेमीपैरामीट्रिक रिग्रेशन. Cambridge University Press. ISBN 978-0-521-78050-6.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

@@ Line 4: / Line 4: @@
 ==घन स्प्लिन परिभाषा==
-मान लीजिये <math>\{x_i,Y_i: i = 1,\dots,n\}</math> संबंध द्वारा प्रतिरूपित अवलोकनों का एक समूह बनें <math>Y_i = f(x_i) + \epsilon_i</math> जहां  <math>\epsilon_i </math> स्वतंत्र, शून्य माध्य यादृच्छिक चर हैं (सामान्यतः स्थिर विचरण माना जाता है)। घन चौरसाई स्प्लिनअनुमान <math>\hat f</math> फलन का <math>f</math> को न्यूनतम (दो बार भिन्न फलन के वर्ग पर) के रूप में परिभाषित किया गया है<ref name=GS>{{Cite book|title=Nonparametric Regression and Generalized Linear Models: A roughness penalty approach|last=Green|first=P. J.|last2=Silverman|first2=B.W.|year=1994|publisher=Chapman and Hall}}</ref><ref>{{Cite book|title=सामान्यीकृत योजक मॉडल|last=Hastie|first=T. J.|author2=Tibshirani, R. J. |year=1990|publisher=Chapman and Hall|isbn=978-0-412-34390-2}}</ref>
+मान लीजिये <math>\{x_i,Y_i: i = 1,\dots,n\}</math> संबंध द्वारा प्रतिरूपित अवलोकनों का एक समूह बनें <math>Y_i = f(x_i) + \epsilon_i</math> जहां  <math>\epsilon_i </math> स्वतंत्र, शून्य माध्य यादृच्छिक चर हैं (सामान्यतः स्थिर विचरण माना जाता है)। घन स्मूथिंग स्प्लिनअनुमान <math>\hat f</math> फलन का <math>f</math> को न्यूनतम (दो बार भिन्न फलन के वर्ग पर) के रूप में परिभाषित किया गया है<ref name=GS>{{Cite book|title=Nonparametric Regression and Generalized Linear Models: A roughness penalty approach|last=Green|first=P. J.|last2=Silverman|first2=B.W.|year=1994|publisher=Chapman and Hall}}</ref><ref>{{Cite book|title=सामान्यीकृत योजक मॉडल|last=Hastie|first=T. J.|author2=Tibshirani, R. J. |year=1990|publisher=Chapman and Hall|isbn=978-0-412-34390-2}}</ref>
 :<math>
 \sum_{i=1}^n \{Y_i - \hat f(x_i)\}^2 + \lambda \int \hat f''(x)^2 \,dx.
 </math>
 टिप्पणियां:
-* <math>\lambda \ge 0</math> एक स्मूथिंग पैरामीटर है, जो डेटा के प्रति निष्ठा और फलन अनुमान के खुरदरेपन के बीच व्यापार-बंद को नियंत्रित करता है। इसका अनुमान अक्सर सामान्यीकृत क्रॉस-सत्यापन द्वारा लगाया जाता है,<ref>{{cite journal|first=P.|last=Craven|first2=G.|last2=Wahba|title=स्प्लाइन फ़ंक्शंस के साथ शोर वाले डेटा को सुचारू करना|journal=Numerische Mathematik|year=1979|volume=31|issue=4|pages=377–403|doi=10.1007/bf01404567}}</ref> या प्रतिबंधित सीमांत संभावना (आरईएमएल) द्वारा जो स्प्लाइन स्मूथिंग और बायेसियन अनुमान के बीच लिंक का फायदा उठाता है (स्मूथिंग पेनल्टी को पूर्व में प्रेरित होने के रूप में देखा जा सकता है <math>f</math>).<ref>{{cite journal|first=G.S.|last=Kimeldorf|first2=G.|last2=Wahba|title=स्टोकेस्टिक प्रक्रियाओं पर बायेसियन अनुमान और स्प्लिंस द्वारा स्मूथिंग के बीच एक पत्राचार|journal=The Annals of Mathematical Statistics|year=1970|volume=41|issue=2|pages=495–502|doi=10.1214/aoms/1177697089|doi-access=free}}</ref>
+* <math>\lambda \ge 0</math> एक स्मूथिंग पैरामीटर है, जो डेटा के प्रति निष्ठा और फलन अनुमान के खुरदरेपन के बीच व्यापार-बंद को नियंत्रित करता है। इसका अनुमान प्रायः सामान्यीकृत क्रॉस-सत्यापन द्वारा लगाया जाता है,<ref>{{cite journal|first=P.|last=Craven|first2=G.|last2=Wahba|title=स्प्लाइन फ़ंक्शंस के साथ शोर वाले डेटा को सुचारू करना|journal=Numerische Mathematik|year=1979|volume=31|issue=4|pages=377–403|doi=10.1007/bf01404567}}</ref> या प्रतिबंधित सीमांत संभावना (आरईएमएल) द्वारा जो स्प्लाइन स्मूथिंग और बायेसियन अनुमान के बीच लिंक का फायदा उठाता है (स्मूथिंग पेनल्टी को पूर्व में प्रेरित होने के रूप में देखा जा सकता है <math>f</math>).<ref>{{cite journal|first=G.S.|last=Kimeldorf|first2=G.|last2=Wahba|title=स्टोकेस्टिक प्रक्रियाओं पर बायेसियन अनुमान और स्प्लिंस द्वारा स्मूथिंग के बीच एक पत्राचार|journal=The Annals of Mathematical Statistics|year=1970|volume=41|issue=2|pages=495–502|doi=10.1214/aoms/1177697089|doi-access=free}}</ref>
-* इंटीग्रल का मूल्यांकन अक्सर संपूर्ण वास्तविक रेखा पर किया जाता है, हालांकि सीमा को उसी तक सीमित करना भी संभव है <math>x_i</math>.
+* इंटीग्रल का मूल्यांकन प्रायः संपूर्ण वास्तविक रेखा पर किया जाता है, हालांकि सीमा को उसी तक सीमित करना भी संभव है <math>x_i</math>.
 * जैसा <math>\lambda\to 0</math> (कोई स्मूथिंग नहीं), स्मूथिंग स्प्लाइन [[अंतर्वेशित तख़्ता|अंतर्वेशित]] स्प्लिनमें परिवर्तित हो जाती है।
 * जैसा <math>\lambda\to\infty</math> (अनंत स्मूथिंग), खुरदरापन जुर्माना सर्वोपरि हो जाता है और अनुमान सामान्य न्यूनतम वर्ग अनुमान में परिवर्तित हो जाता है।
@@ Line 17: / Line 17: @@
 * वर्गों के दण्डित योग को सुचारू करने वाले उद्देश्य को एक दण्डित संभाव्यता उद्देश्य द्वारा प्रतिस्थापित किया जा सकता है जिसमें वर्गों के पदों के योग को डेटा के प्रति निष्ठा के एक अन्य लॉग-संभावना आधारित माप द्वारा प्रतिस्थापित किया जाता है।<ref name=GS/>वर्ग पद का योग गाऊसी धारणा के साथ दंडित संभावना से मेल खाता है <math>\epsilon_i</math>.
-==घन चौरसाई स्प्लिनकी व्युत्पत्ति==
+==घन स्मूथिंग स्प्लिन की व्युत्पत्ति==
 स्मूथिंग स्पलाइन को दो चरणों में फिट करने के बारे में सोचना उपयोगी है:
@@ Line 43: / Line 43: @@
 W तत्वों के साथ एक (n-2)×(n-2) सममित त्रि-विकर्ण आव्यूह है:
-<math>W_{i-1,i}=W_{i,i-1}=h_i/6</math>, <math>W_{ii}=(h_i+h_{i+1})/3</math> और <math>h_i=\xi_{i+1} - \xi_i</math>, क्रमिक गांठों (या x मान) के बीच की दूरी।
+<math>W_{i-1,i}=W_{i,i-1}=h_i/6</math>, <math>W_{ii}=(h_i+h_{i+1})/3</math> और <math>h_i=\xi_{i+1} - \xi_i</math>, क्रमिक गांठों (नाट) (या x मान) के बीच की दूरी।
-अब पहले चरण पर वापस जाएँ। दण्डित योग-वर्गों को इस प्रकार लिखा जा सकता है
+अब पहले चरण पर वापस जाएँ। दण्डित (पीनलाइज़) योग-वर्गों को इस प्रकार लिखा जा सकता है
 :<math>
 \{Y - \hat m\}^T \{Y - \hat m\} + \lambda \hat{m}^T A \hat m,
@@ Line 51: / Line 51: @@
 जहां <math>Y=(Y_1,\ldots,Y_n)^T</math>.
-'''कम से कम''' करना <math>\hat m</math> विरुद्ध भेद करके <math>\hat m</math>. इस में यह परिणाम:
+न्यूनतमीकरण करना <math>\hat m</math> विरुद्ध भेद करके <math>\hat m</math>. इस में यह परिणाम:
 <math> -2 \{ Y - \hat m \} + 2 \lambda A \hat m = 0</math> <ref name="Rodriguez">{{cite web|last1=Rodriguez|first1=German|title=चौरसाई और गैर-पैरामीट्रिक प्रतिगमन|url=http://data.princeton.edu/eco572/smoothing.pdf|accessdate=28 August 2017|location=2.3.1 Computation|pages=12|language=English|date=Spring 2001}}</ref> और
 <math>
 \hat m = (I + \lambda A)^{-1} Y.
 </math>
 ==डी बूर का दृष्टिकोण==
-डी बूर का दृष्टिकोण एक ही विचार का उपयोग करता है, एक चिकनी वक्र होने और दिए गए डेटा के करीब होने के बीच संतुलन खोजने का।<ref name="DeBoor2001">{{Cite book|title=स्प्लिंस के लिए एक व्यावहारिक मार्गदर्शिका (संशोधित संस्करण)|last=De Boor|first=C.|year=2001|publisher=Springer|pages=207–214|isbn=978-0-387-90356-9}}</ref>
+डी बूर का दृष्टिकोण एक ही विचार का उपयोग करता है, एक स्मूथ वक्र होने और दिए गए डेटा के करीब होने के बीच संतुलन खोजने का।<ref name="DeBoor2001">{{Cite book|title=स्प्लिंस के लिए एक व्यावहारिक मार्गदर्शिका (संशोधित संस्करण)|last=De Boor|first=C.|year=2001|publisher=Springer|pages=207–214|isbn=978-0-387-90356-9}}</ref>
 <math>p\sum_{i=1}^n \left ( \frac{Y_i - \hat f \left (x_i \right )}{\delta_i} \right )^2+\left ( 1-p \right )\int \left ( \hat f^{\left (m \right )}\left ( x \right ) \right )^2 \, dx</math>
-जहां <math>p</math> एक पैरामीटर है जिसे स्मूथ फ़ैक्टर कहा जाता है और यह अंतराल से संबंधित है <math>[0,1]</math>, और <math>\delta_i;i=1,\dots,n</math> वे मात्राएँ हैं जो स्मूथिंग की सीमा को नियंत्रित करती हैं (वे वजन का प्रतिनिधित्व करती हैं <math>\delta_i^{-2}</math> प्रत्येक बिंदु का <math>Y_i</math>). व्यवहार में, चूंकि [[घन विभाजन]] का अधिकतर उपयोग किया जाता है, <math>m</math> सामान्यतः  है <math>2</math>. के लिए समाधान <math>m=2</math> 1967 में रिंस्च द्वारा प्रस्तावित किया गया था।<ref name="Reinsch1967" />के लिए <math>m=2</math>, कब <math>p</math> दृष्टिकोण <math>1</math>, <math>\hat f</math> दिए गए डेटा के प्राकृतिक स्पलाइन इंटरपोलेंट में परिवर्तित हो जाता है।<ref name="DeBoor2001" />जैसा <math>p</math> दृष्टिकोण <math>0</math>, <math>\hat f</math> एक सीधी रेखा (सबसे चिकनी वक्र) में परिवर्तित हो जाती है। का उपयुक्त मान ज्ञात करने के बाद से <math>p</math> परीक्षण और त्रुटि का कार्य है, एक निरर्थक स्थिरांक <math>S</math> सुविधा के लिए पेश किया गया था।<ref name="Reinsch1967">{{Cite journal|title=स्प्लाइन फ़ंक्शंस द्वारा स्मूथिंग|author=Reinsch, Christian H|doi=10.1007/BF02162161|volume=10|issue = 3|journal=Numerische Mathematik|pages=177–183|year = 1967}}</ref>
+जहां <math>p</math> एक पैरामीटर है जिसे स्मूथ कारक कहा जाता है और यह अंतराल से संबंधित है <math>[0,1]</math>, और <math>\delta_i;i=1,\dots,n</math> वे मात्राएँ हैं जो स्मूथिंग की सीमा को नियंत्रित करती हैं (वे वजन का प्रतिनिधित्व करती हैं <math>\delta_i^{-2}</math> प्रत्येक बिंदु का <math>Y_i</math>). व्यवहार में, चूंकि [[घन विभाजन]] का अधिकतर उपयोग किया जाता है, <math>m</math> सामान्यतः  है <math>2</math>. के लिए समाधान <math>m=2</math> 1967 में रिंस्च द्वारा प्रस्तावित किया गया था।<ref name="Reinsch1967" />के लिए <math>m=2</math>, कब <math>p</math> दृष्टिकोण <math>1</math>, <math>\hat f</math> दिए गए डेटा के प्राकृतिक स्पलाइन इंटरपोलेंट में परिवर्तित हो जाता है।<ref name="DeBoor2001" />जैसा <math>p</math> दृष्टिकोण <math>0</math>, <math>\hat f</math> एक सीधी रेखा (सबसे स्मूथ वक्र) में परिवर्तित हो जाती है। का उपयुक्त मान ज्ञात करने के बाद से <math>p</math> परीक्षण और त्रुटि का कार्य है, एक निरर्थक स्थिरांक <math>S</math> सुविधा के लिए पेश किया गया था।<ref name="Reinsch1967">{{Cite journal|title=स्प्लाइन फ़ंक्शंस द्वारा स्मूथिंग|author=Reinsch, Christian H|doi=10.1007/BF02162161|volume=10|issue = 3|journal=Numerische Mathematik|pages=177–183|year = 1967}}</ref>
 <math>S</math> का मान संख्यात्मक रूप से निर्धारित करने के लिए उपयोग किया जाता है <math>p</math> ताकि फलन <math>\hat f</math> निम्नलिखित शर्त को पूरा करता है:
 <math>\sum_{i=1}^n \left ( \frac{Y_i - \hat f \left (x_i \right )}{\delta_i} \right )^2 \le S</math>
-डी बूर द्वारा वर्णित एल्गोरिदम शुरू होता है <math>p=0</math> और बढ़ जाता है <math>p</math> जब तक शर्त पूरी नहीं हो जाती.<ref name="DeBoor2001" />अगर <math>\delta_i</math> के लिए मानक विचलन का एक अनुमान है <math>Y_i</math>, अटल <math>S</math> अंतराल में चुनने की अनुशंसा की जाती है <math>\left [ n-\sqrt{2n},n+\sqrt{2n} \right ]</math>. रखना <math>S=0</math> इसका मतलब है कि समाधान प्राकृतिक स्पलाइन इंटरपोलेंट है।<ref name="Reinsch1967" />की बढ़ती <math>S</math> इसका मतलब है कि हम दिए गए डेटा से दूर जाकर एक चिकना वक्र प्राप्त करते हैं।
+डी बूर द्वारा वर्णित एल्गोरिदम प्रांरम्भ होता है <math>p=0</math> और बढ़ जाता है <math>p</math> जब तक शर्त पूरी नहीं हो जाती.<ref name="DeBoor2001" />अगर <math>\delta_i</math> के लिए मानक विचलन का एक अनुमान है <math>Y_i</math>,   स्थिरांक <math>S</math> अंतराल में चुनने की अनुशंसा की जाती है <math>\left [ n-\sqrt{2n},n+\sqrt{2n} \right ]</math>. रखना <math>S=0</math> इसका तात्पर्य है कि समाधान प्राकृतिक स्पलाइन इंटरपोलेंट है।<ref name="Reinsch1967" />की बढ़ती <math>S</math> इसका तात्पर्य है कि हम दिए गए डेटा से दूर जाकर एक चिकना वक्र प्राप्त करते हैं।
 ==बहुआयामी विभाजन==
-एक अदिश राशि के संबंध में चौरसाई से सामान्यीकरण करने की विधि के दो मुख्य वर्ग हैं <math>x</math> एक  सदिश के संबंध में चौरसाई करने के लिए
+एक अदिश राशि के संबंध में स्मूथिंग से सामान्यीकरण करने की विधि के दो मुख्य वर्ग हैं <math>x</math> सदिश के संबंध में स्मूथिंग करने के लिए
   <math>x</math>. पहला दृष्टिकोण बहुआयामी सेटिंग के लिए स्प्लाइन स्मूथिंग पेनल्टी को सामान्यीकृत करता है। उदाहरण के लिए, यदि अनुमान लगाने का प्रयास किया जा रहा है <math>f(x,z)</math> हम [[ पतली प्लेट तख़्ता | पतली प्लेट स्प्लिन]] पेनाल्टी का उपयोग कर सकते हैं और इसका पता लगा सकते हैं <math>\hat f(x,z)</math> कम से कम
 :<math>
 \sum_{i=1}^n \{y_i - \hat f(x_i,z_i)\}^2 + \lambda \int \left[\left(\frac{\partial^2 \hat f}{\partial x^2}\right)^2 + 2\left(\frac{\partial^2 \hat f}{\partial x \partial z}\right)^2 + \left(\frac{\partial^2 \hat f}{\partial z^2}\right)^2 \right] \textrm{d} x \, \textrm{d}z.
   </math>
-पतली प्लेट स्प्लिनदृष्टिकोण को दो से अधिक आयामों और दंड में विभेदन के अन्य आदेशों के संबंध में चौरसाई करने के लिए सामान्यीकृत किया जा सकता है।<ref name=GS/>जैसे-जैसे आयाम बढ़ता है, अंतर के सबसे छोटे क्रम पर कुछ प्रतिबंध होते हैं जिनका उपयोग किया जा सकता है,<ref name=GS/>लेकिन वास्तव में डचॉन का मूल पेपर,<ref>J. Duchon, 1976, Splines minimizing rotation invariant semi-norms in Sobolev spaces. pp 85–100, In: Constructive Theory of Functions of Several Variables, Oberwolfach 1976, W. Schempp and [[Karl Longin Zeller|K. Zeller]], eds., Lecture Notes in Math., Vol. 571, Springer, Berlin, 1977</ref> थोड़ा अधिक जटिल दंड देता है जिससे इस प्रतिबंध से बचा जा सकता है।
+पतली प्लेट स्प्लिनदृष्टिकोण को दो से अधिक आयामों और दंड में विभेदन के अन्य आदेशों के संबंध में स्मूथिंग करने के लिए सामान्यीकृत किया जा सकता है।<ref name=GS/>जैसे-जैसे आयाम बढ़ता है, अंतर के सबसे छोटे क्रम पर कुछ प्रतिबंध होते हैं जिनका उपयोग किया जा सकता है,<ref name=GS/>लेकिन वास्तव में डचॉन का मूल पेपर,<ref>J. Duchon, 1976, Splines minimizing rotation invariant semi-norms in Sobolev spaces. pp 85–100, In: Constructive Theory of Functions of Several Variables, Oberwolfach 1976, W. Schempp and [[Karl Longin Zeller|K. Zeller]], eds., Lecture Notes in Math., Vol. 571, Springer, Berlin, 1977</ref> थोड़ा अधिक जटिल दंड देता है जिससे इस प्रतिबंध से बचा जा सकता है।
-पतली प्लेट स्प्लिन आइसोट्रोपिक हैं, जिसका अर्थ है कि यदि हम घूमते हैं  <math>x,z</math> समन्वय प्रणाली का अनुमान नहीं बदलेगा, लेकिन यह भी हम मान रहे हैं कि सभी दिशाओं में समान स्तर का स्मूथिंग उपयुक्त है। स्थानिक स्थान के संबंध में समायोजन करते समय इसे अक्सर उचित माना जाता है, लेकिन कई अन्य मामलों में आइसोट्रॉपी एक उचित धारणा नहीं है और माप इकाइयों के स्पष्ट रूप से मनमाने विकल्पों के प्रति संवेदनशीलता पैदा कर सकता है। उदाहरण के लिए, यदि दूरी और समय के संबंध में स्मूथिंग की जाती है तो एक आइसोट्रोपिक स्मूथर अलग-अलग परिणाम देगा यदि दूरी मीटर में और समय सेकंड में मापा जाता है, तो क्या होगा यदि हम इकाइयों को सेंटीमीटर और घंटों में बदल दें।
+पतली प्लेट स्प्लिन आइसोट्रोपिक हैं, जिसका अर्थ है कि यदि हम घूमते हैं  <math>x,z</math> समन्वय प्रणाली का अनुमान नहीं बदलेगा, लेकिन यह भी हम मान रहे हैं कि सभी दिशाओं में समान स्तर का स्मूथिंग उपयुक्त है। स्थानिक स्थान के संबंध में समायोजन करते समय इसे प्रायः उचित माना जाता है, लेकिन कई अन्य स्थितियो में आइसोट्रॉपी एक उचित धारणा नहीं है और माप इकाइयों के स्पष्ट रूप से मनमाने विकल्पों के प्रति संवेदनशीलता पैदा कर सकता है। उदाहरण के लिए, यदि दूरी और समय के संबंध में स्मूथिंग की जाती है तो एक आइसोट्रोपिक स्मूथर अलग-अलग परिणाम देगा यदि दूरी मीटर में और समय सेकंड में मापा जाता है, तो क्या होगा यदि हम इकाइयों को सेंटीमीटर और घंटों में बदल दें।
 बहु-आयामी स्मूथिंग के सामान्यीकरण का दूसरा वर्ग सीधे तौर पर टेंसर उत्पाद स्पलाइन निर्माणों का उपयोग करके इस पैमाने के अपरिवर्तनीय मुद्दे से संबंधित है।<ref name=Wahba1990>{{cite book|first=Grace|last=Wahba|title=अवलोकन डेटा के लिए तख़्ता मॉडल|publisher=SIAM}}</ref><ref name=Gu2013>{{cite book|first=Chong|last=Gu|year=2013|title=Smoothing Spline ANOVA Models (2nd ed.)|publisher=Springer}}</ref><ref name=Wood2017>{{cite book|author = Wood, S. N.|title = Generalized Additive Models: An Introduction with R (2nd ed)|publisher = Chapman & Hall/CRC|year = 2017|isbn=978-1-58488-474-3}}</ref> इस तरह के स्प्लिन में कई स्मूथिंग मापदंडों के साथ स्मूथिंग पेनल्टी होती है, जो वह कीमत है जिसे यह मानने के लिए भुगतान किया जाना चाहिए कि चिकनाई की समान डिग्री सभी दिशाओं में उपयुक्त है।
 ==संबंधित विधियाँ==
-{{see also|Curve fitting}}
+{{see also|वक्र फिटिंग}}
 स्मूथिंग स्प्लिन संबंधित हैं, लेकिन इनसे अलग हैं:
-* प्रतिगमन विभाजन। इस पद्धति में, डेटा को कम गांठों के सेट के साथ, सामान्यतः  कम से कम वर्गों के साथ, स्प्लिनआधार फलन के एक सेट में फिट किया जाता है। किसी खुरदरापन दंड का उपयोग नहीं किया जाता है। (बहुभिन्नरूपी अनुकूली प्रतिगमन स्प्लिन भी देखें।)
+* ''रिग्रेशन स्प्लाइन'' (प्रतिगमन ''स्प्लाइन'') इस पद्धति में, डेटा को कम गांठों के सेट के साथ, सामान्यतः  कम से कम वर्गों के साथ, स्प्लिनआधार फलन के एक सेट में फिट किया जाता है। किसी खुरदरापन दंड का उपयोग नहीं किया जाता है। (बहुभिन्नरूपी अनुकूली प्रतिगमन स्प्लिन भी देखें।)
 * दंडित विभाजन। यह प्रतिगमन स्प्लिन की कम हुई गांठों को स्मूथिंग स्प्लिन के खुरदरेपन के दंड के साथ जोड़ता है।<ref name="EilersMarx1996">{{Cite journal|title=बी-स्प्लिन और पेनाल्टी के साथ लचीली स्मूथिंग|author=Eilers, P.H.C. and Marx B.|volume=11|issue = 2|journal=Statistical Science|pages=89–121|year = 1996}}</ref><ref>{{Cite book|title=सेमीपैरामीट्रिक रिग्रेशन|last=Ruppert|first=David |author2=Wand, M. P. |author3=Carroll, R. J.|publisher=Cambridge University Press|year=2003|isbn=978-0-521-78050-6}}</ref>
 * कई गुना सीखने के लिए पतली प्लेट स्प्लिन और इलास्टिक मानचित्र विधि। यह विधि सन्निकटन त्रुटि के लिए न्यूनतम वर्ग दंड को सन्निकटन मैनिफोल्ड के झुकने और खींचने वाले दंड के साथ जोड़ती है और अनुकूलन समस्या के मोटे विवेक का उपयोग करती है।

Anonymous

Search

स्मूथिंग स्प्लिन: Difference between revisions

Namespaces

More

Page actions

Revision as of 21:39, 7 August 2023

Contents

घन स्प्लिन परिभाषा

घन स्मूथिंग स्प्लिन की व्युत्पत्ति

डी बूर का दृष्टिकोण

बहुआयामी विभाजन

संबंधित विधियाँ

स्रोत कोड

संदर्भ

अग्रिम पठन

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

स्मूथिंग स्प्लिन: Difference between revisions

Revision as of 21:39, 7 August 2023

घन स्प्लिन परिभाषा

घन स्मूथिंग स्प्लिन की व्युत्पत्ति

डी बूर का दृष्टिकोण

बहुआयामी विभाजन

संबंधित विधियाँ

स्रोत कोड

संदर्भ

अग्रिम पठन

Navigation

Wiki tools

Page tools

Other projects

Categories