स्मूथिंग स्प्लिन

From Vigyanwiki
Revision as of 19:14, 22 August 2023 by Manidh (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

स्मूथिंग स्प्लिन फलन अनुमान हैं, , रव अवलोकनों के एक सेट से प्राप्त किया गया लक्ष्य का , फिट की अच्छाई के एक माप को संतुलित करने के लिए को की स्मूथिंग के व्युत्पन्न आधारित माप के साथ . वे रव को कम करने का एक साधन प्रदान करते हैं आंकड़े। सबसे परिचित उदाहरण क्यूबिक स्मूथिंग स्प्लाइन है, लेकिन इस स्थिति सहित कई अन्य संभावनाएं भी हैं एक सदिश राशि हैl

घन स्प्लिन परिलैंग्वेज

मान लीजिये संबंध द्वारा प्रतिरूपित अवलोकनों का एक समूह बनें जहां स्वतंत्र, शून्य माध्य यादृच्छिक चर हैं (सामान्यतः स्थिर विचरण माना जाता है)। घन स्मूथिंग स्प्लिनअनुमान फलन का को न्यूनतम (दो बार भिन्न फलन के वर्ग पर) के रूप में परिभाषित किया गया है[1][2]

टिप्पणियां:

  • एक स्मूथिंग पैरामीटर है, जो डेटा के प्रति निष्ठा और फलन अनुमान के खुरदरेपन के बीच व्यापार-बंद को नियंत्रित करता है। इसका अनुमान प्रायः सामान्यीकृत क्रॉस-सत्यापन द्वारा लगाया जाता है,[3] या प्रतिबंधित सीमांत संभावना (आरईएमएल) द्वारा जो स्प्लाइन स्मूथिंग और बायेसियन अनुमान के बीच लिंक का फायदा उठाता है (स्मूथिंग पेनल्टी को पूर्व में प्रेरित होने के रूप में देखा जा सकता है ).[4]
  • इंटीग्रल का मूल्यांकन प्रायः संपूर्ण वास्तविक रेखा पर किया जाता है, हालांकि सीमा को उसी तक सीमित करना भी संभव है .
  • जैसा (कोई स्मूथिंग नहीं), स्मूथिंग स्प्लाइन अंतर्वेशित स्प्लिनमें परिवर्तित हो जाती है।
  • जैसा (अनंत स्मूथिंग), खुरदरापन जुर्माना सर्वोपरि हो जाता है और अनुमान सामान्य न्यूनतम वर्ग अनुमान में परिवर्तित हो जाता है।
  • दूसरे व्युत्पन्न पर आधारित खुरदरापन दंड आधुनिक सांख्यिकी साहित्य में सबसे आम है, हालांकि इस पद्धति को अन्य व्युत्पन्न पर आधारित दंड के लिए आसानी से अपनाया जा सकता है।
  • प्रारंभिक साहित्य में, समान-स्थान वाले क्रम के साथ , डेरिवेटिव के बजाय दूसरे या तीसरे क्रम के अंतर का उपयोग दंड में किया गया था।[5]
  • वर्गों के दण्डित योग को सुचारू करने वाले उद्देश्य को दण्डित संभाव्यता उद्देश्य द्वारा प्रतिस्थापित किया जा सकता है जिसमें वर्गों के पदों के योग को डेटा के प्रति निष्ठा के एक अन्य लॉग-संभावना आधारित माप द्वारा प्रतिस्थापित किया जाता है।[1]वर्ग पद का योग गाऊसी धारणा के साथ पीनलाइज़ संभावना से मेल खाता है .

घन स्मूथिंग स्प्लिन की व्युत्पत्ति

स्मूथिंग स्पलाइन को दो चरणों में फिट करने के बारे में सोचना उपयोगी है:

  1. सबसे पहले, मान प्राप्त करें .
  2. इन मूल्यों से निष्कर्ष निकालें सभी x के लिए

अब, पहले दूसरे चरण का इलाज करें।

सदिश को देखते हुए फिट किए गए मानों में, स्प्लिनमानदंड का योग-वर्ग भाग निश्चित होता है। यह केवल न्यूनतम करने के लिए ही रह गया है , और मिनिमाइज़र एक प्राकृतिक क्यूबिक स्प्लाइन (गणित) है जो बिंदुओं को प्रक्षेपित करता है . यह इंटरपोलेटिंग स्पलाइन एक रैखिक ऑपरेटर है, और इसे फॉर्म में लिखा जा सकता है

जहां स्प्लिनआधार फलन का एक सेट हैं। परिणामस्वरूप खुरदरापन दंड का रूप धारण कर लेता है

जहां A के तत्व हैं . आधार कार्य, और इसलिए आव्यूह A, भविष्यवक्ता चर के विन्यास पर निर्भर करता है , लेकिन प्रतिक्रियाओं पर नहीं या .

A, द्वारा दिया गया एक n×n आव्यूह है .

Δ तत्वों के साथ दूसरे अंतर का एक (n-2)×n आव्यूह है:

, ,

W तत्वों के साथ एक (n-2)×(n-2) सममित त्रि-विकर्ण आव्यूह है:

, और , क्रमिक गांठों (नाट) (या x मान) के बीच की दूरी।

अब पहले चरण पर वापस जाएँ। दण्डित (पीनलाइज़) योग-वर्गों को इस प्रकार लिखा जा सकता है

जहां .

न्यूनतमीकरण करना विरुद्ध भेद करके . इस में यह परिणाम:

[6] और

डी बूर का दृष्टिकोण

डी बूर का दृष्टिकोण एक ही विचार का उपयोग करता है, एक स्मूथ वक्र होने और दिए गए डेटा के करीब होने के बीच संतुलन खोजने का।[7]

जहां एक पैरामीटर है जिसे स्मूथ कारक कहा जाता है और यह अंतराल से संबंधित है , और वे मात्राएँ हैं जो स्मूथिंग की सीमा को नियंत्रित करती हैं (वे वजन का प्रतिनिधित्व करती हैं प्रत्येक बिंदु का ). व्यवहार में, चूंकि घन विभाजन का अधिकतर उपयोग किया जाता है, सामान्यतः है . के लिए समाधान 1967 में रिंस्च द्वारा प्रस्तावित किया गया था।[8]के लिए , जब दृष्टिकोण , दिए गए डेटा के प्राकृतिक स्पलाइन इंटरपोलेंट में परिवर्तित हो जाता है।[7]जैसा दृष्टिकोण , एक सीधी रेखा (सबसे स्मूथ वक्र) में परिवर्तित हो जाती है। का उपयुक्त मान ज्ञात करने के बाद से परीक्षण और त्रुटि का कार्य है, एक निरर्थक स्थिरांक सुविधा के लिए पेश किया गया था।[8]

का मान संख्यात्मक रूप से निर्धारित करने के लिए उपयोग किया जाता है ताकि फलन निम्नलिखित शर्त को पूरा करता है:

डी बूर द्वारा वर्णित एल्गोरिदम प्रांरम्भ होता है और बढ़ जाता है जब तक शर्त पूरी नहीं हो जाती.[7]अगर के लिए मानक विचलन का एक अनुमान है , स्थिरांक अंतराल में चुनने की अनुशंसा की जाती है . रखना इसका तात्पर्य है कि समाधान प्राकृतिक स्पलाइन इंटरपोलेंट है।[8]की बढ़ती इसका तात्पर्य है कि हम दिए गए डेटा से दूर जाकर एक चिकना वक्र प्राप्त करते हैं।

बहुआयामी विभाजन

एक अदिश राशि के संबंध में स्मूथिंग से सामान्यीकरण करने की विधि के दो मुख्य वर्ग हैं सदिश के संबंध में स्मूथिंग करने के लिए

. पहला दृष्टिकोण बहुआयामी सेटिंग के लिए स्प्लाइन स्मूथिंग पेनल्टी को सामान्यीकृत करता है। उदाहरण के लिए, यदि अनुमान लगाने का प्रयास किया जा रहा है  हम  पतली प्लेट स्प्लिन पेनाल्टी का उपयोग कर सकते हैं और इसका पता लगा सकते हैं  कम से कम

पतली प्लेट स्प्लिनदृष्टिकोण को दो से अधिक आयामों और दंड में विभेदन के अन्य आदेशों के संबंध में स्मूथिंग करने के लिए सामान्यीकृत किया जा सकता है।[1]जैसे-जैसे आयाम बढ़ता है, अंतर के सबसे छोटे क्रम पर कुछ प्रतिबंध होते हैं जिनका उपयोग किया जा सकता है,[1]लेकिन वास्तव में डचॉन का मूल पेपर,[9] थोड़ा अधिक जटिल दंड देता है जिससे इस प्रतिबंध से बचा जा सकता है।

पतली प्लेट स्प्लिन आइसोट्रोपिक हैं, जिसका अर्थ है कि यदि हम घूमते हैं समन्वय प्रणाली का अनुमान नहीं बदलेगा, लेकिन यह भी हम मान रहे हैं कि सभी दिशाओं में समान स्तर का स्मूथिंग उपयुक्त है। स्थानिक स्थान के संबंध में समायोजन करते समय इसे प्रायः उचित माना जाता है, लेकिन कई अन्य स्थितियो में आइसोट्रॉपी एक उचित धारणा नहीं है और माप इकाइयों के स्पष्ट रूप से मनमाने विकल्पों के प्रति संवेदनशीलता पैदा कर सकता है। उदाहरण के लिए, यदि दूरी और समय के संबंध में स्मूथिंग की जाती है तो एक आइसोट्रोपिक स्मूथर अलग-अलग परिणाम देगा यदि दूरी मीटर में और समय सेकंड में मापा जाता है, तो क्या होगा यदि हम इकाइयों को सेंटीमीटर और घंटों में बदल दें।

बहु-आयामी स्मूथिंग के सामान्यीकरण का दूसरा वर्ग सीधे तौर पर टेंसर उत्पाद स्पलाइन निर्माणों का उपयोग करके इस पैमाने के अपरिवर्तनीय मुद्दे से संबंधित है।[10][11][12] इस तरह के स्प्लिन में कई स्मूथिंग मापदंडों के साथ स्मूथिंग पेनल्टी होती है, जो वह कीमत है जिसे यह मानने के लिए भुगतान किया जाना चाहिए कि स्मूथिंग की समान डिग्री सभी दिशाओं में उपयुक्त है।

संबंधित विधियाँ

स्मूथिंग स्प्लिन संबंधित हैं, लेकिन इनसे अलग हैं:

  • रिग्रेशन स्प्लाइन (प्रतिगमन स्प्लाइन) इस पद्धति में, डेटा को कम गांठों के सेट के साथ, सामान्यतः कम से कम वर्गों के साथ, स्प्लिनआधार फलन के एक सेट में फिट किया जाता है। किसी खुरदरापन (रफनेस) दंड का उपयोग नहीं किया जाता है। (बहुभिन्नरूपी अनुकूली प्रतिगमन स्प्लिन भी देखें।)
  • पीनलाइज़ स्प्लाइन यह प्रतिगमन स्प्लिन की कम हुई गांठों को स्मूथिंग स्प्लिन के खुरदरेपन के दंड के साथ जोड़ता है।[13][14]
  • कई गुना सीखने के लिए पतली प्लेट स्प्लिन और इलास्टिक मानचित्र विधि। यह विधि सन्निकटन त्रुटि के लिए न्यूनतम वर्ग दंड को सन्निकटन मैनिफोल्ड के झुकने और खींचने वाले दंड के साथ जोड़ती है और अनुकूलन समस्या के मोटे विवेक का उपयोग करती है।

स्रोत कोड

स्प्लाइन (गणित) स्मूथिंग के लिए स्रोत कोड कार्ल आर. डी बूर; कार्ल डी बूर की पुस्तक ए प्रैक्टिकल गाइड टू स्प्लिंस के उदाहरणों में पाया जा सकता है। उदाहरण फोरट्रान प्रोग्रामिंग लैंग्वेज में हैं। अद्यतन स्रोत कार्ल डी बूर की आधिकारिक साइट [1] पर भी उपलब्ध हैं।

संदर्भ

  1. 1.0 1.1 1.2 1.3 Green, P. J.; Silverman, B.W. (1994). Nonparametric Regression and Generalized Linear Models: A roughness penalty approach. Chapman and Hall.
  2. Hastie, T. J.; Tibshirani, R. J. (1990). सामान्यीकृत योजक मॉडल. Chapman and Hall. ISBN 978-0-412-34390-2.
  3. Craven, P.; Wahba, G. (1979). "स्प्लाइन फ़ंक्शंस के साथ शोर वाले डेटा को सुचारू करना". Numerische Mathematik. 31 (4): 377–403. doi:10.1007/bf01404567.
  4. Kimeldorf, G.S.; Wahba, G. (1970). "स्टोकेस्टिक प्रक्रियाओं पर बायेसियन अनुमान और स्प्लिंस द्वारा स्मूथिंग के बीच एक पत्राचार". The Annals of Mathematical Statistics. 41 (2): 495–502. doi:10.1214/aoms/1177697089.
  5. Whittaker, E.T. (1922). "ग्रेजुएशन की एक नई पद्धति पर". Proceedings of the Edinburgh Mathematical Society. 41: 63–75.
  6. Rodriguez, German (Spring 2001). "चौरसाई और गैर-पैरामीट्रिक प्रतिगमन" (PDF) (in English). 2.3.1 Computation. p. 12. Retrieved 28 August 2017.{{cite web}}: CS1 maint: location (link)
  7. 7.0 7.1 7.2 De Boor, C. (2001). स्प्लिंस के लिए एक व्यावहारिक मार्गदर्शिका (संशोधित संस्करण). Springer. pp. 207–214. ISBN 978-0-387-90356-9.
  8. 8.0 8.1 8.2 Reinsch, Christian H (1967). "स्प्लाइन फ़ंक्शंस द्वारा स्मूथिंग". Numerische Mathematik. 10 (3): 177–183. doi:10.1007/BF02162161.
  9. J. Duchon, 1976, Splines minimizing rotation invariant semi-norms in Sobolev spaces. pp 85–100, In: Constructive Theory of Functions of Several Variables, Oberwolfach 1976, W. Schempp and K. Zeller, eds., Lecture Notes in Math., Vol. 571, Springer, Berlin, 1977
  10. Wahba, Grace. अवलोकन डेटा के लिए तख़्ता मॉडल. SIAM.
  11. Gu, Chong (2013). Smoothing Spline ANOVA Models (2nd ed.). Springer.
  12. Wood, S. N. (2017). Generalized Additive Models: An Introduction with R (2nd ed). Chapman & Hall/CRC. ISBN 978-1-58488-474-3.
  13. Eilers, P.H.C. and Marx B. (1996). "बी-स्प्लिन और पेनाल्टी के साथ लचीली स्मूथिंग". Statistical Science. 11 (2): 89–121.
  14. Ruppert, David; Wand, M. P.; Carroll, R. J. (2003). सेमीपैरामीट्रिक रिग्रेशन. Cambridge University Press. ISBN 978-0-521-78050-6.


अग्रिम पठन

  • Wahba, G. (1990). Spline Models for Observational Data. SIAM, Philadelphia.
  • Green, P. J. and Silverman, B. W. (1994). Nonparametric Regression and Generalized Linear Models. CRC Press.
  • De Boor, C. (2001). A Practical Guide to Splines (Revised Edition). Springer.