मॉडल चयन: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से | {{Short description|Task of selecting a statistical model from a set of candidate models}}मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।<ref> {{ cite book | title=The elements of statistical learning | author= Hastie, Tibshirani, Friedman | date=2009| publisher=Springer | pages=195}} </ref> सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से [[सांख्यिकीय मॉडल]] का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)। | ||
{{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है। | {{harvtxt|कोनिशी|कितागावा|2008|p=75}} कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, {{harvtxt|कॉक्स|2006|p=197}} ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है। | ||
मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के | मॉडल चयन [[निर्णय सिद्धांत]] या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।<ref>{{cite journal |title=निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका|journal=Computers & Geosciences |date=2016 |volume=96 |pages=109–123 |doi=10.1016/j.cageo.2016.08.002|last1=Shirangi |first1=Mehrdad G. |last2=Durlofsky |first2=Louis J. |bibcode=2016CG.....96..109S }}</ref> | ||
[[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में | [[ यंत्र अधिगम |यंत्र अधिगम]] में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में [[फीचर चयन|लक्षण वरण]], [[हाइपरपैरामीटर अनुकूलन|अतिप्राचल अनुकूलन]] और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं। | ||
== परिचय == | == परिचय == | ||
[[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई | [[File:ObservationCycle.png|right|thumb|वैज्ञानिक अवलोकन चक्र।]]अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब [[गैलीलियो]] ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया {{Citation needed|date=September 2017}}। | ||
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः | अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में [[बहुपद]] जैसे सरल मॉडल का उपयोग किया जाता है {{Citation needed|date=September 2017}}। {{harvtxt|बर्नहैम|एंडरसन|2002}} ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है। | ||
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य | एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी {{Citation needed|date=September 2017}}। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं।(संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः [[संभावना-अनुपात परीक्षण]] दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है। | ||
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)]] पर भी प्रायः विचार किया जाता है। | मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। [[एक अनुमानक का पूर्वाग्रह|अनुमानक का पूर्वाग्रह]] और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; [[दक्षता (सांख्यिकी)|दक्षता(सांख्यिकी]]) पर भी प्रायः विचार किया जाता है। | ||
मॉडल चयन का एक मानक उदाहरण | मॉडल चयन का एक मानक उदाहरण [[वक्र फिटिंग|वक्र आसंजन]] का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है। | ||
== मॉडल चयन की दो दिशाएँ == | == मॉडल चयन की दो दिशाएँ == | ||
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। | डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है। | ||
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> | दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।<ref name=":0">{{Cite journal|last1=Ding|first1=Jie|last2=Tarokh|first2=Vahid|last3=Yang|first3=Yuhong|date=2018|title=Model Selection Techniques: An Overview|url=https://resolver.caltech.edu/CaltechAUTHORS:20181128-150927005|journal=IEEE Signal Processing Magazine|volume=35|issue=6|pages=16–34|doi=10.1109/MSP.2018.2867638|arxiv=1810.09583|bibcode=2018ISPM...35f..16D |s2cid=53035396|issn=1053-5888}}</ref> प्रथम दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा। | ||
दूसरी दिशा उत्कृष्ट | दूसरी दिशा उत्कृष्ट पूर्वकथन प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(भविष्यवाणी) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।<ref name=":0" /> इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।<ref name="adv">{{Cite journal|last1=Su|first1=J.|first2=D.V.|last2=Vargas|first3=K.|last3=Sakurai|title=डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक|journal=IEEE Transactions on Evolutionary Computation|volume=23|issue=5|pages=828–841|date=2019|doi=10.1109/TEVC.2019.2890858|arxiv=1710.08864|s2cid=2698863 }}</ref> | ||
==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां== | ==उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां== | ||
* [[डेटा परिवर्तन (सांख्यिकी)]] | * [[डेटा परिवर्तन (सांख्यिकी)|डेटा परिवर्तन(सांख्यिकी)]] | ||
*[[अन्वेषणात्मक डेटा विश्लेषण]] | *[[अन्वेषणात्मक डेटा विश्लेषण]] | ||
*[[सांख्यिकीय मॉडल विनिर्देश]] | *[[सांख्यिकीय मॉडल विनिर्देश]] | ||
Line 34: | Line 34: | ||
== मानदंड == | == मानदंड == | ||
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं (i) एकाइक सूचना मानदंड और (ii) बेयस कारक और/या बायेसियन सूचना मानदंड (जो | नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं(i) एकाइक सूचना मानदंड और(ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें | ||
{{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए। | {{Harvtxt|स्टोइका|सेलेन|2004|}} समीक्षा के लिए। | ||
* आकाइक सूचना मानदंड (एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक | * आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक | ||
* बेयस कारक | * बेयस कारक | ||
* [[बायेसियन सूचना मानदंड]] (बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | * [[बायेसियन सूचना मानदंड]](बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड | ||
* ब्रिज मानदंड (बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की | * ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक प्रदर्शन को प्राप्त कर सकता है।<ref>{{Cite journal|last1=Ding|first1=J.|last2=Tarokh|first2=V.|last3=Yang|first3=Y.|date=June 2018|title=Bridging AIC and BIC: A New Criterion for Autoregression|url=https://ieeexplore.ieee.org/document/7953690|journal=IEEE Transactions on Information Theory|volume=64|issue=6|pages=4024–4043|doi=10.1109/TIT.2017.2717599|issn=1557-9654|arxiv=1508.02473|s2cid=5189440}}</ref> | ||
* अंतः वैधीकरण (सांख्यिकी) | * अंतः वैधीकरण(सांख्यिकी) | ||
* [[विचलन सूचना मानदंड]] (डीआईसी), एक अन्य बायेसियन | * [[विचलन सूचना मानदंड]](डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड | ||
* [[झूठी खोज दर|असत्य खोज दर]] | * [[झूठी खोज दर|असत्य खोज दर]] | ||
* [[केंद्रित सूचना मानदंड]] (एफआईसी), एक चयन मानदंड जो किसी दिए गए | * [[केंद्रित सूचना मानदंड]](एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है | ||
* हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | * हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प | ||
* [[कश्यप सूचना मानदंड]] (केआईसी) एआईसी और बीआईसी का एक | * [[कश्यप सूचना मानदंड]](केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करता है | ||
* संभावना-अनुपात परीक्षण | * संभावना-अनुपात परीक्षण | ||
* | * मलोज का C<sub>p</sub> [[न्यूनतम विवरण लंबाई]] | ||
* [[न्यूनतम संदेश लंबाई]] (एमएमएल) | * [[न्यूनतम संदेश लंबाई]](एमएमएल) | ||
* | * मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है | ||
* [[संरचनात्मक जोखिम न्यूनीकरण]] | * [[संरचनात्मक जोखिम न्यूनीकरण|संरचनात्मक विपत्ति न्यूनीकरण]] | ||
* [[चरणबद्ध प्रतिगमन]] | * [[चरणबद्ध प्रतिगमन]] | ||
* वातानाबे-एकाइक सूचना मानदंड (डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है | * वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है | ||
* विस्तारित बेयसियन सूचना मानदंड (ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड (बीआईसी) का विस्तार है। | * विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है। | ||
* [[विस्तारित फिशर सूचना मानदंड]] (EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | * [[विस्तारित फिशर सूचना मानदंड]](EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है। | ||
* प्रतिबंधित न्यूनतम मानदंड (CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | * प्रतिबंधित न्यूनतम मानदंड(CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।<ref>{{cite journal |first1=Min |last1=Tsao |year=2023 |title=लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन|journal=Canadian Journal of Statistics | doi=10.1002/cjs.11756 |arxiv=2107.08529 |s2cid=236087375 }}</ref> | ||
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए | इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमूल्य है।{{cn|date=May 2021}} | ||
{{Harvtxt| | {{Harvtxt|बर्नहैम|एंडरसन|2002|loc= §6.3}} निम्नलिखित कहते हैं: | ||
{{quote|text= | {{quote|text=मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें ''[[दक्षता (सांख्यिकी)|कुशल]]''' और ''[[कंसिस्टेंसी (सांख्यिकी)|सुसंगत]]'' नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।}} | ||
== यह भी देखें == | == यह भी देखें == | ||
{{div col|colwidth=30em}} | {{div col|colwidth=30em}} | ||
* [[सभी मॉडल | * [[सभी मॉडल अनुचित हैं]] | ||
* [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]] | * [[प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण]] | ||
* [[स्वचालित मशीन | * [[स्वचालित मशीन अधिगम]] (ऑटोएमएल) | ||
* बायस-विचरण | * बायस-विचरण असमंजस | ||
* | * लक्षण वरण | ||
* फ्रीडमैन का विरोधाभास | * फ्रीडमैन का विरोधाभास | ||
* [[ग्रिड खोज]] | * [[ग्रिड खोज]] | ||
* [[ | * [[अभिनिर्धारणीयता विश्लेषण]] | ||
* [[लॉग- | * [[लॉग-रैखिक विश्लेषण]] | ||
* [[मॉडल | * [[मॉडल अभिनिर्धारण]] | ||
* ओकाम का उस्तरा | * ओकाम का उस्तरा | ||
* इष्टतम डिजाइन | * इष्टतम डिजाइन | ||
* [[पैरामीटर | * [[पैरामीटर अभिनिर्धारण समस्या]] | ||
* [[वैज्ञानिक मॉडलिंग]] | * [[वैज्ञानिक मॉडलिंग]] | ||
* [[सांख्यिकीय मॉडल सत्यापन]] | * [[सांख्यिकीय मॉडल सत्यापन]] | ||
* | * स्टीन का विरोधाभास | ||
{{div col end}} | {{div col end}} | ||
Line 93: | Line 93: | ||
*{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }} | *{{citation | last1 = Breiman | first1 = L. | author-link = Leo Breiman | year = 2001 | title = Statistical modeling: the two cultures | journal = [[Statistical Science]] | volume = 16 | pages = 199–231 | doi=10.1214/ss/1009213726| doi-access = free }} | ||
*{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]] | *{{citation|last1=Burnham|first1=K.P.|last2=Anderson|first2=D.R.|year=2002|title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach|edition=2nd|publisher=Springer-Verlag|isbn=0-387-95364-7|url-access=registration|url=https://archive.org/details/modelselectionmu0000burn}} [this has over 38000 citations on [[Google Scholar]]] | ||
*{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}} (reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}}) | *{{citation|last=Chamberlin|first=T.C.|year=1890|title=The method of multiple working hypotheses|journal=[[Science (journal)|Science]]|volume=15|issue=366|pages=92–6|doi=10.1126/science.ns-15.366.92|pmid=17782687|bibcode=1890Sci....15R..92.}}(reprinted 1965, ''Science'' 148: 754–759 [https://web.archive.org/web/20161117210123/http://www.d.umn.edu/~mille066/Teaching/3000/Chamberlin-MWH.pdf] {{doi|10.1126/science.148.3671.754}}) | ||
*{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }} | *{{Citation | first= G. | last= Claeskens | author-link= Gerda Claeskens | title= Statistical model choice | journal= [[Annual Review of Statistics and Its Application]] | year= 2016 | volume= 3 | issue= 1 | pages= 233–256 | doi= 10.1146/annurev-statistics-041715-033413 | url= https://feb.kuleuven.be/public/ndbaf45/papers/KBI_1521.pdf | bibcode= 2016AnRSA...3..233C }}{{Dead link|date=April 2020 |bot=InternetArchiveBot |fix-attempted=yes }} | ||
*{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}} | *{{citation|last1=Claeskens|first1=G.|author-link2=Nils Lid Hjort|last2=Hjort|first2=N.L.|year=2008|title=Model Selection and Model Averaging|publisher=Cambridge University Press|url=https://books.google.com/books?id=sjQFwB2XEFAC&q=%22Model+Selection+and+Model+Averaging%22|isbn=9781139471800}} |
Revision as of 08:51, 31 March 2023
मॉडल चयन प्रदर्शन मानदंड के आधार पर विभिन्न उम्मीदवारों में से एक मॉडल का चयन करने का कार्य है ताकि सर्वश्रेष्ठ का चयन किया जा सके।[1] सीखने के संदर्भ में, यह डेटा दिए गए उम्मीदवार मॉडल के एक समूह से सांख्यिकीय मॉडल का चयन हो सकता है। सरलतम स्थितियों में, डेटा के पूर्व से स्थित समूह पर विचार किया जाता है। यद्यपि, कार्य में प्रयोगों के डिज़ाइन को भी सम्मिलित किया जा सकता है जैसे कि डेटा संग्रह मॉडल चयन की समस्या के अनुकूल हो। समान पूर्वकथन या व्याख्यात्मक अधिकार के उम्मीदवार मॉडल को देखते हुए, सबसे सरल मॉडल सबसे ठीक विकल्प होने की संभावना है(ओकाम का रेजर)।
कोनिशी & कितागावा (2008, p. 75) कहते हैं, सांख्यिकीय अनुमान में अधिकांश समस्याओं को सांख्यिकीय मॉडलिंग से संबंधित समस्याओं के रूप में माना जा सकता है। संबंधित रूप से, कॉक्स (2006, p. 197) ने कहा है, कैसे [] विषय-वस्तु समस्या से सांख्यिकीय मॉडल में अनुवाद किया जाता है, यह प्रायः एक विश्लेषण का सबसे महत्वपूर्ण भाग होता है।
मॉडल चयन निर्णय सिद्धांत या अनिश्चितता के अंतर्गत अनुकूलन के उद्देश्य के लिए कम्प्यूटेशनल मॉडल के बड़े समूह से कुछ प्रतिनिधि मॉडल चुनने की समस्या का भी उल्लेख कर सकता है।[2]
यंत्र अधिगम में, मॉडल चयन के एल्गोरिथम दृष्टिकोण में लक्षण वरण, अतिप्राचल अनुकूलन और सांख्यिकीय शिक्षण सिद्धांत सम्मिलित हैं।
परिचय
अपने सबसे आधारभूत रूपों में, मॉडल चयन वैज्ञानिक पद्धति के मूलभूत कार्यों में से एक है। अवलोकनों की एक श्रृंखला की व्याख्या करने वाले सिद्धांत का निर्धारण प्रायः उन अवलोकनों की भविष्यवाणी करने वाले गणितीय मॉडल से सीधे जुड़ा होता है। उदाहरण के लिए, जब गैलीलियो ने गुरुत्वाकर्षण प्रयोगों के अपने अरिस्टोटेलियन सिद्धांत का प्रदर्शन किया, तो उन्होंने प्रदर्शित किया कि गेंदों की गति ने उनके मॉडल द्वारा भविष्यवाणी की गई अनुवृत्त को आक्षेप किया[citation needed]।
अनगिनत संभावित तंत्रों और प्रक्रियाओं में से जो डेटा का उत्पादन कर सकते थे, कोई कैसे सबसे ठीक मॉडल चुनना प्रारम्भ कर सकता है? गणितीय दृष्टिकोण सामान्यतः उम्मीदवार मॉडल के समूह के बीच निर्णय लेता है; यह समूह शोधकर्ता द्वारा चुना जाना चाहिए। कम से कम प्रारम्भ में बहुपद जैसे सरल मॉडल का उपयोग किया जाता है[citation needed]। बर्नहैम & एंडरसन (2002) ने अपनी पूर्ण पुस्तक में ध्वनि वैज्ञानिक सिद्धांतों के आधार पर मॉडल चुनने के महत्व पर बल दिया है, जैसे कि घटना संबंधी प्रक्रियाओं या तंत्र(जैसे, रासायनिक प्रतिक्रियाओं) की समझ डेटा अंतर्निहित है।
एक बार उम्मीदवार मॉडल का समूह चुने जाने के बाद, सांख्यिकीय विश्लेषण हमें इन मॉडलों में से सर्वश्रेष्ठ का चयन करने की अनुमति देता है। सबसे ठीक का तात्पर्य विवादास्पद है। उचित मॉडल चयन तकनीक आसंजन श्रेष्ठता को सरलता के साथ संतुलित करेगी[citation needed]। अधिक जटिल मॉडल डेटा को आक्षेप करने के लिए अपने अमाप को ठीक रूप से अनुकूलित करने में सक्षम होंगे(उदाहरण के लिए, पांचवें क्रम का बहुपद छह बिंदुओं को यथार्थ रूप से आक्षेप कर सकता है), परन्तु अतिरिक्त पैरामीटर किसी भी उपयोगी चीज का प्रतिनिधित्व नहीं कर सकते हैं।(संभवतः उन छह बिंदुओं को वस्तुतः सीधी रेखा के विषय में यादृच्छिक रूप से वितरित किया जाता है।) आसंजन श्रेष्ठता सामान्यतः संभावना-अनुपात परीक्षण दृष्टिकोण, या इसके अनुमान का उपयोग करके निर्धारित की जाती है, जिससे ची-स्क्वेर्ड परीक्षण होता है। सामान्यतः मॉडल में सांख्यिकीय मापदंडों की संख्या की गणना करके जटिलता को मापा जाता है।
मॉडल चयन तकनीकों को कुछ भौतिक मात्रा के अनुमानक के रूप में माना जा सकता है, जैसे कि दिए गए डेटा का उत्पादन करने वाले मॉडल की संभावना। अनुमानक का पूर्वाग्रह और विचरण दोनों इस अनुमानक की गुणवत्ता के महत्वपूर्ण उपाय हैं; दक्षता(सांख्यिकी) पर भी प्रायः विचार किया जाता है।
मॉडल चयन का एक मानक उदाहरण वक्र आसंजन का है, जहां, बिंदुओं का एक समूह और अन्य पृष्ठभूमि ज्ञान दिया गया है(उदाहरण के लिए अंक i.i.d. प्रतिदर्श का परिणाम हैं), हमें एक वक्र का चयन करना चाहिए जो उस प्रकार्य का वर्णन करता है जो अंक उत्पन्न करता है।
मॉडल चयन की दो दिशाएँ
डेटा से अनुमान लगाने और सीखने के दो मुख्य उद्देश्य हैं। वैज्ञानिक खोज के लिए है, जिसे सांख्यिकीय अनुमान भी कहा जाता है, अंतर्निहित डेटा-सृजन तंत्र की समझ और डेटा की प्रकृति की व्याख्या। डेटा से सीखने के अन्य उद्देश्य भविष्य या अपठित टिप्पणियों की भविष्यवाणी करना है, जिसे सांख्यिकीय भविष्यवाणी भी कहा जाता है। द्वितीय उद्देश्य में, डेटा वैज्ञानिक आवश्यक रूप से डेटा के यथार्थ संभाव्य विवरण की चिंता नहीं करता है। निस्सन्देह, किसी की रूचि दोनों दिशाओं में भी हो सकती है।
दो अलग-अलग उद्देश्यों के अनुरूप, मॉडल चयन की भी दो दिशाएँ हो सकती हैं: अनुमान के लिए मॉडल चयन और भविष्यवाणी के लिए मॉडल चयन।[3] प्रथम दिशा डेटा के लिए सर्वश्रेष्ठ मॉडल की अभिनिर्धारण करना है, जो वैज्ञानिक व्याख्या के लिए अनिश्चितता के स्रोतों का एक विश्वसनीय लक्षण वर्णन प्रदान करेगा। इस लक्ष्य के लिए, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि चयनित मॉडल प्रतिदर्श अमाप के प्रति बहुत अधिक संवेदनशील न हो। तदनुसार, मॉडल चयन के मूल्यांकन के लिए एक आक्षेप धारणा चयन स्थिरता है, जिसका अर्थ है कि सबसे सुदृढ़ आँकड़े परिभाषा उम्मीदवार को पर्याप्त रूप से कई डेटा प्रतिदर्श दिए जाने पर निरंतर चुना जाएगा।
दूसरी दिशा उत्कृष्ट पूर्वकथन प्रदर्शन प्रदान करने के लिए एक मॉडल को मशीनरी के रूप में चुनना है। बाद के लिए, यद्यपि, चयनित मॉडल कुछ निकटवर्ती प्रतिस्पर्धियों के बीच भाग्यशाली विजेता हो सकता है, फिर भी अनुमानित प्रदर्शन अभी भी सर्वोत्तम संभव हो सकता है। यदि ऐसा है, तो द्वितीय लक्ष्य(भविष्यवाणी) के लिए मॉडल का चयन ठीक है, परन्तु अंतर्दृष्टि और व्याख्या के लिए चयनित मॉडल का उपयोग गंभीर रूप से अविश्वसनीय और भ्रामक हो सकता है।[3] इसके अतिरिक्त, इस प्रकार से चुने गए बहुत जटिल मॉडलों के लिए, यहां तक कि पूर्वानुमान भी उन आंकड़ों के लिए अनुचित हो सकते हैं, जिन पर चयन किया गया था।[4]
उम्मीदवार मॉडलों के समूह को चुनने में सहायता करने की विधियां
मानदंड
नीचे मॉडल चयन के लिए मानदंडों की एक सूची दी गई है। सबसे अधिक उपयोग किए जाने वाले मानदंड हैं(i) एकाइक सूचना मानदंड और(ii) बेयस कारक और/या बायेसियन सूचना मानदंड(जो पूर्णतया बेयस कारक का अनुमान लगाते हैं), देखें
स्टोइका & सेलेन (2004) समीक्षा के लिए।
- आकाइक सूचना मानदंड(एआईसी), एक अनुमानित सांख्यिकीय मॉडल की आसंजन श्रेष्ठता का मापक
- बेयस कारक
- बायेसियन सूचना मानदंड(बीआईसी), जिसे श्वार्ज़ सूचना मानदंड के रूप में भी जाना जाता है, मॉडल चयन के लिए एक सांख्यिकीय मानदंड
- ब्रिज मानदंड(बीसी), एक सांख्यिकीय मानदंड जो मॉडल विनिर्देश की उपयुक्तता के अतिरिक्त एआईसी और बीआईसी के ठीक प्रदर्शन को प्राप्त कर सकता है।[5]
- अंतः वैधीकरण(सांख्यिकी)
- विचलन सूचना मानदंड(डीआईसी), एक अन्य बायेसियन अभिविन्यस्त मॉडल चयन मानदंड
- असत्य खोज दर
- केंद्रित सूचना मानदंड(एफआईसी), एक चयन मानदंड जो किसी दिए गए केंद्रित पैरामीटर के लिए उनकी प्रभावशीलता द्वारा सांख्यिकीय मॉडल को क्रमबद्ध करता है
- हन्नान-क्विन सूचना मानदंड, एकैके और बायेसियन मानदंड का एक विकल्प
- कश्यप सूचना मानदंड(केआईसी) एआईसी और बीआईसी का एक प्रभावशाली विकल्प है, क्योंकि केआईसी फिशर सूचना आधात्री का उपयोग करता है
- संभावना-अनुपात परीक्षण
- मलोज का Cp न्यूनतम विवरण लंबाई
- न्यूनतम संदेश लंबाई(एमएमएल)
- मुद्रण सांख्यिकी, जिसे मुद्रण मानदंड के रूप में भी जाना जाता है
- संरचनात्मक विपत्ति न्यूनीकरण
- चरणबद्ध प्रतिगमन
- वातानाबे-एकाइक सूचना मानदंड(डब्ल्यूएआईसी), जिसे व्यापक रूप से लागू सूचना मानदंड भी कहा जाता है
- विस्तारित बेयसियन सूचना मानदंड(ईबीआईसी) उच्च पैरामीटर रिक्त स्थान वाले मॉडल के लिए साधारण बायेसियन सूचना मानदंड(बीआईसी) का विस्तार है।
- विस्तारित फिशर सूचना मानदंड(EFIC) रैखिक प्रतिगमन मॉडल के लिए एक मॉडल चयन मानदंड है।
- प्रतिबंधित न्यूनतम मानदंड(CMC) एक ज्यामितीय आधार के साथ प्रतिगमन मॉडल का चयन करने के लिए एक फ़्रीक्वेंटिस्ट मानदंड है।[6]
इन मानदंडों में, पर्यवेक्षित सीखने की समस्याओं के लिए अंतः वैधीकरण सामान्यतः सबसे यथार्थ और कम्प्यूटेशनल रूप से सबसे बहुमूल्य है।[citation needed]
बर्नहैम & एंडरसन (2002, §6.3) निम्नलिखित कहते हैं:
मॉडल चयन विधियों की एक विविधता है। यद्यपि, एक विधि के सांख्यिकीय प्रदर्शन और इसके उपयोग के इच्छित संदर्भ के दृष्टिकोण से, विधियों के मात्र दो अलग-अलग वर्ग हैं: इन्हें कुशल' और सुसंगत नाम दिया गया है। (...) मॉडल चयन के लिए फ्रिक्वेन्टिन प्रतिमान के अंतर्गत सामान्यतः तीन मुख्य दृष्टिकोण होते हैं: (I) कुछ चयन मानदंडों का अनुकूलन, (II) परिकल्पनाओं का परीक्षण, और (III) तदर्थ विधियां।
यह भी देखें
- सभी मॉडल अनुचित हैं
- प्रतिस्पर्धी परिकल्पनाओं का विश्लेषण
- स्वचालित मशीन अधिगम (ऑटोएमएल)
- बायस-विचरण असमंजस
- लक्षण वरण
- फ्रीडमैन का विरोधाभास
- ग्रिड खोज
- अभिनिर्धारणीयता विश्लेषण
- लॉग-रैखिक विश्लेषण
- मॉडल अभिनिर्धारण
- ओकाम का उस्तरा
- इष्टतम डिजाइन
- पैरामीटर अभिनिर्धारण समस्या
- वैज्ञानिक मॉडलिंग
- सांख्यिकीय मॉडल सत्यापन
- स्टीन का विरोधाभास
टिप्पणियाँ
- ↑ Hastie, Tibshirani, Friedman (2009). The elements of statistical learning. Springer. p. 195.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ Shirangi, Mehrdad G.; Durlofsky, Louis J. (2016). "निर्णय लेने और अनिश्चितता के तहत अनुकूलन के लिए प्रतिनिधि मॉडल का चयन करने का एक सामान्य तरीका". Computers & Geosciences. 96: 109–123. Bibcode:2016CG.....96..109S. doi:10.1016/j.cageo.2016.08.002.
- ↑ 3.0 3.1 Ding, Jie; Tarokh, Vahid; Yang, Yuhong (2018). "Model Selection Techniques: An Overview". IEEE Signal Processing Magazine. 35 (6): 16–34. arXiv:1810.09583. Bibcode:2018ISPM...35f..16D. doi:10.1109/MSP.2018.2867638. ISSN 1053-5888. S2CID 53035396.
- ↑ Su, J.; Vargas, D.V.; Sakurai, K. (2019). "डीप न्यूरल नेटवर्क्स को बेवकूफ बनाने के लिए वन पिक्सल अटैक". IEEE Transactions on Evolutionary Computation. 23 (5): 828–841. arXiv:1710.08864. doi:10.1109/TEVC.2019.2890858. S2CID 2698863.
- ↑ Ding, J.; Tarokh, V.; Yang, Y. (June 2018). "Bridging AIC and BIC: A New Criterion for Autoregression". IEEE Transactions on Information Theory. 64 (6): 4024–4043. arXiv:1508.02473. doi:10.1109/TIT.2017.2717599. ISSN 1557-9654. S2CID 5189440.
- ↑ Tsao, Min (2023). "लॉग-लाइबिलिटी अनुपात और सीमित न्यूनतम मानदंड के माध्यम से प्रतिगमन मॉडल चयन". Canadian Journal of Statistics. arXiv:2107.08529. doi:10.1002/cjs.11756. S2CID 236087375.
संदर्भ
- Aho, K.; Derryberry, D.; Peterson, T. (2014), "Model selection for ecologists: the worldviews of AIC and BIC", Ecology, 95 (3): 631–636, doi:10.1890/13-1452.1, PMID 24804445
- Akaike, H. (1994), "Implications of informational point of view on the development of statistical science", in Bozdogan, H. (ed.), Proceedings of the First US/JAPAN Conference on The Frontiers of Statistical Modeling: An Informational Approach—Volume 3, Kluwer Academic Publishers, pp. 27–38
- Anderson, D.R. (2008), Model Based Inference in the Life Sciences, Springer, ISBN 9780387740751
- Ando, T. (2010), Bayesian Model Selection and Statistical Modeling, CRC Press, ISBN 9781439836156
- Breiman, L. (2001), "Statistical modeling: the two cultures", Statistical Science, 16: 199–231, doi:10.1214/ss/1009213726
- Burnham, K.P.; Anderson, D.R. (2002), Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7 [this has over 38000 citations on Google Scholar]
- Chamberlin, T.C. (1890), "The method of multiple working hypotheses", Science, 15 (366): 92–6, Bibcode:1890Sci....15R..92., doi:10.1126/science.ns-15.366.92, PMID 17782687(reprinted 1965, Science 148: 754–759 [1] doi:10.1126/science.148.3671.754)
- Claeskens, G. (2016), "Statistical model choice" (PDF), Annual Review of Statistics and Its Application, 3 (1): 233–256, Bibcode:2016AnRSA...3..233C, doi:10.1146/annurev-statistics-041715-033413[permanent dead link]
- Claeskens, G.; Hjort, N.L. (2008), Model Selection and Model Averaging, Cambridge University Press, ISBN 9781139471800
- Cox, D.R. (2006), Principles of Statistical Inference, Cambridge University Press
- Ding, J.; Tarokh, V.; Yang, Y. (2018), "Model Selection Techniques - An Overview", IEEE Signal Processing Magazine, 35 (6): 16–34, arXiv:1810.09583, Bibcode:2018ISPM...35f..16D, doi:10.1109/MSP.2018.2867638, S2CID 53035396
- Kashyap, R.L. (1982), "Optimal choice of AR and MA parts in autoregressive moving average models", IEEE Transactions on Pattern Analysis and Machine Intelligence, IEEE, PAMI-4 (2): 99–104, doi:10.1109/TPAMI.1982.4767213, PMID 21869012, S2CID 18484243
- Konishi, S.; Kitagawa, G. (2008), Information Criteria and Statistical Modeling, Springer, Bibcode:2007icsm.book.....K, ISBN 9780387718866
- Lahiri, P. (2001), Model Selection, Institute of Mathematical Statistics
- Leeb, H.; Pötscher, B. M. (2009), "Model selection", in Anderson, T. G. (ed.), Handbook of Financial Time Series, Springer, pp. 889–925, doi:10.1007/978-3-540-71297-8_39, ISBN 978-3-540-71296-1
- Lukacs, P. M.; Thompson, W. L.; Kendall, W. L.; Gould, W. R.; Doherty, P. F. Jr.; Burnham, K. P.; Anderson, D. R. (2007), "Concerns regarding a call for pluralism of information theory and hypothesis testing", Journal of Applied Ecology, 44 (2): 456–460, doi:10.1111/j.1365-2664.2006.01267.x, S2CID 83816981
- McQuarrie, Allan D. R.; Tsai, Chih-Ling (1998), Regression and Time Series Model Selection, Singapore: World Scientific, ISBN 981-02-3242-X
- Massart, P. (2007), Concentration Inequalities and Model Selection, Springer
- Massart, P. (2014), "A non-asymptotic walk in probability and statistics", in Lin, Xihong (ed.), Past, Present, and Future of Statistical Science, Chapman & Hall, pp. 309–321, ISBN 9781482204988
- Navarro, D. J. (2019), "Between the Devil and the Deep Blue Sea: Tensions between scientific judgement and statistical model selection", Computational Brain & Behavior, 2: 28–34, doi:10.1007/s42113-018-0019-z
- Resende, Paulo Angelo Alves; Dorea, Chang Chung Yu (2016), "Model identification using the Efficient Determination Criterion", Journal of Multivariate Analysis, 150: 229–244, arXiv:1409.7441, doi:10.1016/j.jmva.2016.06.002, S2CID 5469654
- Shmueli, G. (2010), "To explain or to predict?", Statistical Science, 25 (3): 289–310, arXiv:1101.0891, doi:10.1214/10-STS330, MR 2791669, S2CID 15900983
- Stoica, P.; Selen, Y. (2004), "Model-order selection: a review of information criterion rules" (PDF), IEEE Signal Processing Magazine, 21 (4): 36–47, doi:10.1109/MSP.2004.1311138, S2CID 17338979
- Wit, E.; van den Heuvel, E.; Romeijn, J.-W. (2012), "'All models are wrong...': an introduction to model uncertainty" (PDF), Statistica Neerlandica, 66 (3): 217–236, doi:10.1111/j.1467-9574.2012.00530.x, S2CID 7793470
- Wit, E.; McCullagh, P. (2001), Viana, M. A. G.; Richards, D. St. P. (eds.), "The extendibility of statistical models", Algebraic Methods in Statistics and Probability, pp. 327–340
- Wójtowicz, Anna; Bigaj, Tomasz (2016), "Justification, confirmation, and the problem of mutually exclusive hypotheses", in Kuźniar, Adrian; Odrowąż-Sypniewska, Joanna (eds.), Uncovering Facts and Values, Brill Publishers, pp. 122–143, doi:10.1163/9789004312654_009, ISBN 9789004312654
- Owrang, Arash; Jansson, Magnus (2018), "A Model Selection Criterion for High-Dimensional Linear Regression", IEEE Transactions on Signal Processing , 66 (13): 3436–3446, Bibcode:2018ITSP...66.3436O, doi:10.1109/TSP.2018.2821628, ISSN 1941-0476, S2CID 46931136
- B. Gohain, Prakash; Jansson, Magnus (2022), "Scale-Invariant and consistent Bayesian information criterion for order selection in linear regression models", Signal Processing, 196: 108499, doi:10.1016/j.sigpro.2022.108499, ISSN 0165-1684, S2CID 246759677