तीव्र मॉडल

From Vigyanwiki
Revision as of 20:36, 7 July 2023 by alpha>Indicwiki (Created page with "{{Short description|Psychometric model for analyzing categorical data}} रैश मॉडल, जिसका नाम जॉर्ज रश के नाम पर...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

रैश मॉडल, जिसका नाम जॉर्ज रश के नाम पर रखा गया है, श्रेणीबद्ध डेटा का विश्लेषण करने के लिए एक साइकोमेट्रिक्स मॉडल है, जैसे कि पढ़ने के मूल्यांकन या प्रश्नावली प्रतिक्रियाओं पर प्रश्नों के उत्तर, उत्तरदाता की क्षमताओं, दृष्टिकोण या व्यक्तित्व लक्षणों के बीच व्यापार-बंद के कार्य के रूप में। और आइटम कठिनाई.[1][2] उदाहरण के लिए, उनका उपयोग किसी छात्र की पढ़ने की क्षमता या किसी प्रश्नावली के उत्तरों से मृत्युदंड के प्रति किसी व्यक्ति के रवैये की चरम सीमा का अनुमान लगाने के लिए किया जा सकता है। साइकोमेट्रिक्स और शैक्षिक अनुसंधान के अलावा, रैश मॉडल और इसके विस्तार का उपयोग स्वास्थ्य पेशे सहित अन्य क्षेत्रों में भी किया जाता है।[3] कृषि,[4] और बाजार अनुसंधान[5][6] रैश मॉडल में अंतर्निहित गणितीय सिद्धांत आइटम प्रतिक्रिया सिद्धांत का एक विशेष मामला है। हालाँकि, मॉडल मापदंडों की व्याख्या और इसके दार्शनिक निहितार्थों में महत्वपूर्ण अंतर हैं[7] वह रैश मॉडल के समर्थकों को आइटम प्रतिक्रिया मॉडलिंग परंपरा से अलग करता है। इस विभाजन का एक केंद्रीय पहलू विशिष्ट वस्तुनिष्ठता की भूमिका से संबंधित है,[8] सफल माप के लिए एक आवश्यकता के रूप में, जॉर्ज रैश के अनुसार रैश मॉडल की एक परिभाषित संपत्ति।

अवलोकन

माप के लिए रैश मॉडल

रैश मॉडल में, एक निर्दिष्ट प्रतिक्रिया (उदाहरण के लिए सही/गलत उत्तर) की संभावना को व्यक्ति और आइटम मापदंडों के एक फ़ंक्शन के रूप में तैयार किया जाता है। विशेष रूप से, मूल रैश मॉडल में, सही प्रतिक्रिया की संभावना को व्यक्ति और आइटम पैरामीटर के बीच अंतर के एक लॉजिस्टिक फ़ंक्शन के रूप में तैयार किया जाता है। मॉडल का गणितीय रूप इस आलेख में बाद में प्रदान किया गया है। अधिकांश संदर्भों में, मॉडल के पैरामीटर उत्तरदाताओं की दक्षता और निरंतर अव्यक्त चर पर स्थानों के रूप में वस्तुओं की कठिनाई को दर्शाते हैं। उदाहरण के लिए, शैक्षिक परीक्षणों में, आइटम पैरामीटर वस्तुओं की कठिनाई का प्रतिनिधित्व करते हैं जबकि व्यक्ति पैरामीटर उन लोगों की क्षमता या उपलब्धि स्तर का प्रतिनिधित्व करते हैं जिनका मूल्यांकन किया जाता है। किसी वस्तु की कठिनाई के सापेक्ष किसी व्यक्ति की क्षमता जितनी अधिक होगी, उस वस्तु पर सही प्रतिक्रिया की संभावना उतनी ही अधिक होगी। जब किसी व्यक्ति का अव्यक्त गुण पर स्थान वस्तु की कठिनाई के बराबर होता है, तो परिभाषा के अनुसार रैश मॉडल में सही प्रतिक्रिया की संभावना 0.5 होती है।

रैश मॉडल एक अर्थ में एक मॉडल है जिसमें यह उस संरचना का प्रतिनिधित्व करता है जिसे डेटा से माप प्राप्त करने के लिए डेटा को प्रदर्शित करना चाहिए; यानी यह सफल माप के लिए एक मानदंड प्रदान करता है। डेटा से परे, रैश के समीकरण मॉडल रिश्तों को हम वास्तविक दुनिया में प्राप्त करने की उम्मीद करते हैं। उदाहरण के लिए, शिक्षा का उद्देश्य बच्चों को जीवन में आने वाली सभी चुनौतियों के लिए तैयार करना है, न कि केवल पाठ्यपुस्तकों या परीक्षाओं में आने वाली चुनौतियों के लिए। एक ही चीज़ को मापने वाले विभिन्न परीक्षणों में समान (अपरिवर्तनीय) रहने के उपायों की आवश्यकता के द्वारा, रैश मॉडल इस परिकल्पना का परीक्षण करना संभव बनाते हैं कि पाठ्यक्रम और परीक्षण में उत्पन्न विशेष चुनौतियाँ सुसंगत रूप से सभी संभावित चुनौतियों की अनंत आबादी का प्रतिनिधित्व करती हैं। कार्यक्षेत्र। इसलिए एक रैश मॉडल एक आदर्श या मानक के अर्थ में एक मॉडल है जो एक अनुमानी कल्पना प्रदान करता है जो एक उपयोगी आयोजन सिद्धांत के रूप में कार्य करता है, भले ही इसे वास्तव में व्यवहार में कभी नहीं देखा गया हो।

रैश मॉडल को रेखांकित करने वाला परिप्रेक्ष्य या प्रतिमान सांख्यिकीय मॉडलिंग को रेखांकित करने वाले परिप्रेक्ष्य से अलग है। मॉडल का उपयोग अक्सर डेटा के एक सेट का वर्णन करने के इरादे से किया जाता है। पैरामीटर्स को इस आधार पर संशोधित और स्वीकार या अस्वीकार किया जाता है कि वे डेटा में कितने फिट बैठते हैं। इसके विपरीत, जब रैश मॉडल को नियोजित किया जाता है, तो उद्देश्य उस डेटा को प्राप्त करना होता है जो मॉडल में फिट बैठता है।[9][10][11] इस परिप्रेक्ष्य का तर्क यह है कि रैश मॉडल उन आवश्यकताओं का प्रतीक है जिन्हें माप प्राप्त करने के लिए पूरा किया जाना चाहिए, इस अर्थ में कि माप को आम तौर पर भौतिक विज्ञान में समझा जाता है।

इस तर्क को समझने के लिए एक उपयोगी सादृश्य तराजू पर मापी गई वस्तुओं पर विचार करना है। मान लीजिए कि किसी वस्तु A का वजन एक अवसर पर वस्तु B के वजन से काफी अधिक मापा जाता है, तो इसके तुरंत बाद वस्तु B का वजन वस्तु A के वजन से काफी अधिक मापा जाता है। हमें एक संपत्ति की आवश्यकता होती है माप यह है कि वस्तुओं के बीच परिणामी तुलना अन्य कारकों के बावजूद समान, या अपरिवर्तनीय होनी चाहिए। यह प्रमुख आवश्यकता रैश मॉडल की औपचारिक संरचना में सन्निहित है। नतीजतन, रैश मॉडल को डेटा के अनुरूप नहीं बदला जाता है। इसके बजाय, मूल्यांकन के तरीके को बदला जाना चाहिए ताकि यह आवश्यकता पूरी हो सके, उसी तरह जैसे वजन मापने के पैमाने को सुधारा जाना चाहिए यदि यह वस्तुओं के अलग-अलग माप पर वस्तुओं के बीच अलग-अलग तुलना देता है।

मॉडल का उपयोग करके विश्लेषण किया गया डेटा आमतौर पर परीक्षणों पर पारंपरिक वस्तुओं की प्रतिक्रियाएं होती हैं, जैसे कि सही/गलत उत्तरों के साथ शैक्षिक परीक्षण। हालाँकि, मॉडल एक सामान्य है, और इसे वहां भी लागू किया जा सकता है जहां किसी मात्रात्मक विशेषता या विशेषता को मापने के इरादे से अलग-अलग डेटा प्राप्त किया जाता है।

स्केलिंग

चित्र 1: परीक्षण विशेषता वक्र एक परीक्षण पर कुल स्कोर और व्यक्ति स्थान अनुमान के बीच संबंध दर्शाता है

जब सभी परीक्षार्थियों को एक ही परीक्षा में सभी आइटमों का प्रयास करने का अवसर मिलता है, तो परीक्षण पर प्रत्येक कुल स्कोर क्षमता के एक अद्वितीय अनुमान पर आधारित होता है और कुल जितना अधिक होगा, क्षमता का अनुमान उतना ही अधिक होगा। कुल अंकों का क्षमता अनुमानों के साथ कोई रैखिक संबंध नहीं है। बल्कि, संबंध गैर-रैखिक है जैसा कि चित्र 1 में दिखाया गया है। कुल स्कोर ऊर्ध्वाधर अक्ष पर दिखाया गया है, जबकि संबंधित व्यक्ति स्थान का अनुमान क्षैतिज अक्ष पर दिखाया गया है। उस विशेष परीक्षण के लिए जिस पर चित्र 1 में दिखाया गया परीक्षण विशेषता वक्र (TCC) आधारित है, संबंध लगभग 13 से 31 तक के कुल अंकों की सीमा में लगभग रैखिक है। TCC का आकार आम तौर पर कुछ हद तक सिग्मॉइड फ़ंक्शन जैसा होता है। उदाहरण। हालाँकि, कुल स्कोर और व्यक्ति स्थान अनुमान के बीच सटीक संबंध परीक्षण में वस्तुओं के वितरण पर निर्भर करता है। टीसीसी सातत्य पर श्रेणियों में तीव्र है जिसमें अधिक आइटम हैं, जैसे कि आंकड़े 1 और 2 में 0 के दोनों ओर की सीमा में।

रैश मॉडल को लागू करने में, नीचे वर्णित विधियों के आधार पर, आइटम स्थानों को अक्सर पहले स्केल किया जाता है। स्केलिंग की प्रक्रिया के इस भाग को अक्सर आइटम अंशांकन के रूप में जाना जाता है। शैक्षिक परीक्षणों में, सही प्रतिक्रियाओं का अनुपात जितना छोटा होगा, किसी आइटम की कठिनाई उतनी ही अधिक होगी और इसलिए आइटम का स्केल स्थान उतना ही अधिक होगा। एक बार जब आइटम स्थानों को स्केल किया जाता है, तो व्यक्तिगत स्थानों को स्केल पर मापा जाता है। परिणामस्वरूप, व्यक्ति और वस्तु के स्थानों का अनुमान एक ही पैमाने पर लगाया जाता है जैसा चित्र 2 में दिखाया गया है।

पैमाने के स्थानों की व्याख्या करना

चित्र 2: एक पैमाने पर व्यक्ति वितरण (ऊपर) और वस्तु वितरण (नीचे) के हिस्टोग्राम दिखाने वाला ग्राफ़

सही/गलत उत्तर जैसे द्विभाजित डेटा के लिए, परिभाषा के अनुसार, पैमाने पर किसी आइटम का स्थान उस व्यक्ति के स्थान से मेल खाता है जिस पर प्रश्न के सही उत्तर की 0.5 संभावना है। सामान्य तौर पर, किसी व्यक्ति द्वारा उस व्यक्ति के स्थान से कम कठिनाई वाले प्रश्न का सही उत्तर देने की संभावना 0.5 से अधिक होती है, जबकि उस व्यक्ति के स्थान से अधिक कठिनाई वाले प्रश्न का सही उत्तर देने की संभावना 0.5 से कम होती है। आइटम कैरेक्टरिस्टिक कर्व (आईसीसी) या आइटम रिस्पांस फंक्शन (आईआरएफ) व्यक्तियों की क्षमता के कार्य के रूप में सही प्रतिक्रिया की संभावना को दर्शाता है। इस लेख में चित्र 4 के संबंध में एक एकल आईसीसी को अधिक विस्तार से दिखाया और समझाया गया है (आइटम रिस्पांस थ्योरी#आइटम रिस्पांस फ़ंक्शन भी देखें)। चित्र 3 में सबसे बाईं ओर वाली आईसीसी सबसे आसान आइटम हैं, उसी आकृति में सबसे दाईं ओर वाली आईसीसी सबसे कठिन आइटम हैं।

जब किसी व्यक्ति की प्रतिक्रियाओं को आइटम की कठिनाई के अनुसार निम्नतम से उच्चतम तक क्रमबद्ध किया जाता है, तो सबसे संभावित पैटर्न गुटमैन स्केल या वेक्टर होता है; यानी {1,1,...,1,0,0,0,...,0}। हालाँकि, जबकि यह पैटर्न रैश मॉडल की संरचना को देखते हुए सबसे अधिक संभावित है, मॉडल को केवल संभाव्य गुटमैन प्रतिक्रिया पैटर्न की आवश्यकता होती है; अर्थात्, ऐसे पैटर्न जो गुटमैन पैटर्न की ओर प्रवृत्त होते हैं। प्रतिक्रियाओं का पैटर्न के अनुरूप होना असामान्य है क्योंकि कई संभावित पैटर्न हैं। डेटा को रैश मॉडल में फिट करने के लिए प्रतिक्रियाओं का पैटर्न के अनुरूप होना अनावश्यक है।

चित्र 3: कई वस्तुओं के लिए आईसीसी। ऊर्ध्वाधर रेखा पर क्षमता स्थान वाले व्यक्ति के लिए सफल प्रतिक्रिया की संभावना में परिवर्तन को उजागर करने के लिए आईसीसी को रंगीन किया जाता है। व्यक्ति द्वारा सबसे आसान वस्तुओं (बाईं ओर और निचले वक्रों के स्थानों के साथ) पर सही ढंग से प्रतिक्रिया देने की संभावना है और कठिन वस्तुओं (दाईं ओर और निचले वक्रों के स्थानों के साथ) पर सही ढंग से प्रतिक्रिया देने की संभावना नहीं है।

प्रत्येक क्षमता अनुमान में माप की एक संबद्ध मानक त्रुटि होती है, जो क्षमता अनुमान से जुड़ी अनिश्चितता की डिग्री निर्धारित करती है। आइटम अनुमानों में मानक त्रुटियाँ भी हैं। आम तौर पर, आइटम अनुमानों की मानक त्रुटियां व्यक्ति अनुमानों की मानक त्रुटियों से काफी छोटी होती हैं क्योंकि आमतौर पर किसी व्यक्ति की तुलना में किसी आइटम के लिए अधिक प्रतिक्रिया डेटा होता है। अर्थात्, किसी दिए गए आइटम का प्रयास करने वाले लोगों की संख्या आमतौर पर किसी दिए गए व्यक्ति द्वारा प्रयास किए गए आइटम की संख्या से अधिक होती है। जहां आईसीसी का ढलान अधिक होता है, वहां व्यक्ति अनुमान की मानक त्रुटियां छोटी होती हैं, जो आम तौर पर एक परीक्षण में स्कोर की मध्य सीमा के माध्यम से होती है। इस प्रकार, इस सीमा में अधिक सटीकता है क्योंकि ढलान जितना अधिक होगा, रेखा पर किन्हीं दो बिंदुओं के बीच अंतर उतना ही अधिक होगा।

मॉडल के साथ डेटा के पत्राचार का मूल्यांकन करने के लिए सांख्यिकीय और ग्राफिकल परीक्षणों का उपयोग किया जाता है। कुछ परीक्षण वैश्विक होते हैं, जबकि अन्य विशिष्ट वस्तुओं या लोगों पर ध्यान केंद्रित करते हैं। फिट के कुछ परीक्षण इस बारे में जानकारी प्रदान करते हैं कि किन वस्तुओं का उपयोग खराब वस्तुओं के साथ समस्याओं को छोड़कर या सही करके परीक्षण की विश्वसनीयता (सांख्यिकी) को बढ़ाने के लिए किया जा सकता है। रैश मापन में विश्वसनीयता सूचकांकों के स्थान पर व्यक्ति पृथक्करण सूचकांक का उपयोग किया जाता है। हालाँकि, व्यक्ति पृथक्करण सूचकांक विश्वसनीयता सूचकांक के समान है। पृथक्करण सूचकांक माप त्रुटि सहित पृथक्करण के अनुपात के रूप में वास्तविक पृथक्करण का सारांश है। जैसा कि पहले उल्लेख किया गया है, माप त्रुटि का स्तर एक परीक्षण की सीमा में एक समान नहीं है, लेकिन आम तौर पर अधिक चरम स्कोर (कम और उच्च) के लिए बड़ा होता है।

रैश मॉडल की विशेषताएं

मॉडलों के वर्ग का नाम डेनिश गणितज्ञ और सांख्यिकीविद् जॉर्ज रैश के नाम पर रखा गया है, जिन्होंने भौतिकी में माप की मुख्य आवश्यकता के साथ उनकी अनुरूपता के आधार पर मॉडलों के लिए ज्ञानमीमांसा के मामले को आगे बढ़ाया; अर्थात् अपरिवर्तनीय तुलना की आवश्यकता।[1]यह मॉडलों के वर्ग की परिभाषित विशेषता है, जैसा कि निम्नलिखित अनुभाग में विस्तार से बताया गया है। द्विभाजित डेटा के लिए रैश मॉडल का तुलनात्मक निर्णय के नियम (एलसीजे) के साथ घनिष्ठ वैचारिक संबंध है, यह एक मॉडल है जिसे एल. एल. थर्स्टन द्वारा बड़े पैमाने पर तैयार और उपयोग किया जाता है।[12][13] और इसलिए थर्स्टन पैमाने पर भी।[14] माप मॉडल पेश करने से पहले, जिसके लिए वह सबसे ज्यादा जाने जाते हैं, रैश ने माप मॉडल के रूप में डेटा को पढ़ने के लिए पॉइसन वितरण को लागू किया था, यह परिकल्पना करते हुए कि प्रासंगिक अनुभवजन्य संदर्भ में, किसी दिए गए व्यक्ति द्वारा की गई त्रुटियों की संख्या के अनुपात से नियंत्रित होती थी। व्यक्ति की पढ़ने की क्षमता में पाठ्य कठिनाई। रैश ने इस मॉडल को गुणक पॉइसन मॉडल के रूप में संदर्भित किया। द्विभाजित डेटा के लिए रैश का मॉडल - यानी जहां प्रतिक्रियाओं को दो श्रेणियों में वर्गीकृत किया जा सकता है - उनका सबसे व्यापक रूप से ज्ञात और उपयोग किया जाने वाला मॉडल है, और यहां मुख्य फोकस है। इस मॉडल में एक साधारण लॉजिस्टिक फ़ंक्शन का रूप है।

उपरोक्त संक्षिप्त रूपरेखा सामाजिक माप पर रैश के परिप्रेक्ष्य की कुछ विशिष्ट और परस्पर संबंधित विशेषताओं पर प्रकाश डालती है, जो इस प्रकार हैं:

  1. वह आबादी के बीच वितरण के बजाय मुख्य रूप से व्यक्तियों के माप से चिंतित थे।
  2. वह भौतिकी से प्राप्त माप के लिए प्राथमिक आवश्यकताओं को पूरा करने के लिए एक आधार स्थापित करने के बारे में चिंतित थे और परिणामस्वरूप, उन्होंने जनसंख्या में किसी विशेषता के स्तर के वितरण के बारे में कोई धारणा नहीं बनाई।
  3. रैश का दृष्टिकोण स्पष्ट रूप से मानता है कि यह एक वैज्ञानिक परिकल्पना है कि एक दिया गया गुण मात्रात्मक और मापने योग्य दोनों है, जैसा कि एक विशेष प्रयोगात्मक संदर्भ में क्रियान्वित किया गया है।

इस प्रकार, थॉमस कुह्न द्वारा अपने 1961 के पेपर द आधुनिक भौतिक विज्ञान में माप के कार्य में व्यक्त परिप्रेक्ष्य के अनुरूप, माप को सिद्धांत में स्थापित होने के साथ-साथ व्यापक सैद्धांतिक ढांचे से संबंधित परिकल्पनाओं के साथ असंगत मात्रात्मक विसंगतियों का पता लगाने में सहायक माना गया था। .[15] यह परिप्रेक्ष्य आम तौर पर सामाजिक विज्ञानों में प्रचलित परिप्रेक्ष्य के विपरीत है, जिसमें परीक्षण स्कोर जैसे डेटा को माप के लिए सैद्धांतिक आधार की आवश्यकता के बिना सीधे माप के रूप में माना जाता है। यद्यपि यह विरोधाभास मौजूद है, रैश का परिप्रेक्ष्य वास्तव में सांख्यिकीय विश्लेषण या मॉडलिंग के उपयोग का पूरक है जिसके लिए अंतराल-स्तरीय माप की आवश्यकता होती है, क्योंकि रैश मॉडल को लागू करने का उद्देश्य ऐसे माप प्राप्त करना है। रैश मॉडल के अनुप्रयोगों का वर्णन विभिन्न प्रकार के स्रोतों में किया गया है।[16]


अपरिवर्तनीय तुलना और पर्याप्तता

द्विभाजित डेटा के लिए रैश मॉडल को अक्सर एक आइटम पैरामीटर के साथ आइटम प्रतिक्रिया सिद्धांत (आईआरटी) मॉडल के रूप में माना जाता है। हालाँकि, एक विशेष आईआरटी मॉडल होने के बजाय, मॉडल के प्रस्तावक[17] इसे एक ऐसे मॉडल के रूप में मानें जिसमें ऐसी संपत्ति है जो इसे अन्य आईआरटी मॉडल से अलग करती है। विशेष रूप से, रैश मॉडल की परिभाषित संपत्ति अपरिवर्तनीय तुलना के सिद्धांत का उनका औपचारिक या गणितीय अवतार है। रैश ने अपरिवर्तनीय तुलना के सिद्धांत को इस प्रकार संक्षेप में प्रस्तुत किया:

दो उत्तेजनाओं के बीच तुलना इस बात से स्वतंत्र होनी चाहिए कि कौन से विशेष व्यक्ति तुलना के लिए सहायक थे; और यह इस बात से भी स्वतंत्र होना चाहिए कि विचारित वर्ग के भीतर किन अन्य उत्तेजनाओं की तुलना की गई थी या की गई होगी।
सममित रूप से, दो व्यक्तियों के बीच तुलना इस बात से स्वतंत्र होनी चाहिए कि विचार किए गए वर्ग के भीतर कौन सी विशेष उत्तेजनाएं तुलना के लिए सहायक थीं; और यह इस बात से भी स्वतंत्र होना चाहिए कि उसी या किसी अन्य अवसर पर अन्य व्यक्तियों की भी तुलना की गई थी।[18]

रश मॉडल इस सिद्धांत को अपनाते हैं क्योंकि उनकी औपचारिक संरचना व्यक्ति और आइटम मापदंडों के बीजगणितीय पृथक्करण की अनुमति देती है, इस अर्थ में कि आइटम मापदंडों के सांख्यिकीय अनुमान की प्रक्रिया के दौरान व्यक्ति पैरामीटर को समाप्त किया जा सकता है। यह परिणाम सशर्त अधिकतम संभावना अनुमान के उपयोग के माध्यम से प्राप्त किया जाता है, जिसमें प्रतिक्रिया स्थान को व्यक्ति के कुल स्कोर के अनुसार विभाजित किया जाता है। इसका परिणाम यह होता है कि किसी वस्तु या व्यक्ति के लिए कच्चा स्कोर उस वस्तु या व्यक्ति पैरामीटर के लिए पर्याप्त आँकड़ा होता है। कहने का तात्पर्य यह है कि, व्यक्ति के कुल स्कोर में व्यक्ति के बारे में निर्दिष्ट संदर्भ में उपलब्ध सभी जानकारी शामिल होती है, और आइटम के कुल स्कोर में संबंधित अव्यक्त विशेषता के संबंध में आइटम के संबंध में सभी जानकारी शामिल होती है। रैश मॉडल को प्रतिक्रिया डेटा में एक विशिष्ट संरचना की आवश्यकता होती है, अर्थात् एक संभाव्य गुटमैन स्केल संरचना।

कुछ अधिक परिचित शब्दों में, रैश मॉडल मूल्यांकन पर कुल अंकों से सातत्य पर व्यक्ति स्थान प्राप्त करने के लिए एक आधार और औचित्य प्रदान करते हैं। हालाँकि कुल अंकों को सीधे माप के रूप में मानना ​​असामान्य नहीं है, वे वास्तव में माप के बजाय अलग-अलग अवलोकनों की गिनती हैं। प्रत्येक अवलोकन किसी व्यक्ति और वस्तु के बीच तुलना के अवलोकन योग्य परिणाम का प्रतिनिधित्व करता है। इस तरह के परिणाम सीधे तौर पर एक दिशा या किसी अन्य दिशा में तराजू #संतुलन के झुकने के अवलोकन के अनुरूप होते हैं। यह अवलोकन इंगित करेगा कि एक या अन्य वस्तु का द्रव्यमान अधिक है, लेकिन ऐसे अवलोकनों की गणना को सीधे माप के रूप में नहीं माना जा सकता है।

रैश ने बताया कि अपरिवर्तनीय तुलना का सिद्धांत भौतिकी में माप की विशेषता है, उदाहरण के तौर पर, दो-तरफा प्रयोगात्मक संदर्भ फ्रेम जिसमें प्रत्येक उपकरण त्वरण उत्पन्न करने के लिए ठोस निकायों पर यांत्रिकी बल लगाता है। रैश[1]: 112–3 इस संदर्भ में कहा गया है: आम तौर पर: यदि किन्हीं दो वस्तुओं के लिए हम एक उपकरण द्वारा उत्पन्न उनके त्वरणों का एक निश्चित अनुपात पाते हैं, तो वही अनुपात किसी अन्य उपकरण के लिए भी पाया जाएगा। यह आसानी से दिखाया गया है कि न्यूटन का दूसरा नियम कहता है कि ऐसे अनुपात पिंडों के द्रव्यमान के अनुपात के व्युत्क्रमानुपाती होते हैं।

द्विभाजित डेटा के लिए रैश मॉडल का गणितीय रूप

होने देना एक द्विभाजित यादृच्छिक चर बनें, उदाहरण के लिए, एक सही प्रतिक्रिया को दर्शाता है और किसी दिए गए मूल्यांकन आइटम के लिए गलत प्रतिक्रिया। द्विभाजित डेटा के लिए रैश मॉडल में, परिणाम की संभावना द्वारा दिया गया है:

कहाँ व्यक्ति की क्षमता है और आइटम की कठिनाई है . इस प्रकार, एक द्विभाजित प्राप्ति मद के मामले में, संबंधित व्यक्ति और मूल्यांकन मद के बीच बातचीत पर सफलता की संभावना है। यह आसानी से दिखाया गया है कि मॉडल के आधार पर किसी व्यक्ति द्वारा किसी आइटम पर सही प्रतिक्रिया का लॉग कठिनाइयाँ या लॉगिट बराबर है . अलग-अलग क्षमता मापदंडों वाले दो परीक्षार्थी दिए गए और और कठिनाई के साथ एक मनमाना आइटम , इन दोनों परीक्षार्थियों के लिए लॉग में अंतर की गणना करें . ये फर्क हो जाता है . इसके विपरीत, यह दिखाया जा सकता है कि एक ही व्यक्ति द्वारा एक आइटम के लिए सही प्रतिक्रिया की लॉग संभावना, दो वस्तुओं में से किसी एक के लिए सही प्रतिक्रिया पर सशर्त, आइटम स्थानों के बीच अंतर के बराबर है। उदाहरण के लिए,

कहाँ दो वस्तुओं पर व्यक्ति n का कुल स्कोर है, जो एक या अन्य वस्तुओं पर सही प्रतिक्रिया दर्शाता है।[1][19][20] इसलिए, सशर्त लॉग ऑड्स में व्यक्ति पैरामीटर शामिल नहीं है , जिसे कुल स्कोर पर कंडीशनिंग द्वारा समाप्त किया जा सकता है . अर्थात्, कच्चे अंकों के अनुसार प्रतिक्रियाओं को विभाजित करके और सही प्रतिक्रिया की लॉग बाधाओं की गणना करके, एक अनुमान लगाया जाता है की भागीदारी के बिना प्राप्त किया जाता है . अधिक आम तौर पर, सशर्त अधिकतम संभावना अनुमान (राश मॉडल अनुमान देखें) जैसी प्रक्रिया के अनुप्रयोग के माध्यम से कई आइटम पैरामीटरों का पुनरावर्ती अनुमान लगाया जा सकता है। जबकि अधिक शामिल है, वही मौलिक सिद्धांत ऐसे अनुमानों में लागू होता है।

चित्र 4: राश मॉडल के लिए आईसीसी, व्यक्तियों के पांच वर्ग अंतरालों के लिए सही देखे गए और अपेक्षित अनुपात के बीच तुलना दर्शाता है

द्विभाजित डेटा के लिए रैश मॉडल का आईसीसी चित्र 4 में दिखाया गया है। ग्रे लाइन अलग परिणाम की संभावना को दर्शाती है (अर्थात, प्रश्न का सही उत्तर देना) अव्यक्त सातत्य पर विभिन्न स्थानों वाले व्यक्तियों के लिए (अर्थात, उनकी क्षमताओं का स्तर)। किसी वस्तु का स्थान, परिभाषा के अनुसार, वह स्थान है जिस पर इसकी संभावना होती है 0.5 के बराबर है. चित्र 4 में, काले घेरे वर्ग अंतराल के भीतर व्यक्तियों के वास्तविक या देखे गए अनुपात को दर्शाते हैं जिसके लिए परिणाम देखा गया था। उदाहरण के लिए, शैक्षिक मनोविज्ञान के संदर्भ में उपयोग किए जाने वाले मूल्यांकन आइटम के मामले में, ये उन व्यक्तियों के अनुपात का प्रतिनिधित्व कर सकते हैं जिन्होंने आइटम का सही उत्तर दिया है। व्यक्तियों को अव्यक्त सातत्य पर उनके स्थान के अनुमानों के आधार पर क्रमबद्ध किया जाता है और मॉडल के साथ टिप्पणियों के अनुरूपता का रेखांकन निरीक्षण करने के लिए इस आधार पर वर्ग अंतराल में वर्गीकृत किया जाता है। मॉडल के साथ डेटा की घनिष्ठ अनुरूपता है। डेटा के ग्राफ़िकल निरीक्षण के अलावा, फिट के सांख्यिकीय परीक्षणों की एक श्रृंखला का उपयोग यह मूल्यांकन करने के लिए किया जाता है कि क्या मॉडल से टिप्पणियों के विचलन को केवल यादृच्छिक प्रभावों के लिए जिम्मेदार ठहराया जा सकता है, जैसा कि आवश्यक है, या क्या मॉडल से व्यवस्थित विचलन हैं।

रैश मॉडल के बहुपद विस्तार

रैश मॉडल में कई बहुपद विस्तार हैं, जो द्विभाजित मॉडल को सामान्यीकृत करते हैं ताकि इसे उन संदर्भों में लागू किया जा सके जिसमें क्रमिक पूर्णांक स्कोर एक अव्यक्त विशेषता के बढ़ते स्तर या परिमाण की श्रेणियों का प्रतिनिधित्व करते हैं, जैसे बढ़ती क्षमता, मोटर फ़ंक्शन, का समर्थन एक बयान, इत्यादि। उदाहरण के लिए, ये बहुपद विस्तार लिकर्ट स्केल के उपयोग, शैक्षिक मूल्यांकन में ग्रेडिंग और न्यायाधीशों द्वारा प्रदर्शन के स्कोरिंग पर लागू होते हैं।

अन्य विचार

रैश मॉडल की आलोचना यह है कि यह अत्यधिक प्रतिबंधात्मक या अनुदेशात्मक है क्योंकि मॉडल की एक धारणा यह है कि सभी वस्तुओं में समान भेदभाव होता है, जबकि व्यवहार में, वस्तुओं का भेदभाव अलग-अलग होता है, और इस प्रकार कोई भी डेटा सेट कभी भी सही डेटा-मॉडल फिट नहीं दिखाएगा। एक बार-बार होने वाली गलतफहमी यह है कि रैश मॉडल प्रत्येक आइटम को अलग-अलग भेदभाव करने की अनुमति नहीं देता है, लेकिन समान भेदभाव अपरिवर्तनीय माप की एक धारणा है, इसलिए अलग-अलग आइटम भेदभाव निषिद्ध नहीं हैं, बल्कि यह संकेत मिलता है कि माप की गुणवत्ता एक सैद्धांतिक आदर्श के बराबर नहीं है। भौतिक माप की तरह, वास्तविक दुनिया के डेटासेट कभी भी सैद्धांतिक मॉडल से पूरी तरह मेल नहीं खाएंगे, इसलिए प्रासंगिक प्रश्न यह है कि क्या कोई विशेष डेटा सेट हाथ में उद्देश्य के लिए माप की पर्याप्त गुणवत्ता प्रदान करता है, न कि यह कि क्या यह पूर्णता के अप्राप्य मानक से पूरी तरह मेल खाता है।

बहुविकल्पी वस्तुओं से प्रतिक्रिया डेटा के साथ रैश मॉडल के उपयोग के लिए विशिष्ट आलोचना यह है कि मॉडल में अनुमान लगाने के लिए कोई प्रावधान नहीं है क्योंकि रैश मॉडल में बायां अनंतस्पर्शी हमेशा शून्य संभावना के करीब पहुंचता है। इसका तात्पर्य यह है कि कम क्षमता वाले व्यक्ति को हमेशा कोई वस्तु गलत मिलेगी। हालाँकि, बहुविकल्पीय परीक्षा पूरी करने वाले कम क्षमता वाले व्यक्तियों के पास अकेले संयोग से सही उत्तर चुनने की काफी अधिक संभावना होती है (k-विकल्प आइटम के लिए, संभावना 1/k के आसपास होती है)।

तीन-पैरामीटर लॉजिस्टिक मॉडल इन दोनों धारणाओं को शिथिल करता है और दो-पैरामीटर लॉजिस्टिक मॉडल अलग-अलग ढलानों की अनुमति देता है।[21] हालाँकि, सरल, बिना भार वाले कच्चे स्कोर की पर्याप्तता को बनाए रखने के लिए समान भेदभाव और शून्य बाएँ स्पर्शोन्मुख की विशिष्टता मॉडल के आवश्यक गुण हैं। व्यवहार में, बहु-विकल्प डेटासेट में पाया जाने वाला गैर-शून्य निम्न अनंतस्पर्शी आमतौर पर मानी जाने वाली तुलना में माप के लिए कम खतरा होता है और आमतौर पर माप में वास्तविक त्रुटियां नहीं होती हैं जब अच्छी तरह से विकसित परीक्षण वस्तुओं का उपयोग समझदारी से किया जाता है [22] वर्हेल्स्ट एंड ग्लास (1995) ने एक मॉडल के लिए सशर्त अधिकतम संभावना (सीएमएल) समीकरण प्राप्त किए, जिसे वे वन पैरामीटर लॉजिस्टिक मॉडल (ओपीएलएम) के रूप में संदर्भित करते हैं। बीजगणितीय रूप में यह 2PL मॉडल के समान प्रतीत होता है, लेकिन OPLM में 2PL के अनुमानित भेदभाव मापदंडों के बजाय पूर्व निर्धारित भेदभाव सूचकांक शामिल हैं। जैसा कि इन लेखकों ने उल्लेख किया है, हालांकि, अनुमानित भेदभाव मापदंडों के साथ अनुमान लगाने में जिस समस्या का सामना करना पड़ता है वह यह है कि भेदभाव अज्ञात हैं, जिसका अर्थ है कि भारित कच्चा स्कोर केवल एक आँकड़ा नहीं है, और इसलिए सीएमएल को एक अनुमान पद्धति के रूप में उपयोग करना असंभव है।[23]: 217  अर्थात्, 2PL में भारित स्कोर की पर्याप्तता का उपयोग उस तरीके के अनुसार नहीं किया जा सकता है जिसमें पर्याप्त आँकड़ा परिभाषित किया गया है। यदि वज़न का अनुमान लगाने के बजाय आरोप लगाया जाता है, जैसा कि ओपीएलएम में होता है, तो सशर्त अनुमान संभव है और रैश मॉडल के कुछ गुणों को बरकरार रखा जाता है।[24][23]ओपीएलएम में, भेदभाव सूचकांक के मान 1 और 15 के बीच सीमित हैं। इस दृष्टिकोण की एक सीमा यह है कि व्यवहार में, भेदभाव सूचकांक के मूल्यों को शुरुआती बिंदु के रूप में पूर्व निर्धारित किया जाना चाहिए। इसका मतलब यह है कि भेदभाव का कुछ प्रकार का अनुमान तब शामिल होता है जब उद्देश्य ऐसा करने से बचना होता है।

द्विभाजित डेटा के लिए रैश मॉडल में स्वाभाविक रूप से एक एकल भेदभाव पैरामीटर शामिल होता है, जैसा कि रैश ने नोट किया है,[1]: 121  माप की इकाइयों का एक मनमाना विकल्प बनता है जिसके संदर्भ में अव्यक्त विशेषता के परिमाण व्यक्त या अनुमानित किए जाते हैं। हालाँकि, रैश मॉडल के लिए आवश्यक है कि भेदभाव सामाजिक संपर्क में एक समान हो[disambiguation needed] संदर्भ के एक निर्दिष्ट फ्रेम के भीतर व्यक्तियों और वस्तुओं के बीच (यानी मूल्यांकन संदर्भ मूल्यांकन के लिए दी गई शर्तें)।

मॉडल का अनुप्रयोग मानदंड को कितनी अच्छी तरह पूरा करता है, इसके बारे में नैदानिक ​​जानकारी प्रदान करता है। मॉडल का अनुप्रयोग इस बारे में भी जानकारी प्रदान कर सकता है कि मूल्यांकन पर आइटम या प्रश्न क्षमता या विशेषता को मापने के लिए कितनी अच्छी तरह काम करते हैं। उदाहरण के लिए, किसी दिए गए व्यवहार में संलग्न व्यक्तियों के अनुपात को जानकर, रश मॉडल का उपयोग जुड़ाव की कठिनाई, दृष्टिकोण और व्यवहार के बीच संबंधों को प्राप्त करने के लिए किया जा सकता है।[25] रैश मॉडल के प्रमुख समर्थकों में बेंजामिन ड्रेक राइट, डेविड एंड्रीच और एर्लिंग एंडरसन शामिल हैं।

यह भी देखें

  • नकली पैमाना
  • गुटमैन स्केल

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 Rasch, G. (1980) [First published 1960]. कुछ बुद्धिमत्ता और दक्षता परीक्षणों के लिए सम्भाव्यता मॉडल्स. Foreword and afterword by B.D. Wright (Expanded ed.). Chicago: The University of Chicago Press.
  2. Istiqomah, Istiqomah; Hasanati, Nida (2022-10-27). "रैश मॉडल विश्लेषण का उपयोग करके छात्र शैक्षणिक प्रदर्शन निर्धारकों का विकास". Psympathic: Jurnal Ilmiah Psikologi. 9 (1): 17–30. doi:10.15575/psy.v9i1.7571. ISSN 2502-2903. S2CID 253200678.
  3. Bezruczko, N. (2005). स्वास्थ्य विज्ञान में रश माप. Maple Grove: Jam Press.
  4. Moral, F. J.; Rebollo, F. J. (2017). "रैश मॉडल का उपयोग करके मिट्टी की उर्वरता का लक्षण वर्णन". Journal of Soil Science and Plant Nutrition. Springer Science and Business Media LLC (ahead): 0. doi:10.4067/s0718-95162017005000035. ISSN 0718-9516.
  5. Bechtel, Gordon G. (1985). "उपभोक्ता रेटिंग पैमानों के लिए रैश मॉडल का सामान्यीकरण". Marketing Science. Institute for Operations Research and the Management Sciences (INFORMS). 4 (1): 62–73. doi:10.1287/mksc.4.1.62. ISSN 0732-2399.
  6. Wright, B. D. (1977). Solving measurement problems with the Rasch model. Journal of Educational Measurement, 14(2), 97-116.
  7. Linacre J.M. (2005). Rasch dichotomous model vs. One-parameter Logistic Model. Rasch Measurement Transactions, 19:3, 1032
  8. Rasch, G. (1977). On Specific Objectivity: An attempt at formalizing the request for generality and validity of scientific statements. The Danish Yearbook of Philosophy, 14, 58-93.
  9. Andrich, D. (January 2004). "Controversy and the Rasch model: a characteristic of incompatible paradigms?". Medical Care. Lippincott Williams & Wilkins. 42 (1 Suppl): 107–116. doi:10.1097/01.mlr.0000103528.48582.7c. JSTOR 4640697. PMID 14707751. S2CID 23087904.
  10. Wright, B. D. (1984). "शैक्षिक माप के लिए निराशा और आशा". Contemporary Education Review. 3 (1): 281–288.
  11. Wright, B. D. (1999). "Fundamental measurement for psychology". In Embretson, S. E.; Hershberger, S. L. (eds.). The new rules of measurement: What every educator and psychologist should know. Hillsdale: Lawrence Erlbaum Associates. pp. 65–104.
  12. Thurstone, L. L. (1927). A law of comparative judgment. Psychological Review, 34(4), 273.
  13. Luce, R. Duncan (1994). "Thurstone and sensory scaling: Then and now". Psychological Review. American Psychological Association (APA). 101 (2): 271–277. doi:10.1037/0033-295x.101.2.271. ISSN 0033-295X.
  14. Andrich, D. (1978b). Relationships between the Thurstone and Rasch approaches to item scaling. Applied Psychological Measurement, 2, 449–460.
  15. Kuhn, Thomas S. (1961). "आधुनिक भौतिक विज्ञान में मापन का कार्य". Isis. University of Chicago Press. 52 (2): 161–193. doi:10.1086/349468. ISSN 0021-1753. S2CID 144294881.
  16. Sources include
    • Alagumalai, S., Curtis, D.D. & Hungi, N. (2005). Applied Rasch Measurement: A book of exemplars. Springer-Kluwer.
    • Bezruczko, N. (Ed.). (2005). Rasch measurement in health sciences. Maple Grove, MN: JAM Press.
    • Bond, T.G. & Fox, C.M. (2007). Applying the Rasch Model: Fundamental measurement in the human sciences. 2nd edn. Lawrence Erlbaum.
    • Burro, Roberto (5 October 2016). "To be objective in Experimental Phenomenology: a Psychophysics application". SpringerPlus. Springer Science and Business Media LLC. 5 (1): 1720. doi:10.1186/s40064-016-3418-4. ISSN 2193-1801. PMC 5052248. PMID 27777856.
    • Fisher, W. P. Jr., & Wright, B. D. (Eds.). (1994). Applications of probabilistic conjoint measurement. International Journal of Educational Research, 21(6), 557–664.
    • Masters, G. N., & Keeves, J. P. (Eds.). (1999). Advances in measurement in educational research and assessment. New York: Pergamon.
    • Journal of Applied Measurement
  17. Bond, T.G. & Fox, C.M. (2007). Applying the Rasch Model: Fundamental measurement in the human sciences. 2nd Edn. Lawrence Erlbaum. Page 265
  18. Rasch, G. (1961). On general laws and the meaning of measurement in psychology, pp. 321–334 in Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, IV. Berkeley, California: University of California Press. Available free from Project Euclid
  19. Andersen, E.B. (1977). Sufficient statistics and latent trait models, Psychometrika, 42, 69–81.
  20. Andrich, D. (2010). Sufficiency and conditional estimation of person parameters in the polytomous Rasch model. Psychometrika, 75(2), 292-308.
  21. Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee’s ability. In Lord, F.M. & Novick, M.R. (Eds.), Statistical theories of mental test scores. Reading, MA: Addison–Wesley.
  22. Holster, Trevor A.; Lake, J. W. (2016). "अनुमान लगाना और रैश मॉडल". Language Assessment Quarterly. 13 (2): 124–141. doi:10.1080/15434303.2016.1160096. S2CID 148393334.
  23. 23.0 23.1 Verhelst, N.D. and Glas, C.A.W. (1995). The one parameter logistic model. In G.H. Fischer and I.W. Molenaar (Eds.), Rasch Models: Foundations, recent developments, and applications (pp. 215–238). New York: Springer Verlag.
  24. Verhelst, N.D., Glas, C.A.W. and Verstralen, H.H.F.M. (1995). One parameter logistic model (OPLM). Arnhem: CITO.
  25. Byrka, Katarzyna; Jȩdrzejewski, Arkadiusz; Sznajd-Weron, Katarzyna; Weron, Rafał (2016-09-01). "Difficulty is critical: The importance of social factors in modeling diffusion of green products and practices". Renewable and Sustainable Energy Reviews. 62: 723–735. doi:10.1016/j.rser.2016.04.063.


अग्रिम पठन

  • Andrich, D. (1978a). A rating formulation for ordered response categories. Psychometrika, 43, 357–74.
  • Andrich, D. (1988). Rasch models for measurement. Beverly Hills: Sage Publications.
  • Baker, F. (2001). The Basics of Item Response Theory. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD. Available free with software included from IRT at Edres.org
  • Fischer, G.H. & Molenaar, I.W. (1995). Rasch models: foundations, recent developments and applications. New York: Springer-Verlag.
  • Goldstein H & Blinkhorn S (1977). Monitoring Educational Standards: an inappropriate model. . Bull.Br.Psychol.Soc. 30 309–311
  • Goldstein H & Blinkhorn S (1982). The Rasch Model Still Does Not Fit. BERJ 82 167–170.
  • Hambleton RK, Jones RW. "Comparison of classical test theory and item response," Educational Measurement: Issues and Practice 1993; 12(3):38–47. available in the ITEMS Series from the National Council on Measurement in Education
  • Harris D. Comparison of 1-, 2-, and 3-parameter IRT models. Educational Measurement: Issues and Practice;. 1989; 8: 35–41 available in the ITEMS Series from the National Council on Measurement in Education
  • Linacre, J. M. (1999). "Understanding Rasch measurement: Estimation methods for Rasch measures". Journal of Outcome Measurement. 3 (4): 382–405. PMID 10572388.
  • von Davier, M., & Carstensen, C. H. (2007). Multivariate and Mixture Distribution Rasch Models: Extensions and Applications. New York: Springer. [1]
  • von Davier, M. (2016). Rasch Model. In Wim J. van der Linden (ed.): Handbook of Item Response Theory (Boca Raton: CRC Press), Routledge Handbooks.[2]
  • Wright, B.D., & Stone, M.H. (1979). Best Test Design. Chicago, IL: MESA Press.
  • Wu, M. & Adams, R. (2007). Applying the Rasch model to psycho-social measurement: A practical approach. Melbourne, Australia: Educational Measurement Solutions. Available free from Educational Measurement Solutions


बाहरी संबंध