सुदृढीकरण: Difference between revisions
m (12 revisions imported from alpha:सुदृढीकरण) |
No edit summary |
||
Line 419: | Line 419: | ||
{{Authority control}} | {{Authority control}} | ||
[[et:Sarrus]] | [[et:Sarrus]] | ||
[[Category:Articles with hatnote templates targeting a nonexistent page]] | |||
[[Category:CS1 errors]] | |||
[[Category: | [[Category:Collapse templates]] | ||
[[Category:Created On 22/03/2023]] | [[Category:Created On 22/03/2023]] | ||
[[Category:Vigyan Ready]] | [[Category:Lua-based templates]] | ||
[[Category:Machine Translated Page]] | |||
[[Category:Multi-column templates]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages using div col with small parameter]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Short description with empty Wikidata description]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Templates using under-protected Lua modules]] | |||
[[Category:Wikipedia fully protected templates|Div col]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:आचरण]] | |||
[[Category:लत]] | |||
[[Category:व्यवहार चिकित्सा]] | |||
[[Category:व्यवहार संबंधी अवधारणाएँ]] |
Latest revision as of 16:41, 18 April 2023
व्यवहारवाद में, सुदृढीकरण एक क्रियाप्रसूत अनुबंधन है क्रियाप्रसूत अनुबंधन के उपकरण और प्रक्रियाएं प्रायुक्त की जाती हैं जो एक जीव के भविष्य के व्यवहार को शक्तिशाली करेगा जब भी वह व्यवहार एक विशिष्ट पूर्ववर्ती (व्यवहार मनोविज्ञान) से पहले होता है। इस सुदृढ़ीकरण प्रभाव को व्यवहार की उच्च आवृत्ति (जैसे, लीवर को अधिक बार खींचना), लंबी अवधि (जैसे, लीवर को अधिक समय तक खींचना), अधिक परिमाण (जैसे, अधिक बल के साथ लीवर को खींचना) या कम विलंबता (उदाहरण के लिए, पूर्ववर्ती उत्तेजना के बाद लीवर को अधिक तेज़ी से खींचना) के रूप में मापा जा सकता है।।
आत्म-नियमन के मॉडल में मानव व्यवहार के तीन मुख्य स्वरुप हैं, जो आत्म-जागरूकता, आत्म-चिंतन और आत्म-नियमन हैं। सुदृढीकरण पारंपरिक रूप से स्व-नियमन के साथ संरेखित होते हैं। व्यवहार परिणाम से प्रभावित हो सकता है किन्तु व्यवहार को भी पूर्ववृत्त की आवश्यकता होती है। सुदृढीकरण चार प्रकार के होते हैं: सकारात्मक सुदृढीकरण, नकारात्मक सुदृढीकरण, विलोपन और दंड। सकारात्मक सुदृढीकरण एक सकारात्मक प्रबलक का अनुप्रयोग है। नकारात्मक सुदृढीकरण उस विषय के स्थान से कुछ नकारात्मक को हटाने का अभ्यास है, जो उस विषय से पूर्ववर्ती व्यवहार को प्रोत्साहित करने की विधि के रूप में है।
विलुप्त होने में एक ऐसा व्यवहार सम्मिलित होता है जिसके लिए किसी आकस्मिक परिणाम की आवश्यकता नहीं होती है। यदि कुछ (अच्छा या बुरा) प्रबल नहीं होता है, तो उसे सैद्धांतिक रूप से लुप्त हो जाना चाहिए। अंत में, दंड अवांछित व्यवहार पर प्रतिकूल परिणाम का आरोपण है। निष्कासन द्वारा दंड खराब प्रदर्शन के बाद लाभ को हटाना एक सामान्य उदाहरण है। जबकि सुदृढीकरण के लिए किसी व्यक्ति को सचेत रूप से उत्तेजना द्वारा प्राप्त प्रभाव को अनुभव करने की आवश्यकता नहीं होती है, फिर भी वांछित लक्ष्य की दिशा में काम करने के लिए सचेत प्रयास की आवश्यकता होती है।
पुरस्कृत प्रोत्साहन, जो प्रोत्साहन के साथ जुड़े हुए हैं | चाहते हैं और पसंद करते हैं (क्रमशः इच्छा और खुशी) और क्षुधावर्धक व्यवहार, सकारात्मक पुष्टाहार के रूप में कार्य करते हैं;[1] बातचीत (तर्क) भी सच है: सकारात्मक पुष्टाहार एक वांछनीय उत्तेजना प्रदान करते हैं।[1] सुदृढीकरण के लिए किसी व्यक्ति को उत्तेजना से प्राप्त प्रभाव को सचेत रूप से अनुभव करने की आवश्यकता नहीं होती है।[2] इस प्रकार, सुदृढीकरण केवल तभी होता है जब व्यवहार में अवलोकन योग्य शक्तिशालीी हो। चूंकि, नकारात्मक सुदृढीकरण भी है, जो एक अवांछनीय उत्तेजना को दूर करने की विशेषता है। किसी की नौकरी बदलना किसी ऐसे व्यक्ति के लिए नकारात्मक प्रबलक के रूप में काम कर सकता है जिसे पीठ की समस्या है, (उदाहरण के लिए एक मजदूर की नौकरी से कार्यालय की स्थिति में बदलना)।
अधिकतर स्थितियों में, सुदृढीकरण शब्द व्यवहार में वृद्धि को संदर्भित करता है, किन्तु इस शब्द का उपयोग कभी-कभी स्मृति में वृद्धि को दर्शाने के लिए भी किया जाता है; उदाहरण के लिए, प्रशिक्षण के बाद सुदृढीकरण एक सीखने के सत्र के बाद एक प्रोत्साहन (जैसे भोजन) के प्रावधान को संदर्भित करता है, जो व्यक्तिगत यादों या समग्र स्मृति की बरकरार चौड़ाई, विस्तार और अवधि को बढ़ाने के प्रयास में होता है।[3] मेमोरी-बढ़ाने वाली उत्तेजना भी एक हो सकती है जिसका प्रभाव केवल अप्रत्यक्ष रूप से भावनात्मक होने के अतिरिक्त प्रत्यक्ष रूप से होता है, जैसा कि फ्लैशबल्ब मेमोरी की घटना के साथ होता है, जिसमें भावनात्मक रूप से अत्यधिक तीव्र उत्तेजना उन परिस्थितियों के सबसेट से परे एक स्थिति की स्मृति को प्रोत्साहित कर सकती है परिस्थितियाँ जो भावनात्मक रूप से महत्वपूर्ण उत्तेजना का कारण बनीं, जैसे कि जब उपयुक्त उम्र के लोग यह याद रखने में सक्षम होते हैं कि जॉन एफ कैनेडी की हत्या या 11 सितंबर के हमलों के बारे में जानने के बाद वे कहाँ थे और क्या कर रहे थे।[4]
सुदृढीकरण स्फूर्त अनुकूलन का एक महत्वपूर्ण भाग है।
शब्दावली
Addiction and dependence glossary[5][6][7][8] | |
---|---|
| |
व्यवहार विज्ञान में सकारात्मक और नकारात्मक शब्दों का संदर्भ तब होता है जब उनके सख्त तकनीकी अर्थ में अनुकूलन द्वारा की जाने वाली क्रिया की प्रकृति के अतिरिक्त उस क्रिया और उसके परिणामों के प्रतिसाद देने वाले के मूल्यांकन के लिए उपयोग किया जाता है। सकारात्मक क्रियाएं वे हैं जो पर्यावरण के लिए एक कारक जोड़ते हैं, चाहे वह सुखद या अप्रिय हो, जबकि नकारात्मक क्रियाएं वे हैं जो किसी भी प्रकार के कारक को पर्यावरण से हटाती हैं या वापस लेती हैं। बदले में, सुदृढीकरण का सख्त अर्थ केवल इनाम-आधारित कंडीशनिंग को संदर्भित करता है; अप्रिय कारकों की प्रारंभ और सुखद कारकों को हटाने या रोकने के अतिरिक्त दंड के रूप में संदर्भित किया जाता है, जो कि इसके सख्त अर्थों में उपयोग किए जाने पर सुदृढीकरण के विरोधाभास में खड़ा होता है। इस प्रकार, सकारात्मक सुदृढीकरण एक सुखद कारक के अतिरिक्त को संदर्भित करता है, सकारात्मक दंड एक अप्रिय कारक को जोड़ने के लिए संदर्भित करता है नकारात्मक सुदृढीकरण एक अप्रिय कारक को हटाने या रोकने को संदर्भित करता है और नकारात्मक दंड एक सुखद कारक को हटाने या रोकने को संदर्भित करता है।
यह उपयोग चार शब्द संयोजनों के कुछ गैर-तकनीकी उपयोगों के साथ बाधाओं पर है, विशेष रूप से नकारात्मक सुदृढीकरण शब्द के मामले में, जिसका उपयोग अधिकांश यह बताने के लिए किया जाता है कि तकनीकी भाषा में सकारात्मक दंड के रूप में क्या वर्णन किया जाएगा जिसमें गैर-तकनीकी उपयोग सुदृढीकरण की व्याख्या करता है। प्रतिसाद देने वाले कारक के मूल्यांकन के संदर्भ में इनाम और दंड और नकारात्मक दोनों को कम करने के रूप में प्रस्तुत किया जा रहा है। इसके विपरीत, तकनीकी शब्दावली "नकारात्मक सुदृढीकरण" शब्द का उपयोग किसी दिए गए व्यवहार के प्रोत्साहन का वर्णन करने के लिए एक परिदृश्य बनाकर करती है जिसमें एक अप्रिय कारक उपस्थित होता है या उपस्थित होगा लेकिन व्यवहार में सम्मिलित होने से या तो उस कारक से बचने या इसकी घटना को रोकने में परिणाम होता है। जैसा कि मार्टिन सेलिगमैन के प्रयोगों में बिजली के झटके से बचाव के संबंध में कुत्तों की सीखने की प्रक्रिया सम्मिलित है।
परिचय
बी.एफ. स्किनर एक प्रसिद्ध और प्रभावशाली शोधकर्ता थे जिन्होंने सुदृढीकरण और व्यवहारवाद के कई सैद्धांतिक निर्माणों को स्पष्ट किया था। स्किनर ने पुनर्बलक्स को प्रतिक्रिया शक्ति (प्रतिक्रिया दर) में परिवर्तन के अनुसार परिभाषित किया, न कि अधिक व्यक्तिपरक मानदंडों के अनुसार, जैसे कि किसी के लिए क्या सुखद या मूल्यवान है। तदनुसार, गतिविधियाँ, खाद्य पदार्थ या वस्तुओं को सुखद या आनंददायक माना जाता है, जरूरी नहीं कि वे प्रबल (क्योंकि वे उनके पूर्ववर्ती प्रतिक्रिया में कोई वृद्धि नहीं करते हैं) हों। स्टिमुली, सेटिंग्स, और गतिविधियाँ केवल पुनर्बलक्स की परिभाषा में फिट होती हैं यदि भविष्य में समान स्थितियों में संभावित पुनर्बलक से तुरंत पहले का व्यवहार बढ़ जाता है; उदाहरण के लिए, एक बच्चा जो कुकी माँगने पर उसे प्राप्त करता है। यदि कुकी-अनुरोध व्यवहार की आवृत्ति बढ़ जाती है, तो कुकी को कुकी-अनुरोध करने वाले व्यवहार को शक्तिशाली करने के रूप में देखा जा सकता है। यदि चूंकि, कुकी-अनुरोध व्यवहार से कुकी में वृद्धि नहीं होती है, तो उसे प्रबल करने वाला नहीं माना जा सकता है।
एकमात्र मापदण्ड जो यह निर्धारित करती है कि क्या कोई उत्तेजना प्रबल हो रही है, उस संभावित प्रबलक के प्रशासन के बाद व्यवहार की संभावना में परिवर्तन है। अन्य सिद्धांत अतिरिक्त कारकों पर ध्यान केंद्रित कर सकते हैं जैसे कि क्या व्यक्ति किसी दिए गए परिणाम का उत्पादन करने के लिए व्यवहार की अपेक्षा करता है, किन्तु व्यवहार सिद्धांत में, सुदृढीकरण को प्रतिक्रिया की बढ़ी हुई संभावना से परिभाषित किया जाता है।
सुदृढीकरण के अध्ययन ने विश्वसनीयता (सांख्यिकी) प्रयोगात्मक परिणामों का एक विशाल निकाय तैयार किया है। सुदृढीकरण विशेष शिक्षा, व्यावहारिक व्यवहार विश्लेषण और व्यवहार के प्रायोगिक विश्लेषण में केंद्रीय अवधारणा और प्रक्रिया है और कुछ चिकित्सा और मनोचिकित्सा मॉडल, विशेष रूप से लत, पदार्थ निर्भरता और बाध्यकारी व्यवहार में एक मुख्य अवधारणा है।
संक्षिप्त इतिहास
सुदृढीकरण पर प्रयोगशाला अनुसंधान सामान्यतः एडवर्ड थार्नडाइक के काम से दिनांकित होता है, जो पहेली बक्से से बचने वाली बिल्लियों के साथ अपने प्रयोगों के लिए जाना जाता है।[9] कई अन्य लोगों ने इस शोध को जारी रखा, विशेष रूप से बीएफ स्किनर, जिन्होंने 1938 में द बिहेवियर ऑफ ऑर्गेनिज्म में इस विषय पर अपना मौलिक कार्य प्रकाशित किया और बाद के कई प्रकाशनों में इस शोध को विस्तृत किया था।[10] विशेष रूप से स्किनर ने तर्क दिया कि सकारात्मक सुदृढीकरण व्यवहार को आकार देने में दंड से उत्तम है।[11] चूंकि दंड सुदृढीकरण के ठीक विपरीत लग सकती है, स्किनर ने दावा किया कि वे अत्यधिक भिन्न हैं, यह कहते हुए कि सकारात्मक सुदृढीकरण के परिणामस्वरूप स्थायी व्यवहार संशोधन (दीर्घकालिक) होता है जबकि दंड व्यवहार को केवल अस्थायी रूप से (अल्पकालिक) बदलती है और इसके कई हानिकारक दुष्प्रभाव होते हैं।
बहुत से शोधकर्ताओं ने बाद में सुदृढीकरण की हमारी समझ का विस्तार किया और स्किनर के कुछ निष्कर्षों को चुनौती दी। उदाहरण के लिए, एज़्रिन और होल्ज़ ने दंड को "उस व्यवहार के परिणाम के रूप में परिभाषित किया है जो उस व्यवहार की भविष्य की संभावना को कम करता है,"[12] और कुछ अध्ययनों से पता चला है कि सकारात्मक सुदृढीकरण और दंड व्यवहार को संशोधित करने में समान रूप से प्रभावी हैं। सकारात्मक सुदृढीकरण, नकारात्मक सुदृढीकरण और दंड के प्रभावों पर शोध आज भी जारी है क्योंकि ये अवधारणाएं सीखने के सिद्धांत के लिए मौलिक हैं और उस सिद्धांत के कई व्यावहारिक अनुप्रयोगों पर प्रायुक्त होती हैं।
ऑपरेंट कंडीशनिंग
Operant conditioning | Extinction | ||||||||||||||||||||||||||||||
Reinforcement Increase behavior | Punishment Decrease behavior | ||||||||||||||||||||||||||||||
Positive reinforcement Add appetitive stimulus following correct behavior | Negative reinforcement | Positive punishment Add noxious stimulus following behavior | Negative punishment Remove appetitive stimulus following behavior | ||||||||||||||||||||||||||||
Escape Remove noxious stimulus following correct behavior | Active avoidance Behavior avoids noxious stimulus | ||||||||||||||||||||||||||||||
ऑपरेशनल कंडीशनिंग शब्द बीएफ स्किनर द्वारा प्रस्तुत किया गया था, यह निरुपित करने के लिए कि उनके प्रायोगिक प्रतिमान में, जीव पर्यावरण पर काम करने के लिए स्वतंत्र है। इस प्रतिमान में, प्रयोगकर्ता वांछनीय प्रतिक्रिया को ट्रिगर नहीं कर सकता; प्रयोगकर्ता प्रतिक्रिया के होने की प्रतीक्षा करता है (जीव द्वारा उत्सर्जित होने के लिए) और फिर एक संभावित पुष्टाहार दिया जाता है। शास्त्रीय कंडीशनिंग प्रतिमान में, प्रयोग करने वाला ट्रिगर (एलिसिट्स) एक रिफ्लेक्स इलिटिंग स्टिमुलस, बिना शर्त स्टिमुलस (यूसीएस) प्रस्तुत करके वांछनीय प्रतिक्रिया देता है, जिसे वह एक तटस्थ उत्तेजना, कंडीशनल स्टिमुलस (सीएस) के साथ जोड़े (पूर्ववर्ती) करता है।
ऑपरेंट कंडीशनिंग में सुदृढीकरण एक मूल शब्द है। ऑपरेंट कंडीशनिंग के दंड स्वरुप के लिए, दंड (मनोविज्ञान) देखें।
सकारात्मक सुदृढीकरण
सकारात्मक सुदृढीकरण तब होता है जब एक व्यवहार के परिणाम के रूप में एक इनाम प्रणाली प्रस्तुत की जाती है और इस व्यवहार के समान वातावरण में प्रकट होने की संभावना बढ़ जाती है।[13]: 253
- उदाहरण: चूहा जब भी बटन दबाता है तो उसे प्रबन्ध करती है। यदि चूहा अधिक बार बटन दबाना प्रारंभ कर देता है, तो प्रबन्ध इस व्यवहार को सकारात्मक रूप से सुदृढ़ करने का कार्य करता है।
- उदाहरण: एक पिता अपनी बेटी को कैंडी देता है जब वह अपने खिलौनों को साफ करती है। यदि खिलौनों को उठाने की आवृत्ति बढ़ जाती है, तो कैंडी एक सकारात्मक पुष्टाहार (सफाई के व्यवहार को सुदृढ़ करने के लिए) है।
- उदाहरण: एक कंपनी एक पुरस्कार तालिका प्रायुक्त करती है जिसमें कर्मचारी बेची गई वस्तुओं की संख्या के आधार पर पुरस्कार अर्जित करते हैं। कर्मचारियों को मिलने वाले पुरस्कार सकारात्मक सुदृढीकरण हैं यदि वे बिक्री बढ़ाते हैं।
- उदाहरण: एक शिक्षक अपने छात्र को अच्छा ग्रेड मिलने पर उसकी प्रशंसा करता है। छात्र के ग्रेड में सुधार होने की स्थिति में छात्र को मिलने वाली प्रशंसा सकारात्मक सुदृढीकरण है।
- उदाहरण: एक पर्यवेक्षक उस कर्मचारी के लिए एक मौद्रिक इनाम देता है जो अपेक्षाओं से अधिक होता है। मौद्रिक प्रतिफल आशाों से अधिक अच्छे व्यवहार का सकारात्मक सुदृढीकरण है।
उच्च संभावना निर्देश (एचपीआई) उपचार सकारात्मक सुदृढीकरण के विचार पर आधारित व्यवहारवादी मनोवैज्ञानिक उपचार है।
नकारात्मक सुदृढीकरण
नकारात्मक सुदृढीकरण तब होता है जब किसी व्यवहार की दर बढ़ जाती है क्योंकि प्रतिकूलता को हटा दिया जाता है या ऐसा होने से रोका जाता है।[13]: 253 नकारात्मक पुनर्बलन एक नकारात्मक फीडबैक लूप से उत्पन्न होता है। प्रबंधक चाहता है कि अप्रभावी व्यवहार बंद हो जाएं। इसमें व्यक्तियों को लक्ष्य पूरा करने में विफल रहने पर दंड की धमकी देना सम्मिलित है। थार्नडाइक के प्रभाव का नियम कहता है कि नकारात्मक परिणाम के बाद व्यवहार आवृत्ति में कमी करेगा।[14]
- उदाहरण: एक बच्चा अपने कमरे की सफाई करता है, और इस व्यवहार के बाद माता-पिता बच्चे को बार-बार ऐसा करने के लिए डांटना बंद कर देते हैं या ऐसा करने के लिए कहते हैं। यहाँ, सताहट सफाई के व्यवहार को नकारात्मक रूप से सुदृढ़ करने का कार्य करती है क्योंकि बच्चा सफ़ाई के उस प्रतिकूल उत्तेजना को दूर करना चाहता है।
- उदाहरण: एक कंपनी की नीति है कि यदि कोई कर्मचारी शुक्रवार तक अपना काम पूरा कर लेता है, तो उसे शनिवार की छुट्टी मिल सकती है। शनिवार का काम प्रतिकूल उत्तेजना है; प्रतिकूल उत्तेजना से बचने के लिए कर्मचारियों के पास उत्पादकता बढ़ाने के लिए प्रोत्साहन है।
- उदाहरण: एक व्यक्ति ट्रैफ़िक को कम करने और देर से आने से बचने के लिए काम के लिए जल्दी निकल जाता है। व्यवहार काम के लिए जल्दी निकल रहा है, और व्यक्ति जिस प्रतिकूल उत्तेजना को दूर करना चाहता है, वह काम के लिए देर हो रही है।
विलुप्त होने
विलुप्त होना जानबूझकर या अनजाने में हो सकता है और तब होता है जब एक अवांछित व्यवहार को नजरअंदाज कर दिया जाता है, आशा है कि यदि कोई प्रतिक्रिया नहीं होती है तो यह समय के साथ खत्म हो जाएगा। विलुप्त होने के बाद व्यवहार पहले बढ़ता है और फिर समय के साथ घटता है।[15]
- उदाहरण (उद्देश्य): एक छोटा बच्चा धौंस जमाने वालों की उपेक्षा करता है जो उनका मजाक उड़ाते हैं। डराने-धमकाने वाले को बच्चे से कोई प्रतिक्रिया नहीं मिलती है और वह उन्हें धमकाने में रुचि खो देता है।
- उदाहरण (अनपेक्षित): एक कार्यकर्ता को उसके ऊपर और कड़ी मेहनत के लिए कोई मान्यता नहीं मिली है। वे फिर कड़ी मेहनत करना बंद कर देते हैं।
- उदाहरण (उद्देश्य): एक बिल्ली रात में भोजन के लिए म्याऊं म्याऊं करती रही। मालिक बिल्ली को खाना नहीं खिलाते थे इसलिए बिल्ली ने रात में म्याऊं करना बंद कर दिया।
सुदृढीकरण बनाम दंड
प्रबलक व्यवहार को बढ़ाने का काम करते हैं जबकि दंडक व्यवहार को कम करने का काम करते हैं; इस प्रकार, सकारात्मक पुष्टाहार उत्तेजना हैं कि विषय प्राप्त करने के लिए काम करेगा, और नकारात्मक प्रबलक उत्तेजना हैं कि विषय छुटकारा पाने या समाप्त करने के लिए काम करेगा।[16] नीचे दी गई तालिका सुदृढीकरण बनाम दंड के संबंध में उत्तेजनाओं (सुखद या प्रतिकूल) को जोड़ने और घटाने को दर्शाती है।
पुरस्कृत (सुखद) प्रोत्साहन | प्रतिकूल (अप्रिय) उत्तेजना | |
---|---|---|
जोड़ना/प्रस्तुत करना | सकारात्मक सुदृढीकरण | सकारात्मक दंड |
हटाना/निकालना | नकारात्मक दंड | नकारात्मक सुदृढीकरण |
उदाहरण के लिए, यदि वह अपने कमरे को साफ करता है तो बच्चे को कैंडी देना सकारात्मक सुदृढीकरण है। यदि कोई बच्चा खिड़की तोड़ता है तो उसे पीटना सकारात्मक दंड है। दुर्व्यवहार के लिए बच्चे के खिलौने लेना नकारात्मक दंड है। एक बच्चे को उसके कामों से छुट्टी देना यदि वह परीक्षा में अच्छा प्रदर्शन करता है तो नकारात्मक सुदृढीकरण है। सकारात्मक और नकारात्मक इस प्रयोग में अच्छे और बुरे का अर्थ नहीं रखते हैं।
आगे के विचार और अवधारणाएं
- सकारात्मक और नकारात्मक के बीच अंतर करना कठिन हो सकता है और हमेशा आवश्यक नहीं भी हो सकता है; क्या हटाया या जोड़ा जा रहा है और इसे कैसे हटाया या जोड़ा जा रहा है, इस पर ध्यान केंद्रित करना सुदृढीकरण की प्रकृति को निर्धारित करेगा।
- नकारात्मक सुदृढीकरण दंड नहीं है। दोनों, जैसा कि ऊपर बताया गया है, प्रतिक्रिया की भविष्य की संभावना में वृद्धि (नकारात्मक सुदृढीकरण) या कमी (दंड) में भिन्न है। नकारात्मक सुदृढीकरण में, प्रतिक्रिया के बाद हटाई गई उत्तेजना एक प्रतिकूल उत्तेजना है; यदि इस उत्तेजना को प्रतिक्रिया के आधार पर प्रस्तुत किया गया था, तो यह एक सकारात्मक दंडक के रूप में भी कार्य कर सकता है।
- उत्तेजना का रूप उसके कार्य से अलग है कि क्या यह व्यवहार को सुदृढ़ करेगा या दंडित करेगा। एक घटना जो कुछ के लिए व्यवहार को दंडित कर सकती है, दूसरों के लिए व्यवहार को सुदृढ़ करने का काम कर सकती है। उदाहरण: एक बच्चे को बार-बार स्कूल में अभिनय करने के लिए हिरासत में लिया जाता है, किन्तु बुरे व्यवहार की आवृत्ति बढ़ जाती है। इस प्रकार, निरोध एक प्रबलक हो सकता है (सकारात्मक या नकारात्मक हो सकता है); संभवतः बच्चे को अब एक शिक्षक से आमने-सामने ध्यान मिलता है या संभवतः वे अब घर जाने से बचते हैं जहाँ अधिकांश उनके साथ दुर्व्यवहार किया जाता है।
- कुछ सुदृढीकरण एक साथ सकारात्मक और नकारात्मक हो सकते हैं, जैसे कि नशे की लत अतिरिक्त उत्साह (एक सकारात्मक भावना) के लिए ड्रग्स लेना और वापसी के लक्षणों को दूर करना (जो एक नकारात्मक भावना होगी)। या, एक गर्म कमरे में, बाहरी हवा का प्रवाह सकारात्मक सुदृढीकरण के रूप में कार्य करता है क्योंकि यह सुखद रूप से ठंडा होता है और नकारात्मक सुदृढीकरण के रूप में होता है क्योंकि यह असहज गर्म हवा को हटा देता है।
- उत्पादकता बढ़ाने के लिए कारोबारी संसार में शक्तिशालीी जरूरी है। पदोन्नति या बोनस जैसे सकारात्मक प्रोत्साहन प्राप्त करने की क्षमता से कर्मचारियों को लगातार प्रेरित किया जाता है। कर्मचारी भी नकारात्मक सुदृढीकरण से प्रेरित होते हैं। यह तब देखा जा सकता है जब कर्मचारियों को शनिवार की छुट्टी दी जाती है यदि वे शुक्रवार तक साप्ताहिक कार्यभार पूरा कर लेते हैं।
- चूंकि नकारात्मक सुदृढीकरण का कार्यस्थल के लिए अल्पावधि में सकारात्मक प्रभाव पड़ता है (अर्थात् वित्तीय रूप से लाभकारी कार्रवाई को प्रोत्साहित करता है), नकारात्मक सुदृढीकरण पर अधिक निर्भरता श्रमिकों की रचनात्मक, व्यस्त विधि से कार्य करने की क्षमता में बाधा डालती है जिससे लंबी अवधि में विकास होता है .[17]
- सकारात्मक और नकारात्मक दोनों प्रबलन व्यवहार को बढ़ाते हैं। अधिकांश लोग, विशेष रूप से बच्चे, सकारात्मक और नकारात्मक सुदृढीकरण के मिश्रण से निर्देश का पालन करना सीखेंगे।[13]
- सीमित संसाधन किसी व्यक्ति को निरंतर सुदृढीकरण प्रदान करने में सक्षम नहीं होने का कारण बन सकते हैं।
प्राथमिक और द्वितीयक प्रबलक
एक प्राथमिक पुनर्बलक, जिसे कभी-कभी 'बिना शर्त पुनर्बलक' कहा जाता है, एक उत्तेजना है जिसे पुनर्बलक के रूप में कार्य करने के लिए साहचर्य सीखने की आवश्यकता नहीं होती है और सबसे अधिक संभावना है कि यह फ़ंक्शन विकास और प्रजातियों के अस्तित्व में इसकी भूमिका के माध्यम से प्राप्त किया है।[18] प्राथमिक पुष्टाहार के उदाहरणों में भोजन, पानी और सेक्स सम्मिलित हैं। कुछ प्राथमिक प्रबलक, जैसे कि कुछ दवाएं, अन्य प्राथमिक प्रबलक के प्रभावों की नकल कर सकते हैं। जबकि ये प्राथमिक पुनर्बलक जीवन भर और व्यक्तियों के बीच काफी स्थिर होते हैं, विभिन्न प्राथमिक पुनर्बलक्स का प्रबलन मूल्य कई कारकों (जैसे, आनुवंशिकी, अनुभव) के कारण भिन्न होता है। इस प्रकार, एक व्यक्ति एक प्रकार का भोजन पसंद कर सकता है जबकि दूसरा इससे बचता है। या एक व्यक्ति ज़्यादा खाना खा सकता है जबकि दूसरा बहुत कम खाता है। इसलिए चाहे भोजन दोनों व्यक्तियों के लिए एक प्राथमिक पुनर्बलक है, फिर भी एक प्रबलक के रूप में भोजन का मूल्य उनके बीच भिन्न होता है।
एक द्वितीयक पुनर्बलक, जिसे कभी-कभी वातानुकूलित प्रबलक कहा जाता है, एक उत्तेजना या स्थिति है जिसने एक प्रबलक के रूप में कार्य करने वाले साहचर्य सीखने के बाद एक प्रबलक के रूप में अपना कार्य प्राप्त कर लिया है। यह उद्दीपन एक प्राथमिक पुनर्बलक या अन्य वातानुकूलित प्रबलक (जैसे धन) हो सकता है। द्वितीयक प्रबलक का एक उदाहरण एक क्लिकर से ध्वनि होगी, जैसा कि क्लिकर प्रशिक्षण में उपयोग किया जाता है। क्लिकर की ध्वनि प्रशंसा या व्यवहार के साथ जुड़ी हुई है, और बाद में, क्लिकर की ध्वनि प्रबलक के रूप में कार्य कर सकती है। एक और आम उदाहरण लोगों के ताली बजाने की ध्वनि है - उस ध्वनि को सुनने के बारे में स्वाभाविक रूप से कुछ भी सकारात्मक नहीं है, किन्तु हमने सीखा है कि यह प्रशंसा और पुरस्कार से जुड़ा है।
मानव उदाहरणों में प्राथमिक और द्वितीयक प्रबलकों में अंतर करने का प्रयास करते समय, केवमैन परीक्षण का उपयोग करें। यदि उद्दीपन कुछ ऐसा है जो एक गुफावासी स्वाभाविक रूप से वांछनीय पाता है (उदाहरण के लिए, कैंडी) तो यह एक प्राथमिक पुनर्बलक है। यदि, दूसरी ओर, केवमैन इस पर प्रतिक्रिया नहीं करेगा (उदाहरण के लिए, एक डॉलर का बिल), तो यह एक द्वितीयक प्रबलक है। प्राथमिक पुनर्बलकों की तरह, एक जीव द्वितीयक प्रबलकों के साथ संतुष्टि और अभाव का अनुभव कर सकता है।
अन्य सुदृढीकरण शर्तें
- एक सामान्यीकृत पुनर्बलक एक वातानुकूलित पुनर्बलक है जिसने कई अन्य पुनर्बलक्स के साथ जोड़ी बनाकर रीइन्फोर्सिंग फंक्शन प्राप्त किया है और विभिन्न प्रकार के प्रेरक कार्यों के तहत एक पुनर्बलक के रूप में कार्य करता है। (इसका एक उदाहरण पैसा है क्योंकि इसे कई अन्य प्रबलकों के साथ जोड़ा जाता है)।[19]: 83
- पुनर्बलक सैंपलिंग में, किसी जीव के पूर्व व्यवहार पर ध्यान दिए बिना संभावित रूप से प्रबल करने वाला किन्तु अपरिचित उद्दीपक प्रस्तुत किया जाता है।
- सामाजिक रूप से मध्यस्थता वाले सुदृढीकरण (प्रत्यक्ष सुदृढीकरण) में सुदृढीकरण का वितरण सम्मिलित है जिसके लिए दूसरे जीव के व्यवहार की आवश्यकता होती है।
- प्रिमैक सिद्धांत डेविड प्रिमैक द्वारा विस्तृत सुदृढीकरण का एक विशेष मामला है, जिसमें कहा गया है कि एक कम पसंदीदा गतिविधि के लिए एक अत्यधिक पसंदीदा गतिविधि को एक प्रबलक के रूप में प्रभावी रूप से उपयोग किया जा सकता है।[19]: 123
- सुदृढीकरण पदानुक्रम क्रियाओं की एक सूची है, सबसे वांछनीय से कम से कम वांछनीय परिणामों को रैंक-ऑर्डर करना जो एक प्रबलक के रूप में काम कर सकता है। विभिन्न गतिविधियों की सापेक्ष आवृत्ति और वांछनीयता निर्धारित करने के लिए एक सुदृढीकरण पदानुक्रम का उपयोग किया जा सकता है, और अधिकांश प्रेमैक सिद्धांत को प्रायुक्त करते समय नियोजित किया जाता है।
- गैर-आकस्मिक प्रतिक्रियाओं की तुलना में आकस्मिक परिणामों के व्यवहार को सुदृढ़ करने की अधिक संभावना है। आकस्मिक परिणाम वे हैं जो सामान्यतः एक कारण व्यवहार से जुड़े होते हैं, ऐसा प्रकाश एक स्विच को फ़्लिप करने पर आकस्मिक होता है। ध्यान दें कि सुदृढीकरण प्रदर्शित करने के लिए आकस्मिक परिणाम आवश्यक नहीं हैं, किन्तु कथित आकस्मिकता सीखने में वृद्धि कर सकती है।
- सन्निहित उद्दीपक वे उद्दीपक होते हैं जो विशिष्ट व्यवहारों के साथ समय और स्थान से निकटता से जुड़े होते हैं। वे विलुप्त होने (मनोविज्ञान) के प्रतिरोध को बढ़ाते हुए व्यवहार को सीखने के लिए आवश्यक समय को कम करते हैं। एक कुत्ते को बैठने के तुरंत बाद भोजन का एक टुकड़ा देना व्यवहार के साथ (और इसलिए प्रबल होने की अधिक संभावना है) भोजन वितरण में कई मिनट की देरी की तुलना में अधिक निकट है।
- गैर आकस्मिक सुदृढीकरण उस जीव के कुछ व्यवहारों के लिए पुष्टाहार के रूप में पहचाने जाने वाले उत्तेजनाओं की प्रतिक्रिया-स्वतंत्र डिलीवरी को संदर्भित करता है। चूंकि, यह सामान्यतः अनियमित व्यवहार को बनाए रखने के रूप में पहचानी जाने वाली उत्तेजनाओं के समय-आधारित वितरण पर जोर देता है, जो लक्ष्य व्यवहार की दर को कम करता है।[20] जैसा कि किसी भी मापा व्यवहार को शक्तिशाली होने के रूप में पहचाना नहीं गया है, गैर आकस्मिक सुदृढीकरण शब्द के उपयोग के आसपास विवाद है।[21]
प्राकृतिक और कृत्रिम
अपने 1967 के पत्र में, मनमाना और प्राकृतिक सुदृढीकरण, चार्ल्स फेरस्टर ने उन घटनाओं में वर्गीकरण सुदृढीकरण का प्रस्ताव दिया जो व्यवहार के स्वाभाविक परिणाम के रूप में एक संचालक की आवृत्ति को बढ़ाते हैं, और ऐसी घटनाएं जो मानव मध्यस्थता की उनकी आवश्यकता से आवृत्ति को प्रभावित करने के लिए मानी जाती हैं, जैसे कि एक सांकेतिक अर्थव्यवस्था जहां विषयों को एक परक्राम्य मूल्य के मनमाने ढंग से टोकन के साथ कुछ व्यवहार के लिए पुरस्कृत किया जाता है।
1970 में, बेयर और वुल्फ ने व्यवहार जाल नामक प्राकृतिक प्रबलकों के उपयोग के लिए एक नाम बनाया।[22] एक व्यवहार जाल को जाल में प्रवेश करने के लिए केवल एक साधारण प्रतिक्रिया की आवश्यकता होती है, फिर भी एक बार प्रवेश करने के बाद, सामान्य व्यवहार परिवर्तन बनाने में जाल का विरोध नहीं किया जा सकता है। यह एक व्यवहार जाल का उपयोग है जो किसी व्यक्ति के प्रदर्शनों की सूची को उस व्यवहार के स्वाभाविक रूप से होने वाले सुदृढीकरण को उजागर करके बढ़ाता है। व्यवहार जाल में चार विशेषताएं होती हैं:
- वे वस्तुतः अप्रतिरोध्य पुनर्बलकों के साथ बंधे होते हैं जो छात्र को जाल में फँसाते हैं
- जाल में प्रवेश करने के लिए प्रदर्शनों की सूची में पहले से ही कम प्रयास वाली प्रतिक्रिया आवश्यक है
- जाल के अंदर सुदृढीकरण की परस्पर संबंधित आकस्मिकताएँ व्यक्ति को लक्षित शैक्षणिक / सामाजिक कौशल प्राप्त करने, बढ़ाने और बनाए रखने के लिए प्रेरित करती हैं[23]
- वे लंबे समय तक प्रभावी रह सकते हैं क्योंकि व्यक्ति कुछ, यदि कोई हो, तृप्ति प्रभाव दिखाता है
जैसा कि ऊपर से देखा जा सकता है, कृत्रिम सुदृढीकरण वास्तव में कौशल बनाने या विकसित करने के लिए बनाया गया है, और सामान्यीकरण करने के लिए, यह महत्वपूर्ण है कि या तो कौशल को पकड़ने के लिए एक व्यवहार जाल प्रस्तुत किया जाए और इसे बनाए रखने या बढ़ाने के लिए स्वाभाविक रूप से होने वाले सुदृढीकरण का उपयोग किया जाए। यह व्यवहार जाल सामान्य रूप से एक सामाजिक स्थिति हो सकती है जो सामान्यतः एक निश्चित मानदंड को पूरा करने के बाद एक विशिष्ट व्यवहार से उत्पन्न होती है (उदाहरण के लिए, यदि आप किसी व्यक्ति को हैलो कहने के लिए प्रशिक्षित करने के लिए खाद्य पुष्टाहार का उपयोग करते हैं और लोगों से मिलने पर मुस्कुराते हैं, उसके बाद कौशल का निर्माण किया गया है, अन्य लोगों के मुस्कुराने का प्राकृतिक प्रबलक, और अधिक मैत्रीपूर्ण बातचीत होने से स्वाभाविक रूप से कौशल को सुदृढ़ किया जाएगा और एडिबल्स को फीका किया जा सकता है)।
आंतरायिक सुदृढीकरण तालिका
हर बार उत्सर्जित होने पर बहुत अधिक व्यवहार को प्रबलित नहीं किया जाता है, और आंतरायिक सुदृढीकरण का पैटर्न दृढ़ता से प्रभावित करता है कि एक ऑपरेटिव प्रतिक्रिया कितनी तेजी से सीखी जाती है, किसी भी समय इसकी दर क्या होती है, और जब सुदृढीकरण बंद हो जाता है तो यह कितनी देर तक जारी रहता है। सुदृढीकरण को नियंत्रित करने वाले सबसे सरल नियम निरंतर सुदृढीकरण हैं, जहाँ हर प्रतिक्रिया को प्रबल किया जाता है, और विलोपन, जहाँ कोई प्रतिक्रिया प्रबल नहीं होती है। इन चरम सीमाओं के बीच, सुदृढीकरण के अधिक जटिल तालिका उन नियमों को निर्दिष्ट करते हैं जो यह निर्धारित करते हैं कि कैसे और कब एक प्रबलक द्वारा प्रतिक्रिया का पालन किया जाएगा।
सुदृढीकरण के विशिष्ट तालिका मज़बूती से प्रतिक्रिया के विशिष्ट पैटर्न को प्रेरित करते हैं, चाहे प्रजातियों की (कुछ स्थितियों में मनुष्यों सहित) जांच की जा रही हो। चूँकि, किसी दिए गए तालिका के तहत व्यवहार के मात्रात्मक गुण तालिका के मापदंडों पर निर्भर करते हैं, और कभी-कभी अन्य, गैर-तालिका कारकों पर। सुदृढीकरण की तालिका के तहत व्यवहार की सुव्यवस्था और पूर्वानुमेयता बीएफ स्किनर के दावे के लिए साक्ष्य थी कि क्रियाप्रसूत कंडीशनिंग का उपयोग करके वह व्यवहार पर नियंत्रण प्राप्त कर सकता है, इस तरह से जिसने समकालीन तुलनात्मक मनोविज्ञान के सैद्धांतिक विवादों को अप्रचलित कर दिया था। तालिका नियंत्रण की विश्वसनीयता ने इस विचार का समर्थन किया कि व्यवहार का एक कट्टरपंथी व्यवहारवादी प्रयोगात्मक विश्लेषण मनोविज्ञान की नींव हो सकता है जो मानसिक या संज्ञानात्मक प्रक्रियाओं को संदर्भित नहीं करता है। अनुसूचियों की विश्वसनीयता ने व्यवहार को नियंत्रित करने या बदलने के साधन के रूप में अनुप्रयुक्त व्यवहार विश्लेषण के विकास को भी प्रेरित किया था।
स्किनर द्वारा कोलंबिडे का उपयोग करते हुए बहुत सी सरल संभावनाओं और कुछ अधिक जटिल संभावनाओं की काफी विस्तार से जांच की गई, किन्तु नई समय-सारणी को परिभाषित और जांचना जारी है।
सरल तालिका
- अनुपात तालिका - सुदृढीकरण केवल उस प्रतिक्रिया की संख्या पर निर्भर करता है जो जीव ने की है।
- सतत सुदृढीकरण (सीआरएफ) - सुदृढीकरण का एक तालिका जिसमें सहायक प्रतिक्रिया (वांछित प्रतिक्रिया) की प्रत्येक घटना का पालन करने वाले द्वारा किया जाता है।[19]: 86
- लैब का उदाहरण: हर बार जब कोई चूहा बार दबाता है तो उसे भोजन की एक गोली मिलती है।
- वास्तविक संसार का उदाहरण: हर बार जब एक कुत्ता अपने मालिक के बाहर शौच करता है तो उसे एक प्रबन्ध देता है; हर बार जब कोई व्यक्ति कैंडी मशीन में $1 डालता है और बटन दबाता है तो उन्हें एक कैंडी बार प्राप्त होता है।
सरल अनुसूचियों में यह निर्धारित करने के लिए एक ही नियम होता है कि किसी विशिष्ट प्रतिक्रिया के लिए एक प्रकार का पुनर्बलक कब वितरित किया जाता है।
- निश्चित अनुपात (एफआर) - तालिका हर nth प्रतिक्रिया के बाद सुदृढीकरण प्रदान करती हैं।[19]: 88 एफआर 1 तालिका सीआरएफ तालिका का पर्याय है।
- उदाहरण: FR 2 = विषय द्वारा की जाने वाली प्रत्येक दूसरी वांछित प्रतिक्रिया प्रबल होती है।
- लैब उदाहरण: FR 5 = चूहे के बार-प्रेसिंग व्यवहार को स्किनर बॉक्स में प्रत्येक 5 बार-प्रेस के बाद भोजन के साथ प्रबलित किया जाता है।
- वास्तविक संसार का उदाहरण: FR 10 = पुरानी कारों के डीलर को लॉट पर बेची गई प्रत्येक 10 कारों के लिए $1000 का बोनस मिलता है।
- परिवर्तनीय अनुपात तालिका (वीआर) - औसतन हर 'एन'वें प्रतिक्रिया पर प्रबलित, किन्तु हमेशा 'एन'वें प्रतिक्रिया पर नहीं होते है।[19]: 88
- लैब उदाहरण: वीआर 4 = 2 बार प्रेस पर पहली गोली, 6 बार प्रेस पर दूसरी गोली, तीसरी गोली 4 बार प्रेस (2 + 6 + 4 = 12; 12/3 = 4 बार प्रेस गोली प्राप्त करने के लिए)।
- वास्तविक संसार का उदाहरण: स्लॉट मशीनें (क्योंकि, जैकपॉट को हिट करने की संभावना स्थिर है, जैकपॉट को हिट करने के लिए आवश्यक लीवर प्रेस की संख्या परिवर्तनशील है)।
- निश्चित अंतराल (एफआई) - समय की n राशि के बाद प्रबलित।
- उदाहरण: FI 1-s = 1 सेकंड के बाद पहली प्रतिक्रिया के लिए सुदृढीकरण प्रदान किया गया।
- लैब उदाहरण: FI 15-s = चूहे का बार-प्रेसिंग व्यवहार अंतिम सुदृढीकरण के बाद से 15 सेकंड बीतने के बाद पहले बार प्रेस के लिए प्रबल होता है।
- वास्तविक संसार का उदाहरण: FI 30-मिनट = 30 मिनट की वाशिंग मशीन साइकिल।
- परिवर्तनीय अंतराल (वीआई) - औसतन n समय की मात्रा पर प्रबलित, किन्तु हमेशा बिल्कुल n समय की मात्रा नहीं।[19]: 89
- उदाहरण: वीआई 4-मिनट = पहला पेलेट 2 मिनट के बाद दिया गया, दूसरा 6 मिनट के बाद दिया गया, तीसरा 4 मिनट के बाद दिया गया (2 + 6 + 4 = 12; 12/3 = 4)। सुदृढीकरण औसतन 4 मिनट के बाद वितरित किया जाता है।
- लैब का उदाहरण: वीआई 10-s = एक चूहे का बार-प्रेसिंग बिहेवियर आखिरी रीइन्फोर्समेंट के बाद औसतन 10 सेकंड गुजरने के बाद पहले बार प्रेस के लिए प्रबलित होता है।
- वास्तविक संसार का उदाहरण: वीआई 30-मिनट = मछली पकड़ने जाना—आप 10 मिनट के बाद मछली पकड़ सकते हैं, फिर एक घंटा प्रतीक्षा करनी होगी, फिर 20 मिनट प्रतीक्षा करनी होगी।
- निश्चित समय (एफटी) - अंतिम सुदृढीकरण वितरण के बाद से एक निश्चित समय पर एक शक्तिशाली प्रोत्साहन प्रदान करता है, चाहे विषय ने प्रतिक्रिया दी हो या नहीं। दूसरे शब्दों में, यह एक गैर-आकस्मिक तालिका है।
- लैब का उदाहरण: एफटी 5-एस = चूहे को हर 5 सेकंड में भोजन मिलता है चाहे उसका व्यवहार कुछ भी हो।
- वास्तविक संसार का उदाहरण: एफटी 30-डी = चेक के बीच व्यवहार की परवाह किए बिना एक व्यक्ति को हर महीने वार्षिकी चेक मिलता है
- परिवर्तनीय समय (वीटी) - अंतिम सुदृढीकरण के बाद से औसत चर समय पर सुदृढीकरण प्रदान करता है, चाहे विषय ने प्रतिक्रिया दी हो या नहीं।
कई अंतर सुदृढीकरण में सरल अनुसूचियों का उपयोग किया जाता है[24] प्रक्रियाएं:
- वैकल्पिक व्यवहार का विभेदक सुदृढीकरण (डीआरए) - एक कंडीशनिंग प्रक्रिया जिसमें एक अवांछित प्रतिक्रिया को विलुप्त होने (मनोविज्ञान) पर रखकर कम किया जाता है, या, कम सामान्यतः, आकस्मिक दंड प्रदान करते हुए, साथ ही वांछनीय प्रतिक्रिया पर आकस्मिक सुदृढीकरण प्रदान करते हुए। एक उदाहरण एक शिक्षक होगा जो केवल एक छात्र पर ध्यान दे रहा है जब वे अपना हाथ उठाते हैं, जबकि जब वह छात्र को बुलाता है तो उसे अनदेखा कर देता है।
- अन्य व्यवहार का विभेदक सुदृढीकरण (डीआरओ) - चूक प्रशिक्षण प्रक्रियाओं के रूप में भी जाना जाता है, एक सहायक कंडीशनिंग प्रक्रिया जिसमें एक सकारात्मक प्रबलक समय-समय पर वितरित किया जाता है यदि प्रतिभागी लक्ष्य प्रतिक्रिया के अतिरिक्त कुछ और करता है। एक उदाहरण नोज पिकिंग के अतिरिक्त किसी भी हाथ की कार्रवाई को शक्तिशाली करना होगा।[19]: 338
- असंगत व्यवहार का विभेदक सुदृढीकरण (डीआरआई) - एक असंगत प्रतिक्रिया को शक्तिशाली करके बिना दंड (मनोविज्ञान) के लगातार व्यवहार को कम करने के लिए उपयोग किया जाता है। एक उदाहरण नाक से चुगने को कम करने के लिए ताली बजाना होगा
- कम प्रतिक्रिया दर (डीआरएल) का विभेदक सुदृढीकरण - प्रतिक्रिया की कम दरों को प्रोत्साहित करने के लिए उपयोग किया जाता है। यह एक अंतराल तालिका की तरह है, अतिरिक्त इसके कि समय से पहले प्रतिक्रियाएँ व्यवहार के बीच आवश्यक समय को रीसेट कर देती हैं।
- लैब उदाहरण: डीआरएल 10-एस = एक चूहे को 10 सेकंड के बाद पहली प्रतिक्रिया के लिए प्रबलित किया जाता है, किन्तु यदि चूहा 10 सेकंड से पहले प्रतिक्रिया करता है तो कोई सुदृढीकरण नहीं होता है और चूहे को उस समय से पहले प्रतिक्रिया के बिना 10 सेकंड इंतजार करना पड़ता है बार दबाने से पहले सुदृढीकरण को बढ़ावा मिलता हैं।
- असली संसार का उदाहरण: यदि आप मुझसे हर 10 मिनट में एक बार से ज्यादा आलू की चिप नहीं मांगेंगे, तो मैं आपको दे दूंगा। यदि आप अधिक बार पूछते हैं, तो मैं आपको कुछ नहीं दूंगा।
- उच्च दर (डीआरएच) का विभेदक सुदृढीकरण - प्रतिक्रिया की उच्च दरों को बढ़ाने के लिए उपयोग किया जाता है। यह एक अंतराल तालिका की तरह है, अतिरिक्त इसके कि सुदृढीकरण प्राप्त करने के लिए अंतराल में न्यूनतम संख्या में प्रतिक्रियाओं की आवश्यकता होती है।
- लैब उदाहरण: डीआरएच 10-s/FR 15 = एक चूहे को शक्तिशाली होने के लिए 10 सेकंड की वृद्धि के भीतर 15 बार एक बार दबाना चाहिए।
- वास्तविक संसार का उदाहरण: यदि लैंस आर्मस्ट्रॉन्ग टूर डी फ्रांस जीतने जा रहे हैं तो उन्हें 'वाई'-घंटे की दौड़ के समय कई बार 'x' पेडल करना होगा।
विभिन्न प्रकार के सरल अनुसूचियों के प्रभाव
- निश्चित अनुपात: पुनर्बलक डिलीवर होने के बाद गतिविधि धीमी हो जाती है, फिर अगले पुनर्बलक डिलीवरी (पोस्ट-रिइन्फोर्समेंट पॉज़) तक प्रतिक्रिया दर बढ़ जाती है।
- चर अनुपात: प्रतिक्रिया की तीव्र, स्थिर दर; विलुप्त होने (मनोविज्ञान) के लिए सबसे प्रतिरोधी।
- निश्चित अंतराल: अंतराल के अंत में प्रतिक्रिया बढ़ जाती है; विलुप्त होने के लिए खराब प्रतिरोध।
- चर अंतराल: स्थिर गतिविधि परिणाम, विलुप्त होने के लिए अच्छा प्रतिरोध।
- अनुपात अनुसूचियाँ अंतराल अनुसूचियों की तुलना में प्रतिक्रिया की उच्च दर उत्पन्न करती हैं, जब सुदृढीकरण की दरें अन्यथा समान होती हैं।
- परिवर्तनीय तालिका अधिकांश निश्चित अनुसूचियों की तुलना में उच्च दर और विलुप्त होने (मनोविज्ञान) के लिए अधिक प्रतिरोध उत्पन्न करती हैं। इसे आंशिक सुदृढीकरण विलोपन प्रभाव (पीआरईई) के रूप में भी जाना जाता है।
- परिवर्तनीय अनुपात तालिका प्रतिक्रिया की उच्चतम दर और विलुप्त होने के लिए सबसे बड़ा प्रतिरोध (उदाहरण के लिए, स्लॉट मशीनों पर जुआरी का व्यवहार) दोनों का उत्पादन करती है।
- फिक्स्ड तालिका पोस्ट-रीइन्फोर्समेंट पॉज़ (पीआरपी) का उत्पादन करते हैं, जहाँ प्रतिक्रियाएँ रीइन्फोर्समेंट के तुरंत बाद संक्षिप्त रूप से समाप्त हो जाएँगी, चूँकि पॉज़ पूर्व सुदृढीकरण के अतिरिक्त आगामी प्रतिक्रिया आवश्यकता का एक कार्य है।[25]
- एक निश्चित अंतराल तालिका का पीआरपी अधिकांश एक स्कैलप-आकार की त्वरित प्रतिक्रिया दर के बाद होता है, जबकि निश्चित अनुपात तालिका अधिक कोणीय प्रतिक्रिया उत्पन्न करती हैं।
- फिक्स्ड इंटरवल स्कैलप: निश्चित अंतराल सुदृढीकरण तालिका के साथ विकसित होने वाली प्रतिक्रिया का पैटर्न, एक निश्चित अंतराल पर प्रदर्शन समय बताने में विषय की सटीकता को दर्शाता है।
- एक निश्चित अंतराल तालिका का पीआरपी अधिकांश एक स्कैलप-आकार की त्वरित प्रतिक्रिया दर के बाद होता है, जबकि निश्चित अनुपात तालिका अधिक कोणीय प्रतिक्रिया उत्पन्न करती हैं।
- जिन जीवों के सुदृढीकरण के तालिका पतले होते हैं (अर्थात, अधिक प्रतिक्रियाओं की आवश्यकता होती है या सुदृढीकरण से पहले अधिक प्रतीक्षा की जाती है) बहुत जल्दी पतले होने पर अनुपात तनाव का अनुभव कर सकते हैं। यह विलुप्त होने के समय देखे गए व्यवहार के समान व्यवहार उत्पन्न करता है।
- अनुपात तनाव: प्रतिक्रिया का व्यवधान तब होता है जब एक निश्चित अनुपात प्रतिक्रिया आवश्यकता बहुत तेज़ी से बढ़ जाती है।
- अनुपात रन: प्रतिक्रिया की उच्च और स्थिर दर जो प्रत्येक अनुपात की आवश्यकता को पूरा करती है। सामान्यतः उच्च अनुपात की आवश्यकता के कारण सुदृढीकरण के बाद लंबे समय तक रुक जाता है।
- आंशिक सुदृढीकरण तालिका निरंतर सुदृढीकरण तालिका की तुलना में विलुप्त होने के प्रति अधिक प्रतिरोधी हैं।
- अनुपात तालिका अंतराल अनुसूचियों की तुलना में अधिक प्रतिरोधी होती हैं और परिवर्तनीय तालिका निश्चित की तुलना में अधिक प्रतिरोधी होती हैं।
- सुदृढीकरण मूल्य में क्षणिक परिवर्तन से व्यवहार में गतिशील परिवर्तन होते हैं।[26]
यौगिक तालिका
यौगिक तालिका एक ही व्यवहार के लिए एक ही पुनर्बलक का उपयोग करके किसी तरह से दो या दो से अधिक अलग-अलग सरल तालिका को जोड़ते हैं। बहुत संभावनाएं हैं; उनमें से सबसे अधिक बार उपयोग किया जाता है:
- वैकल्पिक तालिका - एक प्रकार की यौगिक तालिका जहां दो या दो से अधिक सरल तालिका प्रभावी होती हैं और जो भी समय-सारणी पूरी हो जाती है, उसका परिणाम पहले सुदृढीकरण होता है।[27]
- संयोजक तालिका - सुदृढीकरण का एक जटिल तालिका जहां दो या दो से अधिक सरल तालिका एक दूसरे से स्वतंत्र रूप से प्रभावी होते हैं, और सभी सरल अनुसूचियों पर आवश्यकताओं को सुदृढीकरण के लिए पूरा किया जाना चाहिए।
- मल्टीपल तालिका - समय के साथ वैकल्पिक रूप से दो या दो से अधिक तालिका, एक उत्तेजना के साथ जो निरुपित करता है कि कौन सा प्रायुक्त है। यदि तालिका प्रभावी होने पर प्रतिक्रिया की आवश्यकता पूरी हो जाती है तो सुदृढीकरण वितरित किया जाता है।
- उदाहरण: एफआर4 जब सीटी दी जाती है और एफआई6 जब घंटी बजाई जाती है।
- मिश्रित तालिका - या तो दो में से, या अधिक, तालिका बिना किसी प्रोत्साहन के हो सकती हैं जो यह दर्शाता है कि कौन सा प्रायुक्त है। यदि तालिका प्रभावी होने पर प्रतिक्रिया की आवश्यकता पूरी हो जाती है तो सुदृढीकरण वितरित किया जाता है।
- उदाहरण: एफआई6 और फिर वीआर3 तालिका में बदलाव की किसी प्रोत्साहन चेतावनी के बिना।
- समवर्ती तालिका - एक जटिल सुदृढीकरण प्रक्रिया जिसमें प्रतिभागी एक साथ उपलब्ध दो या अधिक सरल सुदृढीकरण अनुसूचियों में से किसी एक को चुन सकता है। प्रतिक्रिया विकल्पों के बीच किसी भी समय आगे और पीछे बदलने के लिए जीव स्वतंत्र हैं।
- वास्तविक संसार का उदाहरण: टेलीविजन पर चैनल बदलना।
- सुदृढीकरण की समवर्ती-श्रृंखला तालिका - एक जटिल सुदृढीकरण प्रक्रिया जिसमें प्रतिभागी को पहली कड़ी के समय यह चुनने की अनुमति है कि दूसरी कड़ी में कई सरल सुदृढीकरण तालिका प्रभावी होंगे। एक बार चुनाव हो जाने के बाद, अस्वीकृत विकल्प अगले परीक्षण के प्रारंभ होने तक अनुपलब्ध हो जाते हैं।
- इंटरलॉकिंग तालिका - दो घटकों के साथ एक एकल तालिका जहां एक घटक में प्रगति दूसरे घटक में प्रगति को प्रभावित करती है। एक इंटरलॉकिंग FR 60 FI 120-s तालिका में, उदाहरण के लिए, प्रत्येक प्रतिक्रिया अंतराल घटक से समय घटाती है जैसे कि प्रत्येक प्रतिक्रिया एफआई तालिका से दो सेकंड हटाने के बराबर होती है।
- श्रृंखला तालिका - दो या दो से अधिक लगातार तालिका पूरा होने के बाद सुदृढीकरण होता है, एक प्रोत्साहन के साथ संकेत मिलता है कि कब एक तालिका पूरा हो गया है और अगला प्रारंभ हो गया है
- उदाहरण: एक एफआर 10 तालिका पर एक लाल बत्ती की उपस्थिति में, एक कबूतर एक हरे रंग की डिस्क को 10 बार चोंच मारता है; फिर, एक पीली रोशनी निरुपित करती है कि एफ 3 तालिका सक्रिय है; कबूतर द्वारा एक पीली डिस्क को 3 बार चोंच मारने के बाद, वीआई 6-s तालिका को निरुपित करने के लिए एक हरी बत्ती प्रभाव में है; यदि यह श्रृंखला में अंतिम तालिका थी, तो कबूतर को वीआई 6-s तालिका पर हरे रंग की डिस्क को चुगने के लिए प्रबलित किया जाएगा; चूंकि, प्रबलक प्रदान करने से पहले श्रृंखला में सभी तालिका आवश्यकताओं को पूरा किया जाना चाहिए।
- अग्रानुक्रम तालिका - सुदृढीकरण तब होता है जब दो या दो से अधिक क्रमिक तालिका आवश्यकताओं को पूरा कर लिया जाता है, बिना किसी प्रोत्साहन के यह संकेत मिलता है कि कब एक तालिका पूरा हो गया है और अगला प्रारंभ हो गया है।
- उदाहरण: वीआर 10, इसके पूरा होने के बाद तालिका को बिना किसी चेतावनी के एफआर 10 में बदल दिया जाता है, उसके बाद इसे बिना किसी चेतावनी के एफआर 16 में बदल दिया जाता है, आदि। तालिका की श्रृंखला के अंत में, एक पुनर्बलक दिया जाता है।
- उच्च-क्रम तालिका - एक तालिका के पूरा होने को दूसरी तालिका के अनुसार प्रबलित किया जाता है; उदा. एफआर2 (एफआई10 सेकेंड) में, दो क्रमिक निश्चित अंतराल अनुसूचियों को एक प्रतिक्रिया के प्रबल होने से पहले पूरा करने की आवश्यकता होती है।
अंतराल तालिका
सुदृढीकरण के सुपरिम्पोज्ड तालिका का मनोविज्ञान शब्द पुरस्कारों की एक संरचना को संदर्भित करता है जहां सुदृढीकरण के दो या दो से अधिक सरल तालिका एक साथ संचालित होते हैं। प्रबलक सकारात्मक, नकारात्मक या दोनों हो सकते हैं। एक उदाहरण एक व्यक्ति है जो दिन भर के काम के बाद घर आता है। सामने के दरवाजे को खोलने का व्यवहार व्यक्ति के पति या पत्नी द्वारा होठों पर एक बड़े चुंबन और उत्साह से कूदने वाले परिवार के कुत्ते से पैंट में एक चीर द्वारा पुरस्कृत किया जाता है। सुदृढीकरण के अंतराल तालिका का एक और उदाहरण एक प्रायोगिक पिंजरे में एक कबूतर है जो एक बटन पर चोंच मारता है। चोंच हर 20 पेक में ग्रेन्स का एक हॉपर देती है, और हर 200 पेक के बाद पानी तक पहुंचती है।
सुदृढीकरण के अंतराल तालिका एक प्रकार के यौगिक तालिका हैं जो बीएफ स्किनर और उनके सहयोगियों (स्किनर और फेरस्टर, 1957) द्वारा सुदृढीकरण के सरल तालिका पर प्रारंभिक कार्य से विकसित हुए हैं। उन्होंने प्रदर्शित किया कि पुनर्बलक तालिका पर वितरित किए जा सकते हैं, और आगे यह कि जीव अलग-अलग तालिका के तहत अलग-अलग व्यवहार करते हैं। किसी व्यवहार के परिणामस्वरूप हर बार वितरित किए जाने वाले भोजन या पानी जैसे प्रबलक के अतिरिक्त, व्यवहार के एक से अधिक उदाहरणों के बाद पुनर्बलक को वितरित किया जा सकता है। उदाहरण के लिए, भोजन प्रकट होने से पहले एक कबूतर को एक बटन स्विच को दस बार चोंच मारने की आवश्यकता हो सकती है। यह एक अनुपात तालिका है। इसके अतिरिक्त, एक लक्षित व्यवहार के बाद समय के अंतराल के बाद एक पुष्टाहार वितरित किया जा सकता है। एक उदाहरण एक चूहा है जिसे पहली प्रतिक्रिया के तुरंत बाद एक भोजन की गोली दी जाती है जो अंतिम लीवर प्रेस के बाद दो मिनट बीत जाने के बाद होती है। इसे अंतराल तालिका कहा जाता है।
इसके अतिरिक्त, अनुपात तालिका अलग-अलग जीव द्वारा व्यवहार की निश्चित या परिवर्तनीय संख्या के बाद सुदृढीकरण प्रदान कर सकती हैं। इसी तरह, अंतराल तालिका जीव द्वारा एकल प्रतिक्रिया के बाद समय के निश्चित या परिवर्तनशील अंतराल के बाद सुदृढीकरण प्रदान कर सकते हैं। अलग-अलग व्यवहार प्रतिक्रिया दर उत्पन्न करते हैं जो कि सुदृढीकरण तालिका कैसे बनाई जाती है, इसके आधार पर भिन्न होती है। कई प्रयोगशालाओं में बाद के कई शोधों ने तालिकािंग पुनर्बलक्स के व्यवहार पर पड़ने वाले प्रभावों की जांच की।
यदि किसी जीव को एक ही समय में दो या दो से अधिक सरल प्रबलन अनुसूचियों के बीच चयन करने का अवसर प्रदान किया जाता है, तो पुनर्बलन संरचना को समवर्ती प्रबलन तालिका कहा जाता है। रेचनर(1974, 1977) ने सामाजिक जालों की एक प्रयोगशाला सादृश्य बनाने के प्रयास में सुदृढीकरण के सुपरइम्पोज़्ड तालिका की अवधारणा प्रस्तुत की, जैसे कि जब मनुष्य अपनी मछलियों की अधिकता करते हैं या अपने वर्षावनों को तोड़ते हैं। ब्रेचनर ने एक ऐसी स्थिति उत्पन्न की जहां सरल सुदृढीकरण तालिका एक-दूसरे पर आरोपित किए गए। दूसरे शब्दों में, एक जीव द्वारा एक प्रतिक्रिया या प्रतिक्रियाओं के समूह ने कई परिणाम दिए। सुदृढीकरण के समवर्ती अनुसूचियों को या अनुसूचियों के रूप में सोचा जा सकता है, और सुदृढीकरण के आरोपित अनुसूचियों को और अनुसूचियों के रूप में सोचा जा सकता है। रेचनरऔर लिंदर(1981) और रेचनर(1987) ने यह वर्णन करने के लिए अवधारणा का विस्तार किया कि सिस्टम के माध्यम से ऊर्जा प्रवाह के विधि का विश्लेषण करने के लिए अंतराल तालिका और सोशल ट्रैप सादृश्य का उपयोग कैसे किया जा सकता है।
सुदृढीकरण के अंतराल तालिका में सामाजिक जाल उत्पन्न करने के अतिरिक्त कई वास्तविक संसार के अनुप्रयोग हैं। सरल सुदृढीकरण अनुसूचियों को सुपरइम्पोज़ करके कई अलग-अलग मानव व्यक्तिगत और सामाजिक स्थितियों का निर्माण किया जा सकता है। उदाहरण के लिए, एक इंसान को तंबाकू और शराब की लत एक साथ हो सकती है। दो या दो से अधिक समवर्ती अनुसूचियों को सुपरइम्पोज़ करके और भी जटिल स्थितियों का निर्माण या अनुकरण किया जा सकता है। उदाहरण के लिए, एक हाई स्कूल सीनियर के पास स्टैनफोर्ड यूनिवर्सिटी या यूसीएलए में जाने के बीच एक विकल्प हो सकता है, और साथ ही सेना या वायु सेना में जाने का विकल्प हो सकता है, और साथ ही साथ एक इंटरनेट कंपनी या एक सॉफ्टवेयर कंपनी में नौकरी नौकरी लेने का विकल्प हो सकता है। यह सुदृढीकरण के तीन आरोपित समवर्ती अनुसूचियों की एक सुदृढीकरण संरचना है।
कर्ट लेविन (1935) द्वारा वर्णित सुदृढीकरण के अंतराल तालिका तीन क्लासिक संघर्ष स्थितियों (दृष्टिकोण-दृष्टिकोण संघर्ष, दृष्टिकोण-परिहार संघर्ष और परिहार-परिहार संघर्ष) का निर्माण कर सकते हैं और उनके बल क्षेत्र विश्लेषण द्वारा विश्लेषण की गई अन्य लेविनियन स्थितियों को संचालित कर सकते हैं। एक विश्लेषणात्मक उपकरण के रूप में सुदृढीकरण के आरोपित अनुसूचियों के उपयोग के अन्य उदाहरण किराए पर नियंत्रण (ब्रेचनर, 2003) की आकस्मिकताओं और लॉस एंजिल्स काउंटी तूफान नाली प्रणाली (ब्रेचनर, 2010) में जहरीले कचरे के डंपिंग की समस्या के लिए आवेदन हैं।
समवर्ती तालिका
ऑपरेशनल कंडीशनिंग में, सुदृढीकरण के समवर्ती तालिका सुदृढीकरण के तालिका हैं जो एक साथ एक पशु विषय या मानव प्रतिभागी के लिए उपलब्ध हैं, ताकि विषय या प्रतिभागी किसी भी समय पर प्रतिक्रिया दे सकें। उदाहरण के लिए, दो-वैकल्पिक फोर्स्ड चॉइस टास्क में, स्किनर बॉक्स में एक कबूतर का सामना दो चोंच चाबियों से होता है; चोंच मारने की प्रतिक्रिया दोनों में से किसी पर भी की जा सकती है, और खाद्य सुदृढीकरण किसी भी पर चोंच के बाद हो सकता है। दो चाबियों पर चोंच के लिए व्यवस्थित सुदृढ़ीकरण के तालिका अलग-अलग हो सकते हैं। वे स्वतंत्र हो सकते हैं, या वे जुड़े हो सकते हैं ताकि एक कुंजी पर व्यवहार दूसरे पर सुदृढीकरण की संभावना को प्रभावित करे।
दो अनुसूचियों पर प्रतिक्रियाओं के लिए शारीरिक रूप से अलग होना आवश्यक नहीं है। 1958 में फाइंडले द्वारा प्रस्तुत समवर्ती अनुसूचियों को व्यवस्थित करने के वैकल्पिक विधि में, दोनों अनुसूचियों को एक कुंजी या अन्य प्रतिक्रिया उपकरण पर व्यवस्थित किया जाता है, और विषय अनुसूचियों के बीच परिवर्तन के लिए दूसरी कुंजी पर प्रतिक्रिया कर सकता है। ऐसी फाइंडले समवर्ती प्रक्रिया में, एक उत्तेजना (जैसे, मुख्य कुंजी का रंग) संकेत देता है कि कौन सा तालिका प्रभाव में है।
समवर्ती तालिका अधिकांश चाबियों के बीच तेजी से बदलाव को प्रेरित करते हैं। इसे रोकने के लिए, एक परिवर्तन विलंब सामान्यतः प्रस्तुत किया जाता है: विषय के स्विच करने के बाद प्रत्येक तालिका को संक्षिप्त अवधि के लिए निष्क्रिय कर दिया जाता है।
जब दोनों समवर्ती तालिका सुदृढीकरण के चर अंतराल तालिका होते हैं, तो एक मात्रात्मक संबंध जिसे मिलान कानून के रूप में जाना जाता है, दो अनुसूचियों में सापेक्ष प्रतिक्रिया दरों और उनके द्वारा प्रदान की जाने वाली सापेक्ष सुदृढीकरण दरों के बीच पाया जाता है; यह पहली बार आर.जे. द्वारा देखा गया था। 1961 में हर्नस्टीन। मैचिंग लॉ, इंस्ट्रूमेंटल बिहेवियर के लिए एक नियम है जो बताता है कि किसी विशेष प्रतिक्रिया विकल्प पर प्रतिक्रिया देने की सापेक्ष दर उस प्रतिक्रिया के लिए सुदृढीकरण की सापेक्ष दर के बराबर होती है (व्यवहार की दर = सुदृढीकरण की दर)। जानवरों और मनुष्यों में अनुसूचियों में चुनाव को प्राथमिकता देने की प्रवृत्ति होती है।[28]
आकार
आकार एक वांछित वाद्य प्रतिक्रिया के लिए लगातार सन्निकटन का सुदृढीकरण है। एक चूहे को लीवर दबाने के लिए प्रशिक्षित करने में, उदाहरण के लिए, बस लीवर की ओर मुड़ना पहले प्रबल होता है। फिर, केवल मुड़ना और उसकी ओर कदम बढ़ाना प्रबल होता है। व्यवहारों के एक सेट के परिणाम व्यवहारों के अगले सेट के लिए आकार देने की प्रक्रिया प्रारंभ करते हैं, और उस सेट के परिणाम अगले सेट के लिए आकार देने की प्रक्रिया तैयार करते हैं, और इसी तरह। जैसे-जैसे प्रशिक्षण आगे बढ़ता है, प्रबलित प्रतिक्रिया वांछित व्यवहार की तरह उत्तरोत्तर अधिक होती जाती है; प्रत्येक बाद का व्यवहार अंतिम व्यवहार का एक निकट सन्निकटन बन जाता है।[29] आकार का उपयोग ऑटिज्म के साथ-साथ अन्य विकासात्मक अक्षमताओं वाले व्यक्तियों के लिए विभिन्न वांछित व्यवहारों के लिए एक हस्तक्षेप के रूप में किया जाता है। जब आकार देने को अन्य साक्ष्य-आधारित प्रथाओं जैसे कि जटिल कार्यात्मक संचार प्रशिक्षण (एफसीटी) के साथ जोड़ा जाता है,[30] व्यक्ति को सकारात्मक परिणाम मिल सकते हैं। जब आकार देने को दक्षता के साथ सुदृढीकरण के तालिका के साथ जोड़ा जाता है, तो लक्षित व्यवहार बढ़ जाता है।
आकार देने का उपयोग भोजन से इनकार करने के लिए भी किया जाता है।[31] भोजन से इनकार तब होता है जब किसी व्यक्ति के पास खाद्य पदार्थों के लिए आंशिक या कुल विरोध होता है। यह अचार खाने वाले से लेकर गंभीर तक न्यूनतम हो सकता है और व्यक्तियों के स्वास्थ्य को प्रभावित कर सकता है। आकार देने का उपयोग खाद्य स्वीकृति के लिए उच्च सफलता दर के लिए किया गया है।[32]
श्रृंखलन
श्रृंखलन में असतत व्यवहारों को एक श्रृंखला में एक साथ जोड़ना सम्मिलित है, जैसे कि प्रत्येक व्यवहार का प्रत्येक परिणाम पिछले व्यवहार के लिए सुदृढीकरण (या परिणाम) और अगले व्यवहार के लिए उत्तेजना (या पूर्ववर्ती) दोनों है। श्रृंखलन सिखाने के कई विधि हैं, जैसे फॉरवर्ड श्रृंखलन (श्रृंखला में पहले व्यवहार से प्रारंभ करना), बैकवर्ड श्रृंखलन (पिछले व्यवहार से प्रारंभ करना) और टोटल टास्क श्रृंखलन (जिसमें पूरा व्यवहार प्रारंभ से अंत तक सिखाया जाता है, बल्कि चरणों की एक श्रृंखला के रूप में)। एक उदाहरण एक बंद दरवाजा खोल रहा है। पहले चाबी डाली फिर घुमाई, फिर दरवाजा खोला।
फ़ॉरवर्ड श्रृंखलन विषय को पहले कुंजी सम्मिलित करना सिखाएगा। एक बार जब उस कार्य में महारत प्राप्त हो जाती है, तो उन्हें चाबी डालने के लिए कहा जाता है, और उसे घुमाना सिखाया जाता है। एक बार जब उस कार्य में महारत प्राप्त हो जाती है, तो उन्हें पहले दो कार्य करने के लिए कहा जाता है, फिर दरवाजा खोलना सिखाया जाता है। बैकवर्ड श्रृंखलन में शिक्षक को पहले चाबी डालना और घुमाना सम्मिलित होता है, और फिर विषय को दरवाजा खोलने के लिए सिखाया जाता है। एक बार जब यह सीख लिया जाता है, तो शिक्षक कुंजी डालता है, और विषय को इसे चालू करना सिखाया जाता है, फिर अगले चरण के रूप में दरवाजा खोलता है। अंत में, विषय को कुंजी डालने के लिए सिखाया जाता है, और वे मुड़ते हैं और दरवाजा खोलते हैं। एक बार पहले चरण में महारत प्राप्त कर लेने के बाद, पूरा कार्य सिखाया जा चुका है। टोटल टास्क श्रृंखलन में पूरे टास्क को सिंगल सीरीज के रूप में पढ़ाना, सभी चरणों के माध्यम से प्रेरित करना सम्मिलित होगा। प्रांप्ट प्रत्येक चरण पर फीके (कम) हो जाते हैं क्योंकि उनमें महारत प्राप्त हो जाती है।
ऑटिज़्म और अन्य संबंधित अक्षमताओं वाले व्यक्तियों में देखे गए चुनौतीपूर्ण व्यवहारों को पिछले अध्ययनों द्वारा सफलतापूर्वक प्रबंधित और बनाए रखा गया है, जो श्रृंखला सुदृढीकरण के एक तालिका का उपयोग कर रहे हैं।[33] कार्यात्मक संचार प्रशिक्षण एक हस्तक्षेप है जो अधिकांश उपयुक्त और वांछित कार्यात्मक संचार प्रतिक्रिया को प्रभावी ढंग से बढ़ावा देने के लिए सुदृढीकरण के श्रृंखलित तालिका का उपयोग करता है।[34] कार्यात्मक संचार प्रशिक्षण के साथ जोड़े जाने पर श्रृंखलन प्रक्रियाओं का उद्देश्य व्यक्ति को व्यक्त करने के कार्यात्मक या अधिक उपयुक्त विधियों के साथ चुनौतीपूर्ण या अनुचित व्यवहार को कम करना है।
प्रेरक संचार और सुदृढीकरण सिद्धांत
प्रेरक संचार
- अनुनय सामाजिक प्रभाव किसी भी व्यक्ति को उसके सोचने, कार्य करने और अनुभव करने के विधि से प्रभावित करता है। प्रेरक कौशल बताता है कि लोग लोगों की चिंता, स्थिति और जरूरतों को कैसे समझते हैं। अनुनय को अनौपचारिक अनुनय और औपचारिक अनुनय में वर्गीकृत किया जा सकता है।
अनौपचारिक अनुनय
- यह उस विधि के बारे में बताता है जिससे कोई व्यक्ति सहकर्मियों और ग्राहकों के साथ बातचीत करता है। अनौपचारिक अनुनय का उपयोग टीम, मेमो के साथ-साथ ई-मेल में भी किया जा सकता है।
- उदाहरण: मैंने देखा कि आपने जो की मदद की जब आपके उपकरण रखरखाव दल द्वारा सेवा किए जा रहे थे।[35] या
- मैंने उस अंतिम ग्राहक को क्रेडिट कार्ड प्राप्त करने, उसका उपयोग करने और उसके लाभ के बारे में आपका स्पष्टीकरण सुना था। मुझे लगता है कि हम उसे अपने व्यवसाय में सम्मिलित कर सकते हैं।[35]
- औपचारिक अनुनय
- इस प्रकार के अनुनय का उपयोग ग्राहक पत्र, प्रस्ताव लिखने और किसी ग्राहक या सहकर्मियों को औपचारिक प्रस्तुति के लिए भी किया जाता है।
अनुनय की प्रक्रिया
अनुनय संबंधित है कि आप अपने कौशल, अनुभव, ज्ञान, नेतृत्व, गुणों और टीम क्षमताओं के साथ लोगों को कैसे प्रभावित करते हैं। दूसरों से काम करवाते समय अनुनय एक संवादात्मक प्रक्रिया है। यहां ऐसे उदाहरण दिए गए हैं जिनके लिए आप वास्तविक समय में अनुनय कौशल का उपयोग कर सकते हैं। साक्षात्कार: आप अपनी सर्वश्रेष्ठ प्रतिभा, कौशल और विशेषज्ञता सिद्ध कर सकते हैं। ग्राहक: लक्ष्यों या लक्ष्यों की उपलब्धि के लिए अपने ग्राहकों का मार्गदर्शन करना। मेमो: संचालन में सुधार के लिए अपने विचारों और सहकर्मियों को विचार व्यक्त करने के लिए। प्रतिरोध की पहचान और सकारात्मक दृष्टिकोण अनुनय की महत्वपूर्ण भूमिकाएँ हैं।
अनुनय मानव संपर्क का एक रूप है। यह तब होता है जब एक व्यक्ति एक या अधिक अन्य व्यक्तियों से कुछ विशेष प्रतिक्रिया की अपेक्षा करता है और जानबूझकर संचार के उपयोग के माध्यम से प्रतिक्रिया को सुरक्षित करने के लिए तैयार हो जाता है। संचारक को यह अनुभव करना चाहिए कि विभिन्न समूहों के अलग-अलग मूल्य हैं।[36]: 24–25
वाद्य सीखने की स्थितियों में, जिसमें क्रियात्मक व्यवहार सम्मिलित होता है, प्रेरक संचारक अपना संदेश प्रस्तुत करेगा और फिर प्राप्तकर्ता द्वारा सही प्रतिक्रिया देने की प्रतीक्षा करेगा। जैसे ही रिसीवर प्रतिक्रिया करता है, संचारक कुछ उचित इनाम या सुदृढीकरण द्वारा प्रतिक्रिया को ठीक करने का प्रयास करेगा।[37]
सशर्त सीखने की स्थितियों में, जहां प्रतिवादी व्यवहार होता है, संचारक अपना संदेश प्रस्तुत करता है ताकि वह रिसीवर से जो प्रतिक्रिया चाहता है उसे प्राप्त कर सके, और उत्तेजना जो मूल रूप से प्रतिक्रिया को प्राप्त करने के लिए काम करती है, फिर कंडीशनिंग में शक्तिशाली या पुरस्कृत तत्व बन जाती है।[36]
गणितीय मॉडल
सुदृढीकरण के गणितीय मॉडल के निर्माण में बहुत काम किया गया है। सुदृढीकरण के गणितीय सिद्धांतों के लिए संक्षिप्त इस मॉडल को एमपीआर के रूप में जाना जाता है। पीटर किलेन ने कबूतरों पर अपने शोध से इस क्षेत्र में महत्वपूर्ण खोजें की हैं।[38]
आलोचना
हालाँकि, सुदृढीकरण का सही उपयोग यह है कि व्यवहार पर इसके प्रभाव के कारण कुछ प्रबल होता है, न कि इसके विपरीत।
व्यवहारिक सुदृढीकरण की मानक परिभाषा की परिपत्र परिभाषा के रूप में आलोचना की गई है, क्योंकि ऐसा प्रतीत होता है कि प्रतिक्रिया शक्ति सुदृढीकरण से बढ़ जाती है, और सुदृढीकरण को कुछ इस तरह से परिभाषित करता है जो प्रतिक्रिया शक्ति (अर्थात्, प्रतिक्रिया शक्ति उन चीजों से बढ़ जाती है जो प्रतिक्रिया शक्ति को बढ़ाती हैं) को बढ़ाता है। चूँकि, सुदृढीकरण का सही उपयोग[39] यह है कि व्यवहार पर इसके प्रभाव के कारण कुछ प्रबल है, न कि इसके विपरीत होता है। यह गोलाकार हो जाता है यदि कोई कहता है कि एक विशेष उत्तेजना व्यवहार को शक्तिशाली करती है क्योंकि यह एक पुनर्बलक है, और यह नहीं समझाती है कि एक उत्तेजना व्यवहार पर उस प्रभाव को क्यों उत्पन्न कर रही है। अन्य परिभाषाएँ प्रस्तावित की गई हैं, जैसे कि एफ.डी. शेफ़ील्ड का उपभोगात्मक व्यवहार एक प्रतिक्रिया पर निर्भर करता है, किन्तु मनोविज्ञान में इनका व्यापक रूप से उपयोग नहीं किया जाता है।[40]
तेजी से, रोल पुनर्बलक्स प्ले की समझ एक शक्तिशाली प्रभाव से एक सिग्नलिंग प्रभाव की ओर बढ़ रही है।[41] यही है, यह विचार है कि पुष्ट करने वाले प्रतिक्रिया में वृद्धि करते हैं क्योंकि वे उन व्यवहारों को संकेत देते हैं जो सुदृढीकरण में परिणाम की संभावना रखते हैं। जबकि अधिकांश व्यावहारिक अनुप्रयोगों में, किसी भी दिए गए पुनर्बलक का प्रभाव समान होगा चाहे प्रबलक संकेत या शक्तिशाली कर रहा हो, यह दृष्टिकोण कई व्यवहारिक घटनाओं की व्याख्या करने में मदद करता है जिसमें आंतरायिक सुदृढीकरण अनुसूचियों तालिका (निश्चित अंतराल स्कैलप्स) पर प्रतिक्रिया के पैटर्न और अंतर परिणाम प्रभाव सम्मिलित हैं।[42]
शर्तों का इतिहास
1920 के दशक में रूसी फिजियोलॉजिस्ट इवान पावलोव व्यवहार के संबंध में सुदृढीकरण शब्द का उपयोग करने वाले पहले व्यक्ति हो सकते हैं, किन्तु (जेम्स ए डिन्समूर के अनुसार) उन्होंने अपने अनुमानित रूसी सजातीय का संयम से उपयोग किया, और तब भी यह पहले से सीखी गई लेकिन कमजोर प्रतिक्रिया को शक्तिशाली करने के लिए संदर्भित था। उन्होंने इसका उपयोग नहीं किया, जैसा कि आज नए व्यवहारों को चुनने और शक्तिशाली करने के लिए है। पावलोव द्वारा विलोपन (रूसी में) शब्द का प्रारंभ आज के मनोवैज्ञानिक उपयोग के निकट है।
लोकप्रिय उपयोग में, सकारात्मक सुदृढीकरण को अधिकांश इनाम प्रणाली के पर्याय के रूप में उपयोग किया जाता है, इस प्रकार लोगों (व्यवहार नहीं) को प्रबलित किया जाता है, किन्तु यह शब्द के लगातार तकनीकी उपयोग के विपरीत है, क्योंकि यह व्यवहार का एक आयाम है, न कि व्यक्ति, जिसे शक्तिशाली किया गया है। दंड (मनोविज्ञान) के पर्याय के रूप में मनोविज्ञान के बाहर आम लोगों और यहां तक कि सामाजिक वैज्ञानिकों द्वारा अधिकांश नकारात्मक सुदृढीकरण का उपयोग किया जाता है। यह आधुनिक तकनीकी उपयोग के विपरीत है, किन्तु यह बी.एफ. स्किनर थे जिन्होंने पहली बार अपनी 1938 की पुस्तक में इस तरह इसका इस्तेमाल किया था। चूंकि, 1953 तक, उन्होंने दंड शब्द का प्रयोग करने में दूसरों का अनुसरण किया, और प्रतिकूल उत्तेजनाओं को हटाने के लिए उन्होंने नकारात्मक सुदृढीकरण को फिर से डाला।
व्यवहार विश्लेषण के क्षेत्र में कुछ हैं[43] जिन्होंने सुझाव दिया है कि सकारात्मक और नकारात्मक शब्द सुदृढीकरण पर चर्चा करने में एक अनावश्यक अंतर बनाते हैं क्योंकि यह अधिकांश स्पष्ट नहीं होता है कि उत्तेजनाओं को हटाया जा रहा है या प्रस्तुत किया जा रहा है। उदाहरण के लिए, इवाता प्रश्न प्रस्तुत करता है: ... तापमान में परिवर्तन ठंड (गर्मी) की प्रस्तुति या गर्मी (ठंड) को हटाने से अधिक सटीक रूप से विशेषता है?[44]: 363 इस प्रकार, प्रबलन को पूर्व-परिवर्तन की स्थिति के रूप में परिकल्पित किया जा सकता है जो परिवर्तन के बाद की स्थिति द्वारा प्रतिस्थापित किया जाता है जो उत्तेजना स्थितियों में परिवर्तन के बाद के व्यवहार को पुष्ट करता है।
अनुप्रयोग
सुदृढीकरण और दंड मानव सामाजिक संबंधों में सर्वव्यापी हैं, और क्रियात्मक सिद्धांतों के बहुत सारे अनुप्रयोगों का सुझाव दिया गया है और उन्हें प्रायुक्त किया गया है। निम्नलिखित कुछ उदाहरण हैं।
लत और निर्भरता
सकारात्मक और नकारात्मक सुदृढीकरण व्यसन और नशीली दवाओं पर निर्भरता के विकास और रखरखाव में केंद्रीय भूमिका निभाते हैं। एक नशे की लत दवा इनाम प्रणाली है; अर्थात्, यह नशीली दवाओं के उपयोग के #प्राथमिक प्रबलकों के रूप में कार्य करता है। मस्तिष्क की इनाम प्रणाली इसे प्रोत्साहन प्रमुखता प्रदान (अर्थात्, यह वांछित या वांछित है) करती है,[45][46][47] इसलिए जैसे ही एक लत विकसित होती है, दवा की कमी से लालसा उत्पन्न होती है। इसके अतिरिक्त, नशीली दवाओं के उपयोग से जुड़े उत्तेजना - जैसे, एक सिरिंज की दृष्टि, और उपयोग का स्थान - दवा द्वारा प्रेरित तीव्र सुदृढीकरण से जुड़ा हुआ है।[45][46][47] ये पहले के तटस्थ उत्तेजना कई गुणों को प्राप्त करते हैं: उनकी उपस्थिति लालसा को प्रेरित कर सकती है, और वे निरंतर उपयोग के द्वितीयक प्रबलक बन सकते हैं।[45][46][47] इस प्रकार, यदि एक व्यसनी व्यक्ति इन दवाओं में से किसी एक संकेत का सामना करता है, तो संबंधित दवा के लिए लालसा फिर से प्रकट हो सकती है। उदाहरण के लिए, नशीली दवाओं के उपयोग के खतरों को दिखाने के प्रयास के रूप में दवा विरोधी एजेंसियों ने पहले दवा सामग्री की छवियों वाले पोस्टर का उपयोग किया था। चूँकि, ऐसे पोस्टरों का उपयोग अब नहीं किया जाता है क्योंकि पोस्टरों में चित्रित उत्तेजनाओं को देखते हुए प्रोत्साहन के प्रभाव के कारण पुनरावृत्ति होती है।
नशीली दवाओं पर निर्भर व्यक्तियों में, नकारात्मक सुदृढीकरण तब होता है जब एक दवा स्व-प्रशासन होती है। शारीरिक निर्भरता (जैसे, कंपकंपी और पसीना) और / या मनोवैज्ञानिक निर्भरता (जैसे, एंधोनिया, बेचैनी, चिड़चिड़ापन) के लक्षणों को कम करने या बचने के लिए स्व-प्रशासित , और चिंता) जो दवा वापसी की स्थिति के समय उत्पन्न होती है।[45]
पशु प्रशिक्षण
इन विचारों के नाम और अध्ययन से बहुत पहले पशु प्रशिक्षक और पालतू जानवर के मालिक ऑपरेशनल कंडीशनिंग के सिद्धांतों और प्रथाओं को प्रायुक्त कर रहे थे, और पशु प्रशिक्षण अभी भी ऑपरेशनल नियंत्रण के सबसे स्पष्ट और सबसे ठोस उदाहरणों में से एक प्रदान करता है। इस लेख में वर्णित अवधारणाओं और प्रक्रियाओं में से कुछ सबसे प्रमुख हैं: तत्काल सुदृढीकरण की उपलब्धता (उदाहरण के लिए कुत्ते की स्वादिष्ट चीजों का हमेशा उपस्थित रहने वाला बैग); आकस्मिकता, यह आश्वासन देना कि सुदृढीकरण वांछित व्यवहार का पालन करता है और कुछ और नहीं; वांछित प्रतिक्रिया के तुरंत बाद एक क्लिकर ध्वनि के रूप में माध्यमिक सुदृढीकरण का उपयोग; आकार देना, जैसा कि धीरे-धीरे एक कुत्ते को ऊंची और ऊंची छलांग लगाने में होता है; आंतरायिक सुदृढीकरण, बिना संतृप्ति के लगातार व्यवहार को प्रेरित करने के लिए उन यम्मी की आवृत्ति को कम करना; श्रृंखलन, जहां एक जटिल व्यवहार को धीरे-धीरे एक साथ रखा जाता है।[48]
बाल व्यवहार - अभिभावक प्रबंधन प्रशिक्षण
उपयुक्त बाल व्यवहारों के लिए सकारात्मक सुदृढीकरण प्रदान करना माता-पिता प्रबंधन प्रशिक्षण का एक प्रमुख केंद्र है। सामान्यतः, माता-पिता सामाजिक पुरस्कारों (जैसे प्रशंसा, मुस्कान और गले लगाना) के साथ-साथ ठोस पुरस्कार (जैसे स्टिकर या बच्चे के साथ सहयोगात्मक रूप से बनाई गई प्रोत्साहन प्रणाली के हिस्से के रूप में बड़े इनाम की ओर इशारा करते हैं) के माध्यम से उचित व्यवहार को पुरस्कृत करना सीखते हैं।[49] इसके अतिरिक्त, माता-पिता प्रारंभिक फोकस के रूप में सरल व्यवहारों का चयन करना सीखते हैं और प्रत्येक छोटे कदम को पुरस्कृत करते हैं जो उनके बच्चे को एक बड़े लक्ष्य तक पहुँचने की दिशा में प्राप्त होता है (इस अवधारणा को क्रमिक सन्निकटन कहा जाता है)।[49][50] वे प्रगति चार्ट के माध्यम से अप्रत्यक्ष पुरस्कारों का भी उपयोग कर सकते हैं। कक्षा में सकारात्मक सुदृढीकरण प्रदान करना विद्यार्थी की सफलता के लिए लाभदायक हो सकता है। छात्रों पर सकारात्मक सुदृढीकरण प्रायुक्त करते समय, इसे उस छात्र की आवश्यकताओं के अनुसार व्यक्तिगत बनाना महत्वपूर्ण है। इस तरह, छात्र समझते हैं कि उन्हें प्रशंसा क्यों मिल रही है, वे इसे स्वीकार कर सकते हैं, और अंततः उस क्रिया को जारी रखना सीख सकते हैं जो सकारात्मक सुदृढीकरण द्वारा अर्जित की गई थी। उदाहरण के लिए, पुरस्कार या अतिरिक्त अवकाश समय का उपयोग करना कुछ छात्रों पर अधिक प्रायुक्त हो सकता है, जबकि अन्य प्रशंसा को निरुपित करने वाले स्टिकर या चेक मार्क प्राप्त करके प्रवर्तन को स्वीकार कर सकते हैं।
अर्थशास्त्र
मनोवैज्ञानिक और अर्थशास्त्री दोनों बाजार में मनुष्यों के व्यवहार के लिए प्रभावी अवधारणाओं और निष्कर्षों को प्रायुक्त करने में रुचि रखते हैं। एक उदाहरण उपभोक्ता मांग का विश्लेषण है, जैसा कि खरीदी गई वस्तु की मात्रा से अनुक्रमित होता है। अर्थशास्त्र में, जिस हद तक कीमत उपभोग को प्रभावित करती है, उसे मांग की कीमत लोच कहा जाता है। कुछ वस्तुएँ अन्य वस्तुओं की तुलना में अधिक लोचदार होती हैं; उदाहरण के लिए, कुछ खाद्य पदार्थों की कीमत में बदलाव का खरीदारी की गई मात्रा पर बड़ा प्रभाव हो सकता है, जबकि गैसोलीन और अन्य आवश्यक चीजें मूल्यों में बदलाव से कम प्रभावित हो सकती हैं। क्रियाप्रसूत विश्लेषण के संदर्भ में, इस तरह के प्रभावों की व्याख्या उपभोक्ताओं की प्रेरणा और वस्तुओं के सापेक्ष मूल्य के रूप में प्रबलकों के रूप में की जा सकती है।[51]
जुआ - चर अनुपात निर्धारण
जैसा कि इस लेख में पहले कहा गया है, एक चर अनुपात तालिका प्रतिक्रियाओं की अप्रत्याशित संख्या के उत्सर्जन के बाद सुदृढीकरण उत्पन्न करती है। यह तालिका सामान्यतः तेज़, लगातार प्रतिक्रिया उत्पन्न करता है। स्लॉट मशीनें एक चर अनुपात तालिका पर भुगतान करती हैं, और वे जुआरी में इस तरह के लगातार लीवर-खींचने वाले व्यवहार का उत्पादन करती हैं। क्योंकि मशीनों को उनके द्वारा लिए गए पैसे से कम भुगतान करने के लिए प्रोग्राम किया जाता है, लगातार स्लॉट-मशीन उपयोगकर्ता लंबे समय में हार जाता है। स्लॉट मशीन, और इस प्रकार चर अनुपात सुदृढीकरण, को अधिकांश जुए की लत के अंतर्निहित कारक के रूप में दोषी ठहराया गया है।[52]
संगठनों में व्यवहार का प्रबंधन
प्रदर्शन प्रोत्साहन योजनाओं के लिए पारंपरिक वेतन का एक विकल्प जो सुदृढीकरण सिद्धांत में निहित है, जिसे O.B के रूप में जाना जाता है। मॉड दृष्टिकोण, एक संगठन के सदस्यों के प्रदर्शन संबंधी व्यवहारों के प्रबंधन के लिए एक व्यावहारिक दृष्टिकोण के रूप में प्रस्तावित किया गया है। . ओ.बी. मॉड. और इसके सुदृढ़-के-प्रदर्शन के आधार को निर्माण और सेवा संगठनों दोनों में प्रदर्शन में सुधार लाने के लिए अनुभवजन्य रूप से दिखाया गया है, चूंकि सुधार दोनों संदर्भों में प्रबलक के प्रकार से भिन्न हैं।[53]
नज सिद्धांत
न्यूड थ्योरी (या नज) व्यवहार विज्ञान, राजनीतिक सिद्धांत और अर्थशास्त्र में एक अवधारणा है जो तर्क देती है कि गैर-विवश अनुपालन (मनोविज्ञान) प्राप्त करने की कोशिश करने के लिए सकारात्मक सुदृढीकरण और अप्रत्यक्ष सुझाव समूहों और व्यक्तियों के उद्देश्यों, प्रोत्साहनों और निर्णय लेने को प्रभावित कर सकते हैं। , कम से कम के रूप में प्रभावी रूप से - यदि प्रत्यक्ष निर्देश, कानून या प्रवर्तन से अधिक प्रभावी नहीं है।
प्रशंसा
मनुष्यों में व्यवहारिक सुदृढीकरण के साधन के रूप में प्रशंसा की अवधारणा बीएफ स्किनर के ऑपरेंट कंडीशनिंग के मॉडल में निहित है। इस लेंस के माध्यम से, प्रशंसा को सकारात्मक सुदृढीकरण के एक साधन के रूप में देखा गया है, जिसमें कथित व्यवहार की आकस्मिक रूप से प्रशंसा करके एक देखे गए व्यवहार की संभावना अधिक हो जाती है।[54] सैकड़ों अध्ययनों ने सकारात्मक व्यवहार को बढ़ावा देने में प्रशंसा की प्रभावशीलता का प्रदर्शन किया है, विशेष रूप से शिक्षक और माता-पिता के अध्ययन में बेहतर व्यवहार और शैक्षणिक प्रदर्शन को बढ़ावा देने के लिए बच्चे की प्रशंसा का उपयोग[55][56] कार्य प्रदर्शन के अध्ययन में भी किया है।[57] प्रत्याशित सुदृढीकरण के माध्यम से गैर-प्रशंसित आसन्न व्यक्तियों (जैसे कि प्रशंसा प्राप्तकर्ता का सहपाठी) में सकारात्मक व्यवहार को सुदृढ़ करने के लिए प्रशंसा का प्रदर्शन किया गया है।[58] स्तुति अपने रूप, सामग्री और वितरण के आधार पर व्यवहार को बदलने में अधिक या कम प्रभावी हो सकती है। सकारात्मक व्यवहार परिवर्तन को प्रभावित करने के लिए प्रशंसा के लिए, इसे सकारात्मक व्यवहार पर निर्भर (अर्थात, लक्षित व्यवहार के प्रायुक्त होने के बाद ही प्रशासित) होना चाहिए, उस व्यवहार का विवरण निर्दिष्ट करना चाहिए जिसे प्रबलित किया जाना है, और इसे ईमानदारी और विश्वसनीय रूप से दिया जाना चाहिए।[59]
एक सकारात्मक सुदृढीकरण रणनीति के रूप में प्रशंसा के प्रभाव को स्वीकार करते हुए, कई व्यवहारिक और संज्ञानात्मक व्यवहार संबंधी हस्तक्षेपों ने अपने प्रोटोकॉल में प्रशंसा के उपयोग को सम्मिलित किया है।[60][61] प्रशंसा के रणनीतिक उपयोग को कक्षा प्रबंधन[60] और अभिभावक प्रशिक्षण हस्तक्षेप दोनों में साक्ष्य-आधारित अभ्यास के रूप में मान्यता प्राप्त है,[56] चूंकि प्रशंसा को अधिकांश हस्तक्षेप अनुसंधान में सकारात्मक सुदृढीकरण की एक बड़ी श्रेणी में सम्मिलित किया जाता है, जिसमें रणनीतिक ध्यान और व्यवहार पुरस्कार जैसी रणनीतियां सम्मिलित होती हैं।
हेरफेर
ब्रैकर ने निम्नलिखित विधियों की पहचान की है जो अपमानजनक शक्ति से छेड़छाड़ करते हैं और अपने पीड़ितों को नियंत्रित करते हैं:[62]
- सकारात्मक सुदृढीकरण: प्रशंसा, सतही आकर्षण, सतही सहानुभूति (मगरमच्छ के आँसू), अत्यधिक माफी माँगना, धन, स्वीकृति, उपहार, ध्यान, चेहरे के भाव जैसे कि एक विवश हँसी या मुस्कान, और सार्वजनिक मान्यता सम्मिलित है।
- नकारात्मक सुदृढीकरण: किसी को नकारात्मक स्थिति से निकालना सम्मिलित हो सकता है
- आंतरायिक सुदृढीकरण; तालिका: आंशिक या आंतरायिक नकारात्मक सुदृढीकरण भय और संदेह का एक प्रभावी वातावरण बना सकता है। आंशिक या आंतरायिक सकारात्मक सुदृढीकरण पीड़ित को बने रहने के लिए प्रोत्साहित कर सकता है - उदाहरण के लिए जुए के अधिकांश रूपों में, जुआरी के बार-बार जीतने की संभावना होती है किन्तु फिर भी कुल मिलाकर पैसा हार जाता है।
- दंड (मनोविज्ञान): इसमें गाली-गलौज, चिल्लाना, मूक उपचार, डराना-धमकाना, गाली-गलौज करना, भावनात्मक ब्लैकमेल करना, अपराधबोध यात्रा, रूठना, रोना और पीड़ित की भूमिका निभाना सम्मिलित है।
- दर्दनाक एक-परीक्षण शिक्षा: प्रभुत्व या श्रेष्ठता स्थापित करने के लिए मौखिक दुर्व्यवहार, विस्फोटक क्रोध, या अन्य डराने वाले व्यवहार का उपयोग करना; इस तरह के व्यवहार की एक घटना भी पारंपरिक कंडीशनिंग या पीड़ितों को मैनिपुलेटर को परेशान करने, सामना करने या विरोध करने से बचने के लिए प्रशिक्षित कर सकती है।
दर्दनाक बंधन
अभिघातजन्य बंधन दुरुपयोग के चल रहे चक्र के परिणाम के रूप में होता है जिसमें इनाम और दंड (मनोविज्ञान) का आंतरायिक सुदृढीकरण शक्तिशाली भावनात्मक बंधन बनाता है जो परिवर्तन के लिए प्रतिरोधी होते हैं।[63][64]
दूसरे स्रोत ने संकेत दिया[65]
'दर्दनाक संबंध के लिए आवश्यक शर्तें यह हैं कि एक व्यक्ति को दूसरे पर हावी होना चाहिए और यह कि दुर्व्यवहार का स्तर कालानुक्रमिक रूप से बढ़ता है और फिर कम हो जाता है। रिश्ते को प्रमुख व्यक्ति से अनुमेय, दयालु और यहां तक कि स्नेही व्यवहार की अवधि की विशेषता है, जो तीव्र दुर्व्यवहार के आंतरायिक एपिसोड द्वारा विरामित है। ऊपरी हाथ बनाए रखने के लिए, पीड़ित व्यक्ति पीड़ित के व्यवहार में हेरफेर करता है और पीड़ित के विकल्पों को सीमित करता है ताकि शक्ति असंतुलन को बनाए रखा जा सके। वर्चस्व और अधीनता के संतुलन के लिए किसी भी खतरे का सामना सज़ा के एक बढ़ते चक्र से किया जा सकता है, जिसमें उग्र धमकी से लेकर तीव्र हिंसक विस्फोट सम्मिलित हैं। शिकारकर्ता पीड़ित को समर्थन के अन्य स्रोतों से भी अलग करता है, जो पता लगाने और हस्तक्षेप की संभावना को कम करता है, पीड़ित की आत्म-संदर्भ प्रतिक्रिया प्राप्त करने की क्षमता को कम करता है, और एकतरफा निर्भरता की भावना को शक्तिशाली करता है ... इन अपमानजनक संबंधों के दर्दनाक प्रभाव सटीक स्व-मूल्यांकन के लिए पीड़ित की क्षमता की हानि सम्मिलित हो सकती है, जिससे व्यक्तिगत अपर्याप्तता की भावना और हावी होने वाले व्यक्ति पर निर्भरता की अधीनस्थ भावना हो सकती है। पीड़ितों को किसी ऐसे व्यक्ति के साथ अपने भावनात्मक और व्यवहारिक संबद्धता के विभिन्न प्रकार के अप्रिय सामाजिक और कानूनी परिणामों का सामना करना पड़ सकता है, जो आक्रामक कृत्यों को अंजाम देते हैं, चाहे वे स्वयं आक्रामकता के प्राप्तकर्ता हों।
वीडियो गेम
अधिकांश वीडियो गेम किसी प्रकार के विवश लूप के आसपास डिज़ाइन किए गए हैं, जो खिलाड़ी को गेम खेलते रहने के लिए एक चर दर तालिका के माध्यम से एक प्रकार का सकारात्मक सुदृढीकरण जोड़ते हैं, चूंकि इससे वीडियो गेम की लत भी लग सकती है।[66]
2010 के दशक में वीडियो गेम मुद्रीकरण में एक प्रवृत्ति के हिस्से के रूप में, कुछ गेमों ने इनाम के रूप में लूट बक्से की प्रस्तुतकश की या वास्तविक संसार के फंडों द्वारा खरीदा जा सकता है, जो दुर्लभता द्वारा वितरित इन-गेम आइटमों के यादृच्छिक चयन की प्रस्तुतकश करता है। अभ्यास को उन्हीं विधियों से जोड़ा गया है जो स्लॉट मशीन और अन्य जुआ उपकरण पुरस्कार देते हैं, क्योंकि यह एक चर दर तालिका का पालन करता है। जबकि सामान्य धारणा है कि लूट बक्से जुआ का एक रूप है, अभ्यास को केवल कुछ देशों में जुआ और अन्यथा कानूनी रूप में वर्गीकृत किया जाता है। चूंकि, ऑनलाइन जुआ या वास्तविक संसार के पैसे के लिए व्यापार के लिए उन वस्तुओं को आभासी मुद्रा के रूप में उपयोग करने के विधियों ने एक त्वचा जुआ बाजार बनाया है जो कानूनी मूल्यांकन के अधीन है।[67]
डर की कार्यस्थल संस्कृति
एशफोर्थ ने नेतृत्व के संभावित विनाशकारी पक्षों पर चर्चा की और पहचान की जिसे उन्होंने क्षुद्र अत्याचारियों के रूप में संदर्भित किया: नेता जो प्रबंधन की अत्याचारी शैली का प्रयोग करते हैं, जिसके परिणामस्वरूप कार्यस्थल में भय का माहौल होता है।[68] आंशिक या आंतरायिक नकारात्मक सुदृढीकरण भय और संदेह का एक प्रभावी वातावरण बना सकता है।[62] जब कर्मचारियों को यह आभास हो जाता है कि धौंस जमाने वालों को सहन किया जाता है, तो परिणाम भय का माहौल हो सकता है।[69]
इनाम प्रणाली, दंड (मनोविज्ञान), और प्रेरणा के प्रति संवेदनशीलता में व्यक्तिगत अंतर का अध्ययन सुदृढीकरण संवेदनशीलता सिद्धांत के परिसर के तहत किया गया है और यह सुदृढीकरण संवेदनशीलता सिद्धांत कार्यस्थल प्रदर्शन भी रहा है।
यह भी देखें
- अपमानजनक शक्ति और नियंत्रण
- प्रयुक्त व्यवहार विश्लेषण
- व्यवहार पुच्छल
- गाजर और डंडा
- बाल संवारना
- कुत्ते का प्रशिक्षण
- आदर्शीकरण
- परिश्रम सीखा
- अत्यधिक औचित्य प्रभाव
- पाव्लोवियन-इंस्ट्रुमेंटल ट्रांसफर
- सजा
- सुदृढीकरण सीखना
- सुदृढ़ीकरण संवेदनशीलता सिद्धांत
- पुरस्कार प्रणाली
- सोसायटी फॉर क्वांटिटेटिव एनालिसिस ऑफ बिहेवियर
- टोकन अर्थव्यवस्था
संदर्भ
- ↑ 1.0 1.1 Schultz W (July 2015). "Neuronal Reward and Decision Signals: From Theories to Data". Physiological Reviews. 95 (3): 853–951. doi:10.1152/physrev.00023.2014. PMC 4491543. PMID 26109341.
Rewards in operant conditioning are positive reinforcers. ... Operant behavior gives a good definition for rewards. Anything that makes an individual come back for more is a positive reinforcer and therefore a reward. Although it provides a good definition, positive reinforcement is only one of several reward functions. ... Rewards are attractive. They are motivating and make us exert an effort. ... Rewards induce approach behavior, also called appetitive or preparatory behavior, and consummatory behavior. ... Thus any stimulus, object, event, activity, or situation that has the potential to make us approach and consume it is by definition a reward. ... Intrinsic rewards are activities that are pleasurable on their own and are undertaken for their own sake, without being the means for getting extrinsic rewards. ... Intrinsic rewards are genuine rewards in their own right, as they induce learning, approach, and pleasure, like perfectioning, playing, and enjoying the piano. Although they can serve to condition higher order rewards, they are not conditioned, higher order rewards, as attaining their reward properties does not require pairing with an unconditioned reward.
- ↑ Winkielman P, Berridge KC, Wilbarger JL (January 2005). "नकाबपोश खुश बनाम गुस्सैल चेहरों के प्रति अचेतन भावात्मक प्रतिक्रियाएँ उपभोग व्यवहार और मूल्य के निर्णयों को प्रभावित करती हैं". Personality & Social Psychology Bulletin. 31 (1): 121–35. doi:10.1177/0146167204271309. PMID 15574667. S2CID 7427794.
- ↑ Mondadori C, Waser PG, Huston JP (June 1977). "परीक्षण के बाद के सुदृढीकरण, सजा या ईसीएस के निष्क्रिय परिहार सीखने पर समय-निर्भर प्रभाव". Physiology & Behavior. 18 (6): 1103–9. doi:10.1016/0031-9384(77)90018-X. PMID 928533. S2CID 21534363.
- ↑ Gottfried JA, White NM (2011). "Chapter3: Reward: What is it? How can it be inferred from behavior.". In White NM (ed.). सनसनी और इनाम की न्यूरोबायोलॉजी. Frontiers in Neuroscience. CRC Press. ISBN 978-1-4200-6726-2. PMID 22593908.
- ↑ Malenka RC, Nestler EJ, Hyman SE (2009). "Chapter 15: Reinforcement and Addictive Disorders". In Sydor A, Brown RY (eds.). Molecular Neuropharmacology: A Foundation for Clinical Neuroscience (2nd ed.). New York: McGraw-Hill Medical. pp. 364–375. ISBN 9780071481274.
- ↑ Nestler EJ (December 2013). "Cellular basis of memory for addiction". Dialogues in Clinical Neuroscience. 15 (4): 431–443. PMC 3898681. PMID 24459410.
Despite the importance of numerous psychosocial factors, at its core, drug addiction involves a biological process: the ability of repeated exposure to a drug of abuse to induce changes in a vulnerable brain that drive the compulsive seeking and taking of drugs, and loss of control over drug use, that define a state of addiction. ... A large body of literature has demonstrated that such ΔFosB induction in D1-type [nucleus accumbens] neurons increases an animal's sensitivity to drug as well as natural rewards and promotes drug self-administration, presumably through a process of positive reinforcement ... Another ΔFosB target is cFos: as ΔFosB accumulates with repeated drug exposure it represses c-Fos and contributes to the molecular switch whereby ΔFosB is selectively induced in the chronic drug-treated state.41. ... Moreover, there is increasing evidence that, despite a range of genetic risks for addiction across the population, exposure to sufficiently high doses of a drug for long periods of time can transform someone who has relatively lower genetic loading into an addict.
- ↑ "Glossary of Terms". Mount Sinai School of Medicine. Department of Neuroscience. Retrieved 9 February 2015.
- ↑ Volkow ND, Koob GF, McLellan AT (January 2016). "Neurobiologic Advances from the Brain Disease Model of Addiction". New England Journal of Medicine. 374 (4): 363–371. doi:10.1056/NEJMra1511480. PMC 6135257. PMID 26816013.
Substance-use disorder: A diagnostic term in the fifth edition of the Diagnostic and Statistical Manual of Mental Disorders (DSM-5) referring to recurrent use of alcohol or other drugs that causes clinically and functionally significant impairment, such as health problems, disability, and failure to meet major responsibilities at work, school, or home. Depending on the level of severity, this disorder is classified as mild, moderate, or severe.
Addiction: A term used to indicate the most severe, chronic stage of substance-use disorder, in which there is a substantial loss of self-control, as indicated by compulsive drug taking despite the desire to stop taking the drug. In the DSM-5, the term addiction is synonymous with the classification of severe substance-use disorder. - ↑ Thorndike E (June 1898). "एनिमल इंटेलिजेंस पर कुछ प्रयोग". Science. 7 (181): 818–24. Bibcode:1898Sci.....7..818T. doi:10.1126/science.7.181.818. PMID 17769765.
- ↑ Skinner, B. F. "The Behavior of Organisms: An Experimental Analysis", 1938 New York: Appleton-Century-Crofts
- ↑ Skinner BF (1948). वाल्डेन टू. Toronto: The Macmillan Company.
- ↑ Honig W (1966). Operant Behavior: Areas of Research and Application. New York: Meredith Publishing Company. p. 381.
- ↑ 13.0 13.1 13.2 Flora S (2004). सुदृढीकरण की शक्ति. Albany: State University of New York Press.
- ↑ Stajkovic, Alex (2019). Management and Leadership, What Can MBD Do in My Workday?. First Research Paradigms Applied
- ↑ Stajkovic, Alex (2019). Management and Leadership, What Can MBD Do in My Workday?. First Research Paradigms Applied
- ↑ D'Amato MR (1969). Marx MH (ed.). Learning Processes: Instrumental Conditioning. Toronto: The Macmillan Company.
- ↑ Harter JK (2002). Keyes CL (ed.). Well-Being in the Workplace and its Relationship to Business Outcomes: A Review of the Gallup Studies (PDF). Washington D.C.: American Psychological Association.
- ↑ Skinner, B.F. (1974). About Behaviorism
- ↑ 19.0 19.1 19.2 19.3 19.4 19.5 19.6 Miltenberger, R. G. "Behavioral Modification: Principles and Procedures". Thomson/Wadsworth, 2008.
- ↑ Tucker M, Sigafoos J, Bushell H (October 1998). "चुनौतीपूर्ण व्यवहार के उपचार में गैर आकस्मिक सुदृढीकरण का उपयोग। एक समीक्षा और नैदानिक गाइड". Behavior Modification. 22 (4): 529–47. doi:10.1177/01454455980224005. PMID 9755650. S2CID 21542125.
{{cite journal}}
: zero width space character in|title=
at position 88 (help) - ↑ Droleskey RE, Andrews K, Chiarantini L, DeLoach JR (1992). "Use of fluorescent probes for describing the process of encapsulation by hypotonic dialysis". वाहक और बायोरिएक्टर के रूप में रीसील्ड एरिथ्रोसाइट्स का उपयोग. Advances in Experimental Medicine and Biology. Vol. 326. pp. 73–80. doi:10.1007/978-1-4615-3030-5_9. ISBN 978-1-4613-6321-7. PMID 1284187.
- ↑ Baer DM, Wolf MM. "The entry into natural communities of reinforcement". In Ulrich R, Stachnik T, Mabry J (eds.). मानव व्यवहार पर नियंत्रण. Vol. 2. Glenview, IL: Scott Foresman. pp. 319–24.
- ↑ Kohler FW, Greenwood CR (1986). "Toward a technology of generalization: The identification of natural contingencies of reinforcement". The Behavior Analyst. 9 (1): 19–26. doi:10.1007/bf03391926. PMC 2741872. PMID 22478644.
- ↑ Vollmer TR, Iwata BA (1992). "Differential reinforcement as treatment for behavior disorders: procedural and functional variations". Research in Developmental Disabilities. 13 (4): 393–417. doi:10.1016/0891-4222(92)90013-v. PMID 1509180.
- ↑ Derenne A, Flannery KA (2007). "सत्र के भीतर FR पॉज़िंग।". The Behavior Analyst Today. 8 (2): 175–86. doi:10.1037/h0100611.
- ↑ McSweeney FK, Murphy ES, Kowal BP (2001). "Dynamic changes in reinforcer value: Some misconceptions and why you should care". The Behavior Analyst Today. 2 (4): 341–349. doi:10.1037/h0099952.
- ↑ Iversen IH, Lattal KA (1991). व्यवहार का प्रायोगिक विश्लेषण. Amsterdam: Elsevier. ISBN 9781483291260.
- ↑ Martin TL, Yu CT, Martin GL, Fazzio D (2006). "पसंद, वरीयता और पसंद के लिए वरीयता पर।". The Behavior Analyst Today. 7 (2): 234–48. doi:10.1037/h0100083. PMC 3558524. PMID 23372459.
- ↑ Schacter DL, Gilbert DT, Wegner DM (2011). "Chapter 7: Learning". मनोविज्ञान (2nd ed.). New York: Worth Publishers. pp. 284–85. ISBN 978-1-4292-3719-2.
- ↑ Ghaemmaghami, Mahshid; Hanley, Gregory P.; Jessel, Joshua; Landa, Robin (2018-05-14). "जटिल कार्यात्मक संचार प्रतिक्रियाओं को आकार देना". Journal of Applied Behavior Analysis. 51 (3): 502–520. doi:10.1002/jaba.468. ISSN 0021-8855. PMID 29761485.
- ↑ Tarbox and Lanagan Bermudez, Jonathan and Taira (2017). आत्मकेंद्रित में खिला चुनौतियों का इलाज. San Diego: Academic Press. pp. 1–6. ISBN 978-0-12-813563-1.
- ↑ Turner, Virginia R; et al. (2020). "Response Shaping to Improve Food Acceptance for Children with Autism: Effects of Small and Large Food Sets". Research in Developmental Disabilities. 98: 103574. doi:10.1016/j.ridd.2020.103574. PMID 31982827. S2CID 210922007.
- ↑ ""चुनौतीपूर्ण व्यवहार के कई कार्यों का इलाज करने के लिए सुदृढीकरण के कार्यात्मक संचार प्रशिक्षण और जंजीर अनुसूचियों के आगे मूल्यांकन" के लिए शुद्धिपत्र". Behavior Modification. 46 (1): 254. 2020-07-24. doi:10.1177/0145445520945810. ISSN 0145-4455. PMID 32706269. S2CID 241136859.
- ↑ Falcomata, Terry S.; Roane, Henry S.; Muething, Colin S.; Stephenson, Kasey M.; Ing, Anna D. (2012-02-09). "क्रियात्मक संचार प्रशिक्षण और क्रियात्मक अवरोधों की समाप्ति द्वारा बनाए गए चुनौतीपूर्ण व्यवहार का इलाज करने के लिए सुदृढीकरण के जंजीर अनुसूचियां". Behavior Modification. 36 (5): 630–649. doi:10.1177/0145445511433821. ISSN 0145-4455. PMID 22327267. S2CID 29108702.
- ↑ 35.0 35.1 Luthans & Stajkovic (2009). प्रदर्शन में सुधार के लिए मान्यता प्रदान करें।. In Edwin A. Locke. Handbook of Principles of Organizational Behavior (2nd Edition).
- ↑ 36.0 36.1 Bettinghaus EP (1968). प्रेरक संचार. Holt, Rinehart and Winston, Inc.
- ↑ Skinner BF (1938). जीवों का व्यवहार। एक प्रायोगिक विश्लेषण. New York: Appleton-Century-Crofts. ISBN 9780996453905.
- ↑ Killeen PR (4 February 2010). "सुदृढीकरण के गणितीय सिद्धांत". Behavioral and Brain Sciences. 17 (1): 105–135. doi:10.1017/S0140525X00033628.
- ↑ Skinner BF (1982). Epstein R (ed.). Skinner for the classroom : selected papers. Champaign, Ill.: Research Press. ISBN 978-0-87822-261-2.
- ↑ Vaccarino FJ, Schiff BB, Glickman SE (1989). Mowrer RR, Klein SB (eds.). समकालीन सीखने के सिद्धांत. Hillsdale, N.J.: Lawrence Erlbaum Associates. ISBN 978-0-89859-915-2.
- ↑ Cowie S, Davison M, Elliffe D (July 2011). "Reinforcement: food signals the time and location of future food". Journal of the Experimental Analysis of Behavior. 96 (1): 63–86. doi:10.1901/jeab.2011.96-63. PMC 3136894. PMID 21765546.
- ↑ McCormack J, Arnold-Saritepe A, Elliffe D (June 2017). "ऑटिज़्म वाले बच्चों में अंतर परिणाम प्रभाव". Behavioral Interventions. 32 (4): 357–369. doi:10.1002/bin.1489.
- ↑ Michael J (2005). "Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things" (PDF). Journal of Organizational Behavior Management. 24 (1–2): 207–22. doi:10.1300/J075v24n01_15. S2CID 144466860. Archived from the original (PDF) on 9 June 2004.
- ↑ Iwata BA (1987). "Negative reinforcement in applied behavior analysis: an emerging technology". Journal of Applied Behavior Analysis. 20 (4): 361–78. doi:10.1901/jaba.1987.20-361. PMC 1286076. PMID 3323157.
- ↑ 45.0 45.1 45.2 45.3 Edwards S (2016). "Reinforcement principles for addiction medicine; from recreational drug use to psychiatric disorder". Neuroscience for Addiction Medicine: From Prevention to Rehabilitation - Constructs and Drugs. Progress in Brain Research. Vol. 223. pp. 63–76. doi:10.1016/bs.pbr.2015.07.005. ISBN 9780444635457. PMID 26806771.
Abused substances (ranging from alcohol to psychostimulants) are initially ingested at regular occasions according to their positive reinforcing properties. Importantly, repeated exposure to rewarding substances sets off a chain of secondary reinforcing events, whereby cues and contexts associated with drug use may themselves become reinforcing and thereby contribute to the continued use and possible abuse of the substance(s) of choice. ...
An important dimension of reinforcement highly relevant to the addiction process (and particularly relapse) is secondary reinforcement (Stewart, 1992). Secondary reinforcers (in many cases also considered conditioned reinforcers) likely drive the majority of reinforcement processes in humans. In the specific case of drug [addiction], cues and contexts that are intimately and repeatedly associated with drug use will often themselves become reinforcing ... A fundamental piece of Robinson and Berridge's incentive-sensitization theory of addiction posits that the incentive value or attractive nature of such secondary reinforcement processes, in addition to the primary reinforcers themselves, may persist and even become sensitized over time in league with the development of drug addiction (Robinson and Berridge, 1993). ...
Negative reinforcement is a special condition associated with a strengthening of behavioral responses that terminate some ongoing (presumably aversive) stimulus. In this case we can define a negative reinforcer as a motivational stimulus that strengthens such an "escape" response. Historically, in relation to drug addiction, this phenomenon has been consistently observed in humans whereby drugs of abuse are self-administered to quench a motivational need in the state of withdrawal (Wikler, 1952). - ↑ 46.0 46.1 46.2 Berridge KC (April 2012). "From prediction error to incentive salience: mesolimbic computation of reward motivation". The European Journal of Neuroscience. 35 (7): 1124–43. doi:10.1111/j.1460-9568.2012.07990.x. PMC 3325516. PMID 22487042.
When a Pavlovian CS+ is attributed with incentive salience it not only triggers 'wanting' for its UCS, but often the cue itself becomes highly attractive – even to an irrational degree. This cue attraction is another signature feature of incentive salience. The CS becomes hard not to look at (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). The CS even takes on some incentive properties similar to its UCS. An attractive CS often elicits behavioral motivated approach, and sometimes an individual may even attempt to 'consume' the CS somewhat as its UCS (e.g., eat, drink, smoke, have sex with, take as drug). 'Wanting' of a CS can turn also turn the formerly neutral stimulus into an instrumental conditioned reinforcer, so that an individual will work to obtain the cue (however, there exist alternative psychological mechanisms for conditioned reinforcement too).
- ↑ 47.0 47.1 47.2 Berridge KC, Kringelbach ML (May 2015). "मस्तिष्क में आनंद प्रणाली". Neuron. 86 (3): 646–64. doi:10.1016/j.neuron.2015.02.018. PMC 4425246. PMID 25950633.
An important goal in future for addiction neuroscience is to understand how intense motivation becomes narrowly focused on a particular target. Addiction has been suggested to be partly due to excessive incentive salience produced by sensitized or hyper-reactive dopamine systems that produce intense 'wanting' (Robinson and Berridge, 1993). But why one target becomes more 'wanted' than all others has not been fully explained. In addicts or agonist-stimulated patients, the repetition of dopamine-stimulation of incentive salience becomes attributed to particular individualized pursuits, such as taking the addictive drug or the particular compulsions. In Pavlovian reward situations, some cues for reward become more 'wanted' more than others as powerful motivational magnets, in ways that differ across individuals (Robinson et al., 2014b; Saunders and Robinson, 2013). ... However, hedonic effects might well change over time. As a drug was taken repeatedly, mesolimbic dopaminergic sensitization could consequently occur in susceptible individuals to amplify 'wanting' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), even if opioid hedonic mechanisms underwent down-regulation due to continual drug stimulation, producing 'liking' tolerance. Incentive-sensitization would produce addiction, by selectively magnifying cue-triggered 'wanting' to take the drug again, and so powerfully cause motivation even if the drug became less pleasant (Robinson and Berridge, 1993).
- ↑ McGreevy PD, Boakes RA (2007). Carrots and sticks: principles of animal training. Cambridge: Cambridge University Press. ISBN 978-0-521-68691-4.
- ↑ 49.0 49.1 Kazdin AE (2010). Problem-solving skills training and parent management training for oppositional defiant disorder and conduct disorder. Evidence-based psychotherapies for children and adolescents (2nd ed.), 211–226. New York: Guilford Press.
- ↑ Forgatch MS, Patterson GR (2010). Parent management training — Oregon model: An intervention for antisocial behavior in children and adolescents. Evidence-based psychotherapies for children and adolescents (2nd ed.), 159–78. New York: Guilford Press.
- ↑ Domjan, M. (2009). The Principles of Learning and Behavior. Wadsworth Publishing Company. 6th Edition. pages 244–249.
- ↑ Lozano Bleda JH, Pérez Nieto MA (November 2012). "Impulsivity, intelligence, and discriminating reinforcement contingencies in a fixed-ratio 3 schedule". The Spanish Journal of Psychology. 15 (3): 922–9. doi:10.5209/rev_sjop.2012.v15.n3.39384. PMID 23156902. S2CID 144193503.
- ↑ Luthans F, Stajkovic AD (1999). "Reinforce for performance: The need to go beyond pay and even rewards". Academy of Management Executive. 13 (2): 49–57. doi:10.5465/AME.1999.1899548.
- ↑ Kazdin, Alan (1978). History of behavior modification: Experimental foundations of contemporary research. Baltimore: University Park Press. ISBN 9780839112051.
- ↑ Baker GL, Barnes HJ (1992). "Superior vena cava syndrome: etiology, diagnosis, and treatment". American Journal of Critical Care. 1 (1): 54–64. doi:10.4037/ajcc1992.1.1.54. PMID 1307879.
- ↑ 56.0 56.1 Garland AF, Hawley KM, Brookman-Frazee L, Hurlburt MS (May 2008). "बच्चों की विघटनकारी व्यवहार समस्याओं के लिए साक्ष्य-आधारित मनोसामाजिक उपचार के सामान्य तत्वों की पहचान करना". Journal of the American Academy of Child and Adolescent Psychiatry. 47 (5): 505–14. doi:10.1097/CHI.0b013e31816765c2. PMID 18356768.
- ↑ Crowell CR, Anderson DC, Abel DM, Sergio JP (1988). "Task clarification, performance feedback, and social praise: Procedures for improving the customer service of bank tellers". Journal of Applied Behavior Analysis. 21 (1): 65–71. doi:10.1901/jaba.1988.21-65. PMC 1286094. PMID 16795713.
- ↑ Goldman NC (1992). "बाहरी श्रवण नहर के एडेनोइड सिस्टिक कार्सिनोमा". Otolaryngology–Head and Neck Surgery. 106 (2): 214–5. doi:10.1177/019459989210600211. PMID 1310808. S2CID 23782303.
- ↑ Brophy J (1981). "प्रभावी ढंग से प्रशंसा करने पर". The Elementary School Journal. 81 (5): 269–278. doi:10.1086/461229. JSTOR 1001606. S2CID 144444174.
- ↑ 60.0 60.1 Simonsen B, Fairbanks S, Briesch A, Myers D, Sugai G (2008). "Evidence-based Practices in Classroom Management: Considerations for Research to Practice". Education and Treatment of Children. 31 (1): 351–380. doi:10.1353/etc.0.0007. S2CID 145087451.
- ↑ Weisz JR, Kazdin AE (2010). बच्चों और किशोरों के लिए साक्ष्य-आधारित मनोचिकित्सा. Guilford Press. ISBN 9781606235256.
- ↑ 62.0 62.1 Braiker HB (2004). Who's Pulling Your Strings ? How to Break The Cycle of Manipulation. ISBN 0-07-144672-9.
- ↑ Dutton; Painter (1981). "Traumatic Bonding: The development of emotional attachments in battered women and other relationships of intermittent abuse". Victimology: An International Journal (7).
- ↑ Chrissie Sanderson. Counselling Survivors of Domestic Abuse. Jessica Kingsley Publishers; 15 June 2008. ISBN 978-1-84642-811-1. p. 84.
- ↑ "Traumatic Bonding | Encyclopedia.com".
- ↑ Hopson J (27 April 2001). "व्यवहारिक खेल डिजाइन". Gamasutra.
- ↑ Hood V (October 12, 2017). "Are loot boxes gambling?". Eurogamer. Retrieved October 12, 2017.
- ↑ Ashforth B (1994). "संगठनों में क्षुद्र अत्याचार". Human Relations. 47 (7): 755–778. doi:10.1177/001872679404700701. S2CID 145699243.
- ↑ Helge H, Sheehan MJ, Cooper CL, Einarsen S (2010). "Organisational Effects of Workplace Bullying". In Einarsen S, Hoel H, Zapf D, Cooper C (eds.). Bullying and Harassment in the Workplace: Developments in Theory, Research, and Practice (2nd ed.). Boca Raton, FL: CRC Press. ISBN 978-1-4398-0489-6.
अग्रिम पठन
- Brechner KC (1974). An experimental analysis of social traps (PhD thesis). Arizona State University.
- Brechner KC (1977). "An experimental analysis of social traps". Journal of Experimental Social Psychology. 13 (6): 552–64. doi:10.1016/0022-1031(77)90054-3.
- Brechner KC (1987). Social Traps, Individual Traps, and Theory in Social Psychology. Bulletin No. 870001. Pasadena, CA: Time River Laboratory.
- Brechner KC (28 February 2003). "Superimposed schedules applied to rent control.". In Levine DK, Pesendorfer W (eds.). Economic and Game Theory.
- Brechner KC, Linder DE (1981). "A social trap analysis of energy distribution systems". In Baum A, Singer JE (eds.). Advances in Environmental Psychology. Vol. 3. Hillsdale, NJ: Lawrence Erlbaum & Associates.
- Chance P (2003). Learning and Behavior (5th ed.). Toronto: Thomson-Wadsworth.
- Cowie S (2019). "Some weaknesses of a response-strength account of reinforcer effects". European Journal of Behavior Analysis. 21 (2): 1–16. doi:10.1080/15021149.2019.1685247. S2CID 210503231.
- Dinsmoor JA (November 2004). "The etymology of basic concepts in the experimental analysis of behavior". Journal of the Experimental Analysis of Behavior. 82 (3): 311–6. doi:10.1901/jeab.2004.82-311. PMC 1285013. PMID 15693525.
- Ferster CB, Skinner BF (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts. ISBN 0-13-792309-0.
- Lewin K (1935). A dynamic theory of personality: Selected papers. New York: McGraw-Hill. ISBN 9781447497134.
- Skinner BF (1938). The behavior of organisms. New York: Appleton-Century-Crofts. ISBN 9780996453905.
- Skinner BF (1956). "A case history in scientific method". American Psychologist. 11 (5): 221–33. doi:10.1037/h0047662.
- Zeiler MD (July 1968). "Fixed and variable schedules of response-independent reinforcement". Journal of the Experimental Analysis of Behavior. 11 (4): 405–14. doi:10.1901/jeab.1968.11-405. PMC 1338502. PMID 5672249.
- "Glossary of reinforcement terms". University of Iowa. Archived from the original on 13 April 2007.
- Harter JK, Shmidt FL, Keyes CL (2002). "Well-Being in the Workplace and its Relationship to Business Outcomes: A Review of the Gallup Studies.". In Keyes CL, Haidt J (eds.). Flourishing: The Positive Person and the Good Life. Washington D.C.: American Psychological Association. pp. 205–224.