वाणी धारणा: Difference between revisions
No edit summary |
|||
Line 3: | Line 3: | ||
[[भाषण]] धारणा (वाणी धारणा) वह प्रक्रिया है जिसके द्वारा [[भाषा]] की ध्वनियाँ सुनी, व्याख्या और समझी जाती हैं। भाषण धारणा का अध्ययन भाषाविज्ञान और संज्ञानात्मक [[मनोविज्ञान]] और मनोविज्ञान में धारणा में स्वर विज्ञान और ध्वन्यात्मकता के क्षेत्रों से निकटता से जुड़ा हुआ है। वाक् बोध में अनुसंधान यह समझने का प्रयास करता है कि मानव श्रोता वाक् ध्वनियों को कैसे पहचानते हैं और इस जानकारी का उपयोग बोली जाने वाली भाषा को समझने के लिए करते हैं। भाषण धारणा अनुसंधान में कंप्यूटर सिस्टम के निर्माण में अनुप्रयोग हैं जो भाषण को पहचान सकते हैं, श्रवण और भाषा-बाधित श्रोताओं के लिए स्पीच रिकग्निशन (वाक् पहचान) में सुधार करने और विदेशी भाषा शिक्षण में अनुप्रयोग है। | [[भाषण]] धारणा (वाणी धारणा) वह प्रक्रिया है जिसके द्वारा [[भाषा]] की ध्वनियाँ सुनी, व्याख्या और समझी जाती हैं। भाषण धारणा का अध्ययन भाषाविज्ञान और संज्ञानात्मक [[मनोविज्ञान]] और मनोविज्ञान में धारणा में स्वर विज्ञान और ध्वन्यात्मकता के क्षेत्रों से निकटता से जुड़ा हुआ है। वाक् बोध में अनुसंधान यह समझने का प्रयास करता है कि मानव श्रोता वाक् ध्वनियों को कैसे पहचानते हैं और इस जानकारी का उपयोग बोली जाने वाली भाषा को समझने के लिए करते हैं। भाषण धारणा अनुसंधान में कंप्यूटर सिस्टम के निर्माण में अनुप्रयोग हैं जो भाषण को पहचान सकते हैं, श्रवण और भाषा-बाधित श्रोताओं के लिए स्पीच रिकग्निशन (वाक् पहचान) में सुधार करने और विदेशी भाषा शिक्षण में अनुप्रयोग है। | ||
वाणी को समझने की प्रक्रिया ध्वनि संकेत के स्तर पर | वाणी को समझने की प्रक्रिया ध्वनि संकेत के स्तर पर प्रारम्भ होती है और श्रवण की प्रक्रिया। (ऑडिशन की प्रक्रिया के पूर्ण विवरण के लिए हियरिंग देखें।) प्रारंभिक श्रवण संकेत को संसाधित करने के बाद, ध्वनिक संकेतों और ध्वन्यात्मक जानकारी निकालने के लिए भाषण ध्वनियों को और संसाधित किया जाता है। यह भाषण जानकारी तब उच्च-स्तरीय भाषा प्रक्रियाओं, जैसे शब्द पहचान के लिए उपयोग की जा सकती है। | ||
== ध्वनिक संकेत == | == ध्वनिक संकेत == | ||
ध्वनिक संकेत वाक् ध्वनि संकेत में निहित संवेदी संकेत होते हैं जिनका उपयोग विभिन्न [[ध्वन्यात्मक]] श्रेणियों से संबंधित वाक् ध्वनियों को अलग करने के लिए वाक् धारणा में किया जाता है। उदाहरण के लिए, भाषण में सबसे अधिक अध्ययन किए गए संकेतों में से एक आवाज | ध्वनिक संकेत वाक् ध्वनि संकेत में निहित संवेदी संकेत होते हैं जिनका उपयोग विभिन्न [[ध्वन्यात्मक]] श्रेणियों से संबंधित वाक् ध्वनियों को अलग करने के लिए वाक् धारणा में किया जाता है। उदाहरण के लिए, भाषण में सबसे अधिक अध्ययन किए गए संकेतों में से एक आवाज प्रारम्भ समय या वीओटी है। वीओटी एक प्राथमिक संकेत है जो "b" और "p" जैसे आवाज वाले और आवाज रहित प्लोसिव्स के बीच अंतर को दर्शाता है। अन्य संकेत अलग-अलग ध्वनियों को अलग करते हैं जो अभिव्यक्ति के विभिन्न स्थानों या अभिव्यक्ति के शिष्टाचार में उत्पन्न होते हैं। भाषण प्रणाली को विशिष्ट भाषण ध्वनि की श्रेणी निर्धारित करने के लिए इन संकेतों को भी जोड़ना चाहिए। यह प्रायः स्वनिमों के अमूर्त निरूपण के संदर्भ में सोचा जाता है। इन अभ्यावेदनों को फिर शब्द पहचान और अन्य भाषा प्रक्रियाओं में उपयोग के लिए जोड़ा जा सकता है। | ||
[[File:Spectrograms of syllables dee dah doo.png|right|thumb|250px|चित्र 1: अक्षर डी (शीर्ष), दाह (मध्य), और डू (नीचे) के स्पेक्ट्रोग्राम दिखा रहे हैं कि किस तरह | [[File:Spectrograms of syllables dee dah doo.png|right|thumb|250px|चित्र 1: अक्षर डी (शीर्ष), दाह (मध्य), और डू (नीचे) के स्पेक्ट्रोग्राम दिखा रहे हैं कि किस तरह प्रारम्भ करने वाले संक्रमण जो अवधारणात्मक रूप से व्यंजन को परिभाषित करते हैं {{IPA|[d]}} निम्नलिखित स्वर की पहचान के आधार पर भिन्न हैं। ([[ फार्मेंट ]]्स को लाल बिंदीदार रेखाओं द्वारा हाइलाइट किया गया है; ट्रांज़िशन फॉर्मेंट ट्रैजेक्टोरियों की झुकने वाली प्रारम्भ है।)]]यह पहचानना आसान नहीं है कि कौन से ध्वनिक संकेत श्रोता किसी विशेष भाषण ध्वनि को समझते समय संवेदनशील होते हैं: | ||
''पहली नज़र में, हम भाषण को कैसे देखते हैं, इस समस्या का हल भ्रामक रूप से सरल लगता है। यदि कोई ध्वनिक तरंग के विस्तार की पहचान कर सकता है जो धारणा की इकाइयों के अनुरूप है, तो ध्वनि से अर्थ तक का रास्ता स्पष्ट होगा। हालाँकि, समस्या पर लगभग पैंतालीस वर्षों के शोध के बाद भी, इस पत्राचार या मानचित्रण को खोजना बेहद कठिन साबित हुआ है।<ref name="np">{{cite encyclopedia |author=Nygaard, L.C., Pisoni, D.B. |year=1995 |title=Speech Perception: New Directions in Research and Theory |editor1=J.L. Miller |editor2=P.D. Eimas |encyclopedia=Handbook of Perception and Cognition: Speech, Language, and Communication |location=San Diego |publisher=Academic Press}}</ref>'' | ''पहली नज़र में, हम भाषण को कैसे देखते हैं, इस समस्या का हल भ्रामक रूप से सरल लगता है। यदि कोई ध्वनिक तरंग के विस्तार की पहचान कर सकता है जो धारणा की इकाइयों के अनुरूप है, तो ध्वनि से अर्थ तक का रास्ता स्पष्ट होगा। हालाँकि, समस्या पर लगभग पैंतालीस वर्षों के शोध के बाद भी, इस पत्राचार या मानचित्रण को खोजना बेहद कठिन साबित हुआ है।<ref name="np">{{cite encyclopedia |author=Nygaard, L.C., Pisoni, D.B. |year=1995 |title=Speech Perception: New Directions in Research and Theory |editor1=J.L. Miller |editor2=P.D. Eimas |encyclopedia=Handbook of Perception and Cognition: Speech, Language, and Communication |location=San Diego |publisher=Academic Press}}</ref>'' | ||
यदि ध्वनिक तरंग के एक विशिष्ट पहलू ने | यदि ध्वनिक तरंग के एक विशिष्ट पहलू ने भाषाई इकाई का संकेत दिया है, तो भाषण सिंथेसाइज़र का उपयोग करने वाले परीक्षणों की एक श्रृंखला इस तरह के संकेत या संकेत को निर्धारित करने के लिए पर्याप्त होगी। हालाँकि, इसमें दो महत्वपूर्ण बाधाएँ हैं: | ||
# भाषण संकेत का एक ध्वनिक पहलू अलग-अलग भाषाई रूप से प्रासंगिक आयामों को इंगित कर सकता है। उदाहरण के लिए, अंग्रेजी में एक स्वर की अवधि इंगित कर सकती है कि स्वर पर जोर दिया गया है या नहीं, या क्या यह एक आवाज या ध्वनिहीन व्यंजन द्वारा बंद किए गए अक्षरों में है, और कुछ मामलों में (जैसे अमेरिकी अंग्रेजी {{IPA|/ɛ/}} और {{IPA|/æ/}}) यह स्वरों की पहचान में अंतर कर सकता है।<ref>{{cite journal |author=Klatt, D.H. |year=1976 |title=Linguistic uses of segmental duration in English: Acoustic and perceptual evidence |journal=Journal of the Acoustical Society of America |pmid=956516 |volume=59 |pages=1208–1221 |doi= 10.1121/1.380986 | issue=5|bibcode = 1976ASAJ...59.1208K }}</ref> कुछ विशेषज्ञों का यह भी तर्क है कि अंग्रेजी में पारंपरिक रूप से लघु और दीर्घ स्वर कहे जाने वाले स्वरों में अंतर करने में अवधि मदद कर सकती है।<ref>{{cite journal |author=Halle, M., Mohanan, K.P. |year=1985 |title=आधुनिक अंग्रेजी की खंडीय ध्वन्यात्मकता|journal=Linguistic Inquiry |volume=16 |pages=57–116 | issue=1}}</ref> | # भाषण संकेत का एक ध्वनिक पहलू अलग-अलग भाषाई रूप से प्रासंगिक आयामों को इंगित कर सकता है। उदाहरण के लिए, अंग्रेजी में एक स्वर की अवधि इंगित कर सकती है कि स्वर पर जोर दिया गया है या नहीं, या क्या यह एक आवाज या ध्वनिहीन व्यंजन द्वारा बंद किए गए अक्षरों में है, और कुछ मामलों में (जैसे अमेरिकी अंग्रेजी {{IPA|/ɛ/}} और {{IPA|/æ/}}) यह स्वरों की पहचान में अंतर कर सकता है।<ref>{{cite journal |author=Klatt, D.H. |year=1976 |title=Linguistic uses of segmental duration in English: Acoustic and perceptual evidence |journal=Journal of the Acoustical Society of America |pmid=956516 |volume=59 |pages=1208–1221 |doi= 10.1121/1.380986 | issue=5|bibcode = 1976ASAJ...59.1208K }}</ref> कुछ विशेषज्ञों का यह भी तर्क है कि अंग्रेजी में पारंपरिक रूप से लघु और दीर्घ स्वर कहे जाने वाले स्वरों में अंतर करने में अवधि मदद कर सकती है।<ref>{{cite journal |author=Halle, M., Mohanan, K.P. |year=1985 |title=आधुनिक अंग्रेजी की खंडीय ध्वन्यात्मकता|journal=Linguistic Inquiry |volume=16 |pages=57–116 | issue=1}}</ref> | ||
# | #भाषाई इकाई को कई ध्वनिक गुणों से जोड़ा जा सकता है। उदाहरण के लिए, चिरसम्मत प्रयोग में, [[एल्विन लिबरमैन]] (1957) ने दिखाया कि {{IPA|/d/}} के आरंभिक संक्रमण निम्नलिखित स्वरों के आधार पर भिन्न होते हैं (चित्र 1 देखें) लेकिन वे सभी श्रोताओं द्वारा फोनेमे {{IPA|/d/}} के रूप में व्याख्या किए जाते हैं।<ref>{{cite journal |author=Liberman, A.M. |year=1957 |title=भाषण धारणा पर शोध के कुछ परिणाम|journal=Journal of the Acoustical Society of America |volume=29 |pages=117–123 |url=http://www.haskins.yale.edu/Reprints/HL0016.pdf |access-date=2007-05-17 |doi=10.1121/1.1908635 | issue=1|bibcode = 1957ASAJ...29..117L |hdl=11858/00-001M-0000-002C-5789-A |hdl-access=free }}</ref> | ||
[[Category:All articles with dead external links]] | [[Category:All articles with dead external links]] | ||
Line 28: | Line 28: | ||
== रैखिकता और विभाजन की समस्या == | == रैखिकता और विभाजन की समस्या == | ||
{{Main|भाषण विभाजन}} | {{Main|भाषण विभाजन}} | ||
[[File:Spectrogram of I owe you.png|right|thumb|300px|चित्र 2: मुहावरे का एक स्पेक्ट्रोग्राम जिसका मैं आप पर एहसानमंद हूं। भाषण ध्वनियों के बीच कोई स्पष्ट रूप से अलग-अलग सीमाएँ नहीं हैं।]]हालांकि श्रोता भाषण को असतत इकाइयों (स्वर, शब्दांश और [[शब्द]]) की एक धारा के रूप में देखते हैं, भौतिक भाषण संकेत में इस रैखिकता को देखना मुश्किल है (उदाहरण के लिए चित्र 2 देखें)। वाक् ध्वनियाँ सख्ती से एक दूसरे का अनुसरण नहीं करती हैं, बल्कि, वे ओवरलैप करती हैं।<ref name="fow">{{cite encyclopedia |author=Fowler, C.A. |year=1995 |title=भाषण उत्पादन|editor1=J.L. Miller |editor2=P.D. Eimas |encyclopedia= Handbook of Perception and Cognition: Speech, Language, and Communication |location=San Diego |publisher=Academic Press}}</ref> | [[File:Spectrogram of I owe you.png|right|thumb|300px|चित्र 2: मुहावरे का एक स्पेक्ट्रोग्राम जिसका मैं आप पर एहसानमंद हूं। भाषण ध्वनियों के बीच कोई स्पष्ट रूप से अलग-अलग सीमाएँ नहीं हैं।]]हालांकि श्रोता भाषण को असतत इकाइयों (स्वर, शब्दांश और [[शब्द]]) की एक धारा के रूप में देखते हैं, भौतिक भाषण संकेत में इस रैखिकता को देखना मुश्किल है (उदाहरण के लिए चित्र 2 देखें)। वाक् ध्वनियाँ सख्ती से एक दूसरे का अनुसरण नहीं करती हैं, बल्कि, वे ओवरलैप करती हैं।<ref name="fow">{{cite encyclopedia |author=Fowler, C.A. |year=1995 |title=भाषण उत्पादन|editor1=J.L. Miller |editor2=P.D. Eimas |encyclopedia= Handbook of Perception and Cognition: Speech, Language, and Communication |location=San Diego |publisher=Academic Press}}</ref> भाषण ध्वनि उन लोगों से प्रभावित होती है जो पूर्ववर्ती हैं और जो अनुसरण करते हैं। यह प्रभाव दो या दो से अधिक खंडों (और शब्दांश और शब्द सीमाओं के पार) की दूरी पर भी लगाया जा सकता है।<ref name="fow"/> | ||
क्योंकि वाक् (भाषण) संकेत रैखिक नहीं है, इसलिए विभाजन की समस्या है। | क्योंकि वाक् (भाषण) संकेत रैखिक नहीं है, इसलिए विभाजन की समस्या है। एकल अवधारणात्मक इकाई से संबंधित भाषण संकेत के विस्तार को परिसीमित करना मुश्किल है। उदाहरण के रूप में, ध्वन्यात्मकता {{IPA|/d/}} के ध्वनिक गुण निम्नलिखित स्वर के उत्पादन पर निर्भर करेंगे ([[कॉर्टिक्यूलेशन]] के कारण)। | ||
== निश्चरता का अभाव == | == निश्चरता का अभाव == | ||
Line 36: | Line 36: | ||
=== संदर्भ-प्रेरित भिन्नता === | === संदर्भ-प्रेरित भिन्नता === | ||
ध्वन्यात्मक वातावरण वाक् ध्वनियों के ध्वनिक गुणों को प्रभावित करता है। उदाहरण के लिए, अंग्रेजी में {{IPA|/u/}} जब कोरोनल व्यंजन से घिरा होता है तो सामने होता है।<ref>{{cite journal |author=Hillenbrand, J.M., Clark, M.J., Nearey, T.M. |year=2001 |title=स्वर बनाने वाले पैटर्न पर व्यंजन वातावरण का प्रभाव|journal=Journal of the Acoustical Society of America |pmid=11248979 |volume=109 |pages=748–763 |doi=10.1121/1.1337959 | issue=2|bibcode = 2001ASAJ..109..748H |s2cid=10751216 |url=https://semanticscholar.org/paper/b646a60c2467d38efa46add8c343247097452c7c }}</ref> या, वाणी और ध्वनिरहित प्लोसिव्स के बीच की सीमा को चिह्नित करने वाली आवाज | ध्वन्यात्मक वातावरण वाक् ध्वनियों के ध्वनिक गुणों को प्रभावित करता है। उदाहरण के लिए, अंग्रेजी में {{IPA|/u/}} जब कोरोनल व्यंजन से घिरा होता है तो सामने होता है।<ref>{{cite journal |author=Hillenbrand, J.M., Clark, M.J., Nearey, T.M. |year=2001 |title=स्वर बनाने वाले पैटर्न पर व्यंजन वातावरण का प्रभाव|journal=Journal of the Acoustical Society of America |pmid=11248979 |volume=109 |pages=748–763 |doi=10.1121/1.1337959 | issue=2|bibcode = 2001ASAJ..109..748H |s2cid=10751216 |url=https://semanticscholar.org/paper/b646a60c2467d38efa46add8c343247097452c7c }}</ref> या, वाणी और ध्वनिरहित प्लोसिव्स के बीच की सीमा को चिह्नित करने वाली आवाज प्रारम्भ का समय प्रयोगशाला, वायुकोशीय और वेलार प्लोसिव्स के लिए अलग है और वे तनाव के तहत या एक शब्दांश के भीतर स्थिति के आधार पर बदलते हैं।<ref>{{cite journal |author=Lisker, L., Abramson, A.S. |year=1967 |title=अंग्रेजी प्लोसिव्स में आवाज की शुरुआत के समय पर संदर्भ के कुछ प्रभाव|journal=Language and Speech |volume=10 |pages=1–28 |url=http://www.haskins.yale.edu/Reprints/HL0067.pdf |access-date=2007-05-17 |pmid=6044530 |issue=1|doi=10.1177/002383096701000101 |s2cid=34616732 }}</ref> | ||
=== अलग-अलग भाषण स्थितियों के कारण भिन्नता === | === अलग-अलग भाषण स्थितियों के कारण भिन्नता === | ||
भिन्नता का कारण बनने वाला एक महत्वपूर्ण कारक अलग-अलग भाषण दर है। कई ध्वन्यात्मक विरोधाभास लौकिक विशेषताओं (लघु बनाम दीर्घ स्वर या व्यंजन, एफ़्रीकेट्स बनाम फ्रिकेटिव्स, प्लोसिव्स बनाम ग्लाइड्स, वॉयस बनाम वॉयसलेस प्लोसिव्स, आदि) द्वारा गठित होते हैं और वे निश्चित रूप से बोलने की गति में बदलाव से प्रभावित होते हैं।<ref name="np"/>भिन्नता का एक अन्य प्रमुख स्रोत कलात्मक सावधानी बनाम ढलान है जो जुड़े हुए भाषण के लिए विशिष्ट है (आर्टिक्यूलेटरी अंडरशूट स्पष्ट रूप से निर्मित ध्वनियों के ध्वनिक गुणों में परिलक्षित होता है)। | भिन्नता का कारण बनने वाला एक महत्वपूर्ण कारक अलग-अलग भाषण दर है। कई ध्वन्यात्मक विरोधाभास लौकिक विशेषताओं (लघु बनाम दीर्घ स्वर या व्यंजन, एफ़्रीकेट्स बनाम फ्रिकेटिव्स, प्लोसिव्स बनाम ग्लाइड्स, वॉयस बनाम वॉयसलेस प्लोसिव्स, आदि) द्वारा गठित होते हैं और वे निश्चित रूप से बोलने की गति में बदलाव से प्रभावित होते हैं।<ref name="np"/>भिन्नता का एक अन्य प्रमुख स्रोत कलात्मक सावधानी बनाम ढलान है जो जुड़े हुए भाषण के लिए विशिष्ट है (आर्टिक्यूलेटरी अंडरशूट स्पष्ट रूप से निर्मित ध्वनियों के ध्वनिक गुणों में परिलक्षित होता है)। | ||
=== विभिन्न वक्ता पहचान के कारण भिन्नता === | === विभिन्न वक्ता पहचान के कारण भिन्नता === | ||
ठोस भाषण निर्माण की परिणामी ध्वनिक संरचना व्यक्तिगत वक्ताओं के भौतिक और मनोवैज्ञानिक गुणों पर निर्भर करती है। पुरुष, महिलाएं और बच्चे | ठोस भाषण निर्माण की परिणामी ध्वनिक संरचना व्यक्तिगत वक्ताओं के भौतिक और मनोवैज्ञानिक गुणों पर निर्भर करती है। पुरुष, महिलाएं और बच्चे सामान्यतः अलग-अलग पिच वाली आवाजें निकालते हैं। क्योंकि वक्ताओं के पास विभिन्न आकारों के स्वर पथ होते हैं (विशेष रूप से लिंग और आयु के कारण) गुंजयमान आवृत्तियों (प्रारूप), जो भाषण ध्वनियों की पहचान के लिए महत्वपूर्ण हैं, व्यक्तियों में उनके पूर्ण मूल्यों में भिन्न होंगे<ref name="hill">{{cite journal |author=Hillenbrand, J., Getty, L.A., Clark, M.J., Wheeler, K. |year=1995 |title=अमेरिकी अंग्रेजी स्वरों की ध्वनिक विशेषताएं|journal=Journal of the Acoustical Society of America |volume=97 |pages=3099–3111 |doi=10.1121/1.411872 |pmid=7759650 |issue=5 Pt 1|bibcode = 1995ASAJ...97.3099H |s2cid=10104073 |url=https://semanticscholar.org/paper/2c4c22cc92c1eff3b174a1999019607308a05366 }}</ref> (इसके उदाहरण के लिए चित्र 3 देखें)। अनुसंधान से पता चलता है कि 7.5 महीने की उम्र के शिशु विभिन्न लिंगों के वक्ताओं द्वारा प्रस्तुत जानकारी को पहचान नहीं सकते हैं; हालांकि, 10.5 महीने की उम्र तक वे समानता का पता लगा सकते हैं।<ref>{{cite journal|last=Houston|first=Derek M.|author2=Juscyk, Peter W.|title=शिशुओं द्वारा शब्द विभाजन में वार्ताकार-विशिष्ट जानकारी की भूमिका|journal=Journal of Experimental Psychology: Human Perception and Performance|date=October 2000|volume=26|issue=5|pages=1570–1582|doi=10.1037/0096-1523.26.5.1570|pmid=11039485|url=http://babytalk.iupui.edu/pdfs/HoustonJusczyk_2000.pdf|access-date=1 March 2012|archive-url=https://web.archive.org/web/20140430034452/http://babytalk.iupui.edu/pdfs/HoustonJusczyk_2000.pdf|archive-date=2014-04-30|url-status=dead}}</ref> बोली और विदेशी लहज़े भी भिन्नता का कारण बन सकते हैं, जैसा कि वक्ता और श्रोता की सामाजिक विशेषताओं में हो सकता है।<ref>{{cite journal|last=Hay|first=Jennifer|author2=Drager, Katie |title=भरवां खिलौने और भाषण धारणा|journal=Linguistics|year=2010|volume=48|issue=4|pages=865–892|doi=10.1515/LING.2010.027|s2cid=143639653}}</ref> | ||
== अवधारणात्मक स्थिरता और सामान्यीकरण == | == अवधारणात्मक स्थिरता और सामान्यीकरण == | ||
[[File:Standard and normalized vowel space2.png|right|thumb|300px|चित्र 3: बायां पैनल 3 परिधीय अमेरिकी अंग्रेजी स्वर दिखाता है {{IPA|/i/}}, {{IPA|/ɑ/}}, और {{IPA|/u/}} मानक F1 में F2 प्लॉट द्वारा (हर्ट्ज में)। पुरुष, महिला और बाल मूल्यों के बीच बेमेल स्पष्ट है। 1986 में सिरदल और गोपाल द्वारा प्रस्तावित सामान्यीकरण प्रक्रिया का उपयोग करते हुए पूर्ण मूल्यों के बजाय सही पैनल फॉर्मेंट दूरी ([[ छाल का पैमाना ]] में) प्लॉट किए गए हैं।<ref name="sg">{{cite journal |author1=Syrdal, A.K.|author2= Gopal, H.S.|author-link1=Ann Syrdal |year=1986 |title=अमेरिकी अंग्रेजी स्वरों के श्रवण प्रतिनिधित्व के आधार पर स्वर पहचान का एक अवधारणात्मक मॉडल|journal=Journal of the Acoustical Society of America |volume=79 |pages=1086–1100 |doi=10.1121/1.393381 |pmid=3700864 |issue=4|bibcode = 1986ASAJ...79.1086S }}</ref> फॉर्मेंट वैल्यू हिलेनब्रांड एट अल से लिए गए हैं। (1995)<ref name="hill"/>]]विभिन्न वक्ताओं और विभिन्न स्थितियों की महान विविधता के बावजूद, श्रोता स्वर और व्यंजन को निरंतर श्रेणियों के रूप में देखते हैं। यह प्रस्तावित किया गया है कि यह अवधारणात्मक सामान्यीकरण प्रक्रिया के माध्यम से प्राप्त किया जाता है जिसमें श्रोता अंतर्निहित श्रेणी तक पहुंचने के लिए शोर (अर्थात भिन्नता) को फ़िल्टर करते हैं। स्वर-पथ-आकार के अंतर के परिणामस्वरूप वक्ताओं में फॉर्मेंट-आवृत्ति भिन्नता होती है; इसलिए एक श्रोता को अपनी अवधारणात्मक प्रणाली को किसी विशेष वक्ता की ध्वनिक विशेषताओं के अनुसार समायोजित करना पड़ता है। इसे उनके निरपेक्ष मूल्यों के बजाय फॉर्मेंट्स के अनुपात पर विचार करके पूरा किया जा सकता है।<ref name="sg"/><ref>{{cite encyclopedia |author=Strange, W. |year=1999 |title=Perception of vowels: Dynamic constancy |editor=J.M. Pickett |encyclopedia=The Acoustics of Speech Communication: Fundamentals, Speech Perception Theory, and Technology |location=Needham Heights (MA) |publisher=Allyn & Bacon}}</ref><ref name="john">{{cite encyclopedia |author=Johnson, K. |year=2005 |title=भाषण धारणा में अध्यक्ष सामान्यीकरण|editor=Pisoni, D.B. |editor2=Remez, R. |encyclopedia=The Handbook of Speech Perception |location=Oxford |publisher=Blackwell Publishers |url= http://corpus.linguistics.berkeley.edu/~kjohnson/papers/revised_chapter.pdf |access-date=2007-05-17}}</ref> इस प्रक्रिया को वोकल ट्रैक्ट नॉर्मलाइजेशन (उदाहरण के लिए चित्र 3 देखें) कहा गया है। इसी तरह, माना जाता है कि श्रोता अवधि की धारणा को उस भाषण की वर्तमान गति से समायोजित करते हैं जिसे वे सुन रहे हैं - इसे भाषण दर सामान्यीकरण के रूप में जाना जाता है। | [[File:Standard and normalized vowel space2.png|right|thumb|300px|चित्र 3: बायां पैनल 3 परिधीय अमेरिकी अंग्रेजी स्वर दिखाता है {{IPA|/i/}}, {{IPA|/ɑ/}}, और {{IPA|/u/}} मानक F1 में F2 प्लॉट द्वारा (हर्ट्ज में)। पुरुष, महिला और बाल मूल्यों के बीच बेमेल स्पष्ट है। 1986 में सिरदल और गोपाल द्वारा प्रस्तावित सामान्यीकरण प्रक्रिया का उपयोग करते हुए पूर्ण मूल्यों के बजाय सही पैनल फॉर्मेंट दूरी ([[ छाल का पैमाना ]] में) प्लॉट किए गए हैं।<ref name="sg">{{cite journal |author1=Syrdal, A.K.|author2= Gopal, H.S.|author-link1=Ann Syrdal |year=1986 |title=अमेरिकी अंग्रेजी स्वरों के श्रवण प्रतिनिधित्व के आधार पर स्वर पहचान का एक अवधारणात्मक मॉडल|journal=Journal of the Acoustical Society of America |volume=79 |pages=1086–1100 |doi=10.1121/1.393381 |pmid=3700864 |issue=4|bibcode = 1986ASAJ...79.1086S }}</ref> फॉर्मेंट वैल्यू हिलेनब्रांड एट अल से लिए गए हैं। (1995)<ref name="hill"/>]]विभिन्न वक्ताओं और विभिन्न स्थितियों की महान विविधता के बावजूद, श्रोता स्वर और व्यंजन को निरंतर श्रेणियों के रूप में देखते हैं। यह प्रस्तावित किया गया है कि यह अवधारणात्मक सामान्यीकरण प्रक्रिया के माध्यम से प्राप्त किया जाता है जिसमें श्रोता अंतर्निहित श्रेणी तक पहुंचने के लिए शोर (अर्थात भिन्नता) को फ़िल्टर करते हैं। स्वर-पथ-आकार के अंतर के परिणामस्वरूप वक्ताओं में फॉर्मेंट-आवृत्ति भिन्नता होती है; इसलिए एक श्रोता को अपनी अवधारणात्मक प्रणाली को किसी विशेष वक्ता की ध्वनिक विशेषताओं के अनुसार समायोजित करना पड़ता है। इसे उनके निरपेक्ष मूल्यों के बजाय फॉर्मेंट्स के अनुपात पर विचार करके पूरा किया जा सकता है।<ref name="sg"/><ref>{{cite encyclopedia |author=Strange, W. |year=1999 |title=Perception of vowels: Dynamic constancy |editor=J.M. Pickett |encyclopedia=The Acoustics of Speech Communication: Fundamentals, Speech Perception Theory, and Technology |location=Needham Heights (MA) |publisher=Allyn & Bacon}}</ref><ref name="john">{{cite encyclopedia |author=Johnson, K. |year=2005 |title=भाषण धारणा में अध्यक्ष सामान्यीकरण|editor=Pisoni, D.B. |editor2=Remez, R. |encyclopedia=The Handbook of Speech Perception |location=Oxford |publisher=Blackwell Publishers |url= http://corpus.linguistics.berkeley.edu/~kjohnson/papers/revised_chapter.pdf |access-date=2007-05-17}}</ref> इस प्रक्रिया को वोकल ट्रैक्ट नॉर्मलाइजेशन (उदाहरण के लिए चित्र 3 देखें) कहा गया है। इसी तरह, माना जाता है कि श्रोता अवधि की धारणा को उस भाषण की वर्तमान गति से समायोजित करते हैं जिसे वे सुन रहे हैं - इसे भाषण दर सामान्यीकरण के रूप में जाना जाता है। | ||
Line 49: | Line 49: | ||
== स्पष्ट धारणा == | == स्पष्ट धारणा == | ||
{{Main|श्रेणीबद्ध धारणा}} | {{Main|श्रेणीबद्ध धारणा}} | ||
[[File:Categorization-and-discrimination-curves.png|right|thumb|300px|चित्रा 4: उदाहरण पहचान (लाल) और भेदभाव (नीला) कार्य]]अवधारणात्मक विभेदीकरण की प्रक्रियाओं में श्रेणीबद्ध धारणा | [[File:Categorization-and-discrimination-curves.png|right|thumb|300px|चित्रा 4: उदाहरण पहचान (लाल) और भेदभाव (नीला) कार्य]]अवधारणात्मक विभेदीकरण की प्रक्रियाओं में श्रेणीबद्ध धारणा सम्मिलित है। लोग भाषण ध्वनियों को स्पष्ट रूप से समझते हैं, कहने का मतलब यह है कि वे श्रेणियों के भीतर की तुलना में श्रेणियों (फोनीम्स) के बीच के अंतर को नोटिस करने की अधिक संभावना रखते हैं। श्रेणियों के बीच अवधारणात्मक स्थान इसलिए विकृत हो गया है, आने वाली भाषण ध्वनियों के लिए श्रेणियों के केंद्र (या "प्रोटोटाइप") एक चलनी<ref>{{cite book |last=Trubetzkoy |first=Nikolay S. |author-link=Nikolai Trubetzkoy |title=ध्वन्यात्मकता के सिद्धांत|publisher=University of California Press |location=Berkeley and Los Angeles |year=1969 |isbn=978-0-520-01535-7 |url-access=registration |url=https://archive.org/details/principlesofphon00trub }}</ref> या चुंबक<ref>{{cite journal |author=Iverson, P., Kuhl, P.K. |year=1995 |title=सिग्नल डिटेक्शन सिद्धांत और बहुआयामी स्केलिंग का उपयोग करके भाषण के लिए अवधारणात्मक चुंबक प्रभाव का मानचित्रण करना|journal=Journal of the Acoustical Society of America |pmid=7860832 |volume=97 |pages=553–562 |doi=10.1121/1.412280 | issue=1|bibcode = 1995ASAJ...97..553I }}</ref> की तरह काम कर रहे हैं। | ||
मूक और एक आवाज वाले [[द्विभाषी प्लोसिव]] के बीच एक कृत्रिम सातत्य में, प्रत्येक नया कदम वोट की मात्रा में पिछले एक से अलग होता है। पहली ध्वनि एक पूर्व-आवाज [बी] है, अर्थात इसमें नकारात्मक वीओटी है। फिर, वीओटी को बढ़ाते हुए, यह शून्य तक पहुँच जाता है, अर्थात प्लोसिव एक सादा अप्रेरित ध्वनिहीन {{IPA|[p]}} है। धीरे-धीरे, एक समय में समान मात्रा में वीओटी जोड़ने पर, अंत में प्लोसिव एक जोरदार आकांक्षा रहित ध्वनिहीन द्विभाषी {{IPA|[pʰ]}} बन जाता है। (1970 में लिस्कर और अब्रामसन द्वारा एक प्रयोग में इस तरह की निरंतरता का उपयोग किया गया था।<ref name=la/> उनके द्वारा उपयोग की जाने वाली ध्वनियाँ ऑनलाइन उपलब्ध हैं।) इस निरंतरता में, उदाहरण के लिए, सात ध्वनियाँ, मूल अंग्रेजी श्रोता पहली तीन ध्वनियों को /b/ और अंतिम तीन ध्वनियों को /p/ के रूप में दो श्रेणियों के बीच स्पष्ट सीमा के साथ पहचानेंगे।<ref name=la>{{cite conference |author=Lisker, L., Abramson, A.S. |year=1970 |title=The voicing dimension: Some experiments in comparative phonetics |book-title=Proc. 6th International Congress of Phonetic Sciences |pages=563–567 |location=Prague |publisher=Academia |url=http://www.haskins.yale.edu/Reprints/HL0087.pdf |access-date=2007-05-17}}</ref> एक दो-वैकल्पिक पहचान (या वर्गीकरण) परीक्षण से एक असंतत वर्गीकरण फलन प्राप्त होगा (चित्र 4 में लाल वक्र देखें)। | मूक और एक आवाज वाले [[द्विभाषी प्लोसिव]] के बीच एक कृत्रिम सातत्य में, प्रत्येक नया कदम वोट की मात्रा में पिछले एक से अलग होता है। पहली ध्वनि एक पूर्व-आवाज [बी] है, अर्थात इसमें नकारात्मक वीओटी है। फिर, वीओटी को बढ़ाते हुए, यह शून्य तक पहुँच जाता है, अर्थात प्लोसिव एक सादा अप्रेरित ध्वनिहीन {{IPA|[p]}} है। धीरे-धीरे, एक समय में समान मात्रा में वीओटी जोड़ने पर, अंत में प्लोसिव एक जोरदार आकांक्षा रहित ध्वनिहीन द्विभाषी {{IPA|[pʰ]}} बन जाता है। (1970 में लिस्कर और अब्रामसन द्वारा एक प्रयोग में इस तरह की निरंतरता का उपयोग किया गया था।<ref name=la/> उनके द्वारा उपयोग की जाने वाली ध्वनियाँ ऑनलाइन उपलब्ध हैं।) इस निरंतरता में, उदाहरण के लिए, सात ध्वनियाँ, मूल अंग्रेजी श्रोता पहली तीन ध्वनियों को /b/ और अंतिम तीन ध्वनियों को /p/ के रूप में दो श्रेणियों के बीच स्पष्ट सीमा के साथ पहचानेंगे।<ref name=la>{{cite conference |author=Lisker, L., Abramson, A.S. |year=1970 |title=The voicing dimension: Some experiments in comparative phonetics |book-title=Proc. 6th International Congress of Phonetic Sciences |pages=563–567 |location=Prague |publisher=Academia |url=http://www.haskins.yale.edu/Reprints/HL0087.pdf |access-date=2007-05-17}}</ref> एक दो-वैकल्पिक पहचान (या वर्गीकरण) परीक्षण से एक असंतत वर्गीकरण फलन प्राप्त होगा (चित्र 4 में लाल वक्र देखें)। | ||
Line 60: | Line 60: | ||
== टॉप-डाउन प्रभाव == | == टॉप-डाउन प्रभाव == | ||
उत्कृष्ट प्रयोग में, रिचर्ड एम. वॉरेन (1970) ने शब्द की स्वर ध्वनि को कफ ध्वनि से बदल दिया। अवधारणात्मक रूप से, उनके विषयों ने बिना किसी कठिनाई के लापता भाषण ध्वनि को बहाल कर दिया और सटीक रूप से यह पहचान नहीं कर सके कि कौन से फोनेम को परेशान किया गया था,<ref>{{cite journal |author=Warren, R.M. |year=1970 |title=लापता भाषण ध्वनियों की बहाली|journal=Science |volume=167 |pages= 392–393 |doi=10.1126/science.167.3917.392 |pmid=5409744 |issue=3917|bibcode = 1970Sci...167..392W |s2cid=30356740 }}</ref> एक घटना जिसे फोनेमिक बहाली प्रभाव के रूप में जाना जाता है। इसलिए, वाक् बोध की प्रक्रिया अनिवार्य रूप से एकदिशात्मक नहीं है। | |||
एक अन्य बुनियादी प्रयोग ने वाक्यांश के भीतर स्वाभाविक रूप से बोले जाने वाले शब्दों की पहचान की तुलना अलगाव में समान शब्दों से की, यह पता लगाना कि धारणा सटीकता | एक अन्य बुनियादी प्रयोग ने वाक्यांश के भीतर स्वाभाविक रूप से बोले जाने वाले शब्दों की पहचान की तुलना अलगाव में समान शब्दों से की, यह पता लगाना कि धारणा सटीकता सामान्यतः बाद की स्थिति में गिर जाती है। धारणा पर सिमेंटिक ज्ञान के प्रभाव की जांच करने के लिए, गार्नेस एंड बॉन्ड (1976) ने इसी तरह के वाहक वाक्यों का उपयोग किया, जहां लक्ष्य शब्द केवल एक फोनेम (बे / डे / गे, उदाहरण के लिए) में भिन्न थे, जिनकी गुणवत्ता निरंतरता के साथ बदल गई थी। जब अलग-अलग वाक्यों में डाल दिया जाता है कि प्रत्येक स्वाभाविक रूप से एक व्याख्या का कारण बनता है, तो श्रोता पूरे वाक्य के अर्थ के अनुसार अस्पष्ट शब्दों का न्याय करते हैं <ref>{{cite conference |author=Garnes, S., Bond, Z.S. |year=1976 |title=ध्वनिक सूचना और सिमेंटिक अपेक्षा के बीच संबंध|book-title= Phonologica 1976 |location=Innsbruck |pages=285–293}}</ref><ref>{{cite journal |vauthors=Jongman A, Wang Y, Kim BH |title=नॉनसिबिलेंट फ्रिकेटिव्स की धारणा के लिए शब्दार्थ और चेहरे की जानकारी का योगदान|journal=J. Speech Lang. Hear. Res. |volume=46 |issue=6 |pages=1367–77 |date=December 2003 |pmid=14700361 |doi=10.1044/1092-4388(2003/106) |url=https://www.sfu.ca/~yuew/documents/jongman%20wang%20kim%20JSLHR%20proof.pdf |access-date=2017-09-14 |archive-url=https://web.archive.org/web/20130614064103/http://www.sfu.ca/~yuew/documents/jongman%20wang%20kim%20JSLHR%20proof.pdf |archive-date=2013-06-14 |url-status=dead |hdl=1808/13411 |hdl-access=free }}</ref>। अर्थात्, [[आकृति विज्ञान (भाषा विज्ञान)|आकृति विज्ञान]], वाक्य रचना, या शब्दार्थ से जुड़ी उच्च-स्तरीय भाषा प्रक्रियाएँ वाक् ध्वनियों की पहचान में सहायता के लिए मूल वाक् बोध प्रक्रियाओं के साथ परस्पर क्रिया कर सकती हैं। | ||
यह मामला हो सकता है कि यह जरूरी नहीं है और यहां तक कि श्रोता के लिए उच्च इकाइयों को पहचानने से पहले स्वरों को पहचानना भी संभव नहीं है, जैसे कि उदाहरण के लिए शब्द। ध्वनिक संकेत से कथित इकाई की ध्वन्यात्मक संरचना के बारे में कम से कम एक मूलभूत जानकारी प्राप्त करने के बाद, श्रोता बोली जाने वाली भाषा के अपने ज्ञान का उपयोग करके लापता या शोर-मुखौटे वाले स्वरों की भरपाई कर सकते हैं। प्रतिपूरक तंत्र वाक्य स्तर पर भी काम कर सकता है जैसे कि सीखे गए गीतों, वाक्यांशों और छंदों में, एक प्रभाव जो न्यूरल कोडिंग पैटर्न द्वारा समर्थित होता है, जो मिस्ड निरंतर भाषण अंशों के अनुरूप होता है,<ref name="CervantesConstantino_&_Simon_2018">{{cite journal|last2=Simon|first2=JZ|year=2018|title=निरंतर भाषण के तंत्रिका प्रसंस्करण की बहाली और दक्षता को पूर्व ज्ञान द्वारा बढ़ावा दिया जाता है|journal=Frontiers in Systems Neuroscience|volume=12|issue=56|pages=56|doi=10.3389/fnsys.2018.00056 |pmid=30429778|pmc=6220042|last1=Cervantes Constantino|first1=F|doi-access=free}}</ref> सभी प्रासंगिक नीचे-ऊपर संवेदी इनपुट की कमी के अलावा है। | यह मामला हो सकता है कि यह जरूरी नहीं है और यहां तक कि श्रोता के लिए उच्च इकाइयों को पहचानने से पहले स्वरों को पहचानना भी संभव नहीं है, जैसे कि उदाहरण के लिए शब्द। ध्वनिक संकेत से कथित इकाई की ध्वन्यात्मक संरचना के बारे में कम से कम एक मूलभूत जानकारी प्राप्त करने के बाद, श्रोता बोली जाने वाली भाषा के अपने ज्ञान का उपयोग करके लापता या शोर-मुखौटे वाले स्वरों की भरपाई कर सकते हैं। प्रतिपूरक तंत्र वाक्य स्तर पर भी काम कर सकता है जैसे कि सीखे गए गीतों, वाक्यांशों और छंदों में, एक प्रभाव जो न्यूरल कोडिंग पैटर्न द्वारा समर्थित होता है, जो मिस्ड निरंतर भाषण अंशों के अनुरूप होता है,<ref name="CervantesConstantino_&_Simon_2018">{{cite journal|last2=Simon|first2=JZ|year=2018|title=निरंतर भाषण के तंत्रिका प्रसंस्करण की बहाली और दक्षता को पूर्व ज्ञान द्वारा बढ़ावा दिया जाता है|journal=Frontiers in Systems Neuroscience|volume=12|issue=56|pages=56|doi=10.3389/fnsys.2018.00056 |pmid=30429778|pmc=6220042|last1=Cervantes Constantino|first1=F|doi-access=free}}</ref> सभी प्रासंगिक नीचे-ऊपर संवेदी इनपुट की कमी के अलावा है। | ||
Line 68: | Line 68: | ||
== अधिग्रहीत भाषा हानि == | == अधिग्रहीत भाषा हानि == | ||
वाक् बोध की पहली परिकल्पना का उपयोग उन रोगियों के साथ किया गया था जिन्होंने श्रवण बोध की कमी प्राप्त की थी, जिसे [[ग्रहणशील वाचाघात]] के रूप में भी जाना जाता है। तब से कई अक्षमताओं को वर्गीकृत किया गया है, जिसके परिणामस्वरूप भाषण धारणा की सही परिभाषा हुई।<ref name="Poeppel, Monahan, 2008">{{cite journal|last1=Poeppel |first1=David|last2=Monahan |first2=Philip J.|title=Speech Perception: Cognitive Foundations and Cortical Implementation |journal=Current Directions in Psychological Science |volume=17 |issue=2 |year=2008 |pages=80–85 |issn=0963-7214 |doi=10.1111/j.1467-8721.2008.00553.x|s2cid=18628411|url=https://semanticscholar.org/paper/b01a96f24b7bee2b30c3e83daeabcaaa3ed6decb}}</ref> शब्द 'भाषण धारणा' रुचि की प्रक्रिया का वर्णन करता है जो जांच प्रक्रिया के उप शाब्दिक संदर्भों को नियोजित करता है। इसमें कई अलग-अलग भाषा और व्याकरण संबंधी कार्य | वाक् बोध की पहली परिकल्पना का उपयोग उन रोगियों के साथ किया गया था जिन्होंने श्रवण बोध की कमी प्राप्त की थी, जिसे [[ग्रहणशील वाचाघात]] के रूप में भी जाना जाता है। तब से कई अक्षमताओं को वर्गीकृत किया गया है, जिसके परिणामस्वरूप भाषण धारणा की सही परिभाषा हुई।<ref name="Poeppel, Monahan, 2008">{{cite journal|last1=Poeppel |first1=David|last2=Monahan |first2=Philip J.|title=Speech Perception: Cognitive Foundations and Cortical Implementation |journal=Current Directions in Psychological Science |volume=17 |issue=2 |year=2008 |pages=80–85 |issn=0963-7214 |doi=10.1111/j.1467-8721.2008.00553.x|s2cid=18628411|url=https://semanticscholar.org/paper/b01a96f24b7bee2b30c3e83daeabcaaa3ed6decb}}</ref> शब्द 'भाषण धारणा' रुचि की प्रक्रिया का वर्णन करता है जो जांच प्रक्रिया के उप शाब्दिक संदर्भों को नियोजित करता है। इसमें कई अलग-अलग भाषा और व्याकरण संबंधी कार्य सम्मिलित हैं, जैसे: विशेषताएं, खंड (स्वर), शब्दांश संरचना (उच्चारण की इकाई), ध्वन्यात्मक शब्द रूप (कैसे ध्वनियों को एक साथ समूहीकृत किया जाता है), व्याकरण संबंधी विशेषताएं, रूपात्मक (उपसर्ग और प्रत्यय), और अर्थपूर्ण जानकारी (शब्दों का अर्थ)। प्रारंभिक वर्षों में, वे भाषण के ध्वनिकी में अधिक रुचि रखते थे। उदाहरण के लिए, वे / बीए / या / डीए / के बीच के अंतरों को देख रहे थे, लेकिन अब शोध उत्तेजनाओं से मस्तिष्क में प्रतिक्रिया के लिए निर्देशित किया गया है। हाल के वर्षों में, भाषण धारणा कैसे काम करती है, इसकी भावना पैदा करने के लिए एक मॉडल विकसित किया गया है; इस मॉडल को डुअल स्ट्रीम मॉडल के रूप में जाना जाता है। मनोवैज्ञानिक धारणा को कैसे देखते हैं, यह मॉडल काफी हद तक बदल गया है। द्विधारा मॉडल का पहला भाग उदर मार्ग है। इस मार्ग में मध्य टेम्पोरल गाइरस, अवर टेम्पोरल सल्कस और शायद [[अवर टेम्पोरल गाइरस]] सम्मिलित हैं। वेंट्रल पाथवे लेक्सिकल या वैचारिक अभ्यावेदन के ध्वन्यात्मक प्रतिनिधित्व को दर्शाता है, जो शब्दों का अर्थ है। दोहरी धारा मॉडल का दूसरा खंड पृष्ठीय मार्ग है। इस मार्ग में सिल्वियन पारिएटोटेम्पोरल, अवर ललाट गाइरस, पूर्वकाल इंसुला और प्रीमोटर कॉर्टेक्स सम्मिलित हैं। इसका प्राथमिक कार्य संवेदी या ध्वन्यात्मक उत्तेजनाओं को लेना और इसे एक कलात्मक-मोटर प्रतिनिधित्व (भाषण का निर्माण) में स्थानांतरित करना है।<ref>{{cite journal |vauthors=Hickok G, Poeppel D |title=भाषण प्रसंस्करण का कॉर्टिकल संगठन|journal=Nat. Rev. Neurosci. |volume=8 |issue=5 |pages=393–402 |date=May 2007 |pmid=17431404 |doi=10.1038/nrn2113 |s2cid=6199399 }}</ref> | ||
=== भाषाघात === | === भाषाघात === | ||
वाचाघात मस्तिष्क को नुकसान के कारण [[मस्तिष्क में भाषा प्रसंस्करण]] की हानि है। क्षतिग्रस्त मस्तिष्क के क्षेत्र के आधार पर भाषा प्रसंस्करण के विभिन्न हिस्सों पर प्रभाव पड़ता है, और वाचाघात को चोट के स्थान या लक्षणों के नक्षत्र के आधार पर आगे वर्गीकृत किया जाता है। ब्रोका के मस्तिष्क के क्षेत्र को नुकसान | वाचाघात मस्तिष्क को नुकसान के कारण [[मस्तिष्क में भाषा प्रसंस्करण]] की हानि है। क्षतिग्रस्त मस्तिष्क के क्षेत्र के आधार पर भाषा प्रसंस्करण के विभिन्न हिस्सों पर प्रभाव पड़ता है, और वाचाघात को चोट के स्थान या लक्षणों के नक्षत्र के आधार पर आगे वर्गीकृत किया जाता है। ब्रोका के मस्तिष्क के क्षेत्र को नुकसान प्रायः [[अभिव्यंजक वाचाघात]] का परिणाम होता है जो भाषण उत्पादन में हानि के रूप में प्रकट होता है। वर्निक के क्षेत्र को नुकसान प्रायः ग्रहणशील वाचाघात का परिणाम होता है जहां भाषण प्रसंस्करण बिगड़ा हुआ है।<ref name="hd">{{cite journal|last=Hessler|first=Dorte|author2=Jonkers, Bastiaanse |title=वाक्पटु वाक् बोध पर ध्वन्यात्मक आयामों का प्रभाव|journal=Clinical Linguistics and Phonetics|date=December 2010|volume=24|issue=12|series=12|pages=980–996|doi=10.3109/02699206.2010.507297|pmid=20887215|s2cid=26478503|url=https://semanticscholar.org/paper/cc26c5d02981e2fd6bef3a56a1721875f5646e2b}}</ref> बिगड़ा हुआ वाक् बोध के साथ वाचाघात सामान्यतः बाएं [[टेम्पोरल लोब]] या पार्श्विका लोब में स्थित घावों या क्षति को दर्शाता है। लेक्सिकल और सिमेंटिक कठिनाइयाँ साधारण हैं, और समझ प्रभावित हो सकती है।<ref name="hd"/> | ||
=== [[ संवेदनलोप |संवेदनलोप]] === | === [[ संवेदनलोप |संवेदनलोप]] === | ||
एग्नोसिया " | एग्नोसिया "सामान्यतः मस्तिष्क क्षति के परिणामस्वरूप परिचित वस्तुओं या उत्तेजनाओं को पहचानने की क्षमता का नुकसान या कमी है"।<ref>{{Cite web|url=https://www.merriam-webster.com/dictionary/agnosia|title=एग्नोसिया की परिभाषा|website=www.merriam-webster.com|language=en|access-date=2017-12-15}}</ref> कई अलग-अलग प्रकार के एग्नोसिया हैं जो हमारी हर एक इंद्रियों को प्रभावित करते हैं, लेकिन दो सबसे अधिक भाषण से संबंधित हैं, स्पीच एग्नोसिया और फोन एग्नोसिया हैं। | ||
स्पीच एग्नोसिया: शुद्ध शब्द बहरापन, या स्पीच एग्नोसिया, एक विकार है जिसमें | स्पीच एग्नोसिया: शुद्ध शब्द बहरापन, या स्पीच एग्नोसिया, एक विकार है जिसमें व्यक्ति सुनने, भाषण देने और यहां तक कि भाषण पढ़ने की क्षमता बनाए रखता है, फिर भी वे भाषण को समझने या ठीक से समझने में असमर्थ होते हैं। ऐसा लगता है कि इन रोगियों में भाषण को ठीक से संसाधित करने के लिए आवश्यक सभी कौशल हैं, फिर भी ऐसा प्रतीत होता है कि उनके पास भाषण उत्तेजनाओं से संबंधित कोई अनुभव नहीं है। मरीजों ने बताया है, "मैं आपको बात करते सुन सकता हूं, लेकिन मैं इसका अनुवाद नहीं कर सकता"।<ref>{{Cite web|url=http://www.tulane.edu/~h0Ward/BrLg/index.html|title=मस्तिष्क और भाषा में आपका स्वागत है|last=Howard|first=Harry|date=2017|website=मस्तिष्क और भाषा में आपका स्वागत है}}</ref> भले ही वे भाषण के अर्थ को निर्धारित करने की क्षमता के बिना भाषण की उत्तेजनाओं को शारीरिक रूप से प्राप्त और संसाधित कर रहे हों, वे अनिवार्य रूप से भाषण को बिल्कुल भी समझने में असमर्थ हैं। ऐसा कोई ज्ञात उपचार नहीं है जो पाया गया है, लेकिन मामले के अध्ययन और प्रयोगों से यह ज्ञात है कि वाक् एग्नोसिया बाएं गोलार्द्ध या दोनों में घावों से संबंधित है, विशेष रूप से सही अस्थाई दुष्क्रिया है।<ref>{{Cite journal|last=Lambert|first=J.|date=1999|title=भाषण धारणा के सापेक्ष बख्शते के साथ श्रवण एग्नोसिया|journal=Neurocase|volume=5|issue=5|pages=71–82|doi=10.1093/neucas/5.5.394|pmid=2707006}}</ref> | ||
फोनैग्नोसिया: फोनैग्नोसिया किसी भी परिचित आवाज को पहचानने में असमर्थता से जुड़ा हुआ है। इन मामलों में, भाषण उत्तेजनाओं को सुना जा सकता है और समझा भी जा सकता है लेकिन एक निश्चित आवाज के साथ भाषण का संबंध खो जाता है। यह "जटिल मुखर गुणों (टिम्ब्रे, आर्टिक्यूलेशन, और प्रोसोडी-तत्वों के असामान्य संस्करण) के कारण हो सकता है जो एक व्यक्तिगत आवाज को अलग करते हैं"। कोई ज्ञात उपचार नहीं है; हालाँकि, | फोनैग्नोसिया: फोनैग्नोसिया किसी भी परिचित आवाज को पहचानने में असमर्थता से जुड़ा हुआ है। इन मामलों में, भाषण उत्तेजनाओं को सुना जा सकता है और समझा भी जा सकता है लेकिन एक निश्चित आवाज के साथ भाषण का संबंध खो जाता है। यह "जटिल मुखर गुणों (टिम्ब्रे, आर्टिक्यूलेशन, और प्रोसोडी-तत्वों के असामान्य संस्करण) के कारण हो सकता है जो एक व्यक्तिगत आवाज को अलग करते हैं"। कोई ज्ञात उपचार नहीं है; हालाँकि, मिरगी की महिला की एक केस की रिपोर्ट है जो अन्य दुर्बलताओं के साथ-साथ फोनाग्नोसिया का अनुभव करने लगी। उसके ईईजी और एमआरआई परिणामों ने दिखाया "एक सही कॉर्टिकल पैरिएटल टी2-इपरिंटेनस घाव गैडोलीनियम वृद्धि के बिना और पानी के अणु प्रसार के असतत हानि के साथ"। इसलिए हालांकि कोई इलाज नहीं खोजा गया है, फोनैग्नोसिया को पोस्टिक्टल पैरिटल कॉर्टिकल डिसफंक्शन से जोड़ा जा सकता है। | ||
== शिशु भाषण धारणा == | == शिशु भाषण धारणा == | ||
शिशु भाषण ध्वनियों के बीच बहुत छोटे अंतरों का पता लगाने में सक्षम होकर [[भाषा अधिग्रहण]] की प्रक्रिया | शिशु भाषण ध्वनियों के बीच बहुत छोटे अंतरों का पता लगाने में सक्षम होकर [[भाषा अधिग्रहण]] की प्रक्रिया प्रारम्भ करते हैं। वे सभी संभव भाषण विरोधाभासों (स्वनिम) में भेदभाव कर सकते हैं। धीरे-धीरे, जैसे-जैसे वे अपनी मूल भाषा के संपर्क में आते हैं, उनकी धारणा भाषा-विशिष्ट होती जाती है, यानी वे सीखते हैं कि भाषा की ध्वन्यात्मक श्रेणियों के भीतर के अंतरों को कैसे अनदेखा किया जाए (अंतर जो अन्य भाषाओं में विपरीत हो सकते हैं - उदाहरण के लिए, अंग्रेजी दो स्वरों को अलग करती है [[प्लोसिव्स]] की श्रेणियां, जबकि थाई भाषा # व्यंजन; शिशुओं को यह सीखना चाहिए कि उनकी मूल भाषा के उपयोग में कौन से अंतर विशिष्ट हैं और कौन से नहीं हैं)। चूंकि शिशु आने वाली भाषण ध्वनियों को श्रेणियों में क्रमबद्ध करना सीखते हैं, अप्रासंगिक मतभेदों को अनदेखा करते हैं और विपरीत लोगों को मजबूत करते हैं, उनकी धारणा स्पष्ट धारणा बन जाती है। शिशु लगभग 6 महीने की उम्र तक अपनी मूल भाषा के विभिन्न स्वरों की तुलना करना सीख जाते हैं। देशी व्यंजन विरोधाभास 11 या 12 महीने की उम्र तक प्राप्त कर लिए जाते हैं।<ref name=kawai>{{cite journal |doi=10.1523/JNEUROSCI.1984-06.2007 |author=Minagawa-Kawai, Y., Mori, K., Naoi, N., Kojima, S. |year=2006 |title=एक भाषा-विशिष्ट फोनेमिक कंट्रास्ट के अधिग्रहण के दौरान शिशुओं में न्यूरल एट्यूनमेंट प्रक्रियाएं|journal=The Journal of Neuroscience |volume=27 |pages=315–321 | issue=2 |pmid=17215392|pmc=6672067 }}</ref> कुछ शोधकर्ताओं ने प्रस्तावित किया है कि [[भाषा अधिग्रहण में सांख्यिकीय शिक्षा]] नामक एक प्रक्रिया का उपयोग करके शिशु निष्क्रिय श्रवण के माध्यम से अपनी मूल भाषा की ध्वनि श्रेणियों को सीखने में सक्षम हो सकते हैं। अन्य लोग यह भी दावा करते हैं कि कुछ ध्वनि श्रेणियां सहज हैं, अर्थात, वे आनुवंशिक रूप से निर्दिष्ट हैं (श्रेणीबद्ध धारणा #अधिग्रहीत विशिष्टता के बारे में चर्चा देखें|जन्मजात बनाम अधिग्रहीत श्रेणीबद्ध विशिष्टता)। | ||
यदि एक दिन के बच्चों को उनकी माँ की आवाज़ सामान्य रूप से, असामान्य रूप से (मोनोटोन में), और एक अजनबी की आवाज़ के साथ प्रस्तुत की जाती है, तो वे केवल अपनी माँ की सामान्य रूप से बोलने वाली आवाज़ पर प्रतिक्रिया करते हैं। जब एक मानव और एक गैर-मानव ध्वनि बजाई जाती है, तो बच्चे अपना सिर केवल मानव ध्वनि के स्रोत की ओर घुमाते हैं। यह सुझाव दिया गया है कि श्रवण सीखना प्रसव पूर्व अवधि में पहले से ही | यदि एक दिन के बच्चों को उनकी माँ की आवाज़ सामान्य रूप से, असामान्य रूप से (मोनोटोन में), और एक अजनबी की आवाज़ के साथ प्रस्तुत की जाती है, तो वे केवल अपनी माँ की सामान्य रूप से बोलने वाली आवाज़ पर प्रतिक्रिया करते हैं। जब एक मानव और एक गैर-मानव ध्वनि बजाई जाती है, तो बच्चे अपना सिर केवल मानव ध्वनि के स्रोत की ओर घुमाते हैं। यह सुझाव दिया गया है कि श्रवण सीखना प्रसव पूर्व अवधि में पहले से ही प्रारम्भ हो जाता है।<ref name=cd>{{cite book |last=Crystal |first=David |year=2005 |title=भाषा का कैम्ब्रिज एनसाइक्लोपीडिया|location=Cambridge |publisher=CUP |isbn=978-0-521-55967-6}}</ref> | ||
यह जांचने के लिए | यह जांचने के लिए उपयोग की जाने वाली तकनीकों में से एक है कि ऊपर उल्लिखित हेड-टर्न प्रक्रिया के अलावा शिशु भाषण को कैसे समझते हैं, उनकी चूसने की दर को मापना है। इस तरह के प्रयोग में एक बच्चा आवाज के साथ पेश करते हुए एक खास निप्पल को चूस रहा होता है। सबसे पहले, बच्चे की सामान्य चूसने की दर स्थापित की जाती है। फिर एक प्रोत्साहन बार-बार बजाया जाता है। जब बच्चा पहली बार उत्तेजना सुनता है तो चूसने की दर बढ़ जाती है लेकिन जैसे ही बच्चे को उत्तेजना की आदत हो जाती है, चूसने की दर कम हो जाती है और स्तर बंद हो जाता है। फिर, बच्चे के लिए एक नई उत्तेजना खेली जाती है। यदि बच्चा नई प्रारम्भ की गई उत्तेजना को पृष्ठभूमि उत्तेजना से अलग मानता है तो चूसने की दर में वृद्धि दिखाई देगी।<ref name="cd" /> सक्शन-रेट (मद्यपान दर)और हेड-टर्न (सिर घुमाना) विधि भाषण धारणा का अध्ययन करने के लिए कुछ अधिक पारंपरिक, व्यवहारिक तरीके हैं। भाषण धारणा का अध्ययन करने में हमारी मदद करने वाली नई विधियों (नीचे #अनुसंधान विधियों को देखें) में शिशुओं में [[निकट-अवरक्त स्पेक्ट्रोस्कोपी]] का व्यापक रूप से उपयोग किया जाता है।<ref name="kawai" /> | ||
यह भी पता चला है कि भले ही शिशुओं की विभिन्न भाषाओं के विभिन्न ध्वन्यात्मक गुणों के बीच अंतर करने की क्षमता नौ महीने की उम्र के आसपास कम होने लगती है, इस प्रक्रिया को पर्याप्त तरीके से नई भाषा में उजागर करके इस प्रक्रिया को उल्टा करना संभव है। पेट्रीसिया के. कुहल, फेंग-मिंग त्साओ और हुई-मेई लियू द्वारा किए गए एक शोध अध्ययन में, यह पता चला कि यदि शिशुओं से मंदारिन चीनी के एक मूल वक्ता द्वारा बात की जाती है और उनके साथ बातचीत की जाती है, तो उन्हें वास्तव में अपनी क्षमता बनाए रखने के लिए वातानुकूलित किया जा सकता है। मंदारिन के भीतर विभिन्न वाक् ध्वनियों में अंतर करने के लिए जो अंग्रेजी भाषा में पाई जाने वाली वाक् ध्वनियों से बहुत भिन्न हैं। इस प्रकार यह साबित करते हुए कि सही परिस्थितियों को देखते हुए, मूल भाषा में पाई जाने वाली भाषाओं के अलावा अन्य भाषाओं में भाषण ध्वनियों को अलग करने की क्षमता के नुकसान को रोकना संभव है।<ref>{{cite journal|last=Kuhl|first=Patricia K. |author2=Feng-Ming Tsao |author3=Huei-Mei Liu|title=Foreign-language experience in infancy: Effects of short-term exposure and social interaction on phonetic learning|journal=Proceedings of the National Academy of Sciences|date=July 2003|volume=100|issue=15|pages=9096–9101|bibcode = 2003PNAS..100.9096K |doi = 10.1073/pnas.1532872100 |pmid=12861072 |pmc=166444|doi-access=free }}</ref> | यह भी पता चला है कि भले ही शिशुओं की विभिन्न भाषाओं के विभिन्न ध्वन्यात्मक गुणों के बीच अंतर करने की क्षमता नौ महीने की उम्र के आसपास कम होने लगती है, इस प्रक्रिया को पर्याप्त तरीके से नई भाषा में उजागर करके इस प्रक्रिया को उल्टा करना संभव है। पेट्रीसिया के. कुहल, फेंग-मिंग त्साओ और हुई-मेई लियू द्वारा किए गए एक शोध अध्ययन में, यह पता चला कि यदि शिशुओं से मंदारिन चीनी के एक मूल वक्ता द्वारा बात की जाती है और उनके साथ बातचीत की जाती है, तो उन्हें वास्तव में अपनी क्षमता बनाए रखने के लिए वातानुकूलित किया जा सकता है। मंदारिन के भीतर विभिन्न वाक् ध्वनियों में अंतर करने के लिए जो अंग्रेजी भाषा में पाई जाने वाली वाक् ध्वनियों से बहुत भिन्न हैं। इस प्रकार यह साबित करते हुए कि सही परिस्थितियों को देखते हुए, मूल भाषा में पाई जाने वाली भाषाओं के अलावा अन्य भाषाओं में भाषण ध्वनियों को अलग करने की क्षमता के नुकसान को रोकना संभव है।<ref>{{cite journal|last=Kuhl|first=Patricia K. |author2=Feng-Ming Tsao |author3=Huei-Mei Liu|title=Foreign-language experience in infancy: Effects of short-term exposure and social interaction on phonetic learning|journal=Proceedings of the National Academy of Sciences|date=July 2003|volume=100|issue=15|pages=9096–9101|bibcode = 2003PNAS..100.9096K |doi = 10.1073/pnas.1532872100 |pmid=12861072 |pmc=166444|doi-access=free }}</ref> | ||
Line 96: | Line 96: | ||
=== वाचाघात वाले श्रोता === | === वाचाघात वाले श्रोता === | ||
Aphasia भाषा की अभिव्यक्ति और ग्रहण दोनों को प्रभावित करता है। दो सबसे | Aphasia भाषा की अभिव्यक्ति और ग्रहण दोनों को प्रभावित करता है। दो सबसे साधारण प्रकार, अभिव्यंजक वाचाघात और ग्रहणशील वाचाघात कुछ हद तक वाक् धारणा को प्रभावित करते हैं। अभिव्यंजक वाचाघात भाषा को समझने में मध्यम कठिनाई का कारण बनता है। समझ पर ग्रहणशील वाचाघात का प्रभाव बहुत अधिक गंभीर है। इस बात पर सहमति है, कि अफ़ासिक अवधारणात्मक घाटे से पीड़ित हैं। वे सामान्यतः मुखरता और आवाज के स्थान को पूरी तरह से अलग नहीं कर सकते हैं।<ref name="cse2001">{{cite journal |author=Csépe, V. |author2=Osman-Sagi, J. |author3=Molnar, M. |author4=Gosy, M. |year= 2001 |title=Impaired speech perception in aphasic patients: event-related potential and neuropsychological assessment |journal=Neuropsychologia |pmid=11527557 |volume=39 |pages=1194–1208 |doi= 10.1016/S0028-3932(01)00052-5 | issue=11|s2cid=17307242 }}</ref> जहां तक अन्य सुविधाओं का संबंध है, कठिनाइयां अलग-अलग हैं। यह अभी तक सिद्ध नहीं हुआ है कि वाचाघात पीड़ितों में निम्न-स्तरीय भाषण-धारणा कौशल प्रभावित होते हैं या क्या उनकी कठिनाइयाँ केवल उच्च-स्तर की हानि के कारण होती हैं।<ref name="cse2001"/> | ||
=== कर्णावत प्रत्यारोपण के साथ श्रोता === | === कर्णावत प्रत्यारोपण के साथ श्रोता === | ||
[[कॉकलीयर इम्प्लांट|कॉकलीयर इम्प्लांट (कर्णावत प्रत्यारोपण)]] सेंसरिनुरल हियरिंग लॉस वाले व्यक्तियों में ध्वनिक सिग्नल तक पहुंच को पुनर्स्थापित करता है। इम्प्लांट द्वारा बताई गई ध्वनिक जानकारी | [[कॉकलीयर इम्प्लांट|कॉकलीयर इम्प्लांट (कर्णावत प्रत्यारोपण)]] सेंसरिनुरल हियरिंग लॉस वाले व्यक्तियों में ध्वनिक सिग्नल तक पहुंच को पुनर्स्थापित करता है। इम्प्लांट द्वारा बताई गई ध्वनिक जानकारी सामान्यतः इम्प्लांट उपयोगकर्ताओं के लिए पर्याप्त होती है कि वे उन लोगों के भाषण को ठीक से पहचान सकें जिन्हें वे बिना किसी दृश्य सुराग के जानते हैं।<ref name="loi1998"/> कर्णावत प्रत्यारोपण उपयोगकर्ताओं के लिए, अज्ञात वक्ताओं और ध्वनियों को समझना अधिक कठिन होता है। दो साल की उम्र के बाद इम्प्लांट प्राप्त करने वाले बच्चों की अवधारणात्मक क्षमता उन बच्चों की तुलना में काफी बेहतर है जिन्हें वयस्कता में प्रत्यारोपित किया गया था। अवधारणात्मक प्रदर्शन को प्रभावित करने के लिए कई कारक दिखाए गए हैं, विशेष रूप से: इम्प्लांटेशन से पहले बहरेपन की अवधि, बहरेपन की प्रारम्भ की उम्र, इम्प्लांटेशन पर उम्र (ऐसे उम्र के प्रभाव क्रिटिकल पीरियड परिकल्पना से संबंधित हो सकते हैं) और इम्प्लांट का उपयोग करने की अवधि . जन्मजात और उपार्जित बहरेपन वाले बच्चों में अंतर होता है। पहले से बधिर बच्चों की तुलना में पोस्टलिंगुअली बधिर बच्चों के बेहतर परिणाम होते हैं और कॉक्लियर इम्प्लांट के लिए तेजी से अनुकूल होते हैं।<ref name="loi1998">{{cite journal |author=Loizou, P. |year=1998 |title=कर्णावत प्रत्यारोपण का परिचय|journal=IEEE Signal Processing Magazine |volume=39 |pages=101–130 | issue=11|doi=10.1109/79.708543 }}</ref> कर्णावत प्रत्यारोपण और सामान्य सुनवाई वाले दोनों बच्चों में, स्वर और आवाज की प्रारम्भ का समय अभिव्यक्ति के स्थान पर भेदभाव करने की क्षमता से पहले विकास में प्रचलित हो जाता है। आरोपण के कई महीने बाद, कर्णावत प्रत्यारोपण वाले बच्चे भाषण धारणा को सामान्य कर सकते हैं। | ||
{{See also|श्रवण प्रसंस्करण विकार}} | {{See also|श्रवण प्रसंस्करण विकार}} | ||
== शोर (ध्वनि) == | == शोर (ध्वनि) == | ||
भाषण के अध्ययन में मौलिक समस्याओं में से एक यह है कि शोर से कैसे निपटा जाए। यह मानव भाषण को पहचानने में कठिनाई के द्वारा दिखाया गया है जो कि कंप्यूटर मान्यता प्रणाली के पास है। जबकि वे भाषण को पहचानने में अच्छा कर सकते हैं यदि एक विशिष्ट वक्ता की आवाज पर और शांत परिस्थितियों में प्रशिक्षित किया जाता है, तो ये सिस्टम | भाषण के अध्ययन में मौलिक समस्याओं में से एक यह है कि शोर से कैसे निपटा जाए। यह मानव भाषण को पहचानने में कठिनाई के द्वारा दिखाया गया है जो कि कंप्यूटर मान्यता प्रणाली के पास है। जबकि वे भाषण को पहचानने में अच्छा कर सकते हैं यदि एक विशिष्ट वक्ता की आवाज पर और शांत परिस्थितियों में प्रशिक्षित किया जाता है, तो ये सिस्टम प्रायः अधिक यथार्थवादी सुनने की स्थितियों में खराब प्रदर्शन करते हैं जहां मनुष्य बिना किसी कठिनाई के भाषण को समझेंगे। प्रसंस्करण पैटर्न का अनुकरण करने के लिए जो सामान्य परिस्थितियों में मस्तिष्क में आयोजित किया जाएगा, पूर्व ज्ञान एक महत्वपूर्ण तंत्रिका कारक है, क्योंकि एक मजबूत सीखने का इतिहास एक हद तक निरंतर भाषण संकेतों की पूर्ण अनुपस्थिति में सम्मिलित चरम मास्किंग प्रभावों को ओवरराइड कर सकता है।<ref name="CervantesConstantino_&_Simon_2018"/> | ||
{{See also|श्रवण प्रसंस्करण विकार}} | {{See also|श्रवण प्रसंस्करण विकार}} | ||
Line 111: | Line 111: | ||
[[संगीत मनोविज्ञान|संगीत]] और अनुभूति के बीच संबंध में शोध भाषण धारणा के अध्ययन से संबंधित एक उभरता हुआ क्षेत्र है। मूल रूप से यह सिद्धांत था कि संगीत के लिए तंत्रिका संकेतों को मस्तिष्क के दाहिने गोलार्ध में एक विशेष "मॉड्यूल" में संसाधित किया जाता था। इसके विपरीत, भाषा के लिए तंत्रिका संकेतों को बाएं गोलार्ध में एक समान "मॉड्यूल" द्वारा संसाधित किया जाना था।<ref name="Deutsch, Diana">{{cite journal |last1=Deutsch |first1=Diana |last2=Henthorn |first2=Trevor |last3=Dolson |first3=Mark |date=Spring 2004 |title=जीवन की शुरुआत में सुनाई देने वाले भाषण पैटर्न बाद में ट्राइटोन विरोधाभास की धारणा को प्रभावित करते हैं|url=http://deutsch.ucsd.edu/pdf/MP-2004-21_357-372.pdf |journal=Music Perception |volume=21 |issue=3 |pages=357–72 |doi= 10.1525/mp.2004.21.3.357|access-date=29 April 2014}}</ref> हालांकि, fMRI मशीनों जैसी तकनीकों का उपयोग करते हुए, अनुसंधान ने दिखाया है कि पारंपरिक रूप से मस्तिष्क के दो क्षेत्रों को विशेष रूप से भाषण को संसाधित करने के लिए माना जाता है, ब्रोका और वर्निक के क्षेत्र, संगीत की गतिविधियों के दौरान भी सक्रिय हो जाते हैं जैसे कि म्यूजिकल कॉर्ड के क्रम को सुनना।<ref name="Deutsch, Diana" /> अन्य अध्ययन, जैसे कि मार्केस एट अल द्वारा किया गया एक अध्ययन। 2006 में दिखाया गया कि 8 साल के बच्चों को जिन्हें छह महीने का संगीत प्रशिक्षण दिया गया था, उनके पिच डिटेक्शन प्रदर्शन और उनके इलेक्ट्रोफिजियोलॉजिकल उपायों दोनों में वृद्धि देखी गई जब उन्हें एक अज्ञात विदेशी भाषा सुनने के लिए कहा गया।<ref name="Portuguese">Marques, C et al. (2007). Musicians detect pitch violation in foreign language better than nonmusicians: Behavioral and electrophysiological evidence. "Journal of Cognitive Neuroscience, 19", 1453-1463.</ref> | [[संगीत मनोविज्ञान|संगीत]] और अनुभूति के बीच संबंध में शोध भाषण धारणा के अध्ययन से संबंधित एक उभरता हुआ क्षेत्र है। मूल रूप से यह सिद्धांत था कि संगीत के लिए तंत्रिका संकेतों को मस्तिष्क के दाहिने गोलार्ध में एक विशेष "मॉड्यूल" में संसाधित किया जाता था। इसके विपरीत, भाषा के लिए तंत्रिका संकेतों को बाएं गोलार्ध में एक समान "मॉड्यूल" द्वारा संसाधित किया जाना था।<ref name="Deutsch, Diana">{{cite journal |last1=Deutsch |first1=Diana |last2=Henthorn |first2=Trevor |last3=Dolson |first3=Mark |date=Spring 2004 |title=जीवन की शुरुआत में सुनाई देने वाले भाषण पैटर्न बाद में ट्राइटोन विरोधाभास की धारणा को प्रभावित करते हैं|url=http://deutsch.ucsd.edu/pdf/MP-2004-21_357-372.pdf |journal=Music Perception |volume=21 |issue=3 |pages=357–72 |doi= 10.1525/mp.2004.21.3.357|access-date=29 April 2014}}</ref> हालांकि, fMRI मशीनों जैसी तकनीकों का उपयोग करते हुए, अनुसंधान ने दिखाया है कि पारंपरिक रूप से मस्तिष्क के दो क्षेत्रों को विशेष रूप से भाषण को संसाधित करने के लिए माना जाता है, ब्रोका और वर्निक के क्षेत्र, संगीत की गतिविधियों के दौरान भी सक्रिय हो जाते हैं जैसे कि म्यूजिकल कॉर्ड के क्रम को सुनना।<ref name="Deutsch, Diana" /> अन्य अध्ययन, जैसे कि मार्केस एट अल द्वारा किया गया एक अध्ययन। 2006 में दिखाया गया कि 8 साल के बच्चों को जिन्हें छह महीने का संगीत प्रशिक्षण दिया गया था, उनके पिच डिटेक्शन प्रदर्शन और उनके इलेक्ट्रोफिजियोलॉजिकल उपायों दोनों में वृद्धि देखी गई जब उन्हें एक अज्ञात विदेशी भाषा सुनने के लिए कहा गया।<ref name="Portuguese">Marques, C et al. (2007). Musicians detect pitch violation in foreign language better than nonmusicians: Behavioral and electrophysiological evidence. "Journal of Cognitive Neuroscience, 19", 1453-1463.</ref> | ||
इसके विपरीत, कुछ शोधों से यह पता चला है कि संगीत हमारी वाणी की धारणा को प्रभावित करने के बजाय, हमारी मूल भाषा संगीत की हमारी धारणा को प्रभावित कर सकती है। ट्राइटोन विरोधाभास इसका एक उदाहरण है। ट्राइटोन विरोधाभास वह जगह है जहां एक श्रोता को दो कंप्यूटर-जनित टोन (जैसे सी और एफ-शार्प) के साथ प्रस्तुत किया जाता है जो आधा सप्तक (या ट्राइटोन) अलग होते हैं और फिर यह निर्धारित करने के लिए कहा जाता है कि क्या अनुक्रम की पिच अवरोही है या आरोही। सुश्री डायना ड्यूश द्वारा किए गए इस तरह के एक अध्ययन में पाया गया कि श्रोता की आरोही या अवरोही पिच की व्याख्या श्रोता की भाषा या बोली से प्रभावित थी, जो इंग्लैंड के दक्षिण में और कैलिफोर्निया में या वियतनाम में उन लोगों के बीच भिन्नता दिखाती है। वे कैलिफ़ोर्निया में जिनकी मूल भाषा अंग्रेजी थी।<ref name="Deutsch, Diana" /> दक्षिणी कैलिफोर्निया विश्वविद्यालय में अंग्रेजी बोलने वालों के एक समूह और पूर्वी एशियाई छात्रों के 3 समूहों पर 2006 में किए गए एक दूसरे अध्ययन में पता चला कि अंग्रेजी बोलने वालों ने 5 साल की उम्र में या उससे पहले संगीत प्रशिक्षण | इसके विपरीत, कुछ शोधों से यह पता चला है कि संगीत हमारी वाणी की धारणा को प्रभावित करने के बजाय, हमारी मूल भाषा संगीत की हमारी धारणा को प्रभावित कर सकती है। ट्राइटोन विरोधाभास इसका एक उदाहरण है। ट्राइटोन विरोधाभास वह जगह है जहां एक श्रोता को दो कंप्यूटर-जनित टोन (जैसे सी और एफ-शार्प) के साथ प्रस्तुत किया जाता है जो आधा सप्तक (या ट्राइटोन) अलग होते हैं और फिर यह निर्धारित करने के लिए कहा जाता है कि क्या अनुक्रम की पिच अवरोही है या आरोही। सुश्री डायना ड्यूश द्वारा किए गए इस तरह के एक अध्ययन में पाया गया कि श्रोता की आरोही या अवरोही पिच की व्याख्या श्रोता की भाषा या बोली से प्रभावित थी, जो इंग्लैंड के दक्षिण में और कैलिफोर्निया में या वियतनाम में उन लोगों के बीच भिन्नता दिखाती है। वे कैलिफ़ोर्निया में जिनकी मूल भाषा अंग्रेजी थी।<ref name="Deutsch, Diana" /> दक्षिणी कैलिफोर्निया विश्वविद्यालय में अंग्रेजी बोलने वालों के एक समूह और पूर्वी एशियाई छात्रों के 3 समूहों पर 2006 में किए गए एक दूसरे अध्ययन में पता चला कि अंग्रेजी बोलने वालों ने 5 साल की उम्र में या उससे पहले संगीत प्रशिक्षण प्रारम्भ कर दिया था, उनके पास सही पिच होने का 8% मौका था।<ref name="Deutsch, Diana" /> | ||
== भाषण घटना विज्ञान == | == भाषण घटना विज्ञान == | ||
Line 133: | Line 133: | ||
कम्प्यूटेशनल मॉडलिंग का उपयोग यह अनुकरण करने के लिए भी किया गया है कि मस्तिष्क द्वारा देखे गए व्यवहारों को उत्पन्न करने के लिए भाषण को कैसे संसाधित किया जा सकता है। भाषण धारणा में कई प्रश्नों को हल करने के लिए कंप्यूटर मॉडल का उपयोग किया गया है, जिसमें भाषण में उपयोग किए जाने वाले ध्वनिक संकेतों को निकालने के लिए स्वयं ध्वनि संकेत को कैसे संसाधित किया जाता है, और उच्च-स्तरीय प्रक्रियाओं जैसे शब्द पहचान के लिए भाषण जानकारी का उपयोग कैसे किया जाता है।<ref name="mcc1986">{{cite journal |author1=McClelland, J.L. |author2=Elman, J.L. |name-list-style=amp |year=1986 |title=भाषण धारणा का TRACE मॉडल|journal=Cognitive Psychology |volume=18 |pages=1–86 |url=http://www.cnbc.cmu.edu/~jlm/papers/McClellandElman86.pdf |access-date=2007-05-19 |doi=10.1016/0010-0285(86)90015-0 |pmid=3753912 |issue=1 |s2cid=7428866 |archive-url=https://web.archive.org/web/20070421153000/http://www.cnbc.cmu.edu/~jlm/papers/McClellandElman86.pdf |archive-date=2007-04-21 |url-status=dead }}</ref> | कम्प्यूटेशनल मॉडलिंग का उपयोग यह अनुकरण करने के लिए भी किया गया है कि मस्तिष्क द्वारा देखे गए व्यवहारों को उत्पन्न करने के लिए भाषण को कैसे संसाधित किया जा सकता है। भाषण धारणा में कई प्रश्नों को हल करने के लिए कंप्यूटर मॉडल का उपयोग किया गया है, जिसमें भाषण में उपयोग किए जाने वाले ध्वनिक संकेतों को निकालने के लिए स्वयं ध्वनि संकेत को कैसे संसाधित किया जाता है, और उच्च-स्तरीय प्रक्रियाओं जैसे शब्द पहचान के लिए भाषण जानकारी का उपयोग कैसे किया जाता है।<ref name="mcc1986">{{cite journal |author1=McClelland, J.L. |author2=Elman, J.L. |name-list-style=amp |year=1986 |title=भाषण धारणा का TRACE मॉडल|journal=Cognitive Psychology |volume=18 |pages=1–86 |url=http://www.cnbc.cmu.edu/~jlm/papers/McClellandElman86.pdf |access-date=2007-05-19 |doi=10.1016/0010-0285(86)90015-0 |pmid=3753912 |issue=1 |s2cid=7428866 |archive-url=https://web.archive.org/web/20070421153000/http://www.cnbc.cmu.edu/~jlm/papers/McClellandElman86.pdf |archive-date=2007-04-21 |url-status=dead }}</ref> | ||
=== न्यूरोफिज़ियोलॉजिकल तरीके === | === न्यूरोफिज़ियोलॉजिकल तरीके === | ||
न्यूरोफिज़ियोलॉजिकल तरीके अधिक प्रत्यक्ष और आवश्यक रूप से सचेत (पूर्व-चौकस) प्रक्रियाओं से उपजी जानकारी के उपयोग पर निर्भर करते हैं। विषयों को विभिन्न प्रकार के कार्यों में भाषण उत्तेजनाओं के साथ प्रस्तुत किया जाता है और मस्तिष्क की प्रतिक्रियाओं को मापा जाता है। व्यवहारिक प्रतिक्रियाओं के माध्यम से ऐसा प्रतीत होता है कि मस्तिष्क स्वयं अधिक संवेदनशील हो सकता है। उदाहरण के लिए, विषय एक भेदभाव परीक्षण में दो वाक् ध्वनियों के बीच के अंतर के प्रति संवेदनशीलता नहीं दिखा सकता है, लेकिन मस्तिष्क की प्रतिक्रियाएँ इन अंतरों के प्रति संवेदनशीलता प्रकट कर सकती हैं।<ref name=kawai/> भाषण के लिए तंत्रिका प्रतिक्रियाओं को मापने के लिए उपयोग की जाने वाली विधियों में [[घटना से संबंधित क्षमता|घटना से संबंधित क्षमताएं]], [[मैग्नेटोएन्सेफलोग्राफी]] और निकट अवरक्त स्पेक्ट्रोस्कोपी | न्यूरोफिज़ियोलॉजिकल तरीके अधिक प्रत्यक्ष और आवश्यक रूप से सचेत (पूर्व-चौकस) प्रक्रियाओं से उपजी जानकारी के उपयोग पर निर्भर करते हैं। विषयों को विभिन्न प्रकार के कार्यों में भाषण उत्तेजनाओं के साथ प्रस्तुत किया जाता है और मस्तिष्क की प्रतिक्रियाओं को मापा जाता है। व्यवहारिक प्रतिक्रियाओं के माध्यम से ऐसा प्रतीत होता है कि मस्तिष्क स्वयं अधिक संवेदनशील हो सकता है। उदाहरण के लिए, विषय एक भेदभाव परीक्षण में दो वाक् ध्वनियों के बीच के अंतर के प्रति संवेदनशीलता नहीं दिखा सकता है, लेकिन मस्तिष्क की प्रतिक्रियाएँ इन अंतरों के प्रति संवेदनशीलता प्रकट कर सकती हैं।<ref name=kawai/> भाषण के लिए तंत्रिका प्रतिक्रियाओं को मापने के लिए उपयोग की जाने वाली विधियों में [[घटना से संबंधित क्षमता|घटना से संबंधित क्षमताएं]], [[मैग्नेटोएन्सेफलोग्राफी]] और निकट अवरक्त स्पेक्ट्रोस्कोपी सम्मिलित हैं। घटना-संबंधी संभावनाओं के साथ उपयोग की जाने वाली एक महत्वपूर्ण प्रतिक्रिया [[बेमेल नकारात्मकता]] है, जो तब होती है जब भाषण उत्तेजना ध्वनिक रूप से उस उत्तेजना से भिन्न होती है जिसे विषय ने पहले सुना था। | ||
न्यूरोफिज़ियोलॉजिकल तरीकों को कई कारणों से भाषण धारणा अनुसंधान में पेश किया गया: | न्यूरोफिज़ियोलॉजिकल तरीकों को कई कारणों से भाषण धारणा अनुसंधान में पेश किया गया: | ||
Line 154: | Line 154: | ||
===मोटर सिद्धांत=== | ===मोटर सिद्धांत=== | ||
{{Main|भाषण धारणा का मोटर सिद्धांत}} | {{Main|भाषण धारणा का मोटर सिद्धांत}} | ||
[[हास्किन्स लेबोरेटरीज]] में एल्विन लिबरमैन और उनके सहयोगियों द्वारा भाषण ध्वनियों का अनुभव कैसे किया जाता है, इस अध्ययन में कुछ | [[हास्किन्स लेबोरेटरीज]] में एल्विन लिबरमैन और उनके सहयोगियों द्वारा भाषण ध्वनियों का अनुभव कैसे किया जाता है, इस अध्ययन में कुछ प्रारंभिक काम किए गए थे।<ref name="lib57">{{cite journal |author=Liberman, A.M., Harris, K.S., Hoffman, H.S., Griffith, B.C. |year=1957 |title=भाषण का भेदभाव ध्वन्यात्मक सीमाओं के भीतर और बाहर लगता है|journal=Journal of Experimental Psychology |volume=54 |pages=358–368 |url=http://www.haskins.yale.edu/Reprints/HL0022.pdf |access-date=2007-05-18 |doi=10.1037/h0044417 |pmid=13481283 |issue=5}}</ref> एक भाषण सिंथेसाइज़र का उपयोग करते हुए, उन्होंने भाषण ध्वनियों का निर्माण किया जो एक निरंतरता के साथ अभिव्यक्ति के स्थान पर भिन्न होती हैं {{IPA|/bɑ/}} को {{IPA|/dɑ/}} को {{IPA|/ɡɑ/}}. श्रोताओं को यह पहचानने के लिए कहा गया कि उन्होंने कौन सी ध्वनि सुनी और दो अलग-अलग ध्वनियों के बीच भेदभाव किया। प्रयोग के परिणामों से पता चला कि श्रोताओं ने ध्वनियों को असतत श्रेणियों में समूहीकृत किया, भले ही वे जो ध्वनियाँ सुन रहे थे वे लगातार भिन्न थीं। इन परिणामों के आधार पर, उन्होंने स्पष्ट धारणा की धारणा को एक तंत्र के रूप में प्रस्तावित किया जिसके द्वारा मनुष्य भाषण ध्वनियों की पहचान कर सकते हैं। | ||
विभिन्न प्रकार के कार्यों और विधियों का उपयोग करते हुए हाल के शोध से पता चलता है कि भाषण धारणा के सख्त श्रेणीबद्ध खाते के विपरीत, श्रोता ध्वनि संबंधी श्रेणी के भीतर ध्वनिक मतभेदों के प्रति अत्यधिक संवेदनशील होते हैं। | विभिन्न प्रकार के कार्यों और विधियों का उपयोग करते हुए हाल के शोध से पता चलता है कि भाषण धारणा के सख्त श्रेणीबद्ध खाते के विपरीत, श्रोता ध्वनि संबंधी श्रेणी के भीतर ध्वनिक मतभेदों के प्रति अत्यधिक संवेदनशील होते हैं। | ||
स्पष्ट धारणा डेटा का एक सैद्धांतिक खाता प्रदान करने के लिए, लिबरमैन और उनके सहयोगियों ने<ref name="lib67">{{cite journal |author=Liberman, A.M., Cooper, F.S., Shankweiler, D.P., & Studdert-Kennedy, M. |year=1967 |title=भाषण कोड की धारणा|journal=Psychological Review |volume=74 |pages=431–461 |url=http://www.haskins.yale.edu/Reprints/HL0069.pdf |access-date=2007-05-19 |doi=10.1037/h0020279 |pmid=4170865 |issue=6}}</ref> भाषण धारणा के मोटर सिद्धांत को तैयार किया, जहां "जटिल आर्टिकुलेटरी एन्कोडिंग को उत्पादन में | स्पष्ट धारणा डेटा का एक सैद्धांतिक खाता प्रदान करने के लिए, लिबरमैन और उनके सहयोगियों ने<ref name="lib67">{{cite journal |author=Liberman, A.M., Cooper, F.S., Shankweiler, D.P., & Studdert-Kennedy, M. |year=1967 |title=भाषण कोड की धारणा|journal=Psychological Review |volume=74 |pages=431–461 |url=http://www.haskins.yale.edu/Reprints/HL0069.pdf |access-date=2007-05-19 |doi=10.1037/h0020279 |pmid=4170865 |issue=6}}</ref> भाषण धारणा के मोटर सिद्धांत को तैयार किया, जहां "जटिल आर्टिकुलेटरी एन्कोडिंग को उत्पादन में सम्मिलित समान प्रक्रियाओं द्वारा भाषण की धारणा में डिकोड किया गया था"<ref name="np"/> (इसे विश्लेषण-दर-संश्लेषण के रूप में संदर्भित किया जाता है)। उदाहरण के लिए, अंग्रेजी व्यंजन /d/ विभिन्न ध्वन्यात्मक संदर्भों (ऊपर देखें) में इसके ध्वनिक विवरण में भिन्न हो सकते हैं, फिर भी एक श्रोता द्वारा माना गया सभी /d/s एक श्रेणी के अंतर्गत आते हैं (आवाज़ वाले वायुकोशीय प्लोसिव) और ऐसा इसलिए है क्योंकि " भाषाई निरूपण अमूर्त, विहित, ध्वन्यात्मक खंड या इशारों हैं जो इन खंडों के अंतर्गत आते हैं।<ref name="np"/> धारणा की इकाइयों का वर्णन करते समय, लिबरमैन ने बाद में आर्टिकुलेटरी मूवमेंट को छोड़ दिया और आर्टिकुलेटर्स <ref name="lib70">{{cite journal |author=Liberman, A.M. |year=1970 |title=भाषण और भाषा के व्याकरण|journal=Cognitive Psychology |volume=1 |issue=4 |pages=301–323 |url= http://www.haskins.yale.edu/Reprints/HL0099.pdf |access-date=2007-07-19 |doi=10.1016/0010-0285(70)90018-6}}</ref> और यहां तक कि बाद में आर्टिकुलेटरी जेस्चर के लिए न्यूरल कमांड के लिए आगे बढ़े, इस प्रकार "स्पीकर के उत्पादन को निर्धारित करने वाले उच्चारण का तंत्रिका प्रतिनिधित्व डिस्टल है वस्तु को श्रोता समझता है"<ref name="lib85">{{cite journal |author1=Liberman, A.M. |author2=Mattingly, I.G. |name-list-style=amp |year=1985 |title=भाषण धारणा का मोटर सिद्धांत संशोधित|journal=Cognition |volume=21 |pages=1–36 |url=http://www.haskins.yale.edu/Reprints/HL0519.pdf |access-date=2007-07-19 |doi=10.1016/0010-0277(85)90021-6 |pmid=4075760 |issue=1|citeseerx=10.1.1.330.220 |s2cid=112932 }}</ref> सिद्धांत मॉड्यूलरिटी परिकल्पना से निकटता से संबंधित है, जो एक विशेष-उद्देश्य मॉड्यूल के अस्तित्व का प्रस्ताव करता है, जिसे सहज और शायद मानव-विशिष्ट माना जाता है। | ||
श्रोताओं द्वारा "ध्वनिक संकेतों को लक्षित इशारों में कैसे अनुवादित किया जाता है, इसका विवरण प्रदान करने में सक्षम नहीं होने" के संदर्भ में इस सिद्धांत की आलोचना की गई है<ref name=hay/>। इसके अलावा, यह स्पष्ट नहीं है कि भाषाई रूप से प्रासंगिक जानकारी के साथ इंडेक्सिकल जानकारी (जैसे बात करने वाले की पहचान) को कैसे एन्कोड/डीकोड किया जाता है। | श्रोताओं द्वारा "ध्वनिक संकेतों को लक्षित इशारों में कैसे अनुवादित किया जाता है, इसका विवरण प्रदान करने में सक्षम नहीं होने" के संदर्भ में इस सिद्धांत की आलोचना की गई है<ref name=hay/>। इसके अलावा, यह स्पष्ट नहीं है कि भाषाई रूप से प्रासंगिक जानकारी के साथ इंडेक्सिकल जानकारी (जैसे बात करने वाले की पहचान) को कैसे एन्कोड/डीकोड किया जाता है। | ||
Line 171: | Line 171: | ||
=== ध्वनिक स्थलचिह्न और विशिष्ट विशेषताएं === | === ध्वनिक स्थलचिह्न और विशिष्ट विशेषताएं === | ||
केनेथ एन स्टीवंस ने ध्वन्यात्मक सुविधाओं और श्रवण गुणों के बीच संबंध के रूप में ध्वनिक स्थलों और विशिष्ट विशेषताओं का प्रस्ताव रखा। इस दृष्टिकोण के अनुसार, श्रोता तथाकथित ध्वनिक स्थलों के लिए आने वाले सिग्नल का निरीक्षण कर रहे हैं जो स्पेक्ट्रम में विशेष घटनाएँ हैं जो इशारों के बारे में जानकारी देती हैं जो उन्हें उत्पन्न करती हैं। चूंकि ये इशारे मनुष्यों के आर्टिकुलेटर्स की क्षमता से सीमित हैं और श्रोता उनके श्रवण संबंधी संबंधों के प्रति संवेदनशील हैं, इस मॉडल में निश्चरता का अभाव बस मौजूद नहीं है। स्थलों के ध्वनिक गुण विशिष्ट विशेषताओं को स्थापित करने का आधार बनाते हैं। उनमें से बंडल विशिष्ट रूप से ध्वन्यात्मक खंड (स्वर, शब्दांश, शब्द) निर्दिष्ट करते हैं।<ref>{{cite journal |author=Stevens, K.N. |year=2002 |title=ध्वनिक स्थलों और विशिष्ट विशेषताओं के आधार पर शाब्दिक पहुंच के एक मॉडल की ओर|journal=Journal of the Acoustical Society of America |volume=111 |pmid=12002871 |pages=1872–1891 |url=http://linguistics.berkeley.edu/~kjohnson/ling210/stevens2002.pdf |access-date=2007-05-17 |doi=10.1121/1.1458026 |issue=4 |bibcode=2002ASAJ..111.1872S |archive-url=https://web.archive.org/web/20070609151908/http://linguistics.berkeley.edu/~kjohnson/ling210/stevens2002.pdf |archive-date=2007-06-09 |url-status=dead }}</ref> | केनेथ एन स्टीवंस ने ध्वन्यात्मक सुविधाओं और श्रवण गुणों के बीच संबंध के रूप में ध्वनिक स्थलों और विशिष्ट विशेषताओं का प्रस्ताव रखा। इस दृष्टिकोण के अनुसार, श्रोता तथाकथित ध्वनिक स्थलों के लिए आने वाले सिग्नल का निरीक्षण कर रहे हैं जो स्पेक्ट्रम में विशेष घटनाएँ हैं जो इशारों के बारे में जानकारी देती हैं जो उन्हें उत्पन्न करती हैं। चूंकि ये इशारे मनुष्यों के आर्टिकुलेटर्स की क्षमता से सीमित हैं और श्रोता उनके श्रवण संबंधी संबंधों के प्रति संवेदनशील हैं, इस मॉडल में निश्चरता का अभाव बस मौजूद नहीं है। स्थलों के ध्वनिक गुण विशिष्ट विशेषताओं को स्थापित करने का आधार बनाते हैं। उनमें से बंडल विशिष्ट रूप से ध्वन्यात्मक खंड (स्वर, शब्दांश, शब्द) निर्दिष्ट करते हैं।<ref>{{cite journal |author=Stevens, K.N. |year=2002 |title=ध्वनिक स्थलों और विशिष्ट विशेषताओं के आधार पर शाब्दिक पहुंच के एक मॉडल की ओर|journal=Journal of the Acoustical Society of America |volume=111 |pmid=12002871 |pages=1872–1891 |url=http://linguistics.berkeley.edu/~kjohnson/ling210/stevens2002.pdf |access-date=2007-05-17 |doi=10.1121/1.1458026 |issue=4 |bibcode=2002ASAJ..111.1872S |archive-url=https://web.archive.org/web/20070609151908/http://linguistics.berkeley.edu/~kjohnson/ling210/stevens2002.pdf |archive-date=2007-06-09 |url-status=dead }}</ref> | ||
इस मॉडल में, आने वाले ध्वनिक संकेत को पहले तथाकथित स्थलों को निर्धारित करने के लिए संसाधित माना जाता है जो सिग्नल में विशेष आवृत्ति स्पेक्ट्रम घटनाएँ हैं; उदाहरण के लिए, स्वरों को | इस मॉडल में, आने वाले ध्वनिक संकेत को पहले तथाकथित स्थलों को निर्धारित करने के लिए संसाधित माना जाता है जो सिग्नल में विशेष आवृत्ति स्पेक्ट्रम घटनाएँ हैं; उदाहरण के लिए, स्वरों को सामान्यतः पहले फॉर्मेंट की उच्च आवृत्ति द्वारा चिह्नित किया जाता है, व्यंजनों को संकेत में विच्छिन्नता के रूप में निर्दिष्ट किया जा सकता है और स्पेक्ट्रम के निचले और मध्य क्षेत्रों में कम आयाम होते हैं। ये ध्वनिक विशेषताएं अभिव्यक्ति से उत्पन्न होती हैं। वास्तव में, शोर जैसी बाहरी स्थितियों के कारण स्थलों को बढ़ाने की आवश्यकता होने पर द्वितीयक कलात्मक आंदोलनों का उपयोग किया जा सकता है। स्टीवंस का दावा है कि कॉर्टिक्यूलेशन केवल सीमित और इसके अलावा व्यवस्थित और इस प्रकार सिग्नल में अनुमानित भिन्नता का कारण बनता है जिससे श्रोता निपटने में सक्षम होता है। इस मॉडल के भीतर इसलिए, जिसे वाक् बोध कहा जाता है निश्चरता का अभाव केवल अस्तित्व में नहीं होने का दावा किया जाता है। | ||
विशिष्ट कलात्मक घटनाओं (इशारों) को निर्धारित करने के लिए लैंडमार्क का विश्लेषण किया जाता है जो उनसे जुड़े होते हैं। अगले चरण में, ध्वनिक संकेतों को कुछ मापदंडों के मानसिक माप के माध्यम से स्थलों के आसपास के संकेत से निकाला जाता है जैसे कि वर्णक्रमीय चोटियों की आवृत्ति, कम आवृत्ति क्षेत्र में आयाम, या समय। | विशिष्ट कलात्मक घटनाओं (इशारों) को निर्धारित करने के लिए लैंडमार्क का विश्लेषण किया जाता है जो उनसे जुड़े होते हैं। अगले चरण में, ध्वनिक संकेतों को कुछ मापदंडों के मानसिक माप के माध्यम से स्थलों के आसपास के संकेत से निकाला जाता है जैसे कि वर्णक्रमीय चोटियों की आवृत्ति, कम आवृत्ति क्षेत्र में आयाम, या समय। | ||
अगले प्रसंस्करण चरण में ध्वनिक-संकेत समेकन और विशिष्ट सुविधाओं की व्युत्पत्ति | अगले प्रसंस्करण चरण में ध्वनिक-संकेत समेकन और विशिष्ट सुविधाओं की व्युत्पत्ति सम्मिलित है। ये अभिव्यक्ति से संबंधित बाइनरी श्रेणियां हैं (उदाहरण के लिए [+/- उच्च], [+/- वापस], [+/- गोल होंठ] स्वरों के लिए; [+/- सोनोरेंट], [+/- पार्श्व], या[+/- नासिका] व्यंजन के लिए। | ||
इन सुविधाओं के बंडल विशिष्ट रूप से भाषण खंडों (स्वर, शब्दांश, शब्द) की पहचान करते हैं। ये खंड श्रोता की स्मृति में संग्रहीत शब्दकोष का हिस्सा हैं। इसकी इकाइयाँ लेक्सिकल एक्सेस की प्रक्रिया में सक्रिय होती हैं और मूल सिग्नल पर मैप की जाती हैं ताकि यह पता लगाया जा सके कि वे मेल खाते हैं या नहीं। यदि नहीं, तो एक अलग उम्मीदवार पैटर्न के साथ एक और प्रयास किया जाता है। इस पुनरावृत्त फैशन में, श्रोता इस प्रकार कलात्मक घटनाओं का पुनर्निर्माण करते हैं जो कथित भाषण संकेत उत्पन्न करने के लिए आवश्यक थे। इसलिए इसे विश्लेषण-दर-संश्लेषण के रूप में वर्णित किया जा सकता है। | इन सुविधाओं के बंडल विशिष्ट रूप से भाषण खंडों (स्वर, शब्दांश, शब्द) की पहचान करते हैं। ये खंड श्रोता की स्मृति में संग्रहीत शब्दकोष का हिस्सा हैं। इसकी इकाइयाँ लेक्सिकल एक्सेस की प्रक्रिया में सक्रिय होती हैं और मूल सिग्नल पर मैप की जाती हैं ताकि यह पता लगाया जा सके कि वे मेल खाते हैं या नहीं। यदि नहीं, तो एक अलग उम्मीदवार पैटर्न के साथ एक और प्रयास किया जाता है। इस पुनरावृत्त फैशन में, श्रोता इस प्रकार कलात्मक घटनाओं का पुनर्निर्माण करते हैं जो कथित भाषण संकेत उत्पन्न करने के लिए आवश्यक थे। इसलिए इसे विश्लेषण-दर-संश्लेषण के रूप में वर्णित किया जा सकता है। | ||
Line 194: | Line 194: | ||
===प्रत्यक्ष यथार्थवादी सिद्धांत=== | ===प्रत्यक्ष यथार्थवादी सिद्धांत=== | ||
भाषण धारणा का प्रत्यक्ष यथार्थवादी सिद्धांत (ज्यादातर [[कैरोल फाउलर]] से जुड़ा हुआ है) प्रत्यक्ष यथार्थवाद के अधिक सामान्य सिद्धांत का एक हिस्सा है, जो उस धारणा को मानता है जिससे हमें दुनिया के प्रत्यक्ष जागरूकता की अनुमति मिलती है क्योंकि इसमें दूर के स्रोत की प्रत्यक्ष वसूली | भाषण धारणा का प्रत्यक्ष यथार्थवादी सिद्धांत (ज्यादातर [[कैरोल फाउलर]] से जुड़ा हुआ है) प्रत्यक्ष यथार्थवाद के अधिक सामान्य सिद्धांत का एक हिस्सा है, जो उस धारणा को मानता है जिससे हमें दुनिया के प्रत्यक्ष जागरूकता की अनुमति मिलती है क्योंकि इसमें दूर के स्रोत की प्रत्यक्ष वसूली सम्मिलित होती है जिस घटना का आभास होता है।भाषण धारणा के लिए, सिद्धांत का दावा है कि धारणा की वस्तुएं वास्तविक स्वर पथ आंदोलनों, या इशारों हैं, न कि अमूर्त स्वरों या (मोटर थ्योरी के रूप में) घटनाएं जो इन आंदोलनों के कारण पूर्ववर्ती हैं, अर्थात संकेत। श्रोता संकेतों को एक विशेष डिकोडर (मोटर थ्योरी के रूप में) के माध्यम से नहीं देखते हैं, बल्कि इसलिए कि ध्वनिक संकेत में जानकारी इशारों को निर्दिष्ट करती है जो इसे बनाते हैं।<ref>{{cite journal |author1=Randy L. Diehl |author2=Andrew J. Lotto |author3=Lori L. Holt |year=2004 |title=वाणी धारणा|journal=Annual Review of Psychology |volume=55 |issue=1 |pages=149–179 |doi=10.1146/annurev.psych.55.090902.142028 |pmid=14744213|s2cid=937985 |url=https://semanticscholar.org/paper/06dcaa0190b92a257d778712ad884a07584135ae }}</ref> यह दावा करते हुए कि विभिन्न वाक् ध्वनियों को उत्पन्न करने वाले वास्तविक कलात्मक हाव-भाव स्वयं वाक् बोध की इकाइयाँ हैं, सिद्धांत अविच्छिन्नता की कमी की समस्या को दूर कर देता है। | ||
== यह भी देखें == | == यह भी देखें == |
Revision as of 13:30, 18 May 2023
Part of a series on | ||||||
Phonetics | ||||||
---|---|---|---|---|---|---|
Part of the Linguistics Series | ||||||
Subdisciplines | ||||||
Articulation | ||||||
|
||||||
Acoustics | ||||||
|
||||||
Perception | ||||||
|
||||||
Linguistics portal | ||||||
भाषण धारणा (वाणी धारणा) वह प्रक्रिया है जिसके द्वारा भाषा की ध्वनियाँ सुनी, व्याख्या और समझी जाती हैं। भाषण धारणा का अध्ययन भाषाविज्ञान और संज्ञानात्मक मनोविज्ञान और मनोविज्ञान में धारणा में स्वर विज्ञान और ध्वन्यात्मकता के क्षेत्रों से निकटता से जुड़ा हुआ है। वाक् बोध में अनुसंधान यह समझने का प्रयास करता है कि मानव श्रोता वाक् ध्वनियों को कैसे पहचानते हैं और इस जानकारी का उपयोग बोली जाने वाली भाषा को समझने के लिए करते हैं। भाषण धारणा अनुसंधान में कंप्यूटर सिस्टम के निर्माण में अनुप्रयोग हैं जो भाषण को पहचान सकते हैं, श्रवण और भाषा-बाधित श्रोताओं के लिए स्पीच रिकग्निशन (वाक् पहचान) में सुधार करने और विदेशी भाषा शिक्षण में अनुप्रयोग है।
वाणी को समझने की प्रक्रिया ध्वनि संकेत के स्तर पर प्रारम्भ होती है और श्रवण की प्रक्रिया। (ऑडिशन की प्रक्रिया के पूर्ण विवरण के लिए हियरिंग देखें।) प्रारंभिक श्रवण संकेत को संसाधित करने के बाद, ध्वनिक संकेतों और ध्वन्यात्मक जानकारी निकालने के लिए भाषण ध्वनियों को और संसाधित किया जाता है। यह भाषण जानकारी तब उच्च-स्तरीय भाषा प्रक्रियाओं, जैसे शब्द पहचान के लिए उपयोग की जा सकती है।
ध्वनिक संकेत
ध्वनिक संकेत वाक् ध्वनि संकेत में निहित संवेदी संकेत होते हैं जिनका उपयोग विभिन्न ध्वन्यात्मक श्रेणियों से संबंधित वाक् ध्वनियों को अलग करने के लिए वाक् धारणा में किया जाता है। उदाहरण के लिए, भाषण में सबसे अधिक अध्ययन किए गए संकेतों में से एक आवाज प्रारम्भ समय या वीओटी है। वीओटी एक प्राथमिक संकेत है जो "b" और "p" जैसे आवाज वाले और आवाज रहित प्लोसिव्स के बीच अंतर को दर्शाता है। अन्य संकेत अलग-अलग ध्वनियों को अलग करते हैं जो अभिव्यक्ति के विभिन्न स्थानों या अभिव्यक्ति के शिष्टाचार में उत्पन्न होते हैं। भाषण प्रणाली को विशिष्ट भाषण ध्वनि की श्रेणी निर्धारित करने के लिए इन संकेतों को भी जोड़ना चाहिए। यह प्रायः स्वनिमों के अमूर्त निरूपण के संदर्भ में सोचा जाता है। इन अभ्यावेदनों को फिर शब्द पहचान और अन्य भाषा प्रक्रियाओं में उपयोग के लिए जोड़ा जा सकता है।
यह पहचानना आसान नहीं है कि कौन से ध्वनिक संकेत श्रोता किसी विशेष भाषण ध्वनि को समझते समय संवेदनशील होते हैं:
पहली नज़र में, हम भाषण को कैसे देखते हैं, इस समस्या का हल भ्रामक रूप से सरल लगता है। यदि कोई ध्वनिक तरंग के विस्तार की पहचान कर सकता है जो धारणा की इकाइयों के अनुरूप है, तो ध्वनि से अर्थ तक का रास्ता स्पष्ट होगा। हालाँकि, समस्या पर लगभग पैंतालीस वर्षों के शोध के बाद भी, इस पत्राचार या मानचित्रण को खोजना बेहद कठिन साबित हुआ है।[1]
यदि ध्वनिक तरंग के एक विशिष्ट पहलू ने भाषाई इकाई का संकेत दिया है, तो भाषण सिंथेसाइज़र का उपयोग करने वाले परीक्षणों की एक श्रृंखला इस तरह के संकेत या संकेत को निर्धारित करने के लिए पर्याप्त होगी। हालाँकि, इसमें दो महत्वपूर्ण बाधाएँ हैं:
- भाषण संकेत का एक ध्वनिक पहलू अलग-अलग भाषाई रूप से प्रासंगिक आयामों को इंगित कर सकता है। उदाहरण के लिए, अंग्रेजी में एक स्वर की अवधि इंगित कर सकती है कि स्वर पर जोर दिया गया है या नहीं, या क्या यह एक आवाज या ध्वनिहीन व्यंजन द्वारा बंद किए गए अक्षरों में है, और कुछ मामलों में (जैसे अमेरिकी अंग्रेजी /ɛ/ और /æ/) यह स्वरों की पहचान में अंतर कर सकता है।[2] कुछ विशेषज्ञों का यह भी तर्क है कि अंग्रेजी में पारंपरिक रूप से लघु और दीर्घ स्वर कहे जाने वाले स्वरों में अंतर करने में अवधि मदद कर सकती है।[3]
- भाषाई इकाई को कई ध्वनिक गुणों से जोड़ा जा सकता है। उदाहरण के लिए, चिरसम्मत प्रयोग में, एल्विन लिबरमैन (1957) ने दिखाया कि /d/ के आरंभिक संक्रमण निम्नलिखित स्वरों के आधार पर भिन्न होते हैं (चित्र 1 देखें) लेकिन वे सभी श्रोताओं द्वारा फोनेमे /d/ के रूप में व्याख्या किए जाते हैं।[4]
रैखिकता और विभाजन की समस्या
हालांकि श्रोता भाषण को असतत इकाइयों (स्वर, शब्दांश और शब्द) की एक धारा के रूप में देखते हैं, भौतिक भाषण संकेत में इस रैखिकता को देखना मुश्किल है (उदाहरण के लिए चित्र 2 देखें)। वाक् ध्वनियाँ सख्ती से एक दूसरे का अनुसरण नहीं करती हैं, बल्कि, वे ओवरलैप करती हैं।[5] भाषण ध्वनि उन लोगों से प्रभावित होती है जो पूर्ववर्ती हैं और जो अनुसरण करते हैं। यह प्रभाव दो या दो से अधिक खंडों (और शब्दांश और शब्द सीमाओं के पार) की दूरी पर भी लगाया जा सकता है।[5]
क्योंकि वाक् (भाषण) संकेत रैखिक नहीं है, इसलिए विभाजन की समस्या है। एकल अवधारणात्मक इकाई से संबंधित भाषण संकेत के विस्तार को परिसीमित करना मुश्किल है। उदाहरण के रूप में, ध्वन्यात्मकता /d/ के ध्वनिक गुण निम्नलिखित स्वर के उत्पादन पर निर्भर करेंगे (कॉर्टिक्यूलेशन के कारण)।
निश्चरता का अभाव
भाषण धारणा के अनुसंधान और अनुप्रयोग को कई समस्याओं से निपटना चाहिए, जो कि अपरिवर्तनीयता की कमी का परिणाम है। किसी भाषा के स्वनिम और भाषण में उसकी ध्वनिक अभिव्यक्ति के बीच विश्वसनीय निरंतर संबंध खोजना मुश्किल होता है। इसके अनेक कारण हैं:
संदर्भ-प्रेरित भिन्नता
ध्वन्यात्मक वातावरण वाक् ध्वनियों के ध्वनिक गुणों को प्रभावित करता है। उदाहरण के लिए, अंग्रेजी में /u/ जब कोरोनल व्यंजन से घिरा होता है तो सामने होता है।[6] या, वाणी और ध्वनिरहित प्लोसिव्स के बीच की सीमा को चिह्नित करने वाली आवाज प्रारम्भ का समय प्रयोगशाला, वायुकोशीय और वेलार प्लोसिव्स के लिए अलग है और वे तनाव के तहत या एक शब्दांश के भीतर स्थिति के आधार पर बदलते हैं।[7]
अलग-अलग भाषण स्थितियों के कारण भिन्नता
भिन्नता का कारण बनने वाला एक महत्वपूर्ण कारक अलग-अलग भाषण दर है। कई ध्वन्यात्मक विरोधाभास लौकिक विशेषताओं (लघु बनाम दीर्घ स्वर या व्यंजन, एफ़्रीकेट्स बनाम फ्रिकेटिव्स, प्लोसिव्स बनाम ग्लाइड्स, वॉयस बनाम वॉयसलेस प्लोसिव्स, आदि) द्वारा गठित होते हैं और वे निश्चित रूप से बोलने की गति में बदलाव से प्रभावित होते हैं।[1]भिन्नता का एक अन्य प्रमुख स्रोत कलात्मक सावधानी बनाम ढलान है जो जुड़े हुए भाषण के लिए विशिष्ट है (आर्टिक्यूलेटरी अंडरशूट स्पष्ट रूप से निर्मित ध्वनियों के ध्वनिक गुणों में परिलक्षित होता है)।
विभिन्न वक्ता पहचान के कारण भिन्नता
ठोस भाषण निर्माण की परिणामी ध्वनिक संरचना व्यक्तिगत वक्ताओं के भौतिक और मनोवैज्ञानिक गुणों पर निर्भर करती है। पुरुष, महिलाएं और बच्चे सामान्यतः अलग-अलग पिच वाली आवाजें निकालते हैं। क्योंकि वक्ताओं के पास विभिन्न आकारों के स्वर पथ होते हैं (विशेष रूप से लिंग और आयु के कारण) गुंजयमान आवृत्तियों (प्रारूप), जो भाषण ध्वनियों की पहचान के लिए महत्वपूर्ण हैं, व्यक्तियों में उनके पूर्ण मूल्यों में भिन्न होंगे[8] (इसके उदाहरण के लिए चित्र 3 देखें)। अनुसंधान से पता चलता है कि 7.5 महीने की उम्र के शिशु विभिन्न लिंगों के वक्ताओं द्वारा प्रस्तुत जानकारी को पहचान नहीं सकते हैं; हालांकि, 10.5 महीने की उम्र तक वे समानता का पता लगा सकते हैं।[9] बोली और विदेशी लहज़े भी भिन्नता का कारण बन सकते हैं, जैसा कि वक्ता और श्रोता की सामाजिक विशेषताओं में हो सकता है।[10]
अवधारणात्मक स्थिरता और सामान्यीकरण
विभिन्न वक्ताओं और विभिन्न स्थितियों की महान विविधता के बावजूद, श्रोता स्वर और व्यंजन को निरंतर श्रेणियों के रूप में देखते हैं। यह प्रस्तावित किया गया है कि यह अवधारणात्मक सामान्यीकरण प्रक्रिया के माध्यम से प्राप्त किया जाता है जिसमें श्रोता अंतर्निहित श्रेणी तक पहुंचने के लिए शोर (अर्थात भिन्नता) को फ़िल्टर करते हैं। स्वर-पथ-आकार के अंतर के परिणामस्वरूप वक्ताओं में फॉर्मेंट-आवृत्ति भिन्नता होती है; इसलिए एक श्रोता को अपनी अवधारणात्मक प्रणाली को किसी विशेष वक्ता की ध्वनिक विशेषताओं के अनुसार समायोजित करना पड़ता है। इसे उनके निरपेक्ष मूल्यों के बजाय फॉर्मेंट्स के अनुपात पर विचार करके पूरा किया जा सकता है।[11][12][13] इस प्रक्रिया को वोकल ट्रैक्ट नॉर्मलाइजेशन (उदाहरण के लिए चित्र 3 देखें) कहा गया है। इसी तरह, माना जाता है कि श्रोता अवधि की धारणा को उस भाषण की वर्तमान गति से समायोजित करते हैं जिसे वे सुन रहे हैं - इसे भाषण दर सामान्यीकरण के रूप में जाना जाता है।
सामान्यीकरण वास्तव में होता है या नहीं और इसकी सटीक प्रकृति क्या है, यह सैद्धांतिक विवाद का विषय है (नीचे सिद्धांत देखें)। अवधारणात्मक स्थिरता एक ऐसी घटना है जो केवल भाषण धारणा के लिए विशिष्ट नहीं है; यह अन्य प्रकार की धारणा में भी उपस्थित है।
स्पष्ट धारणा
अवधारणात्मक विभेदीकरण की प्रक्रियाओं में श्रेणीबद्ध धारणा सम्मिलित है। लोग भाषण ध्वनियों को स्पष्ट रूप से समझते हैं, कहने का मतलब यह है कि वे श्रेणियों के भीतर की तुलना में श्रेणियों (फोनीम्स) के बीच के अंतर को नोटिस करने की अधिक संभावना रखते हैं। श्रेणियों के बीच अवधारणात्मक स्थान इसलिए विकृत हो गया है, आने वाली भाषण ध्वनियों के लिए श्रेणियों के केंद्र (या "प्रोटोटाइप") एक चलनी[14] या चुंबक[15] की तरह काम कर रहे हैं।
मूक और एक आवाज वाले द्विभाषी प्लोसिव के बीच एक कृत्रिम सातत्य में, प्रत्येक नया कदम वोट की मात्रा में पिछले एक से अलग होता है। पहली ध्वनि एक पूर्व-आवाज [बी] है, अर्थात इसमें नकारात्मक वीओटी है। फिर, वीओटी को बढ़ाते हुए, यह शून्य तक पहुँच जाता है, अर्थात प्लोसिव एक सादा अप्रेरित ध्वनिहीन [p] है। धीरे-धीरे, एक समय में समान मात्रा में वीओटी जोड़ने पर, अंत में प्लोसिव एक जोरदार आकांक्षा रहित ध्वनिहीन द्विभाषी [pʰ] बन जाता है। (1970 में लिस्कर और अब्रामसन द्वारा एक प्रयोग में इस तरह की निरंतरता का उपयोग किया गया था।[16] उनके द्वारा उपयोग की जाने वाली ध्वनियाँ ऑनलाइन उपलब्ध हैं।) इस निरंतरता में, उदाहरण के लिए, सात ध्वनियाँ, मूल अंग्रेजी श्रोता पहली तीन ध्वनियों को /b/ और अंतिम तीन ध्वनियों को /p/ के रूप में दो श्रेणियों के बीच स्पष्ट सीमा के साथ पहचानेंगे।[16] एक दो-वैकल्पिक पहचान (या वर्गीकरण) परीक्षण से एक असंतत वर्गीकरण फलन प्राप्त होगा (चित्र 4 में लाल वक्र देखें)।
अलग-अलग वीओटी मानों वाली दो ध्वनियों के बीच अंतर करने की क्षमता के परीक्षण में, लेकिन एक दूसरे से लगातार वीओटी दूरी (उदाहरण के लिए 20 एमएस) होने पर, यदि दोनों ध्वनियाँ एक ही श्रेणी में आती हैं और प्रत्येक ध्वनि एक अलग श्रेणी में आती है तो श्रोताओं के मौके के स्तर पर प्रदर्शन करने की संभावना है (चित्र 4 में नीला भेदभाव वक्र देखें)।
पहचान और भेदभाव परीक्षण दोनों से निष्कर्ष निकालने के लिए यह है कि श्रेणियों के बीच की सीमा को पार किया गया था या नहीं, इस पर निर्भर करते हुए श्रोताओं को वीओटी में समान सापेक्ष वृद्धि के लिए अलग संवेदनशीलता होगी। इसी तरह के अवधारणात्मक समायोजन को अन्य ध्वनिक संकेतों के साथ भी प्रमाणित किया गया है।
टॉप-डाउन प्रभाव
उत्कृष्ट प्रयोग में, रिचर्ड एम. वॉरेन (1970) ने शब्द की स्वर ध्वनि को कफ ध्वनि से बदल दिया। अवधारणात्मक रूप से, उनके विषयों ने बिना किसी कठिनाई के लापता भाषण ध्वनि को बहाल कर दिया और सटीक रूप से यह पहचान नहीं कर सके कि कौन से फोनेम को परेशान किया गया था,[17] एक घटना जिसे फोनेमिक बहाली प्रभाव के रूप में जाना जाता है। इसलिए, वाक् बोध की प्रक्रिया अनिवार्य रूप से एकदिशात्मक नहीं है।
एक अन्य बुनियादी प्रयोग ने वाक्यांश के भीतर स्वाभाविक रूप से बोले जाने वाले शब्दों की पहचान की तुलना अलगाव में समान शब्दों से की, यह पता लगाना कि धारणा सटीकता सामान्यतः बाद की स्थिति में गिर जाती है। धारणा पर सिमेंटिक ज्ञान के प्रभाव की जांच करने के लिए, गार्नेस एंड बॉन्ड (1976) ने इसी तरह के वाहक वाक्यों का उपयोग किया, जहां लक्ष्य शब्द केवल एक फोनेम (बे / डे / गे, उदाहरण के लिए) में भिन्न थे, जिनकी गुणवत्ता निरंतरता के साथ बदल गई थी। जब अलग-अलग वाक्यों में डाल दिया जाता है कि प्रत्येक स्वाभाविक रूप से एक व्याख्या का कारण बनता है, तो श्रोता पूरे वाक्य के अर्थ के अनुसार अस्पष्ट शब्दों का न्याय करते हैं [18][19]। अर्थात्, आकृति विज्ञान, वाक्य रचना, या शब्दार्थ से जुड़ी उच्च-स्तरीय भाषा प्रक्रियाएँ वाक् ध्वनियों की पहचान में सहायता के लिए मूल वाक् बोध प्रक्रियाओं के साथ परस्पर क्रिया कर सकती हैं।
यह मामला हो सकता है कि यह जरूरी नहीं है और यहां तक कि श्रोता के लिए उच्च इकाइयों को पहचानने से पहले स्वरों को पहचानना भी संभव नहीं है, जैसे कि उदाहरण के लिए शब्द। ध्वनिक संकेत से कथित इकाई की ध्वन्यात्मक संरचना के बारे में कम से कम एक मूलभूत जानकारी प्राप्त करने के बाद, श्रोता बोली जाने वाली भाषा के अपने ज्ञान का उपयोग करके लापता या शोर-मुखौटे वाले स्वरों की भरपाई कर सकते हैं। प्रतिपूरक तंत्र वाक्य स्तर पर भी काम कर सकता है जैसे कि सीखे गए गीतों, वाक्यांशों और छंदों में, एक प्रभाव जो न्यूरल कोडिंग पैटर्न द्वारा समर्थित होता है, जो मिस्ड निरंतर भाषण अंशों के अनुरूप होता है,[20] सभी प्रासंगिक नीचे-ऊपर संवेदी इनपुट की कमी के अलावा है।
अधिग्रहीत भाषा हानि
वाक् बोध की पहली परिकल्पना का उपयोग उन रोगियों के साथ किया गया था जिन्होंने श्रवण बोध की कमी प्राप्त की थी, जिसे ग्रहणशील वाचाघात के रूप में भी जाना जाता है। तब से कई अक्षमताओं को वर्गीकृत किया गया है, जिसके परिणामस्वरूप भाषण धारणा की सही परिभाषा हुई।[21] शब्द 'भाषण धारणा' रुचि की प्रक्रिया का वर्णन करता है जो जांच प्रक्रिया के उप शाब्दिक संदर्भों को नियोजित करता है। इसमें कई अलग-अलग भाषा और व्याकरण संबंधी कार्य सम्मिलित हैं, जैसे: विशेषताएं, खंड (स्वर), शब्दांश संरचना (उच्चारण की इकाई), ध्वन्यात्मक शब्द रूप (कैसे ध्वनियों को एक साथ समूहीकृत किया जाता है), व्याकरण संबंधी विशेषताएं, रूपात्मक (उपसर्ग और प्रत्यय), और अर्थपूर्ण जानकारी (शब्दों का अर्थ)। प्रारंभिक वर्षों में, वे भाषण के ध्वनिकी में अधिक रुचि रखते थे। उदाहरण के लिए, वे / बीए / या / डीए / के बीच के अंतरों को देख रहे थे, लेकिन अब शोध उत्तेजनाओं से मस्तिष्क में प्रतिक्रिया के लिए निर्देशित किया गया है। हाल के वर्षों में, भाषण धारणा कैसे काम करती है, इसकी भावना पैदा करने के लिए एक मॉडल विकसित किया गया है; इस मॉडल को डुअल स्ट्रीम मॉडल के रूप में जाना जाता है। मनोवैज्ञानिक धारणा को कैसे देखते हैं, यह मॉडल काफी हद तक बदल गया है। द्विधारा मॉडल का पहला भाग उदर मार्ग है। इस मार्ग में मध्य टेम्पोरल गाइरस, अवर टेम्पोरल सल्कस और शायद अवर टेम्पोरल गाइरस सम्मिलित हैं। वेंट्रल पाथवे लेक्सिकल या वैचारिक अभ्यावेदन के ध्वन्यात्मक प्रतिनिधित्व को दर्शाता है, जो शब्दों का अर्थ है। दोहरी धारा मॉडल का दूसरा खंड पृष्ठीय मार्ग है। इस मार्ग में सिल्वियन पारिएटोटेम्पोरल, अवर ललाट गाइरस, पूर्वकाल इंसुला और प्रीमोटर कॉर्टेक्स सम्मिलित हैं। इसका प्राथमिक कार्य संवेदी या ध्वन्यात्मक उत्तेजनाओं को लेना और इसे एक कलात्मक-मोटर प्रतिनिधित्व (भाषण का निर्माण) में स्थानांतरित करना है।[22]
भाषाघात
वाचाघात मस्तिष्क को नुकसान के कारण मस्तिष्क में भाषा प्रसंस्करण की हानि है। क्षतिग्रस्त मस्तिष्क के क्षेत्र के आधार पर भाषा प्रसंस्करण के विभिन्न हिस्सों पर प्रभाव पड़ता है, और वाचाघात को चोट के स्थान या लक्षणों के नक्षत्र के आधार पर आगे वर्गीकृत किया जाता है। ब्रोका के मस्तिष्क के क्षेत्र को नुकसान प्रायः अभिव्यंजक वाचाघात का परिणाम होता है जो भाषण उत्पादन में हानि के रूप में प्रकट होता है। वर्निक के क्षेत्र को नुकसान प्रायः ग्रहणशील वाचाघात का परिणाम होता है जहां भाषण प्रसंस्करण बिगड़ा हुआ है।[23] बिगड़ा हुआ वाक् बोध के साथ वाचाघात सामान्यतः बाएं टेम्पोरल लोब या पार्श्विका लोब में स्थित घावों या क्षति को दर्शाता है। लेक्सिकल और सिमेंटिक कठिनाइयाँ साधारण हैं, और समझ प्रभावित हो सकती है।[23]
संवेदनलोप
एग्नोसिया "सामान्यतः मस्तिष्क क्षति के परिणामस्वरूप परिचित वस्तुओं या उत्तेजनाओं को पहचानने की क्षमता का नुकसान या कमी है"।[24] कई अलग-अलग प्रकार के एग्नोसिया हैं जो हमारी हर एक इंद्रियों को प्रभावित करते हैं, लेकिन दो सबसे अधिक भाषण से संबंधित हैं, स्पीच एग्नोसिया और फोन एग्नोसिया हैं।
स्पीच एग्नोसिया: शुद्ध शब्द बहरापन, या स्पीच एग्नोसिया, एक विकार है जिसमें व्यक्ति सुनने, भाषण देने और यहां तक कि भाषण पढ़ने की क्षमता बनाए रखता है, फिर भी वे भाषण को समझने या ठीक से समझने में असमर्थ होते हैं। ऐसा लगता है कि इन रोगियों में भाषण को ठीक से संसाधित करने के लिए आवश्यक सभी कौशल हैं, फिर भी ऐसा प्रतीत होता है कि उनके पास भाषण उत्तेजनाओं से संबंधित कोई अनुभव नहीं है। मरीजों ने बताया है, "मैं आपको बात करते सुन सकता हूं, लेकिन मैं इसका अनुवाद नहीं कर सकता"।[25] भले ही वे भाषण के अर्थ को निर्धारित करने की क्षमता के बिना भाषण की उत्तेजनाओं को शारीरिक रूप से प्राप्त और संसाधित कर रहे हों, वे अनिवार्य रूप से भाषण को बिल्कुल भी समझने में असमर्थ हैं। ऐसा कोई ज्ञात उपचार नहीं है जो पाया गया है, लेकिन मामले के अध्ययन और प्रयोगों से यह ज्ञात है कि वाक् एग्नोसिया बाएं गोलार्द्ध या दोनों में घावों से संबंधित है, विशेष रूप से सही अस्थाई दुष्क्रिया है।[26]
फोनैग्नोसिया: फोनैग्नोसिया किसी भी परिचित आवाज को पहचानने में असमर्थता से जुड़ा हुआ है। इन मामलों में, भाषण उत्तेजनाओं को सुना जा सकता है और समझा भी जा सकता है लेकिन एक निश्चित आवाज के साथ भाषण का संबंध खो जाता है। यह "जटिल मुखर गुणों (टिम्ब्रे, आर्टिक्यूलेशन, और प्रोसोडी-तत्वों के असामान्य संस्करण) के कारण हो सकता है जो एक व्यक्तिगत आवाज को अलग करते हैं"। कोई ज्ञात उपचार नहीं है; हालाँकि, मिरगी की महिला की एक केस की रिपोर्ट है जो अन्य दुर्बलताओं के साथ-साथ फोनाग्नोसिया का अनुभव करने लगी। उसके ईईजी और एमआरआई परिणामों ने दिखाया "एक सही कॉर्टिकल पैरिएटल टी2-इपरिंटेनस घाव गैडोलीनियम वृद्धि के बिना और पानी के अणु प्रसार के असतत हानि के साथ"। इसलिए हालांकि कोई इलाज नहीं खोजा गया है, फोनैग्नोसिया को पोस्टिक्टल पैरिटल कॉर्टिकल डिसफंक्शन से जोड़ा जा सकता है।
शिशु भाषण धारणा
शिशु भाषण ध्वनियों के बीच बहुत छोटे अंतरों का पता लगाने में सक्षम होकर भाषा अधिग्रहण की प्रक्रिया प्रारम्भ करते हैं। वे सभी संभव भाषण विरोधाभासों (स्वनिम) में भेदभाव कर सकते हैं। धीरे-धीरे, जैसे-जैसे वे अपनी मूल भाषा के संपर्क में आते हैं, उनकी धारणा भाषा-विशिष्ट होती जाती है, यानी वे सीखते हैं कि भाषा की ध्वन्यात्मक श्रेणियों के भीतर के अंतरों को कैसे अनदेखा किया जाए (अंतर जो अन्य भाषाओं में विपरीत हो सकते हैं - उदाहरण के लिए, अंग्रेजी दो स्वरों को अलग करती है प्लोसिव्स की श्रेणियां, जबकि थाई भाषा # व्यंजन; शिशुओं को यह सीखना चाहिए कि उनकी मूल भाषा के उपयोग में कौन से अंतर विशिष्ट हैं और कौन से नहीं हैं)। चूंकि शिशु आने वाली भाषण ध्वनियों को श्रेणियों में क्रमबद्ध करना सीखते हैं, अप्रासंगिक मतभेदों को अनदेखा करते हैं और विपरीत लोगों को मजबूत करते हैं, उनकी धारणा स्पष्ट धारणा बन जाती है। शिशु लगभग 6 महीने की उम्र तक अपनी मूल भाषा के विभिन्न स्वरों की तुलना करना सीख जाते हैं। देशी व्यंजन विरोधाभास 11 या 12 महीने की उम्र तक प्राप्त कर लिए जाते हैं।[27] कुछ शोधकर्ताओं ने प्रस्तावित किया है कि भाषा अधिग्रहण में सांख्यिकीय शिक्षा नामक एक प्रक्रिया का उपयोग करके शिशु निष्क्रिय श्रवण के माध्यम से अपनी मूल भाषा की ध्वनि श्रेणियों को सीखने में सक्षम हो सकते हैं। अन्य लोग यह भी दावा करते हैं कि कुछ ध्वनि श्रेणियां सहज हैं, अर्थात, वे आनुवंशिक रूप से निर्दिष्ट हैं (श्रेणीबद्ध धारणा #अधिग्रहीत विशिष्टता के बारे में चर्चा देखें|जन्मजात बनाम अधिग्रहीत श्रेणीबद्ध विशिष्टता)।
यदि एक दिन के बच्चों को उनकी माँ की आवाज़ सामान्य रूप से, असामान्य रूप से (मोनोटोन में), और एक अजनबी की आवाज़ के साथ प्रस्तुत की जाती है, तो वे केवल अपनी माँ की सामान्य रूप से बोलने वाली आवाज़ पर प्रतिक्रिया करते हैं। जब एक मानव और एक गैर-मानव ध्वनि बजाई जाती है, तो बच्चे अपना सिर केवल मानव ध्वनि के स्रोत की ओर घुमाते हैं। यह सुझाव दिया गया है कि श्रवण सीखना प्रसव पूर्व अवधि में पहले से ही प्रारम्भ हो जाता है।[28]
यह जांचने के लिए उपयोग की जाने वाली तकनीकों में से एक है कि ऊपर उल्लिखित हेड-टर्न प्रक्रिया के अलावा शिशु भाषण को कैसे समझते हैं, उनकी चूसने की दर को मापना है। इस तरह के प्रयोग में एक बच्चा आवाज के साथ पेश करते हुए एक खास निप्पल को चूस रहा होता है। सबसे पहले, बच्चे की सामान्य चूसने की दर स्थापित की जाती है। फिर एक प्रोत्साहन बार-बार बजाया जाता है। जब बच्चा पहली बार उत्तेजना सुनता है तो चूसने की दर बढ़ जाती है लेकिन जैसे ही बच्चे को उत्तेजना की आदत हो जाती है, चूसने की दर कम हो जाती है और स्तर बंद हो जाता है। फिर, बच्चे के लिए एक नई उत्तेजना खेली जाती है। यदि बच्चा नई प्रारम्भ की गई उत्तेजना को पृष्ठभूमि उत्तेजना से अलग मानता है तो चूसने की दर में वृद्धि दिखाई देगी।[28] सक्शन-रेट (मद्यपान दर)और हेड-टर्न (सिर घुमाना) विधि भाषण धारणा का अध्ययन करने के लिए कुछ अधिक पारंपरिक, व्यवहारिक तरीके हैं। भाषण धारणा का अध्ययन करने में हमारी मदद करने वाली नई विधियों (नीचे #अनुसंधान विधियों को देखें) में शिशुओं में निकट-अवरक्त स्पेक्ट्रोस्कोपी का व्यापक रूप से उपयोग किया जाता है।[27]
यह भी पता चला है कि भले ही शिशुओं की विभिन्न भाषाओं के विभिन्न ध्वन्यात्मक गुणों के बीच अंतर करने की क्षमता नौ महीने की उम्र के आसपास कम होने लगती है, इस प्रक्रिया को पर्याप्त तरीके से नई भाषा में उजागर करके इस प्रक्रिया को उल्टा करना संभव है। पेट्रीसिया के. कुहल, फेंग-मिंग त्साओ और हुई-मेई लियू द्वारा किए गए एक शोध अध्ययन में, यह पता चला कि यदि शिशुओं से मंदारिन चीनी के एक मूल वक्ता द्वारा बात की जाती है और उनके साथ बातचीत की जाती है, तो उन्हें वास्तव में अपनी क्षमता बनाए रखने के लिए वातानुकूलित किया जा सकता है। मंदारिन के भीतर विभिन्न वाक् ध्वनियों में अंतर करने के लिए जो अंग्रेजी भाषा में पाई जाने वाली वाक् ध्वनियों से बहुत भिन्न हैं। इस प्रकार यह साबित करते हुए कि सही परिस्थितियों को देखते हुए, मूल भाषा में पाई जाने वाली भाषाओं के अलावा अन्य भाषाओं में भाषण ध्वनियों को अलग करने की क्षमता के नुकसान को रोकना संभव है।[29]
पार भाषा और दूसरी भाषा
शोध की एक बड़ी मात्रा ने अध्ययन किया है कि एक भाषा के उपयोगकर्ता विदेशी भाषा भाषण (क्रॉस-भाषा भाषण धारणा के रूप में संदर्भित) या दूसरी भाषा | दूसरी भाषा भाषण (द्वितीय भाषा भाषण धारणा) को कैसे समझते हैं। उत्तरार्द्ध दूसरी भाषा अधिग्रहण के क्षेत्र में आता है।
भाषाएं उनके ध्वन्यात्मक सूची में भिन्न होती हैं। स्वाभाविक रूप से, जब एक विदेशी भाषा का सामना करना पड़ता है तो यह मुश्किलें पैदा करता है। उदाहरण के लिए, यदि दो विदेशी-भाषा ध्वनियाँ एक ही मातृभाषा श्रेणी में आत्मसात की जाती हैं, तो उनके बीच अंतर करना बहुत मुश्किल होगा। इस स्थिति का एक उत्कृष्ट उदाहरण यह अवलोकन है कि अंग्रेजी के जापानी शिक्षार्थियों को अंग्रेजी तरल व्यंजनों /l/ और /r/ की पहचान करने या उनमें अंतर करने में समस्या होगी (जापानी बोलने वालों द्वारा अंग्रेजी की धारणा /r/ और /l/ देखें)।[30]
बेस्ट (1995) ने एक अवधारणात्मक आत्मसात मॉडल प्रस्तावित किया जो संभावित क्रॉस-लैंग्वेज श्रेणी आत्मसात पैटर्न का वर्णन करता है और उनके परिणामों की भविष्यवाणी करता है।[31] फ्लेज (1995) ने एक स्पीच लर्निंग मॉडल तैयार किया जो दूसरी-भाषा (L2) भाषण अधिग्रहण के बारे में कई परिकल्पनाओं को जोड़ता है और जो सरल शब्दों में भविष्यवाणी करता है कि एक L2 ध्वनि जो मूल भाषा (L1) ध्वनि के समान नहीं है L2 ध्वनि की तुलना में प्राप्त करना आसान है जो अपेक्षाकृत L1 ध्वनि के समान है (क्योंकि इसे शिक्षार्थी द्वारा अधिक स्पष्ट रूप से भिन्न माना जाएगा)।[32]
भाषा या श्रवण हानि में
भाषा या सुनने की अक्षमता वाले लोग भाषण को कैसे समझते हैं, इस पर शोध करना केवल संभावित उपचारों की खोज करना नहीं है। यह गैर-बिगड़ा हुआ वाक् बोध के सिद्धांतों में अंतर्दृष्टि प्रदान कर सकता है।[33] शोध के दो क्षेत्र उदाहरण के रूप में काम कर सकते हैं:
वाचाघात वाले श्रोता
Aphasia भाषा की अभिव्यक्ति और ग्रहण दोनों को प्रभावित करता है। दो सबसे साधारण प्रकार, अभिव्यंजक वाचाघात और ग्रहणशील वाचाघात कुछ हद तक वाक् धारणा को प्रभावित करते हैं। अभिव्यंजक वाचाघात भाषा को समझने में मध्यम कठिनाई का कारण बनता है। समझ पर ग्रहणशील वाचाघात का प्रभाव बहुत अधिक गंभीर है। इस बात पर सहमति है, कि अफ़ासिक अवधारणात्मक घाटे से पीड़ित हैं। वे सामान्यतः मुखरता और आवाज के स्थान को पूरी तरह से अलग नहीं कर सकते हैं।[34] जहां तक अन्य सुविधाओं का संबंध है, कठिनाइयां अलग-अलग हैं। यह अभी तक सिद्ध नहीं हुआ है कि वाचाघात पीड़ितों में निम्न-स्तरीय भाषण-धारणा कौशल प्रभावित होते हैं या क्या उनकी कठिनाइयाँ केवल उच्च-स्तर की हानि के कारण होती हैं।[34]
कर्णावत प्रत्यारोपण के साथ श्रोता
कॉकलीयर इम्प्लांट (कर्णावत प्रत्यारोपण) सेंसरिनुरल हियरिंग लॉस वाले व्यक्तियों में ध्वनिक सिग्नल तक पहुंच को पुनर्स्थापित करता है। इम्प्लांट द्वारा बताई गई ध्वनिक जानकारी सामान्यतः इम्प्लांट उपयोगकर्ताओं के लिए पर्याप्त होती है कि वे उन लोगों के भाषण को ठीक से पहचान सकें जिन्हें वे बिना किसी दृश्य सुराग के जानते हैं।[35] कर्णावत प्रत्यारोपण उपयोगकर्ताओं के लिए, अज्ञात वक्ताओं और ध्वनियों को समझना अधिक कठिन होता है। दो साल की उम्र के बाद इम्प्लांट प्राप्त करने वाले बच्चों की अवधारणात्मक क्षमता उन बच्चों की तुलना में काफी बेहतर है जिन्हें वयस्कता में प्रत्यारोपित किया गया था। अवधारणात्मक प्रदर्शन को प्रभावित करने के लिए कई कारक दिखाए गए हैं, विशेष रूप से: इम्प्लांटेशन से पहले बहरेपन की अवधि, बहरेपन की प्रारम्भ की उम्र, इम्प्लांटेशन पर उम्र (ऐसे उम्र के प्रभाव क्रिटिकल पीरियड परिकल्पना से संबंधित हो सकते हैं) और इम्प्लांट का उपयोग करने की अवधि . जन्मजात और उपार्जित बहरेपन वाले बच्चों में अंतर होता है। पहले से बधिर बच्चों की तुलना में पोस्टलिंगुअली बधिर बच्चों के बेहतर परिणाम होते हैं और कॉक्लियर इम्प्लांट के लिए तेजी से अनुकूल होते हैं।[35] कर्णावत प्रत्यारोपण और सामान्य सुनवाई वाले दोनों बच्चों में, स्वर और आवाज की प्रारम्भ का समय अभिव्यक्ति के स्थान पर भेदभाव करने की क्षमता से पहले विकास में प्रचलित हो जाता है। आरोपण के कई महीने बाद, कर्णावत प्रत्यारोपण वाले बच्चे भाषण धारणा को सामान्य कर सकते हैं।
शोर (ध्वनि)
भाषण के अध्ययन में मौलिक समस्याओं में से एक यह है कि शोर से कैसे निपटा जाए। यह मानव भाषण को पहचानने में कठिनाई के द्वारा दिखाया गया है जो कि कंप्यूटर मान्यता प्रणाली के पास है। जबकि वे भाषण को पहचानने में अच्छा कर सकते हैं यदि एक विशिष्ट वक्ता की आवाज पर और शांत परिस्थितियों में प्रशिक्षित किया जाता है, तो ये सिस्टम प्रायः अधिक यथार्थवादी सुनने की स्थितियों में खराब प्रदर्शन करते हैं जहां मनुष्य बिना किसी कठिनाई के भाषण को समझेंगे। प्रसंस्करण पैटर्न का अनुकरण करने के लिए जो सामान्य परिस्थितियों में मस्तिष्क में आयोजित किया जाएगा, पूर्व ज्ञान एक महत्वपूर्ण तंत्रिका कारक है, क्योंकि एक मजबूत सीखने का इतिहास एक हद तक निरंतर भाषण संकेतों की पूर्ण अनुपस्थिति में सम्मिलित चरम मास्किंग प्रभावों को ओवरराइड कर सकता है।[20]
संगीत-भाषा संबंध
संगीत और अनुभूति के बीच संबंध में शोध भाषण धारणा के अध्ययन से संबंधित एक उभरता हुआ क्षेत्र है। मूल रूप से यह सिद्धांत था कि संगीत के लिए तंत्रिका संकेतों को मस्तिष्क के दाहिने गोलार्ध में एक विशेष "मॉड्यूल" में संसाधित किया जाता था। इसके विपरीत, भाषा के लिए तंत्रिका संकेतों को बाएं गोलार्ध में एक समान "मॉड्यूल" द्वारा संसाधित किया जाना था।[36] हालांकि, fMRI मशीनों जैसी तकनीकों का उपयोग करते हुए, अनुसंधान ने दिखाया है कि पारंपरिक रूप से मस्तिष्क के दो क्षेत्रों को विशेष रूप से भाषण को संसाधित करने के लिए माना जाता है, ब्रोका और वर्निक के क्षेत्र, संगीत की गतिविधियों के दौरान भी सक्रिय हो जाते हैं जैसे कि म्यूजिकल कॉर्ड के क्रम को सुनना।[36] अन्य अध्ययन, जैसे कि मार्केस एट अल द्वारा किया गया एक अध्ययन। 2006 में दिखाया गया कि 8 साल के बच्चों को जिन्हें छह महीने का संगीत प्रशिक्षण दिया गया था, उनके पिच डिटेक्शन प्रदर्शन और उनके इलेक्ट्रोफिजियोलॉजिकल उपायों दोनों में वृद्धि देखी गई जब उन्हें एक अज्ञात विदेशी भाषा सुनने के लिए कहा गया।[37]
इसके विपरीत, कुछ शोधों से यह पता चला है कि संगीत हमारी वाणी की धारणा को प्रभावित करने के बजाय, हमारी मूल भाषा संगीत की हमारी धारणा को प्रभावित कर सकती है। ट्राइटोन विरोधाभास इसका एक उदाहरण है। ट्राइटोन विरोधाभास वह जगह है जहां एक श्रोता को दो कंप्यूटर-जनित टोन (जैसे सी और एफ-शार्प) के साथ प्रस्तुत किया जाता है जो आधा सप्तक (या ट्राइटोन) अलग होते हैं और फिर यह निर्धारित करने के लिए कहा जाता है कि क्या अनुक्रम की पिच अवरोही है या आरोही। सुश्री डायना ड्यूश द्वारा किए गए इस तरह के एक अध्ययन में पाया गया कि श्रोता की आरोही या अवरोही पिच की व्याख्या श्रोता की भाषा या बोली से प्रभावित थी, जो इंग्लैंड के दक्षिण में और कैलिफोर्निया में या वियतनाम में उन लोगों के बीच भिन्नता दिखाती है। वे कैलिफ़ोर्निया में जिनकी मूल भाषा अंग्रेजी थी।[36] दक्षिणी कैलिफोर्निया विश्वविद्यालय में अंग्रेजी बोलने वालों के एक समूह और पूर्वी एशियाई छात्रों के 3 समूहों पर 2006 में किए गए एक दूसरे अध्ययन में पता चला कि अंग्रेजी बोलने वालों ने 5 साल की उम्र में या उससे पहले संगीत प्रशिक्षण प्रारम्भ कर दिया था, उनके पास सही पिच होने का 8% मौका था।[36]
भाषण घटना विज्ञान
वाणी का अनुभव
केसी ओ'कैलाघन ने अपने लेख अनुभवात्मक भाषण में विश्लेषण किया है कि क्या "भाषण सुनने का अवधारणात्मक अनुभव असाधारण चरित्र में भिन्न होता है"[38] सुनी जा रही भाषा को समझने के संबंध में उनका तर्क है कि किसी भाषा को सुनते समय एक व्यक्ति का अनुभव जिसे वे समझते हैं, उनके अनुभव के विपरीत जब वे किसी ऐसी भाषा को सुनते हैं जिसके बारे में उन्हें कोई जानकारी नहीं है, तो वे अभूतपूर्व विशेषताओं में अंतर प्रदर्शित करते हैं जिसे वे परिभाषित करते हैं एक व्यक्ति के लिए "अनुभव कैसा होता है के पहलू"[38]।
यदि एक विषय जो एक भाषा बोलने वाला मूल अंग्रेजी वक्ता है, को जर्मन में भाषण की उत्तेजना के साथ प्रस्तुत किया जाता है, तो स्वरों की स्ट्रिंग केवल ध्वनि के रूप में दिखाई देगी और एक बहुत ही अलग अनुभव उत्पन्न करेगी, यदि वास्तव में एक ही उत्तेजना जर्मन बोलने वाले विषय को प्रस्तुत की गई थी। .
वह इस बात की भी जांच करता है कि जब कोई भाषा सीखता है तो भाषण की धारणा कैसे बदलती है। यदि जापानी भाषा के ज्ञान के बिना किसी विषय को जापानी भाषण की उत्तेजना के साथ प्रस्तुत किया गया था, और फिर जापानी भाषा सिखाए जाने के बाद ठीक वही उत्तेजना दी गई थी, तो इस एक ही व्यक्ति को एक अत्यंत अलग अनुभव होगा।
अनुसंधान के तरीके
वाक् बोध अनुसंधान में प्रयुक्त विधियों को मोटे तौर पर तीन समूहों में विभाजित किया जा सकता है: व्यवहारिक, कम्प्यूटेशनल और, हाल ही में, न्यूरोफिज़ियोलॉजिकल तरीके।
व्यवहार के तरीके
व्यवहार संबंधी प्रयोग एक प्रतिभागी की सक्रिय भूमिका पर आधारित होते हैं, यानी विषयों को उत्तेजना के साथ प्रस्तुत किया जाता है और उनके बारे में सचेत निर्णय लेने के लिए कहा जाता है। यह पहचान परीक्षण, भेदभाव परीक्षण, समानता रेटिंग आदि का रूप ले सकता है। इस प्रकार के प्रयोग मूल विवरण प्रदान करने में मदद करते हैं कि श्रोता कैसे वाक् ध्वनियों को देखते और वर्गीकृत करते हैं।
सिनेवेव वाणी
सिनवेव भाषण के माध्यम से भाषण धारणा का भी विश्लेषण किया गया है, सिंथेटिक भाषण का एक रूप जहां मानव आवाज को साइन लहरों द्वारा प्रतिस्थापित किया जाता है जो मूल भाषण में मौजूद आवृत्तियों और आयामों की नकल करते हैं। जब विषयों को पहली बार इस भाषण के साथ प्रस्तुत किया जाता है, तो साइनवेव भाषण को यादृच्छिक शोर के रूप में व्याख्यायित किया जाता है। लेकिन जब विषयों को सूचित किया जाता है कि उत्तेजना वास्तव में भाषण है और कहा जा रहा है कि क्या कहा जा रहा है, तो एक विशिष्ट, लगभग तत्काल बदलाव होता है[38]साइनवेव भाषण को कैसे माना जाता है।
कम्प्यूटेशनल तरीके
कम्प्यूटेशनल मॉडलिंग का उपयोग यह अनुकरण करने के लिए भी किया गया है कि मस्तिष्क द्वारा देखे गए व्यवहारों को उत्पन्न करने के लिए भाषण को कैसे संसाधित किया जा सकता है। भाषण धारणा में कई प्रश्नों को हल करने के लिए कंप्यूटर मॉडल का उपयोग किया गया है, जिसमें भाषण में उपयोग किए जाने वाले ध्वनिक संकेतों को निकालने के लिए स्वयं ध्वनि संकेत को कैसे संसाधित किया जाता है, और उच्च-स्तरीय प्रक्रियाओं जैसे शब्द पहचान के लिए भाषण जानकारी का उपयोग कैसे किया जाता है।[39]
न्यूरोफिज़ियोलॉजिकल तरीके
न्यूरोफिज़ियोलॉजिकल तरीके अधिक प्रत्यक्ष और आवश्यक रूप से सचेत (पूर्व-चौकस) प्रक्रियाओं से उपजी जानकारी के उपयोग पर निर्भर करते हैं। विषयों को विभिन्न प्रकार के कार्यों में भाषण उत्तेजनाओं के साथ प्रस्तुत किया जाता है और मस्तिष्क की प्रतिक्रियाओं को मापा जाता है। व्यवहारिक प्रतिक्रियाओं के माध्यम से ऐसा प्रतीत होता है कि मस्तिष्क स्वयं अधिक संवेदनशील हो सकता है। उदाहरण के लिए, विषय एक भेदभाव परीक्षण में दो वाक् ध्वनियों के बीच के अंतर के प्रति संवेदनशीलता नहीं दिखा सकता है, लेकिन मस्तिष्क की प्रतिक्रियाएँ इन अंतरों के प्रति संवेदनशीलता प्रकट कर सकती हैं।[27] भाषण के लिए तंत्रिका प्रतिक्रियाओं को मापने के लिए उपयोग की जाने वाली विधियों में घटना से संबंधित क्षमताएं, मैग्नेटोएन्सेफलोग्राफी और निकट अवरक्त स्पेक्ट्रोस्कोपी सम्मिलित हैं। घटना-संबंधी संभावनाओं के साथ उपयोग की जाने वाली एक महत्वपूर्ण प्रतिक्रिया बेमेल नकारात्मकता है, जो तब होती है जब भाषण उत्तेजना ध्वनिक रूप से उस उत्तेजना से भिन्न होती है जिसे विषय ने पहले सुना था।
न्यूरोफिज़ियोलॉजिकल तरीकों को कई कारणों से भाषण धारणा अनुसंधान में पेश किया गया: व्यवहार संबंधी प्रतिक्रियाएं देर से, सचेत प्रक्रियाओं को प्रतिबिंबित कर सकती हैं और ऑर्थोग्राफी जैसी अन्य प्रणालियों से प्रभावित हो सकती हैं, और इस प्रकार वे निचले स्तर के ध्वनिक वितरणों के आधार पर ध्वनि को पहचानने की वक्ता की क्षमता को छिपा सकती हैं।[40]
परीक्षण में सक्रिय भाग लेने की आवश्यकता के बिना, शिशुओं का भी परीक्षण किया जा सकता है; अधिग्रहण प्रक्रियाओं में शोध में यह विशेषता महत्वपूर्ण है। निम्न-स्तरीय श्रवण प्रक्रियाओं को उच्च-स्तर से स्वतंत्र रूप से देखने की संभावना लंबे समय से चले आ रहे सैद्धांतिक मुद्दों को संबोधित करना संभव बनाती है जैसे कि मनुष्य के पास वाक् को समझने के लिए एक विशेष मॉड्यूल है या नहीं[41][42] या वाक् ध्वनि की पहचान में कुछ जटिल ध्वनिक व्युत्क्रमण (उपरोक्त निश्चरता की कमी देखें) अंतर्निहित है या नहीं।[43]
सिद्धांत
मोटर सिद्धांत
हास्किन्स लेबोरेटरीज में एल्विन लिबरमैन और उनके सहयोगियों द्वारा भाषण ध्वनियों का अनुभव कैसे किया जाता है, इस अध्ययन में कुछ प्रारंभिक काम किए गए थे।[44] एक भाषण सिंथेसाइज़र का उपयोग करते हुए, उन्होंने भाषण ध्वनियों का निर्माण किया जो एक निरंतरता के साथ अभिव्यक्ति के स्थान पर भिन्न होती हैं /bɑ/ को /dɑ/ को /ɡɑ/. श्रोताओं को यह पहचानने के लिए कहा गया कि उन्होंने कौन सी ध्वनि सुनी और दो अलग-अलग ध्वनियों के बीच भेदभाव किया। प्रयोग के परिणामों से पता चला कि श्रोताओं ने ध्वनियों को असतत श्रेणियों में समूहीकृत किया, भले ही वे जो ध्वनियाँ सुन रहे थे वे लगातार भिन्न थीं। इन परिणामों के आधार पर, उन्होंने स्पष्ट धारणा की धारणा को एक तंत्र के रूप में प्रस्तावित किया जिसके द्वारा मनुष्य भाषण ध्वनियों की पहचान कर सकते हैं।
विभिन्न प्रकार के कार्यों और विधियों का उपयोग करते हुए हाल के शोध से पता चलता है कि भाषण धारणा के सख्त श्रेणीबद्ध खाते के विपरीत, श्रोता ध्वनि संबंधी श्रेणी के भीतर ध्वनिक मतभेदों के प्रति अत्यधिक संवेदनशील होते हैं।
स्पष्ट धारणा डेटा का एक सैद्धांतिक खाता प्रदान करने के लिए, लिबरमैन और उनके सहयोगियों ने[45] भाषण धारणा के मोटर सिद्धांत को तैयार किया, जहां "जटिल आर्टिकुलेटरी एन्कोडिंग को उत्पादन में सम्मिलित समान प्रक्रियाओं द्वारा भाषण की धारणा में डिकोड किया गया था"[1] (इसे विश्लेषण-दर-संश्लेषण के रूप में संदर्भित किया जाता है)। उदाहरण के लिए, अंग्रेजी व्यंजन /d/ विभिन्न ध्वन्यात्मक संदर्भों (ऊपर देखें) में इसके ध्वनिक विवरण में भिन्न हो सकते हैं, फिर भी एक श्रोता द्वारा माना गया सभी /d/s एक श्रेणी के अंतर्गत आते हैं (आवाज़ वाले वायुकोशीय प्लोसिव) और ऐसा इसलिए है क्योंकि " भाषाई निरूपण अमूर्त, विहित, ध्वन्यात्मक खंड या इशारों हैं जो इन खंडों के अंतर्गत आते हैं।[1] धारणा की इकाइयों का वर्णन करते समय, लिबरमैन ने बाद में आर्टिकुलेटरी मूवमेंट को छोड़ दिया और आर्टिकुलेटर्स [46] और यहां तक कि बाद में आर्टिकुलेटरी जेस्चर के लिए न्यूरल कमांड के लिए आगे बढ़े, इस प्रकार "स्पीकर के उत्पादन को निर्धारित करने वाले उच्चारण का तंत्रिका प्रतिनिधित्व डिस्टल है वस्तु को श्रोता समझता है"[47] सिद्धांत मॉड्यूलरिटी परिकल्पना से निकटता से संबंधित है, जो एक विशेष-उद्देश्य मॉड्यूल के अस्तित्व का प्रस्ताव करता है, जिसे सहज और शायद मानव-विशिष्ट माना जाता है।
श्रोताओं द्वारा "ध्वनिक संकेतों को लक्षित इशारों में कैसे अनुवादित किया जाता है, इसका विवरण प्रदान करने में सक्षम नहीं होने" के संदर्भ में इस सिद्धांत की आलोचना की गई है[48]। इसके अलावा, यह स्पष्ट नहीं है कि भाषाई रूप से प्रासंगिक जानकारी के साथ इंडेक्सिकल जानकारी (जैसे बात करने वाले की पहचान) को कैसे एन्कोड/डीकोड किया जाता है।
अनुकरणीय सिद्धांत
भाषण धारणा के अनुकरणीय मॉडल ऊपर उल्लिखित चार सिद्धांतों से भिन्न होते हैं, जो मानते हैं कि शब्द- और बात करने वाले की पहचान के बीच कोई संबंध नहीं है और यह कि बात करने वालों में भिन्नता फ़िल्टर करने के लिए शोर है।
अनुकरणीय-आधारित दृष्टिकोण दावा करते हैं कि श्रोता शब्द और बोलने वाले की पहचान दोनों के लिए जानकारी संग्रहीत करते हैं। इस सिद्धांत के अनुसार, वाक् ध्वनियों के विशेष उदाहरण श्रोता की स्मृति में संचित होते हैं। भाषण धारणा की प्रक्रिया में, याद किए गए उदाहरण उदा। श्रोता की स्मृति में संग्रहीत एक शब्दांश की तुलना आने वाली उत्तेजना से की जाती है ताकि उत्तेजना को वर्गीकृत किया जा सके। इसी तरह, जब किसी बात करने वाले को पहचानते हैं, तो उस वक्ता द्वारा किए गए उच्चारणों के सभी स्मृति निशान सक्रिय हो जाते हैं और बात करने वाले की पहचान निर्धारित हो जाती है। जॉनसन द्वारा बताए गए कई प्रयोग इस सिद्धांत का समर्थन करते हैं[13] यह सुझाव देता है कि जब हम बात करने वाले से परिचित होते हैं या जब हमारे पास बात करने वाले के लिंग का दृश्य प्रतिनिधित्व होता है तो हमारी संकेत पहचान अधिक सटीक होती है। जब बात करने वाला अप्रत्याशित होता है या लिंग की गलत पहचान होती है, तो शब्द-पहचान में त्रुटि दर बहुत अधिक होती है।
अनुकरणीय मॉडलों को कई आपत्तियों का सामना करना पड़ता है, जिनमें से दो हैं (1) कभी भी सुनी गई प्रत्येक वाणी को संग्रहीत करने के लिए अपर्याप्त स्मृति क्षमता और, जो सुना गया था उसे उत्पन्न करने की क्षमता के संबंध में, (2) क्या बात करने वाले के स्वयं के कलात्मक इशारों को भी संग्रहीत या गणना की जाती है श्रवण स्मृतियों के रूप में ध्वनि उत्पन्न करने वाले कथनों का निर्माण करते समय।[13][48]
ध्वनिक स्थलचिह्न और विशिष्ट विशेषताएं
केनेथ एन स्टीवंस ने ध्वन्यात्मक सुविधाओं और श्रवण गुणों के बीच संबंध के रूप में ध्वनिक स्थलों और विशिष्ट विशेषताओं का प्रस्ताव रखा। इस दृष्टिकोण के अनुसार, श्रोता तथाकथित ध्वनिक स्थलों के लिए आने वाले सिग्नल का निरीक्षण कर रहे हैं जो स्पेक्ट्रम में विशेष घटनाएँ हैं जो इशारों के बारे में जानकारी देती हैं जो उन्हें उत्पन्न करती हैं। चूंकि ये इशारे मनुष्यों के आर्टिकुलेटर्स की क्षमता से सीमित हैं और श्रोता उनके श्रवण संबंधी संबंधों के प्रति संवेदनशील हैं, इस मॉडल में निश्चरता का अभाव बस मौजूद नहीं है। स्थलों के ध्वनिक गुण विशिष्ट विशेषताओं को स्थापित करने का आधार बनाते हैं। उनमें से बंडल विशिष्ट रूप से ध्वन्यात्मक खंड (स्वर, शब्दांश, शब्द) निर्दिष्ट करते हैं।[49] इस मॉडल में, आने वाले ध्वनिक संकेत को पहले तथाकथित स्थलों को निर्धारित करने के लिए संसाधित माना जाता है जो सिग्नल में विशेष आवृत्ति स्पेक्ट्रम घटनाएँ हैं; उदाहरण के लिए, स्वरों को सामान्यतः पहले फॉर्मेंट की उच्च आवृत्ति द्वारा चिह्नित किया जाता है, व्यंजनों को संकेत में विच्छिन्नता के रूप में निर्दिष्ट किया जा सकता है और स्पेक्ट्रम के निचले और मध्य क्षेत्रों में कम आयाम होते हैं। ये ध्वनिक विशेषताएं अभिव्यक्ति से उत्पन्न होती हैं। वास्तव में, शोर जैसी बाहरी स्थितियों के कारण स्थलों को बढ़ाने की आवश्यकता होने पर द्वितीयक कलात्मक आंदोलनों का उपयोग किया जा सकता है। स्टीवंस का दावा है कि कॉर्टिक्यूलेशन केवल सीमित और इसके अलावा व्यवस्थित और इस प्रकार सिग्नल में अनुमानित भिन्नता का कारण बनता है जिससे श्रोता निपटने में सक्षम होता है। इस मॉडल के भीतर इसलिए, जिसे वाक् बोध कहा जाता है निश्चरता का अभाव केवल अस्तित्व में नहीं होने का दावा किया जाता है।
विशिष्ट कलात्मक घटनाओं (इशारों) को निर्धारित करने के लिए लैंडमार्क का विश्लेषण किया जाता है जो उनसे जुड़े होते हैं। अगले चरण में, ध्वनिक संकेतों को कुछ मापदंडों के मानसिक माप के माध्यम से स्थलों के आसपास के संकेत से निकाला जाता है जैसे कि वर्णक्रमीय चोटियों की आवृत्ति, कम आवृत्ति क्षेत्र में आयाम, या समय।
अगले प्रसंस्करण चरण में ध्वनिक-संकेत समेकन और विशिष्ट सुविधाओं की व्युत्पत्ति सम्मिलित है। ये अभिव्यक्ति से संबंधित बाइनरी श्रेणियां हैं (उदाहरण के लिए [+/- उच्च], [+/- वापस], [+/- गोल होंठ] स्वरों के लिए; [+/- सोनोरेंट], [+/- पार्श्व], या[+/- नासिका] व्यंजन के लिए।
इन सुविधाओं के बंडल विशिष्ट रूप से भाषण खंडों (स्वर, शब्दांश, शब्द) की पहचान करते हैं। ये खंड श्रोता की स्मृति में संग्रहीत शब्दकोष का हिस्सा हैं। इसकी इकाइयाँ लेक्सिकल एक्सेस की प्रक्रिया में सक्रिय होती हैं और मूल सिग्नल पर मैप की जाती हैं ताकि यह पता लगाया जा सके कि वे मेल खाते हैं या नहीं। यदि नहीं, तो एक अलग उम्मीदवार पैटर्न के साथ एक और प्रयास किया जाता है। इस पुनरावृत्त फैशन में, श्रोता इस प्रकार कलात्मक घटनाओं का पुनर्निर्माण करते हैं जो कथित भाषण संकेत उत्पन्न करने के लिए आवश्यक थे। इसलिए इसे विश्लेषण-दर-संश्लेषण के रूप में वर्णित किया जा सकता है।
यह सिद्धांत इस प्रकार मानता है कि भाषण धारणा की धारणा प्रक्रिया और शब्दावली अंतर्निहित भाषण के कलात्मक इशारे हैं। श्रोता वाणी संकेत का बोध कराते हैं। मॉडल उन लोगों से संबंधित है जिन्हें विश्लेषण-दर-संश्लेषण कहा जाता है।
फ़ज़ी-लॉजिकल मॉडल
डोमिनिक डब्ल्यू मस्सारो द्वारा विकसित भाषण धारणा का अस्पष्ट तार्किक सिद्धांत[50] प्रस्तावित करता है कि लोग संभाव्य, या श्रेणीबद्ध तरीके से भाषण ध्वनियों को याद करते हैं। यह सुझाव देता है कि लोग भाषा की अवधारणात्मक इकाइयों के विवरणों को याद रखते हैं, जिन्हें प्रोटोटाइप कहा जाता है। प्रत्येक प्रोटोटाइप के भीतर विभिन्न विशेषताओं का संयोजन हो सकता है। हालाँकि, सुविधाएँ केवल बाइनरी (सत्य या असत्य) नहीं हैं, एक फजी लॉजिक मान है जो इस बात की संभावना के अनुरूप है कि ध्वनि किसी विशेष भाषण श्रेणी से संबंधित है। इस प्रकार, जब एक भाषण संकेत को देखते हुए हम वास्तव में जो सुनते हैं, उसके बारे में हमारा निर्णय प्रोत्साहन की जानकारी और विशेष प्रोटोटाइप के मूल्यों के बीच मैच की सापेक्ष अच्छाई पर आधारित होता है। अंतिम निर्णय कई विशेषताओं या सूचना के स्रोतों, यहां तक कि दृश्य जानकारी (यह मैकगर्क प्रभाव की व्याख्या करता है) पर आधारित है।[48] फ़ज़ी लॉजिकल थ्योरी के कंप्यूटर मॉडल का उपयोग यह प्रदर्शित करने के लिए किया गया है कि थ्योरी की भविष्यवाणियाँ कैसे बोली जाती हैं, मानव श्रोताओं के व्यवहार के अनुरूप होती हैं।[51]
भाषण मोड परिकल्पना
भाषण मोड परिकल्पना यह विचार है कि भाषण की धारणा के लिए विशेष मानसिक प्रसंस्करण के उपयोग की आवश्यकता होती है।[52][53] स्पीच मोड परिकल्पना फोडर के मॉड्यूलरिटी सिद्धांत की एक शाखा है (दिमाग की मॉड्यूलरिटी देखें)। यह एक लंबवत प्रसंस्करण तंत्र का उपयोग करता है जहां सीमित उत्तेजनाओं को मस्तिष्क के विशेष-उद्देश्य वाले क्षेत्रों द्वारा संसाधित किया जाता है जो उत्तेजना विशिष्ट होते हैं।[53]
भाषण विधा परिकल्पना के दो संस्करण:[52]
- कमजोर संस्करण - भाषण सुनने से भाषा का पिछला ज्ञान जुड़ जाता है।
- मजबूत संस्करण - विशेष भाषण तंत्र भाषण सुनने के लिए भाषण को समझने में संलग्न है।
वाक् विधा परिकल्पना के प्रमाण खोजने के लिए खोज में तीन महत्वपूर्ण प्रयोगात्मक प्रतिमान विकसित हुए हैं। ये द्वैतिक श्रवण, श्रेणीबद्ध बोध और द्वैध बोध हैं।[52] इन श्रेणियों में अनुसंधान के माध्यम से यह पाया गया है कि एक विशिष्ट भाषण मोड नहीं हो सकता है, बल्कि श्रवण कोड के लिए एक जटिल श्रवण प्रसंस्करण की आवश्यकता होती है। इसके अलावा ऐसा लगता है कि अवधारणात्मक प्रणालियों में प्रतिरूपकता सीखी जाती है।[52] इसके बावजूद भाषण मोड परिकल्पना के लिए सबूत और प्रति-साक्ष्य अभी भी अस्पष्ट हैं और आगे के शोध की आवश्यकता है।
प्रत्यक्ष यथार्थवादी सिद्धांत
भाषण धारणा का प्रत्यक्ष यथार्थवादी सिद्धांत (ज्यादातर कैरोल फाउलर से जुड़ा हुआ है) प्रत्यक्ष यथार्थवाद के अधिक सामान्य सिद्धांत का एक हिस्सा है, जो उस धारणा को मानता है जिससे हमें दुनिया के प्रत्यक्ष जागरूकता की अनुमति मिलती है क्योंकि इसमें दूर के स्रोत की प्रत्यक्ष वसूली सम्मिलित होती है जिस घटना का आभास होता है।भाषण धारणा के लिए, सिद्धांत का दावा है कि धारणा की वस्तुएं वास्तविक स्वर पथ आंदोलनों, या इशारों हैं, न कि अमूर्त स्वरों या (मोटर थ्योरी के रूप में) घटनाएं जो इन आंदोलनों के कारण पूर्ववर्ती हैं, अर्थात संकेत। श्रोता संकेतों को एक विशेष डिकोडर (मोटर थ्योरी के रूप में) के माध्यम से नहीं देखते हैं, बल्कि इसलिए कि ध्वनिक संकेत में जानकारी इशारों को निर्दिष्ट करती है जो इसे बनाते हैं।[54] यह दावा करते हुए कि विभिन्न वाक् ध्वनियों को उत्पन्न करने वाले वास्तविक कलात्मक हाव-भाव स्वयं वाक् बोध की इकाइयाँ हैं, सिद्धांत अविच्छिन्नता की कमी की समस्या को दूर कर देता है।
यह भी देखें
- जिनी (जंगली बच्चे) की केस स्टडी से संबंधित
- न्यूरोकंप्यूटेशनल भाषण प्रसंस्करण
- बहुसंवेदी एकीकरण
- भाषण की उत्पत्ति
- भाषण भाषा पैथोलॉजी
- भाषण धारणा का मोटर सिद्धांत
संदर्भ
- ↑ 1.0 1.1 1.2 1.3 Nygaard, L.C., Pisoni, D.B. (1995). "Speech Perception: New Directions in Research and Theory". In J.L. Miller; P.D. Eimas (eds.). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press.
{{cite encyclopedia}}
: CS1 maint: multiple names: authors list (link) - ↑ Klatt, D.H. (1976). "Linguistic uses of segmental duration in English: Acoustic and perceptual evidence". Journal of the Acoustical Society of America. 59 (5): 1208–1221. Bibcode:1976ASAJ...59.1208K. doi:10.1121/1.380986. PMID 956516.
- ↑ Halle, M., Mohanan, K.P. (1985). "आधुनिक अंग्रेजी की खंडीय ध्वन्यात्मकता". Linguistic Inquiry. 16 (1): 57–116.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Liberman, A.M. (1957). "भाषण धारणा पर शोध के कुछ परिणाम" (PDF). Journal of the Acoustical Society of America. 29 (1): 117–123. Bibcode:1957ASAJ...29..117L. doi:10.1121/1.1908635. hdl:11858/00-001M-0000-002C-5789-A. Retrieved 2007-05-17.
- ↑ 5.0 5.1 Fowler, C.A. (1995). "भाषण उत्पादन". In J.L. Miller; P.D. Eimas (eds.). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press.
- ↑ Hillenbrand, J.M., Clark, M.J., Nearey, T.M. (2001). "स्वर बनाने वाले पैटर्न पर व्यंजन वातावरण का प्रभाव". Journal of the Acoustical Society of America. 109 (2): 748–763. Bibcode:2001ASAJ..109..748H. doi:10.1121/1.1337959. PMID 11248979. S2CID 10751216.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Lisker, L., Abramson, A.S. (1967). "अंग्रेजी प्लोसिव्स में आवाज की शुरुआत के समय पर संदर्भ के कुछ प्रभाव" (PDF). Language and Speech. 10 (1): 1–28. doi:10.1177/002383096701000101. PMID 6044530. S2CID 34616732. Retrieved 2007-05-17.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ 8.0 8.1 Hillenbrand, J., Getty, L.A., Clark, M.J., Wheeler, K. (1995). "अमेरिकी अंग्रेजी स्वरों की ध्वनिक विशेषताएं". Journal of the Acoustical Society of America. 97 (5 Pt 1): 3099–3111. Bibcode:1995ASAJ...97.3099H. doi:10.1121/1.411872. PMID 7759650. S2CID 10104073.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Houston, Derek M.; Juscyk, Peter W. (October 2000). "शिशुओं द्वारा शब्द विभाजन में वार्ताकार-विशिष्ट जानकारी की भूमिका" (PDF). Journal of Experimental Psychology: Human Perception and Performance. 26 (5): 1570–1582. doi:10.1037/0096-1523.26.5.1570. PMID 11039485. Archived from the original (PDF) on 2014-04-30. Retrieved 1 March 2012.
- ↑ Hay, Jennifer; Drager, Katie (2010). "भरवां खिलौने और भाषण धारणा". Linguistics. 48 (4): 865–892. doi:10.1515/LING.2010.027. S2CID 143639653.
- ↑ 11.0 11.1 Syrdal, A.K.; Gopal, H.S. (1986). "अमेरिकी अंग्रेजी स्वरों के श्रवण प्रतिनिधित्व के आधार पर स्वर पहचान का एक अवधारणात्मक मॉडल". Journal of the Acoustical Society of America. 79 (4): 1086–1100. Bibcode:1986ASAJ...79.1086S. doi:10.1121/1.393381. PMID 3700864.
- ↑ Strange, W. (1999). "Perception of vowels: Dynamic constancy". In J.M. Pickett (ed.). The Acoustics of Speech Communication: Fundamentals, Speech Perception Theory, and Technology. Needham Heights (MA): Allyn & Bacon.
- ↑ 13.0 13.1 13.2 Johnson, K. (2005). "भाषण धारणा में अध्यक्ष सामान्यीकरण" (PDF). In Pisoni, D.B.; Remez, R. (eds.). The Handbook of Speech Perception. Oxford: Blackwell Publishers. Retrieved 2007-05-17.
- ↑ Trubetzkoy, Nikolay S. (1969). ध्वन्यात्मकता के सिद्धांत. Berkeley and Los Angeles: University of California Press. ISBN 978-0-520-01535-7.
- ↑ Iverson, P., Kuhl, P.K. (1995). "सिग्नल डिटेक्शन सिद्धांत और बहुआयामी स्केलिंग का उपयोग करके भाषण के लिए अवधारणात्मक चुंबक प्रभाव का मानचित्रण करना". Journal of the Acoustical Society of America. 97 (1): 553–562. Bibcode:1995ASAJ...97..553I. doi:10.1121/1.412280. PMID 7860832.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ 16.0 16.1 Lisker, L., Abramson, A.S. (1970). "The voicing dimension: Some experiments in comparative phonetics" (PDF). Proc. 6th International Congress of Phonetic Sciences. Prague: Academia. pp. 563–567. Retrieved 2007-05-17.
{{cite conference}}
: CS1 maint: multiple names: authors list (link) - ↑ Warren, R.M. (1970). "लापता भाषण ध्वनियों की बहाली". Science. 167 (3917): 392–393. Bibcode:1970Sci...167..392W. doi:10.1126/science.167.3917.392. PMID 5409744. S2CID 30356740.
- ↑ Garnes, S., Bond, Z.S. (1976). "ध्वनिक सूचना और सिमेंटिक अपेक्षा के बीच संबंध". Phonologica 1976. Innsbruck. pp. 285–293.
{{cite conference}}
: CS1 maint: multiple names: authors list (link) - ↑ Jongman A, Wang Y, Kim BH (December 2003). "नॉनसिबिलेंट फ्रिकेटिव्स की धारणा के लिए शब्दार्थ और चेहरे की जानकारी का योगदान" (PDF). J. Speech Lang. Hear. Res. 46 (6): 1367–77. doi:10.1044/1092-4388(2003/106). hdl:1808/13411. PMID 14700361. Archived from the original (PDF) on 2013-06-14. Retrieved 2017-09-14.
- ↑ 20.0 20.1 Cervantes Constantino, F; Simon, JZ (2018). "निरंतर भाषण के तंत्रिका प्रसंस्करण की बहाली और दक्षता को पूर्व ज्ञान द्वारा बढ़ावा दिया जाता है". Frontiers in Systems Neuroscience. 12 (56): 56. doi:10.3389/fnsys.2018.00056. PMC 6220042. PMID 30429778.
- ↑ Poeppel, David; Monahan, Philip J. (2008). "Speech Perception: Cognitive Foundations and Cortical Implementation". Current Directions in Psychological Science. 17 (2): 80–85. doi:10.1111/j.1467-8721.2008.00553.x. ISSN 0963-7214. S2CID 18628411.
- ↑ Hickok G, Poeppel D (May 2007). "भाषण प्रसंस्करण का कॉर्टिकल संगठन". Nat. Rev. Neurosci. 8 (5): 393–402. doi:10.1038/nrn2113. PMID 17431404. S2CID 6199399.
- ↑ 23.0 23.1 Hessler, Dorte; Jonkers, Bastiaanse (December 2010). "वाक्पटु वाक् बोध पर ध्वन्यात्मक आयामों का प्रभाव". Clinical Linguistics and Phonetics. 12. 24 (12): 980–996. doi:10.3109/02699206.2010.507297. PMID 20887215. S2CID 26478503.
- ↑ "एग्नोसिया की परिभाषा". www.merriam-webster.com (in English). Retrieved 2017-12-15.
- ↑ Howard, Harry (2017). "मस्तिष्क और भाषा में आपका स्वागत है". मस्तिष्क और भाषा में आपका स्वागत है.
- ↑ Lambert, J. (1999). "भाषण धारणा के सापेक्ष बख्शते के साथ श्रवण एग्नोसिया". Neurocase. 5 (5): 71–82. doi:10.1093/neucas/5.5.394. PMID 2707006.
- ↑ 27.0 27.1 27.2 Minagawa-Kawai, Y., Mori, K., Naoi, N., Kojima, S. (2006). "एक भाषा-विशिष्ट फोनेमिक कंट्रास्ट के अधिग्रहण के दौरान शिशुओं में न्यूरल एट्यूनमेंट प्रक्रियाएं". The Journal of Neuroscience. 27 (2): 315–321. doi:10.1523/JNEUROSCI.1984-06.2007. PMC 6672067. PMID 17215392.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ 28.0 28.1 Crystal, David (2005). भाषा का कैम्ब्रिज एनसाइक्लोपीडिया. Cambridge: CUP. ISBN 978-0-521-55967-6.
- ↑ Kuhl, Patricia K.; Feng-Ming Tsao; Huei-Mei Liu (July 2003). "Foreign-language experience in infancy: Effects of short-term exposure and social interaction on phonetic learning". Proceedings of the National Academy of Sciences. 100 (15): 9096–9101. Bibcode:2003PNAS..100.9096K. doi:10.1073/pnas.1532872100. PMC 166444. PMID 12861072.
- ↑ Iverson, P., Kuhl, P.K., Akahane-Yamada, R., Diesh, E., Thokura, Y., Kettermann, A., Siebert, C. (2003). "गैर-देशी स्वरों के लिए अधिग्रहण की कठिनाइयों का एक अवधारणात्मक हस्तक्षेप खाता". Cognition. 89 (1): B47–B57. doi:10.1016/S0010-0277(02)00198-1. PMID 12499111. S2CID 463529.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Best, C. T. (1995). "A direct realist view of cross-language speech perception: New Directions in Research and Theory". In Winifred Strange (ed.). Speech perception and linguistic experience: Theoretical and methodological issues. Baltimore: York Press. pp. 171–204.
- ↑ Flege, J. (1995). "Second language speech learning: Theory, findings and problems". In Winifred Strange (ed.). Speech perception and linguistic experience: Theoretical and methodological issues. Baltimore: York Press. pp. 233–277.
- ↑ Uhler; Yoshinaga-Itano; Gabbard; Rothpletz; Jenkins (March 2011). "युवा कर्णावत प्रत्यारोपण उपयोगकर्ताओं में शिशु भाषण धारणा". Journal of the American Academy of Audiology. 22 (3): 129–142. doi:10.3766/jaaa.22.3.2. PMID 21545766.
- ↑ 34.0 34.1 Csépe, V.; Osman-Sagi, J.; Molnar, M.; Gosy, M. (2001). "Impaired speech perception in aphasic patients: event-related potential and neuropsychological assessment". Neuropsychologia. 39 (11): 1194–1208. doi:10.1016/S0028-3932(01)00052-5. PMID 11527557. S2CID 17307242.
- ↑ 35.0 35.1 Loizou, P. (1998). "कर्णावत प्रत्यारोपण का परिचय". IEEE Signal Processing Magazine. 39 (11): 101–130. doi:10.1109/79.708543.
- ↑ 36.0 36.1 36.2 36.3 Deutsch, Diana; Henthorn, Trevor; Dolson, Mark (Spring 2004). "जीवन की शुरुआत में सुनाई देने वाले भाषण पैटर्न बाद में ट्राइटोन विरोधाभास की धारणा को प्रभावित करते हैं" (PDF). Music Perception. 21 (3): 357–72. doi:10.1525/mp.2004.21.3.357. Retrieved 29 April 2014.
- ↑ Marques, C et al. (2007). Musicians detect pitch violation in foreign language better than nonmusicians: Behavioral and electrophysiological evidence. "Journal of Cognitive Neuroscience, 19", 1453-1463.
- ↑ 38.0 38.1 38.2 O'Callaghan, Casey (2010). "वाणी का अनुभव करना". Philosophical Issues. 20: 305–327. doi:10.1111/j.1533-6077.2010.00186.x.
- ↑ McClelland, J.L. & Elman, J.L. (1986). "भाषण धारणा का TRACE मॉडल" (PDF). Cognitive Psychology. 18 (1): 1–86. doi:10.1016/0010-0285(86)90015-0. PMID 3753912. S2CID 7428866. Archived from the original (PDF) on 2007-04-21. Retrieved 2007-05-19.
- ↑ Kazanina, N., Phillips, C., Idsardi, W. (2006). "भाषण ध्वनियों की धारणा पर अर्थ का प्रभाव" (PDF). PNAS. Vol. 30. pp. 11381–11386. Retrieved 2007-05-19.
{{cite conference}}
: CS1 maint: multiple names: authors list (link)[permanent dead link] - ↑ Gocken, J.M. & Fox R.A. (2001). "एक विशिष्ट ध्वन्यात्मक प्रसंस्करण मॉड्यूल के समर्थन में न्यूरोलॉजिकल साक्ष्य". Brain and Language. 78 (2): 241–253. doi:10.1006/brln.2001.2467. PMID 11500073. S2CID 28469116.
- ↑ Dehaene-Lambertz, G., Pallier, C., Serniclaes, W., Sprenger-Charolles, L., Jobert, A., & Dehaene, S. (2005). "तंत्रिका श्रवण से भाषण धारणा पर स्विच करने का संबंध है" (PDF). NeuroImage. 24 (1): 21–33. doi:10.1016/j.neuroimage.2004.09.039. PMID 15588593. S2CID 11899232. Retrieved 2007-07-04.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Näätänen, R. (2001). "बेमेल नकारात्मकता (MMN) और इसके चुंबकीय समकक्ष (MMNm) द्वारा परिलक्षित मानव मस्तिष्क द्वारा भाषण की धारणा". Psychophysiology. 38 (1): 1–21. doi:10.1111/1469-8986.3810001. PMID 11321610.
- ↑ Liberman, A.M., Harris, K.S., Hoffman, H.S., Griffith, B.C. (1957). "भाषण का भेदभाव ध्वन्यात्मक सीमाओं के भीतर और बाहर लगता है" (PDF). Journal of Experimental Psychology. 54 (5): 358–368. doi:10.1037/h0044417. PMID 13481283. Retrieved 2007-05-18.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Liberman, A.M., Cooper, F.S., Shankweiler, D.P., & Studdert-Kennedy, M. (1967). "भाषण कोड की धारणा" (PDF). Psychological Review. 74 (6): 431–461. doi:10.1037/h0020279. PMID 4170865. Retrieved 2007-05-19.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Liberman, A.M. (1970). "भाषण और भाषा के व्याकरण" (PDF). Cognitive Psychology. 1 (4): 301–323. doi:10.1016/0010-0285(70)90018-6. Retrieved 2007-07-19.
- ↑ Liberman, A.M. & Mattingly, I.G. (1985). "भाषण धारणा का मोटर सिद्धांत संशोधित" (PDF). Cognition. 21 (1): 1–36. CiteSeerX 10.1.1.330.220. doi:10.1016/0010-0277(85)90021-6. PMID 4075760. S2CID 112932. Retrieved 2007-07-19.
- ↑ 48.0 48.1 48.2 Hayward, Katrina (2000). Experimental Phonetics: An Introduction. Harlow: Longman.
- ↑ Stevens, K.N. (2002). "ध्वनिक स्थलों और विशिष्ट विशेषताओं के आधार पर शाब्दिक पहुंच के एक मॉडल की ओर" (PDF). Journal of the Acoustical Society of America. 111 (4): 1872–1891. Bibcode:2002ASAJ..111.1872S. doi:10.1121/1.1458026. PMID 12002871. Archived from the original (PDF) on 2007-06-09. Retrieved 2007-05-17.
- ↑ Massaro, D.W. (1989). "TRACE मॉडल और भाषण धारणा के फ़ज़ी लॉजिकल मॉडल के बीच परीक्षण". Cognitive Psychology. 21 (3): 398–421. doi:10.1016/0010-0285(89)90014-5. PMID 2758786. S2CID 7629786.
- ↑ Oden, G.C., Massaro, D.W. (1978). "भाषण धारणा में करतब की जानकारी का एकीकरण". Psychological Review. 85 (3): 172–191. doi:10.1037/0033-295X.85.3.172. PMID 663005.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ 52.0 52.1 52.2 52.3 Ingram, John. C.L. (2007). Neurolinguistics: An Introduction to Spoken Language Processing and its Disorders. Cambridge: Cambridge University Press. pp. 113–127.
- ↑ 53.0 53.1 Parker, Ellen M.; R.L. Diehl; K.R. Kluender (1986). "वाक् और अवाक् में व्यापारिक संबंध". Attention, Perception, & Psychophysics. 39 (2): 129–142. doi:10.3758/bf03211495. PMID 3725537.
- ↑ Randy L. Diehl; Andrew J. Lotto; Lori L. Holt (2004). "वाणी धारणा". Annual Review of Psychology. 55 (1): 149–179. doi:10.1146/annurev.psych.55.090902.142028. PMID 14744213. S2CID 937985.