अक्षर-विभाजन: Difference between revisions

From Vigyanwiki
Line 7: Line 7:


==संक्षिप्त विवरण==
==संक्षिप्त विवरण==
अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक [[हैफ़ेन|योजक चिन्ह]] द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा [[अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला]] में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, {{IPA|[ˈsɪl.ə.bᵊɫ]}})। प्रस्तुतिकरण उद्देश्यों के लिए, [[टाइपोग्राफर]] [[इंटरपंकट]] ([[यूनिकोड]] वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), एक विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या एक [[स्थान (विराम चिह्न)]] का उपयोग कर सकते हैं ) (उदाहरण के लिए, syl la ble)।
अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक [[हैफ़ेन|योजक चिन्ह]] द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा [[अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला]] में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, {{IPA|[ˈsɪl.ə.bᵊɫ]}})। प्रस्तुतिकरण उद्देश्यों के लिए, [[टाइपोग्राफर]] [[इंटरपंकट]] ([[यूनिकोड]] वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या [[स्थान (विराम चिह्न)|अंतराल]] का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।


एक पंक्ति के अंत में, एक शब्द को लिखित रूप में भागों में विभाजित किया जाता है, जिसे पारंपरिक रूप से शब्दांश कहा जाता है, यदि यह पंक्ति में फिट नहीं होता है और यदि इसे अगली पंक्ति में ले जाने से पहली पंक्ति अन्य की तुलना में बहुत छोटी हो जाएगी। बहुत लंबे शब्दों और समाचार पत्रों में संकीर्ण स्तंभों के साथ यह एक विशेष समस्या हो सकती है। [[ शब्द संसाधन ]] ने [[औचित्य (टाइपसेटिंग)]] की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण अक्सर अनावश्यक हो जाता है।
किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। बहुत लंबे शब्दों और समाचार पत्रों में संकीर्ण स्तंभों के साथ यह एक विशेष समस्या हो सकती है। [[ शब्द संसाधन ]] ने [[औचित्य (टाइपसेटिंग)]] की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण अक्सर अनावश्यक हो जाता है।


कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। हालाँकि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर पत्राचार के कारण, अंग्रेजी में लिखित शब्दांशीकरण [[ध्वन्यात्मक]] सिद्धांतों के बजाय ज्यादातर [[व्युत्पत्ति]] विज्ञान या [[आकृति विज्ञान (भाषा विज्ञान)]] पर आधारित है। उदाहरण के लिए, सीखने को जीवित भाषा के सही शब्दांश के अनुसार सीखना-सीखना संभव नहीं है। किसी पंक्ति के अंत में केवल लीयर- देखने से पाठक शब्द का गलत उच्चारण करने में भ्रमित हो सकता है, क्योंकि [[डिग्राफ (शब्दावली)]] ईए अंग्रेजी वर्तनी#ध्वनि-से-वर्तनी के अनुरूप हो सकता है। अंग्रेजी शब्दावली का इतिहास ऐसी घटनाओं का विवरण देता है।
कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। हालाँकि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर पत्राचार के कारण, अंग्रेजी में लिखित शब्दांशीकरण [[ध्वन्यात्मक]] सिद्धांतों के बजाय ज्यादातर [[व्युत्पत्ति]] विज्ञान या [[आकृति विज्ञान (भाषा विज्ञान)]] पर आधारित है। उदाहरण के लिए, सीखने को जीवित भाषा के सही शब्दांश के अनुसार सीखना-सीखना संभव नहीं है। किसी पंक्ति के अंत में केवल लीयर- देखने से पाठक शब्द का गलत उच्चारण करने में भ्रमित हो सकता है, क्योंकि [[डिग्राफ (शब्दावली)]] ईए अंग्रेजी वर्तनी#ध्वनि-से-वर्तनी के अनुरूप हो सकता है। अंग्रेजी शब्दावली का इतिहास ऐसी घटनाओं का विवरण देता है।

Revision as of 23:35, 15 July 2023

शब्दांशीकरण (/sɪˌlæbɪfɪˈkʃən/) या शब्दांश (/sɪˌlæbɪˈkʃən/), जिसे हाइफ़नेशन के रूप में भी जाना जाता है, किसी मौखिक, लिखित या हस्ताक्षरित शब्द को शब्दांशो में विभाजित करने की प्रक्रिया है[1]


संक्षिप्त विवरण

अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक योजक चिन्ह द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, [ˈsɪl.ə.bᵊɫ])। प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या अंतराल का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।

किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। बहुत लंबे शब्दों और समाचार पत्रों में संकीर्ण स्तंभों के साथ यह एक विशेष समस्या हो सकती है। शब्द संसाधन ने औचित्य (टाइपसेटिंग) की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण अक्सर अनावश्यक हो जाता है।

कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। हालाँकि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर पत्राचार के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के बजाय ज्यादातर व्युत्पत्ति विज्ञान या आकृति विज्ञान (भाषा विज्ञान) पर आधारित है। उदाहरण के लिए, सीखने को जीवित भाषा के सही शब्दांश के अनुसार सीखना-सीखना संभव नहीं है। किसी पंक्ति के अंत में केवल लीयर- देखने से पाठक शब्द का गलत उच्चारण करने में भ्रमित हो सकता है, क्योंकि डिग्राफ (शब्दावली) ईए अंग्रेजी वर्तनी#ध्वनि-से-वर्तनी के अनुरूप हो सकता है। अंग्रेजी शब्दावली का इतिहास ऐसी घटनाओं का विवरण देता है।

अंग्रेजी लिखित शब्दांश इसलिए शब्दांश की एक अवधारणा से संबंधित है जो ध्वन्यात्मक (रूपात्मक के विपरीत) इकाई की भाषाई अवधारणा के अनुरूप नहीं है।

परिणामस्वरूप, अधिकांश देशी अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल सामान्यतः शब्दकोश से परामर्श लेने के अलावा इस विषय पर अधिक सलाह नहीं देते हैं। इसके अलावा, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक ​​कि एक ही अंग्रेजी किस्म के शब्दकोशों के बीच भी अंतर हैं।

फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा (गंभीरता से ) और अन्य लगभग ध्वन्यात्मक रूप से वर्तनी वाली भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी मौजूदा या नव निर्मित शब्द को सही ढंग से बना सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न को छोड़ा जा सकता है।

एल्गोरिदम

Unsolved problem in computer science:

Is there any perfect syllabification algorithm in English language?

हाइफ़नेशन एल्गोरिदम नियमों का एक सेट है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर एक शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक हाइफ़नेशन एल्गोरिदम यह तय कर सकता है कि महाभियोग को महाभियोग-मेंट या इम-पीचमेंट के रूप में तोड़ा जा सकता है, लेकिन इम्पेचमेंट के रूप में नहीं।

शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ हाइफ़नेशन पर भिन्न होती हैं[citation needed]: अमेरिकी अंग्रेजी ध्वनि पर काम करती है, लेकिन ब्रिटिश अंग्रेजी शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो मामलों को और अधिक जटिल बनाते हैं।

अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं।[2] हाइफ़नेशन के लिए कलन विधि दृष्टिकोण के बीच, TeX में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसेटिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।[3] लिआंग के काम का उद्देश्य एल्गोरिदम को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।

अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।[4]


TeX में

TeX हाइफ़नेशन एल्गोरिदम के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल (प्रोग्रामिंग भाषा), जावास्क्रिप्ट, पर्ल, परिशिष्ट भाग , पायथन (प्रोग्रामिंग भाषा), रूबी (प्रोग्रामिंग भाषा), सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है \showhyphens.

LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:

\हाइफ़नेशन{शब्द}

\hyphenation ई> कमांड अनुमत हाइफ़नेशन बिंदुओं की घोषणा करता है जिसमें शब्द रिक्त स्थान द्वारा अलग किए गए शब्दों की एक सूची है, जिसमें प्रत्येक हाइफ़नेशन बिंदु को एक द्वारा दर्शाया जाता है - चरित्र। उदाहरण के लिए,

\हाइफ़नेशन{फोरट्रान एर-गो-नो-माइक}

घोषणा करता है कि वर्तमान कार्य में फोरट्रान को हाइफ़न नहीं किया जाना चाहिए और यदि एर्गोनोमिक को हाइफ़न किया जाना चाहिए, तो यह संकेतित बिंदुओं में से एक पर होगा।[5] हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक \hyphenation कमांड डिफ़ॉल्ट रूप से केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।[6][7]


यह भी देखें

टिप्पणियाँ

  1. Baus C, Gutiérrez E, Carreiras M. The role of syllables in sign language production. Front Psychol. 2014;5:1254. Published 2014 Nov 13. doi:10.3389/fpsyg.2014.01254
  2. Major Keary. "हाइफ़नेशन पर - पांडित्य की अराजकता". PC Update. Australia: Melbourne PC User Group. Archived from the original on March 10, 2005. Retrieved Oct 6, 2005.
  3. Liang, Franklin Mark (Aug 1983), "Word Hy-phen-a-tion by Com-pu-ter", PhD dissertation, Stanford University Department of Computer Science, STAN-CS-83-977
  4. "सादा TeX हाइफ़नेशन तालिकाएँ". Retrieved June 23, 2009.
  5. "\hyphenation". Hypertext Help with LaTeX. Yale.
  6. "उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है". TeX FAQ.
  7. "How does hyphenation work in TeX?". Tex FAQ.


बाहरी संबंध