अक्षर-विभाजन: Difference between revisions
(→टेक्स) |
|||
Line 49: | Line 49: | ||
<pre>\hyphenation{फोर्ट्रैन इर्गोनॉमिक}</pre> | <pre>\hyphenation{फोर्ट्रैन इर्गोनॉमिक}</pre> | ||
इससे स्पष्ट होता है कि वर्तमान कार्य में "फोर्ट्रैन" को | इससे स्पष्ट होता है कि वर्तमान कार्य में "फोर्ट्रैन" को शब्दांसिकृत नहीं किया जाना चाहिए और यदि "इर्गोनॉमिक" को हायफेनेट किया जाना आवश्यक है, तो यह वहां दिखाए गए बिन्दुओ में से किसी एक पर होगा।<ref>{{cite web |url= http://noodle.med.yale.edu/latex/latex2e-html/ltx-244.html |title= \hyphenation |work= Hypertext Help with LaTeX |publisher= Yale }}</ref> | ||
हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक <code>\hyphenation</code> कमांड डिफ़ॉल्ट रूप से केवल [[ASCII]] अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।<ref>{{cite web |url= https://texfaq.org/FAQ-hyphenaccents |title= उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है|work= TeX FAQ }}</ref><ref>{{cite web |url= https://texfaq.org/FAQ-hyphen |title= How does hyphenation work in TeX? |work= Tex FAQ }}</ref> | हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक <code>\hyphenation</code> कमांड डिफ़ॉल्ट रूप से केवल [[ASCII]] अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।<ref>{{cite web |url= https://texfaq.org/FAQ-hyphenaccents |title= उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है|work= TeX FAQ }}</ref><ref>{{cite web |url= https://texfaq.org/FAQ-hyphen |title= How does hyphenation work in TeX? |work= Tex FAQ }}</ref> | ||
Revision as of 01:52, 16 July 2023
शब्दांशीकरण (/sɪˌlæbɪfɪˈkeɪʃən/) या शब्दांश (/sɪˌlæbɪˈkeɪʃən/), जिसे हाइफ़नेशन के रूप में भी जाना जाता है, किसी मौखिक, लिखित या हस्ताक्षरित शब्द को शब्दांशो में विभाजित करने की प्रक्रिया है[1]
संक्षिप्त विवरण
अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक योजक चिन्ह द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, [ˈsɪl.ə.bᵊɫ])। प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या अंतराल का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।
किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। यह विशेष रूप से बड़े शब्दों और समाचार पत्रों में संक्षिप्त स्तंभों के साथ एक विशेष समस्या हो सकती है। वर्ड प्रोसेसिंग ने संरेखण की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण प्रायः अनावश्यक हो जाता हैं।
कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। यद्यपि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर सामंजस्य के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के अतिरिक्त अधिकतर व्युत्पत्ति विज्ञान या आकृति विज्ञान पर आधारित है। उदाहरण के रूप में, भाषा के सही शब्दांशीकरण के अनुसार "learning" को "lear-ning" के रूप में शब्दांसिकृत नहीं किया जा सकता है। किसी पंक्ति के अंत में केवल "lear-" देखने से पाठक शब्द का उच्चारण करने में भ्रमित हो सकता है, क्योंकि "ea" शब्दावली अंग्रेजी वर्तनी में कई ध्वनि धारण कर सकती है। अंग्रेजी शब्दावली का इतिहास ऐसी कई घटनाओं का विवरण देता है।
अंग्रेजी लिखित शब्दांशीकरण, इसलिए शब्दांश की एक ऐसी अवधारणा से संबंधित है जो ध्वन्यात्मक इकाई के भाषाई अवधारणा के अनुरूप नहीं है।
परिणामस्वरूप, अधिकांश जन्मजात अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल सामान्यतः शब्दकोश से परामर्श लेने के अतिरिक्त इस विषय पर अधिक सलाह नहीं देते हैं। इसके अतिरिक्त, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक कि एक ही अंग्रेजी प्रकार के शब्दकोशों के बीच भी अंतर हैं।
फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा (गंभीरता से ) और ध्वन्यात्मक वर्तनी वाली अन्य भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी उपलब्ध या नव निर्मित शब्द को सही ढंग से शब्दांसिकृत कर सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को तबतक हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न के उपयोग को छोड़ा जा सकता है।
विधिकलन
Is there any perfect syllabification algorithm in English language?
शब्दांशीकरण विधिकलन नियमों का एक समुच्चय है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर किसी शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक शब्दांशीकरण विधिकलन यह तय कर सकता है कि impeachment को impeach-ment या im-peachment के रूप में तो तोड़ा जा सकता है, परंतु impe-achment के रूप में नहीं।
शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: अमेरिकी अंग्रेजी, ध्वनि पर कार्य करती है, परंतु ब्रिटिश अंग्रेजी, शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।
मेजर कीरी के "ऑन हायफेनेशन - एनार्की ऑफ़ पेडेंट्री" में कुछ विशिष्ट नियम प्राप्त किए जा सकते हैं।"[2] हायफेनेशन के विधिकलन दृष्टिकोण से, टेक टाइपसेटिंग सिस्टम (TeX) में लागू एक विधि व्यापक रूप से प्रयोग की जाती है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसेटिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।[3] लिआंग के कार्य का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।
TeX के मूल हायफेनेशन प्रारूप में अमेरिकी अंग्रेजी के लिए अपवाद सूची में केवल 14 शब्द हैं।[4]
टेक्स
टेक्स हायफेनेशन विधिकलन के पोर्ट प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल, जावास्क्रिप्ट, पर्ल, पोस्टस्क्रिप्ट, पायथन, रूबी, सी शार्प, और टेक्स को लॉग में योजक चिन्ह दिखाने के लिए \showhyphens
कमांड का उपयोग किया जा सकता है।
LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा निम्नलिखित कूट का उपयोग करके जोड़ा जा सकता है:
\hyphenation
कमांड शब्दों को शब्दांशीकरण की अनुमति देने के लिए उपयोग होता है, जहां शब्दों की सूची होती है जो अंतराल से अलग होती हैं, और प्रत्येक शब्दांशीकरण बिन्दु को -
वर्ण के द्वारा दर्शाया जाता है। उदाहरण के लिए,
\hyphenation{फोर्ट्रैन इर्गोनॉमिक}
इससे स्पष्ट होता है कि वर्तमान कार्य में "फोर्ट्रैन" को शब्दांसिकृत नहीं किया जाना चाहिए और यदि "इर्गोनॉमिक" को हायफेनेट किया जाना आवश्यक है, तो यह वहां दिखाए गए बिन्दुओ में से किसी एक पर होगा।[5]
हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक \hyphenation
कमांड डिफ़ॉल्ट रूप से केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।[6][7]
यह भी देखें
- ध्वन्यात्मकता
- टौटोसिलेबिक|टॉटोसिलेबिक, हेटरोसिलेबिक और अस्पष्ट फ़ोन
- अंग्रेजी ध्वनिविज्ञान#शब्दांश संरचना
टिप्पणियाँ
- ↑ Baus C, Gutiérrez E, Carreiras M. The role of syllables in sign language production. Front Psychol. 2014;5:1254. Published 2014 Nov 13. doi:10.3389/fpsyg.2014.01254
- ↑ Major Keary. "On Hyphenation - Anarchy of Pedantry". PC Update. Australia: Melbourne PC User Group. Archived from the original on March 10, 2005. Retrieved Oct 6, 2005.
- ↑ Liang, Franklin Mark (Aug 1983), "Word Hy-phen-a-tion by Com-pu-ter", PhD dissertation, Stanford University Department of Computer Science, STAN-CS-83-977
- ↑ "The Plain TeX hyphenation tables". Retrieved June 23, 2009.
- ↑ "\hyphenation". Hypertext Help with LaTeX. Yale.
- ↑ "उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है". TeX FAQ.
- ↑ "How does hyphenation work in TeX?". Tex FAQ.
बाहरी संबंध
- Online Lyric Hyphenator: Hyphenates English text into syllables
- Online hyphenation tool: Hyphenation algorithms for several languages
- Hyphenation tool for the French Language: Hyphenates French words with explanation