अक्षर-विभाजन: Difference between revisions

From Vigyanwiki
Line 36: Line 36:
शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: [[अमेरिकी अंग्रेजी|अमेरिकी अंग्रेजी,]] ध्वनि पर कार्य करती है, परंतु [[ब्रिटिश अंग्रेजी]], शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।
शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: [[अमेरिकी अंग्रेजी|अमेरिकी अंग्रेजी,]] ध्वनि पर कार्य करती है, परंतु [[ब्रिटिश अंग्रेजी]], शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।


अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं।<ref>{{cite web |title= हाइफ़नेशन पर - पांडित्य की अराजकता|work= PC Update |last= Major Keary |publisher= Melbourne PC User Group |location= Australia |url=http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |accessdate= Oct 6, 2005 |url-status= dead |archiveurl= https://web.archive.org/web/20050310054738/http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |archivedate= March 10, 2005 }}</ref> हाइफ़नेशन के लिए [[ कलन विधि ]] दृष्टिकोण के बीच, [[TeX]] में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा [[कंप्यूटर और टाइपसेटिंग|कंप्यूटर और टाइपसमुच्चयिंग]] के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।<ref>{{citation |last= Liang |first= Franklin Mark |url= http://www.tug.org/docs/liang/ |title= Word Hy-phen-a-tion by Com-pu-ter |work= PhD dissertation |publisher= [[Stanford University]] Department of [[Computer Science]] |id= STAN-CS-83-977 |date= Aug 1983 }}</ref> लिआंग के काम का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।
मेजर कीरी के "ऑन हायफेनेशन - एनार्की ऑफ़ पेडेंट्री" में कुछ विशिष्ट नियम प्राप्त किए जा सकते हैं।"<ref>{{cite web |title= On Hyphenation - Anarchy of Pedantry |work= PC Update |last= Major Keary |publisher= Melbourne PC User Group |location= Australia |url=http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |accessdate= Oct 6, 2005 |url-status= dead |archiveurl= https://web.archive.org/web/20050310054738/http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |archivedate= March 10, 2005 }}</ref> हायफेनेशन के विधिकलन दृष्टिकोण से, [[TeX|टेक टाइपसेटिंग सिस्टम]] (TeX) में लागू एक विधि व्यापक रूप से प्रयोग की जाती है। इसे डोनाल्ड नुथ द्वारा [[कंप्यूटर और टाइपसेटिंग|कंप्यूटर और टाइपसेटिंग]] के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।<ref>{{citation |last= Liang |first= Franklin Mark |url= http://www.tug.org/docs/liang/ |title= Word Hy-phen-a-tion by Com-pu-ter |work= PhD dissertation |publisher= [[Stanford University]] Department of [[Computer Science]] |id= STAN-CS-83-977 |date= Aug 1983 }}</ref> लिआंग के कार्य का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।


अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।<ref>{{cite web |title= सादा TeX हाइफ़नेशन तालिकाएँ|url= http://www.ctan.org/tex-archive/systems/knuth/dist/lib/hyphen.tex |accessdate= June 23, 2009 }}</ref>
TeX के मूल हायफेनेशन प्रारूप में अमेरिकी अंग्रेजी के लिए अपवाद सूची में केवल 14 शब्द हैं।<ref>{{cite web |title= The Plain TeX hyphenation tables |url= http://www.ctan.org/tex-archive/systems/knuth/dist/lib/hyphen.tex |accessdate= June 23, 2009 }}</ref>




Line 53: Line 53:
हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक <code>\hyphenation</code> कमांड डिफ़ॉल्ट रूप से केवल [[ASCII]] अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।<ref>{{cite web |url= https://texfaq.org/FAQ-hyphenaccents |title= उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है|work= TeX FAQ }}</ref><ref>{{cite web |url= https://texfaq.org/FAQ-hyphen |title= How does hyphenation work in TeX? |work= Tex FAQ }}</ref>
हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक <code>\hyphenation</code> कमांड डिफ़ॉल्ट रूप से केवल [[ASCII]] अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।<ref>{{cite web |url= https://texfaq.org/FAQ-hyphenaccents |title= उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है|work= TeX FAQ }}</ref><ref>{{cite web |url= https://texfaq.org/FAQ-hyphen |title= How does hyphenation work in TeX? |work= Tex FAQ }}</ref>


[[Category:All articles with unsourced statements]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with invalid date parameter in template]]
[[Category:Articles with unsourced statements from November 2017]]
[[Category:Created On 10/07/2023]]
[[Category:Machine Translated Page]]
[[Category:Missing redirects]]
[[Category:Pages with script errors]]
[[Category:Short description with empty Wikidata description]]
[[Category:Template documentation pages|Short description/doc]]


== यह भी देखें ==
== यह भी देखें ==

Revision as of 00:14, 16 July 2023

शब्दांशीकरण (/sɪˌlæbɪfɪˈkʃən/) या शब्दांश (/sɪˌlæbɪˈkʃən/), जिसे हाइफ़नेशन के रूप में भी जाना जाता है, किसी मौखिक, लिखित या हस्ताक्षरित शब्द को शब्दांशो में विभाजित करने की प्रक्रिया है[1]


संक्षिप्त विवरण

अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक योजक चिन्ह द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, [ˈsɪl.ə.bᵊɫ])। प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या अंतराल का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।

किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। यह विशेष रूप से बड़े शब्दों और समाचार पत्रों में संक्षिप्त स्तंभों के साथ एक विशेष समस्या हो सकती है। वर्ड प्रोसेसिंग ने संरेखण की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण प्रायः अनावश्यक हो जाता हैं।

कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। यद्यपि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर सामंजस्य के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के अतिरिक्त अधिकतर व्युत्पत्ति विज्ञान या आकृति विज्ञान पर आधारित है। उदाहरण के रूप में, भाषा के सही शब्दांशीकरण के अनुसार "learning" को "lear-ning" के रूप में शब्दांसिकृत नहीं किया जा सकता है। किसी पंक्ति के अंत में केवल "lear-" देखने से पाठक शब्द का उच्चारण करने में भ्रमित हो सकता है, क्योंकि "ea" शब्दावली अंग्रेजी वर्तनी में कई ध्वनि धारण कर सकती है। अंग्रेजी शब्दावली का इतिहास ऐसी कई घटनाओं का विवरण देता है।

अंग्रेजी लिखित शब्दांशीकरण, इसलिए शब्दांश की एक ऐसी अवधारणा से संबंधित है जो ध्वन्यात्मक इकाई के भाषाई अवधारणा के अनुरूप नहीं है।

परिणामस्वरूप, अधिकांश जन्मजात अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल सामान्यतः शब्दकोश से परामर्श लेने के अतिरिक्त इस विषय पर अधिक सलाह नहीं देते हैं। इसके अतिरिक्त, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक ​​कि एक ही अंग्रेजी प्रकार के शब्दकोशों के बीच भी अंतर हैं।

फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा (गंभीरता से ) और ध्वन्यात्मक वर्तनी वाली अन्य भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी उपलब्ध या नव निर्मित शब्द को सही ढंग से शब्दांसिकृत कर सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को तबतक हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न के उपयोग को छोड़ा जा सकता है।

विधिकलन

Unsolved problem in computer science:

Is there any perfect syllabification algorithm in English language?

शब्दांशीकरण विधिकलन नियमों का एक समुच्चय है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर किसी शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक शब्दांशीकरण विधिकलन यह तय कर सकता है कि impeachment को impeach-ment या im-peachment के रूप में तो तोड़ा जा सकता है, परंतु impe-achment के रूप में नहीं।

शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: अमेरिकी अंग्रेजी, ध्वनि पर कार्य करती है, परंतु ब्रिटिश अंग्रेजी, शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।

मेजर कीरी के "ऑन हायफेनेशन - एनार्की ऑफ़ पेडेंट्री" में कुछ विशिष्ट नियम प्राप्त किए जा सकते हैं।"[2] हायफेनेशन के विधिकलन दृष्टिकोण से, टेक टाइपसेटिंग सिस्टम (TeX) में लागू एक विधि व्यापक रूप से प्रयोग की जाती है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसेटिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।[3] लिआंग के कार्य का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।

TeX के मूल हायफेनेशन प्रारूप में अमेरिकी अंग्रेजी के लिए अपवाद सूची में केवल 14 शब्द हैं।[4]


TeX में

TeX हाइफ़नेशन विधिकलन के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल (प्रोग्रामिंग भाषा), जावास्क्रिप्ट, पर्ल, परिशिष्ट भाग , पायथन (प्रोग्रामिंग भाषा), रूबी (प्रोग्रामिंग भाषा), सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है \showhyphens.

LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:

\हाइफ़नेशन{शब्द}

\hyphenation ई> कमांड अनुमत हाइफ़नेशन बिंदुओं की घोषणा करता है जिसमें शब्द रिक्त स्थान द्वारा अलग किए गए शब्दों की एक सूची है, जिसमें प्रत्येक हाइफ़नेशन बिंदु को एक द्वारा दर्शाया जाता है - चरित्र। उदाहरण के लिए,

\हाइफ़नेशन{फोरट्रान एर-गो-नो-माइक}

घोषणा करता है कि वर्तमान कार्य में फोरट्रान को हाइफ़न नहीं किया जाना चाहिए और यदि एर्गोनोमिक को हाइफ़न किया जाना चाहिए, तो यह संकेतित बिंदुओं में से एक पर होगा।[5] हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक \hyphenation कमांड डिफ़ॉल्ट रूप से केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।[6][7]

यह भी देखें

टिप्पणियाँ

  1. Baus C, Gutiérrez E, Carreiras M. The role of syllables in sign language production. Front Psychol. 2014;5:1254. Published 2014 Nov 13. doi:10.3389/fpsyg.2014.01254
  2. Major Keary. "On Hyphenation - Anarchy of Pedantry". PC Update. Australia: Melbourne PC User Group. Archived from the original on March 10, 2005. Retrieved Oct 6, 2005.
  3. Liang, Franklin Mark (Aug 1983), "Word Hy-phen-a-tion by Com-pu-ter", PhD dissertation, Stanford University Department of Computer Science, STAN-CS-83-977
  4. "The Plain TeX hyphenation tables". Retrieved June 23, 2009.
  5. "\hyphenation". Hypertext Help with LaTeX. Yale.
  6. "उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है". TeX FAQ.
  7. "How does hyphenation work in TeX?". Tex FAQ.


बाहरी संबंध