अक्षर-विभाजन: Difference between revisions

From Vigyanwiki
Line 30: Line 30:
[[Category:Template documentation pages|Short description/doc]]
[[Category:Template documentation pages|Short description/doc]]


==एल्गोरिदम==
==विधिकलन==
{{unsolved|computer science|Is there any perfect syllabification algorithm in English language?}}
{{unsolved|computer science|Is there any perfect syllabification algorithm in English language?}}
हाइफ़नेशन एल्गोरिदम नियमों का एक सेट है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर एक शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक हाइफ़नेशन एल्गोरिदम यह तय कर सकता है कि ''महाभियोग'' को ''महाभियोग-मेंट'' या ''इम-पीचमेंट'' के रूप में तोड़ा जा सकता है, लेकिन ''इम्पेचमेंट'' के रूप में नहीं।
शब्दांशीकरण विधिकलन नियमों का एक समुच्चय है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर किसी शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक शब्दांशीकरण विधिकलन यह तय कर सकता है कि ''impeachment'' को ''impeach-ment'' या ''im-peachment'' के रूप में तो तोड़ा जा सकता है, परंतु ''impe-achment'' के रूप में नहीं।


शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ हाइफ़नेशन पर भिन्न होती हैं{{Citation needed|date=November 2017}}: [[अमेरिकी अंग्रेजी]] ध्वनि पर काम करती है, लेकिन [[ब्रिटिश अंग्रेजी]] शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो मामलों को और अधिक जटिल बनाते हैं।
शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: [[अमेरिकी अंग्रेजी|अमेरिकी अंग्रेजी,]] ध्वनि पर कार्य करती है, परंतु [[ब्रिटिश अंग्रेजी]], शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।


अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं।<ref>{{cite web |title= हाइफ़नेशन पर - पांडित्य की अराजकता|work= PC Update |last= Major Keary |publisher= Melbourne PC User Group |location= Australia |url=http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |accessdate= Oct 6, 2005 |url-status= dead |archiveurl= https://web.archive.org/web/20050310054738/http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |archivedate= March 10, 2005 }}</ref> हाइफ़नेशन के लिए [[ कलन विधि ]] दृष्टिकोण के बीच, [[TeX]] में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा [[कंप्यूटर और टाइपसेटिंग]] के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।<ref>{{citation |last= Liang |first= Franklin Mark |url= http://www.tug.org/docs/liang/ |title= Word Hy-phen-a-tion by Com-pu-ter |work= PhD dissertation |publisher= [[Stanford University]] Department of [[Computer Science]] |id= STAN-CS-83-977 |date= Aug 1983 }}</ref> लिआंग के काम का उद्देश्य एल्गोरिदम को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।
अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं।<ref>{{cite web |title= हाइफ़नेशन पर - पांडित्य की अराजकता|work= PC Update |last= Major Keary |publisher= Melbourne PC User Group |location= Australia |url=http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |accessdate= Oct 6, 2005 |url-status= dead |archiveurl= https://web.archive.org/web/20050310054738/http://www.melbpc.org.au/pcupdate/9100/9112article4.htm |archivedate= March 10, 2005 }}</ref> हाइफ़नेशन के लिए [[ कलन विधि ]] दृष्टिकोण के बीच, [[TeX]] में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा [[कंप्यूटर और टाइपसेटिंग|कंप्यूटर और टाइपसमुच्चयिंग]] के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।<ref>{{citation |last= Liang |first= Franklin Mark |url= http://www.tug.org/docs/liang/ |title= Word Hy-phen-a-tion by Com-pu-ter |work= PhD dissertation |publisher= [[Stanford University]] Department of [[Computer Science]] |id= STAN-CS-83-977 |date= Aug 1983 }}</ref> लिआंग के काम का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।


अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।<ref>{{cite web |title= सादा TeX हाइफ़नेशन तालिकाएँ|url= http://www.ctan.org/tex-archive/systems/knuth/dist/lib/hyphen.tex |accessdate= June 23, 2009 }}</ref>
अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।<ref>{{cite web |title= सादा TeX हाइफ़नेशन तालिकाएँ|url= http://www.ctan.org/tex-archive/systems/knuth/dist/lib/hyphen.tex |accessdate= June 23, 2009 }}</ref>
Line 42: Line 42:


===TeX में ===
===TeX में ===
TeX हाइफ़नेशन एल्गोरिदम के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें [[हास्केल (प्रोग्रामिंग भाषा)]], [[जावास्क्रिप्ट]], [[पर्ल]], [[ परिशिष्ट भाग ]], [[पायथन (प्रोग्रामिंग भाषा)]], [[रूबी (प्रोग्रामिंग भाषा)]], सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है <code>\showhyphens</code>.
TeX हाइफ़नेशन विधिकलन के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें [[हास्केल (प्रोग्रामिंग भाषा)]], [[जावास्क्रिप्ट]], [[पर्ल]], [[ परिशिष्ट भाग ]], [[पायथन (प्रोग्रामिंग भाषा)]], [[रूबी (प्रोग्रामिंग भाषा)]], सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है <code>\showhyphens</code>.


[[LaTeX]] में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:
[[LaTeX]] में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:

Revision as of 00:04, 16 July 2023

शब्दांशीकरण (/sɪˌlæbɪfɪˈkʃən/) या शब्दांश (/sɪˌlæbɪˈkʃən/), जिसे हाइफ़नेशन के रूप में भी जाना जाता है, किसी मौखिक, लिखित या हस्ताक्षरित शब्द को शब्दांशो में विभाजित करने की प्रक्रिया है[1]


संक्षिप्त विवरण

अंग्रेजी वर्तनी का उपयोग करते समय अक्षरों में लिखित पृथक्करण को सामान्यतः एक योजक चिन्ह द्वारा चिह्नित किया जाता है (उदाहरण के लिए, syl-la-ble) तथा अंतर्राष्ट्रीय ध्वन्यात्मक वर्णमाला में वास्तव में बोले गए अक्षरों को लिखते समय पूर्णविराम चिह्न के साथ चिह्नित किया जाता है (उदाहरण के लिए, [ˈsɪl.ə.bᵊɫ])। प्रस्तुतिकरण उद्देश्यों के लिए, टाइपोग्राफर इंटरपंकट (यूनिकोड वर्ण U+00B7, उदाहरण के लिए, syl·la·ble), विशेष प्रयोजन हाइफ़नेशन बिंदु (U+2027, उदाहरण के लिए, syl‧la‧ble), या अंतराल का उपयोग कर सकते हैं (उदाहरण के लिए, syl la ble)।

किसी पंक्ति के अंत में, यदि कोई शब्द पंक्ति में समायोजित नहीं होता है और अगली पंक्ति में इसे ले जाने से पहली पंक्ति अन्य पंक्तियों की तुलना में बहुत कम हो जाती है, तो लेखन में इसे दो भागों में विभाजित कर दिया जाता है, जिन्हें परंपरागत रूप से "शब्दांश" कहा जाता है। यह विशेष रूप से बड़े शब्दों और समाचार पत्रों में संक्षिप्त स्तंभों के साथ एक विशेष समस्या हो सकती है। वर्ड प्रोसेसिंग ने संरेखण की प्रक्रिया को स्वचालित कर दिया है, जिससे छोटे शब्दों का शब्दांशीकरण प्रायः अनावश्यक हो जाता हैं।

कुछ भाषाओं में, बोले गए शब्दांश भी लेखन में शब्दांशीकरण का आधार होते हैं। यद्यपि, संभवतः आधुनिक अंग्रेजी की वर्तनी में ध्वनियों और अक्षरों के बीच कमजोर सामंजस्य के कारण, अंग्रेजी में लिखित शब्दांशीकरण ध्वन्यात्मक सिद्धांतों के अतिरिक्त अधिकतर व्युत्पत्ति विज्ञान या आकृति विज्ञान पर आधारित है। उदाहरण के रूप में, भाषा के सही शब्दांशीकरण के अनुसार "learning" को "lear-ning" के रूप में शब्दांसिकृत नहीं किया जा सकता है। किसी पंक्ति के अंत में केवल "lear-" देखने से पाठक शब्द का उच्चारण करने में भ्रमित हो सकता है, क्योंकि "ea" शब्दावली अंग्रेजी वर्तनी में कई ध्वनि धारण कर सकती है। अंग्रेजी शब्दावली का इतिहास ऐसी कई घटनाओं का विवरण देता है।

अंग्रेजी लिखित शब्दांशीकरण, इसलिए शब्दांश की एक ऐसी अवधारणा से संबंधित है जो ध्वन्यात्मक इकाई के भाषाई अवधारणा के अनुरूप नहीं है।

परिणामस्वरूप, अधिकांश जन्मजात अंग्रेजी बोलने वाले भी शब्दकोश की सलाह के बिना या वर्ड प्रोसेसर का उपयोग किए बिना स्थापित नियमों के अनुसार शब्दों का शब्दांश बनाने में असमर्थ हैं। स्कूल सामान्यतः शब्दकोश से परामर्श लेने के अतिरिक्त इस विषय पर अधिक सलाह नहीं देते हैं। इसके अतिरिक्त, ब्रिटिश और अमेरिकी शब्दांशों और यहां तक ​​कि एक ही अंग्रेजी प्रकार के शब्दकोशों के बीच भी अंतर हैं।

फ़िनिश भाषा, इतालवी भाषा, पुर्तगाली भाषा, जापानी भाषा (गंभीरता से ) और ध्वन्यात्मक वर्तनी वाली अन्य भाषाओं में, लेखक सैद्धांतिक रूप से केवल सामान्य नियमों का उपयोग करके किसी भी उपलब्ध या नव निर्मित शब्द को सही ढंग से शब्दांसिकृत कर सकते हैं। फ़िनलैंड में, बच्चों को पहले हर शब्द को तबतक हाइफ़न करना सिखाया जाता है जब तक कि वे विश्वसनीय रूप से सही शब्दांश का निर्माण नहीं कर लेते, जिसके बाद हाइफ़न के उपयोग को छोड़ा जा सकता है।

विधिकलन

Unsolved problem in computer science:

Is there any perfect syllabification algorithm in English language?

शब्दांशीकरण विधिकलन नियमों का एक समुच्चय है, विशेष रूप से एक कंप्यूटर प्रोग्राम में कार्यान्वयन के लिए संहिताबद्ध, जो यह तय करता है कि किन बिंदुओं पर किसी शब्द को हाइफ़न के साथ दो पंक्तियों में तोड़ा जा सकता है। उदाहरण के लिए, एक शब्दांशीकरण विधिकलन यह तय कर सकता है कि impeachment को impeach-ment या im-peachment के रूप में तो तोड़ा जा सकता है, परंतु impe-achment के रूप में नहीं।

शब्द-विभाजन के नियमों की जटिलता का एक कारण यह है कि अंग्रेजी की विभिन्न बोलियाँ शब्दांशीकरण में भिन्न होती हैं: अमेरिकी अंग्रेजी, ध्वनि पर कार्य करती है, परंतु ब्रिटिश अंग्रेजी, शब्द की उत्पत्ति और फिर ध्वनि पर ध्यान देती है। बड़ी संख्या में अपवाद भी हैं, जो इन विषयों को और अधिक जटिल बनाते हैं।

अंगूठे के कुछ नियम मेजर केरी के ऑन हाइफ़नेशन - एनार्की ऑफ़ पेडेंट्री में पाए जा सकते हैं।[2] हाइफ़नेशन के लिए कलन विधि दृष्टिकोण के बीच, TeX में कार्यान्वित दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। इसे डोनाल्ड नुथ द्वारा कंप्यूटर और टाइपसमुच्चयिंग के पहले दो खंडों और फ्रैंकलिन मार्क लियांग के शोध प्रबंध में पूरी तरह से प्रलेखित किया गया है।[3] लिआंग के काम का उद्देश्य विधिकलन को यथासंभव सटीक बनाना और किसी भी अपवाद शब्दकोश को छोटा रखना था।

अमेरिकी अंग्रेजी के लिए TeX के मूल हाइफ़नेशन पैटर्न में, अपवाद सूची में केवल 14 शब्द हैं।[4]


TeX में

TeX हाइफ़नेशन विधिकलन के पोर्ट कई प्रोग्रामिंग भाषाओं के लिए लाइब्रेरी के रूप में उपलब्ध हैं, जिनमें हास्केल (प्रोग्रामिंग भाषा), जावास्क्रिप्ट, पर्ल, परिशिष्ट भाग , पायथन (प्रोग्रामिंग भाषा), रूबी (प्रोग्रामिंग भाषा), सी शार्प (प्रोग्रामिंग भाषा)|सी#, और शामिल हैं। TeX को कमांड द्वारा लॉग में हाइफ़न दिखाने के लिए बनाया जा सकता है \showhyphens.

LaTeX में, हाइफ़नेशन सुधार को उपयोगकर्ताओं द्वारा इसका उपयोग करके जोड़ा जा सकता है:

\हाइफ़नेशन{शब्द}

\hyphenation ई> कमांड अनुमत हाइफ़नेशन बिंदुओं की घोषणा करता है जिसमें शब्द रिक्त स्थान द्वारा अलग किए गए शब्दों की एक सूची है, जिसमें प्रत्येक हाइफ़नेशन बिंदु को एक द्वारा दर्शाया जाता है - चरित्र। उदाहरण के लिए,

\हाइफ़नेशन{फोरट्रान एर-गो-नो-माइक}

घोषणा करता है कि वर्तमान कार्य में फोरट्रान को हाइफ़न नहीं किया जाना चाहिए और यदि एर्गोनोमिक को हाइफ़न किया जाना चाहिए, तो यह संकेतित बिंदुओं में से एक पर होगा।[5] हालाँकि, कई सीमाएँ हैं। उदाहरण के लिए, स्टॉक \hyphenation कमांड डिफ़ॉल्ट रूप से केवल ASCII अक्षरों को स्वीकार करता है और इसलिए इसका उपयोग गैर-ASCII वर्णों (जैसे ä, é, ç) वाले शब्दों के लिए हाइफ़नेशन को सही करने के लिए नहीं किया जा सकता है, जो अंग्रेजी को छोड़कर लगभग सभी भाषाओं में बहुत आम हैं। हालाँकि, सरल उपाय मौजूद हैं।[6][7]


यह भी देखें

टिप्पणियाँ

  1. Baus C, Gutiérrez E, Carreiras M. The role of syllables in sign language production. Front Psychol. 2014;5:1254. Published 2014 Nov 13. doi:10.3389/fpsyg.2014.01254
  2. Major Keary. "हाइफ़नेशन पर - पांडित्य की अराजकता". PC Update. Australia: Melbourne PC User Group. Archived from the original on March 10, 2005. Retrieved Oct 6, 2005.
  3. Liang, Franklin Mark (Aug 1983), "Word Hy-phen-a-tion by Com-pu-ter", PhD dissertation, Stanford University Department of Computer Science, STAN-CS-83-977
  4. "सादा TeX हाइफ़नेशन तालिकाएँ". Retrieved June 23, 2009.
  5. "\hyphenation". Hypertext Help with LaTeX. Yale.
  6. "उच्चारण वाले शब्दों को हाइफ़न नहीं किया गया है". TeX FAQ.
  7. "How does hyphenation work in TeX?". Tex FAQ.


बाहरी संबंध