अकारादिक्रम: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 37: Line 37:


सरल वर्णमाला क्रम का एक उदाहरण इस प्रकार है:
सरल वर्णमाला क्रम का एक उदाहरण इस प्रकार है:
*''जैसा; एस्टर; एस्ट्रोलैब; खगोल विज्ञान; खगोलभौतिकी; एटमान; प्रारंभ करना; बा''
*''जैसा; एस्टर; एस्ट्रोलैब; खगोल विज्ञान; खगोलभौतिकी; एटमान; अटैक; बा''
एक और उदाहरण:
एक और उदाहरण:
*''बार्नकल; होना; गया; फ़ायदा; झुका हुआ''
*''बार्नकल; बे; बिन; बेनफिट; बेन्ट''
   
   
उपरोक्त शब्द वर्णानुक्रम में क्रमबद्ध हैं। ''एस्टर'' से पहले ''एज़'' आता है क्योंकि वे उन्हीं दो अक्षरों से प्रारंभ होते हैं और ''एज़'' के बाद कोई और अक्षर नहीं है जबकि ''एस्टर'' के पास है। अगले तीन शब्द ''एस्टर'' के बाद आते हैं क्योंकि उनका चौथा अक्षर (पहला जो अलग है) ''आर'' है, जो '''' (''एस्टर'' का चौथा अक्षर) के बाद आता है वर्णमाला। उन शब्दों को उनके छठे अक्षर (क्रमशः एल, एन और पी) के आधार पर क्रमबद्ध किया गया है। इसके बाद ''एट'' आता है, जो दूसरे अक्षर में पिछले शब्दों से भिन्न है (''टी'' ''एस'' के बाद आता है)। ''अतामन'' ''एट'' के बाद उसी कारण से आता है जिस तरह ''एस्टर'' ''अस'' के बाद आता है। ''अटैक'' उनके तीसरे अक्षरों की तुलना के आधार पर ''अतामान'' का अनुसरण करता है, और ''बा'' अन्य सभी के बाद आता है क्योंकि इसका पहला अक्षर अलग है।
उपरोक्त शब्द वर्णानुक्रम में क्रमबद्ध हैं। ''एस्टर'' से पहले ''As'' आता है क्योंकि वे उन्हीं दो अक्षरों से प्रारंभ होते हैं और ''As'' के बाद कोई और अक्षर नहीं है जबकि ''एस्टर'' के पास है। अगले तीन शब्द ''एस्टर'' के बाद आते हैं क्योंकि उनका चौथा अक्षर (पहला जो अलग है) ''r'' है, जो ''e'' (''एस्टर'' का चौथा अक्षर) के बाद आता है वर्णमाला। उन शब्दों को उनके छठे अक्षर (क्रमशः ''l'', ''n'' और ''p'') के आधार पर क्रमबद्ध किया गया है। इसके बाद ''At'' आता है, जो दूसरे अक्षर में पिछले शब्दों से भिन्न है (''t s'' के बाद आता है)। ''अतामन'' ''At'' के बाद उसी कारण से आता है जिस तरह ''एस्टर'' ''As'' के बाद आता है। ''अटैक'' उनके तीसरे अक्षरों की तुलना के आधार पर ''अतामान'' का अनुसरण करता है, और ''बा'' अन्य सभी के बाद आता है क्योंकि इसका पहला अक्षर अलग है।


===मल्टीवर्ड श्रृंखला ्स का उपचार===
===मल्टीवर्ड श्रृंखला का प्रतिपादन===
जब ऑर्डर की जा रही कुछ श्रृंखला ्स में एक से अधिक शब्द होते हैं, यानी, उनमें स्पेस (वर्ण) या [[हैफ़ेन]] जैसे अन्य विभाजक होते हैं, तो दो बुनियादी दृष्टिकोण अपनाए जा सकते हैं। पहले दृष्टिकोण में, सभी श्रृंखला ्स को प्रारंभ में उनके पहले शब्द के अनुसार क्रमबद्ध किया जाता है, जैसा कि अनुक्रम में है:
जब क्रम की जा रही कुछ श्रृंखला में एक से अधिक शब्द होते हैं, यानी, उनमें स्पेस (वर्ण) या [[हैफ़ेन]] जैसे अन्य विभाजक होते हैं, तो दो बुनियादी दृष्टिकोण अपनाए जा सकते हैं। पहले दृष्टिकोण में, सभी श्रृंखला को प्रारंभ में उनके पहले शब्द के अनुसार क्रमबद्ध किया जाता है, जैसा कि अनुक्रम में है:
*ओक; ओक हिल; ओक रिज; ओकले पार्क; ओकले नदी
*ओक; ओक हिल; ओक रिज; ओकले पार्क; ओकले नदी
*: जहां अलग-अलग शब्द ओक से प्रारंभ होने वाले सभी श्रृंखला ओकले से प्रारंभ होने वाले सभी श्रृंखलाों से पहले आते हैं, क्योंकि वर्णमाला क्रम में ओक, ओकले से पहले आता है।
*: जहां अलग-अलग शब्द ओक से प्रारंभ होने वाले सभी श्रृंखला ओकले से प्रारंभ होने वाले सभी श्रृंखलाों से पहले आते हैं, क्योंकि वर्णमाला क्रम में ओक, ओकले से पहले आता है।


दूसरे दृष्टिकोण में, श्रृंखला ्स को ऐसे वर्णानुक्रम में रखा जाता है जैसे कि उनमें कोई स्थान न हो, अनुक्रम देते हुए:
दूसरे दृष्टिकोण में, श्रृंखला को ऐसे वर्णानुक्रम में रखा जाता है जैसे कि उनमें कोई स्थान न हो, अनुक्रम देते हुए:
*ओक; ओक हिल; ओकले पार्क; ओकले नदी; ओक रिज
*ओक; ओक हिल; ओकले पार्क; ओकले नदी; ओक रिज
*: जहां ओक रिज अब ओकले श्रृंखला ्स के बाद आता है, जैसा कि अगर इसे ओक्रीज लिखा जाता तो ऐसा होता।
*: जहां ओक रिज अब ओकले श्रृंखला के बाद आता है, जैसा कि अगर इसे ओक्रीज लिखा जाता तो ऐसा होता है।


दूसरा दृष्टिकोण वह है जो आमतौर पर शब्दकोशों में अपनाया जाता है{{citation needed|date=October 2020}}, और इस प्रकार प्रकाशन द्वारा इसे अक्सर [[शब्दकोश क्रम (बहुविकल्पी)]] कहा जाता है। पहला दृष्टिकोण अक्सर [[सूचकांक (प्रकाशन)]] में उपयोग किया जाता है, यद्यपि प्रत्येक प्रकाशक पारंपरिक रूप से अपने स्वयं के मानक निर्धारित करता है कि उसमें किस दृष्टिकोण का उपयोग किया जाए; 1975 से पहले पुस्तक अनुक्रमणिका ([[आईएसओ 999]]) के लिए कोई आईएसओ मानक नहीं था।
दूसरा दृष्टिकोण वह है जो सामान्यतः शब्दकोशों में अपनाया जाता है{{citation needed|date=October 2020}}, और इस प्रकार प्रकाशन द्वारा इसे प्रायः [[शब्दकोश क्रम (बहुविकल्पी)]] कहा जाता है। पहला दृष्टिकोण प्रायः [[सूचकांक (प्रकाशन)]] में उपयोग किया जाता है, यद्यपि प्रत्येक प्रकाशक पारंपरिक रूप से अपने स्वयं के मानक निर्धारित करता है कि उसमें किस दृष्टिकोण का उपयोग किया जाए; 1975 से पहले पुस्तक अनुक्रमणिका ([[आईएसओ 999|ISO 999]]) के लिए कोई ISO मानक नहीं था।
 
===विशेष मामले===
{{Unreferenced section|date=June 2017}}


===विशेष स्थितियॉं===
====संशोधित अक्षर====
====संशोधित अक्षर====
फ़्रेंच में, संशोधित अक्षरों (जैसे कि विशेषक वाले अक्षर) को वर्णमाला क्रम के प्रयोजनों के लिए आधार अक्षर के समान माना जाता है। उदाहरण के लिए, चट्टान और गुलाब के बीच भूमिका आती है, मानो यह लिखित भूमिका हो। यद्यपि, जो भाषाएँ ऐसे अक्षरों का व्यवस्थित रूप से उपयोग करती हैं, उनके आमतौर पर अपने स्वयं के आदेश नियम होते हैं। देखना {{slink||Language-specific conventions}} नीचे।
फ़्रेंच में, संशोधित अक्षरों (जैसे कि विशेषक वाले अक्षर) को वर्णमाला क्रम के प्रयोजनों के लिए आधार अक्षर के समान माना जाता है। उदाहरण के लिए, चट्टान और गुलाब के बीच भूमिका आती है, मानो यह लिखित भूमिका हो। यद्यपि, जो भाषाएँ ऐसे अक्षरों का व्यवस्थित रूप से उपयोग करती हैं, उनके सामान्यतः अपने स्वयं के आदेश नियम होते हैं। देखना {{slink||Language-specific conventions}} नीचे।


====उपनाम से आदेश देना====
====उपनाम से क्रमीकरण====
अधिकांश संस्कृतियों में जहां परिवार के नाम दिए गए नामों के बाद लिखे जाते हैं, वहां अभी भी पहले परिवार के नाम के आधार पर नामों की सूची (जैसे टेलीफोन निर्देशिकाओं में) को क्रमबद्ध करना वांछित है। इस मामले में, नामों को सही ढंग से क्रमबद्ध करने के लिए उन्हें पुन: व्यवस्थित करने की आवश्यकता है। उदाहरण के लिए, जुआन हर्नांडेस और ब्रायन ओ'लेरी को हर्नांडेस, जुआन और ओ'लेरी, ब्रायन के रूप में क्रमबद्ध किया जाना चाहिए, भले ही उन्हें इस तरह नहीं लिखा गया हो। इस नियम को कंप्यूटर संयोजन एल्गोरिदम में कैद करना जटिल है, और सरल प्रयास विफल हो जाएंगे। उदाहरण के लिए, जब तक एल्गोरिथ्म के पास परिवार के नामों की एक विस्तृत सूची न हो, तब तक यह तय करने का कोई तरीका नहीं है कि गिलियन ल्यूसिले वैन डेर वाल वैन डेर वाल हैं, गिलियन ल्यूसिले, वाल, गिलियन ल्यूसिले वैन डेर, या यहां तक ​​कि ल्यूसिले वैन डेर वाल भी हैं। , गिलियन।
अधिकांश संस्कृतियों में जहां परिवार के नाम दिए गए नामों के बाद लिखे जाते हैं, वहां अभी भी पहले परिवार के नाम के आधार पर नामों की सूची (जैसे टेलीफोन निर्देशिकाओं में) को क्रमबद्ध करना वांछित है। इस स्थितियॉं में, नामों को सही ढंग से क्रमबद्ध करने के लिए उन्हें पुन: व्यवस्थित करने की आवश्यकता है। उदाहरण के लिए, जुआन हर्नांडेस और ब्रायन ओ'लेरी को हर्नांडेस, जुआन और ओ'लेरी, ब्रायन के रूप में क्रमबद्ध किया जाना चाहिए, भले ही उन्हें इस तरह नहीं लिखा गया हो। इस नियम को कंप्यूटर संयोजन एल्गोरिदम में कैद करना जटिल है, और सरल प्रयास विफल हो जाएंगे। उदाहरण के लिए, जब तक एल्गोरिथ्म के पास वर्ग के नामों की एक विस्तृत सूची न हो, तब तक यह तय करने का कोई तरीका नहीं है कि गिलियन ल्यूसिले वैन डेर वाल वैन डेर वाल हैं, गिलियन ल्यूसिले, वाल, गिलियन ल्यूसिले वैन डेर, या यहां तक ​​कि ल्यूसिले वैन डेर वाल भी हैं।


शैक्षणिक संदर्भों में उपनाम से आदेश देने का अक्सर सामना किया जाता है। एकल बहु-लेखक पेपर के भीतर, लेखकों को अन्य तरीकों जैसे रिवर्स वरिष्ठता या पेपर में योगदान की व्यक्तिपरक डिग्री के अतिरिक्त उपनाम के अनुसार क्रमबद्ध करना, समान योगदान को स्वीकार करने या टालने के एक तरीके के रूप में देखा जाता है। सहयोगी समूहों में असामंजस्य।<ref>{{cite journal|first1=Teja|last1=Tscharntke|first2=Michael E|last2=Hochberg|first3=Tatyana A|last3=Rand|first4=Vincent H|last4=Resh|first5=Jochen|last5=Krauss|title=बहुलेखक प्रकाशनों में योगदान के लिए लेखक अनुक्रम और श्रेय|journal=PLOS Biol.|date=January 2007|volume=5|issue=1|pages=e18|pmid=17227141|doi=10.1371/journal.pbio.0050018|pmc=1769438}}</ref> कुछ क्षेत्रों में ग्रंथ सूची में [[उद्धरण]]ों को उनके लेखकों के उपनामों के आधार पर क्रमबद्ध करने की प्रथा उन लेखकों के पक्ष में पूर्वाग्रह पैदा करती पाई गई है जिनके उपनाम वर्णमाला में पहले आते हैं, जबकि यह प्रभाव उन क्षेत्रों में प्रकट नहीं होता है जिनमें ग्रंथ सूची को कालानुक्रमिक रूप से क्रमबद्ध किया जाता है।<ref>{{cite journal|url=https://decisionslab.unl.edu/pubs/stevens_duque_2018_SM.pdf|first1=Jeffrey R.|last1=Stevens|first2=Juan F.|last2=Duque|title=Order Matters: Alphabetizing In-Text Citations Biases Citation Rates|journal=Psychonomic Bulletin & Review|year=2018|volume=26|issue=3|pages=1020–1026|doi=10.3758/s13423-018-1532-8|doi-access=free|pmid=30288671|s2cid=52922399|access-date=10 November 2018|archive-date=10 November 2018|archive-url=https://web.archive.org/web/20181110080311/https://decisionslab.unl.edu/pubs/stevens_duque_2018_SM.pdf|url-status=live}}
शैक्षणिक संदर्भों में उपनाम से क्रमीकरण का प्रायः सामना किया जाता है। एकल बहु-लेखक पेपर के भीतर, लेखकों को अन्य तरीकों जैसे रिवर्स वरिष्ठता या पेपर में योगदान की व्यक्तिपरक डिग्री के अतिरिक्त उपनाम के अनुसार क्रमबद्ध करना, समान योगदान को स्वीकार करने या टालने के एक तरीके के रूप में देखा जाता है। सहयोगी समूहों में असामंजस्य।<ref>{{cite journal|first1=Teja|last1=Tscharntke|first2=Michael E|last2=Hochberg|first3=Tatyana A|last3=Rand|first4=Vincent H|last4=Resh|first5=Jochen|last5=Krauss|title=बहुलेखक प्रकाशनों में योगदान के लिए लेखक अनुक्रम और श्रेय|journal=PLOS Biol.|date=January 2007|volume=5|issue=1|pages=e18|pmid=17227141|doi=10.1371/journal.pbio.0050018|pmc=1769438}}</ref> कुछ क्षेत्रों में ग्रंथ सूची में [[उद्धरण|उद्धरणो]] को उनके लेखकों के उपनामों के आधार पर क्रमबद्ध करने की प्रथा उन लेखकों के पक्ष में पूर्वाग्रह रचना करती पाई गई है जिनके उपनाम वर्णमाला में पहले आते हैं, जबकि यह प्रभाव उन क्षेत्रों में प्रकट नहीं होता है जिनमें ग्रंथ सूची को कालानुक्रमिक रूप से क्रमबद्ध किया जाता है।<ref>{{cite journal|url=https://decisionslab.unl.edu/pubs/stevens_duque_2018_SM.pdf|first1=Jeffrey R.|last1=Stevens|first2=Juan F.|last2=Duque|title=Order Matters: Alphabetizing In-Text Citations Biases Citation Rates|journal=Psychonomic Bulletin & Review|year=2018|volume=26|issue=3|pages=1020–1026|doi=10.3758/s13423-018-1532-8|doi-access=free|pmid=30288671|s2cid=52922399|access-date=10 November 2018|archive-date=10 November 2018|archive-url=https://web.archive.org/web/20181110080311/https://decisionslab.unl.edu/pubs/stevens_duque_2018_SM.pdf|url-status=live}}
*{{lay source |author=Colleen Flaherty |title=The Case Against Alphabetical Naming of Authors |url=https://www.insidehighered.com/news/2018/10/22/study-takes-aim-psychologys-practice-ordering-reference-lists-alphabetically|website=[[Inside Higher Ed]] |date=22 October 2018}}</ref>
*{{lay source |author=Colleen Flaherty |title=The Case Against Alphabetical Naming of Authors |url=https://www.insidehighered.com/news/2018/10/22/study-takes-aim-psychologys-practice-ordering-reference-lists-alphabetically|website=[[Inside Higher Ed]] |date=22 October 2018}}</ref>




====द और अन्य सामान्य शब्द====
====द और अन्य सामान्य शब्द====
यदि कोई वाक्यांश किसी बहुत ही सामान्य शब्द से प्रारंभ होता है (जैसे कि, या , जिसे व्याकरण में लेख कहा जाता है), तो उस शब्द को कभी-कभी अनदेखा कर दिया जाता है या वाक्यांश के अंत में ले जाया जाता है, लेकिन हमेशा ऐसा नहीं होता है। उदाहरण के लिए, पुस्तक [[द शाइनिंग (उपन्यास)]] को शाइनिंग, या शाइनिंग, द के रूप में माना जा सकता है और इसलिए पुस्तक के शीर्षक [[सैम की गर्मी]] से पहले। यद्यपि, इसे केवल द शाइनिंग और आफ्टर समर ऑफ़ सैम के रूप में भी माना जा सकता है। इसी तरह, [[समय में एक झुर्री]] को रिंकल इन टाइम, रिंकल इन टाइम, ए या रिंकल इन टाइम के रूप में माना जा सकता है। एल्गोरिथम द्वारा सभी तीन वर्णानुक्रम विधियाँ बनाना काफी आसान है, लेकिन कई प्रोग्राम इसके अतिरिक्त सरल [[शब्दकोषीय क्रम]] पर भरोसा करते हैं।
यदि कोई वाक्यांश किसी बहुत ही सामान्य शब्द से प्रारंभ होता है (जैसे कि, "the", "a" या "an", जिसे व्याकरण में लेख कहा जाता है), तो उस शब्द को कभी-कभी अनदेखा कर दिया जाता है या वाक्यांश के अंत में ले जाया जाता है, लेकिन हमेशा ऐसा नहीं होता है। उदाहरण के लिए, पुस्तक शीर्षक 'समर ऑफ सैम' से पहले पुस्तक [[द शाइनिंग (उपन्यास)]] को शाइनिंग, या शाइनिंग, द के रूप में माना जा सकता है। यद्यपि, इसे केवल द शाइनिंग और आफ्टर समर ऑफ़ सैम के रूप में भी माना जा सकता है। इसी तरह, [[समय में एक झुर्री|रिंकल इन टाइम]] को रिंकल इन टाइम A", या "A रिंकल इन टाइम के रूप में माना जा सकता है। एल्गोरिथम द्वारा सभी तीन वर्णानुक्रम विधियाँ बनाना काफी आसान है, लेकिन कई प्रोग्राम इसके अतिरिक्त सरल [[शब्दकोषीय क्रम]] पर निर्भर करते हैं।


====मैक उपसर्ग====
====मैक उपसर्ग====
{{Main|Mac and Mc together}}
{{Main|मैक और Mc एक साथ}}
आयरिश और स्कॉटिश उपनामों में उपसर्ग एम और मैक मैक के लिए संक्षिप्त रूप हैं और कभी-कभी इन्हें वर्णानुक्रम में रखा जाता है जैसे कि वर्तनी पूरी तरह से मैक है। इस प्रकार मैकिन्ले को मैकिन्टोश से पहले सूचीबद्ध किया जा सकता है (जैसा कि यह होगा यदि इसे मैकिन्ले के रूप में लिखा गया हो)। कंप्यूटर-सॉर्ट की गई सूचियों के आगमन के बाद से, इस प्रकार का वर्णानुक्रम कम बार सामने आता है, यद्यपि इसका उपयोग अभी भी ब्रिटिश टेलीफोन निर्देशिकाओं में किया जाता है।
आयरिश और स्कॉटिश उपनामों में उपसर्ग एम और मैक मैक के लिए संक्षिप्त रूप हैं और कभी-कभी इन्हें वर्णानुक्रम में रखा जाता है जैसे कि वर्तनी पूरी तरह से मैक है। इस प्रकार मैकिन्ले को मैकिन्टोश से पहले सूचीबद्ध किया जा सकता है (जैसा कि यह होगा यदि इसे मैकिन्ले के रूप में लिखा गया हो)। कंप्यूटर-सॉर्ट की गई सूचियों के आगमन के बाद से, इस प्रकार का वर्णानुक्रम कम बार सामने आता है, यद्यपि इसका उपयोग अभी भी ब्रिटिश टेलीफोन निर्देशिकाओं में किया जाता है।


Line 78: Line 76:


====संयुक्ताक्षर====
====संयुक्ताक्षर====
टाइपोग्राफ़िक संयुक्ताक्षर (दो या दो से अधिक अक्षर एक प्रतीक में विलीन हो जाते हैं) जिन्हें विशिष्ट अक्षर नहीं माना जाता है, जैसे कि अंग्रेजी में Æ और Œ, आमतौर पर ऐसे एकत्रित किए जाते हैं जैसे कि अक्षर अलग-अलग हों - æther और aether को अन्य सभी शब्दों के सापेक्ष समान क्रम दिया जाएगा . यह तब भी सच है जब संयुक्ताक्षर पूरी तरह से शैलीगत नहीं है, जैसे कि ऋणशब्दों और ब्रांड नामों में।
टाइपोग्राफ़िक संयुक्ताक्षर (दो या दो से अधिक अक्षर एक प्रतीक में विलीन हो जाते हैं) जिन्हें विशिष्ट अक्षर नहीं माना जाता है, जैसे कि अंग्रेजी में Æ और Œ, सामान्यतः ऐसे एकत्रित किए जाते हैं जैसे कि अक्षर अलग-अलग हों - æther और aether को अन्य सभी शब्दों के सापेक्ष समान क्रम दिया जाएगा . यह तब भी सच है जब संयुक्ताक्षर पूरी तरह से शैलीगत नहीं है, जैसे कि ऋणशब्दों और ब्रांड नामों में।


श्रृंखला ्स को क्रमबद्ध करने के लिए विशेष नियमों को अपनाने की आवश्यकता हो सकती है जो केवल इस आधार पर भिन्न होते हैं कि दो अक्षर एक संयुक्ताक्षर से जुड़े हुए हैं या नहीं।
श्रृंखला ्स को क्रमबद्ध करने के लिए विशेष नियमों को अपनाने की आवश्यकता हो सकती है जो केवल इस आधार पर भिन्न होते हैं कि दो अक्षर एक संयुक्ताक्षर से जुड़े हुए हैं या नहीं।
Line 88: Line 86:
जब कुछ श्रृंखला ्स में [[संख्यात्मक अंक]] (या अन्य गैर-अक्षर वर्ण) होते हैं, तो विभिन्न दृष्टिकोण संभव होते हैं। कभी-कभी ऐसे वर्णों के साथ ऐसा व्यवहार किया जाता है मानो वे वर्णमाला के सभी अक्षरों से पहले या बाद में आए हों। एक अन्य तरीका यह है कि संख्याओं को वर्णानुक्रम में क्रमबद्ध किया जाए जैसे कि उन्हें लिखा जाएगा: उदाहरण के लिए 1776 (फिल्म) को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें सत्रह छिहत्तर लिखा गया हो, और 24 ह्यूरेस डु मैन्स को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें विंग्ट-क्वाट्रे लिखा गया हो... (फ्रेंच में) चौबीस )। जब अंकों या अन्य प्रतीकों का उपयोग अक्षरों के विशेष ग्राफिकल रूपों के रूप में किया जाता है, जैसे कि [[लीट]] के लिए 1337 या फिल्म सेवन (1995 फिल्म) (जिसे Se7en के रूप में शैलीबद्ध किया गया था), तो उन्हें इस तरह क्रमबद्ध किया जा सकता है जैसे कि वे वही अक्षर हों। प्राकृतिक सॉर्ट क्रम श्रृंखला  को वर्णानुक्रम में क्रमबद्ध करता है, सिवाय इसके कि बहु-अंकीय संख्याओं को एक एकल वर्ण के रूप में माना जाता है और अंकों द्वारा एन्कोड की गई संख्या के मान के आधार पर क्रमबद्ध किया जाता है।
जब कुछ श्रृंखला ्स में [[संख्यात्मक अंक]] (या अन्य गैर-अक्षर वर्ण) होते हैं, तो विभिन्न दृष्टिकोण संभव होते हैं। कभी-कभी ऐसे वर्णों के साथ ऐसा व्यवहार किया जाता है मानो वे वर्णमाला के सभी अक्षरों से पहले या बाद में आए हों। एक अन्य तरीका यह है कि संख्याओं को वर्णानुक्रम में क्रमबद्ध किया जाए जैसे कि उन्हें लिखा जाएगा: उदाहरण के लिए 1776 (फिल्म) को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें सत्रह छिहत्तर लिखा गया हो, और 24 ह्यूरेस डु मैन्स को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें विंग्ट-क्वाट्रे लिखा गया हो... (फ्रेंच में) चौबीस )। जब अंकों या अन्य प्रतीकों का उपयोग अक्षरों के विशेष ग्राफिकल रूपों के रूप में किया जाता है, जैसे कि [[लीट]] के लिए 1337 या फिल्म सेवन (1995 फिल्म) (जिसे Se7en के रूप में शैलीबद्ध किया गया था), तो उन्हें इस तरह क्रमबद्ध किया जा सकता है जैसे कि वे वही अक्षर हों। प्राकृतिक सॉर्ट क्रम श्रृंखला  को वर्णानुक्रम में क्रमबद्ध करता है, सिवाय इसके कि बहु-अंकीय संख्याओं को एक एकल वर्ण के रूप में माना जाता है और अंकों द्वारा एन्कोड की गई संख्या के मान के आधार पर क्रमबद्ध किया जाता है।


राजाओं और [[पोप]]ों के मामले में, यद्यपि उनकी संख्या [[रोमन अंक]]ों में होती है और अक्षरों से मिलती-जुलती होती है, उन्हें सामान्यतः  संख्यात्मक क्रम में व्यवस्थित किया जाता है: इसलिए, उदाहरण के लिए, भले ही V I के बाद आता है, डेनमार्क के डेनिश राजा क्रिश्चियन IX अपने पूर्ववर्ती के बाद आते हैं [[डेनमार्क के ईसाई आठवीं]]।
राजाओं और [[पोप]]ों के स्थितियॉं में, यद्यपि उनकी संख्या [[रोमन अंक]]ों में होती है और अक्षरों से मिलती-जुलती होती है, उन्हें सामान्यतः  संख्यात्मक क्रम में व्यवस्थित किया जाता है: इसलिए, उदाहरण के लिए, भले ही V I के बाद आता है, डेनमार्क के डेनिश राजा क्रिश्चियन IX अपने पूर्ववर्ती के बाद आते हैं [[डेनमार्क के ईसाई आठवीं]]।


===भाषा-विशिष्ट परंपराएँ===
===भाषा-विशिष्ट परंपराएँ===
Line 97: Line 95:


विभिन्न भाषाओं में लागू वर्णानुक्रम नियम नीचे सूचीबद्ध हैं।
विभिन्न भाषाओं में लागू वर्णानुक्रम नियम नीचे सूचीबद्ध हैं।
* [[अरबी भाषा]] में, आज उपयोग की जाने वाली 28 अक्षरों की वर्णमाला के दो मुख्य क्रम हैं। मानक और सबसे अधिक उपयोग किया जाने वाला है {{ill|hijā alphabet|ar|ترتيب_هجائي|v=sup}}, जिसे प्रारंभिक अरब भाषाविद् नस्र इब्न 'असीम अल-लेथी द्वारा गढ़ा गया था और इसमें एक दृश्य आदेश पद्धति की सुविधा है, जहां उदाहरण के लिए अक्षर बा, ता, Θaa ب ت ث को बा के आकार के आधार पर क्रमबद्ध किया जाता है। मूल अबजद क्रम, जो ध्वन्यात्मक रूप से अन्य सेमेटिक भाषाओं के साथ-साथ लैटिन से मिलता-जुलता है, आज भी उपयोग में है, आमतौर पर [[रोमन अंक]]ों के अनुरूप दस्तावेज़ में सूचियों को ऑर्डर करने तक ही सीमित है। जब अब्जदिया का उपयोग क्रमांकन में किया जाता है, तो उन अक्षरों को वाक्य के तीन पहले अक्षरों के साथ-साथ संख्याओं से अलग करने के लिए अक्षरों को लिखने का एक अनोखा अमूर्त तरीका इस्तेमाल किया जाना चाहिए। उदाहरण के लिए, एलेफ़ ا जो हिंदी अंक ١ के समान दिखता है, एक छोटा अंडाकार लूप अक्षर के निचले हिस्से की दक्षिणावर्त दिशा में फैला हुआ है, जिसके बाद एक छोटी पूंछ होती है। यद्यपि इन वर्णों का उपयोग शायद ही कभी डिजिटल रूप से किया जाता है, इन्हें [[ASCII]] के तहत अरबी गणितीय वर्णमाला के रूप में मान्यता दी गई है, जिसकी सीमाएँ 1EE00 से 1EEFF तक हैं। <ref>{{cite web |title=अरबी गणितीय वर्णमाला चिह्न|url=https://www.unicode.org/charts/PDF/U1EE00.pdf |publisher=THE Unicode Standard |access-date=26 November 2022 |archive-date=30 October 2022 |archive-url=https://web.archive.org/web/20221030230610/https://www.unicode.org/charts/PDF/U1EE00.pdf |url-status=live }}</ref> एक कम सामान्य आदेश है, जिसे ध्वन्यात्मक रूप से आदेश दिया जाता है {{ill| Sawti Alphabet |ar|ترتيب_صوتي|v=sup}}, गहरे गले की ध्वनि हा से प्रारंभ होकर लिप मोस्ट मीम तक। यह आदेश [[फ़राहिदी]] द्वारा बनाया गया था।
* [[अरबी भाषा]] में, आज उपयोग की जाने वाली 28 अक्षरों की वर्णमाला के दो मुख्य क्रम हैं। मानक और सबसे अधिक उपयोग किया जाने वाला है {{ill|hijā alphabet|ar|ترتيب_هجائي|v=sup}}, जिसे प्रारंभिक अरब भाषाविद् नस्र इब्न 'असीम अल-लेथी द्वारा गढ़ा गया था और इसमें एक दृश्य आदेश पद्धति की सुविधा है, जहां उदाहरण के लिए अक्षर बा, ता, Θaa ب ت ث को बा के आकार के आधार पर क्रमबद्ध किया जाता है। मूल अबजद क्रम, जो ध्वन्यात्मक रूप से अन्य सेमेटिक भाषाओं के साथ-साथ लैटिन से मिलता-जुलता है, आज भी उपयोग में है, सामान्यतः [[रोमन अंक]]ों के अनुरूप दस्तावेज़ में सूचियों को ऑर्डर करने तक ही सीमित है। जब अब्जदिया का उपयोग क्रमांकन में किया जाता है, तो उन अक्षरों को वाक्य के तीन पहले अक्षरों के साथ-साथ संख्याओं से अलग करने के लिए अक्षरों को लिखने का एक अनोखा अमूर्त तरीका इस्तेमाल किया जाना चाहिए। उदाहरण के लिए, एलेफ़ ا जो हिंदी अंक ١ के समान दिखता है, एक छोटा अंडाकार लूप अक्षर के निचले हिस्से की दक्षिणावर्त दिशा में फैला हुआ है, जिसके बाद एक छोटी पूंछ होती है। यद्यपि इन वर्णों का उपयोग शायद ही कभी डिजिटल रूप से किया जाता है, इन्हें [[ASCII]] के तहत अरबी गणितीय वर्णमाला के रूप में मान्यता दी गई है, जिसकी सीमाएँ 1EE00 से 1EEFF तक हैं। <ref>{{cite web |title=अरबी गणितीय वर्णमाला चिह्न|url=https://www.unicode.org/charts/PDF/U1EE00.pdf |publisher=THE Unicode Standard |access-date=26 November 2022 |archive-date=30 October 2022 |archive-url=https://web.archive.org/web/20221030230610/https://www.unicode.org/charts/PDF/U1EE00.pdf |url-status=live }}</ref> एक कम सामान्य आदेश है, जिसे ध्वन्यात्मक रूप से आदेश दिया जाता है {{ill| Sawti Alphabet |ar|ترتيب_صوتي|v=sup}}, गहरे गले की ध्वनि हा से प्रारंभ होकर लिप मोस्ट मीम तक। यह आदेश [[फ़राहिदी]] द्वारा बनाया गया था।


* [[अज़रबैजानी भाषा]] [[[[[[में]]]]]], मानक लैटिन वर्णमाला में आठ अतिरिक्त अक्षर हैं। उनमें से पांच स्वर हैं: i, ı, ö, ü, ə [[[[और]]]] तीन व्यंजन हैं: ç, ş, ğ. वर्णमाला [[तुर्की वर्णमाला]] के समान है, जिसमें समान अक्षरों के [[साथ]] समान ध्वनियाँ लिखी जाती हैं, तीन अतिरिक्त अक्षरों को छोड़कर: q, x और ə उन ध्वनियों के लि[[ए]] जो तुर्की में उपस्थित नहीं हैं। यद्यपि सभी तुर्की अक्षरों को तुर्की की तरह उनके सामान्य वर्णमाला क्रम में संकलित किया गया है, तीन अतिरिक्त अक्षरों को उन अक्षरों के बाद मनमाने ढंग से एकत्रित किया जाता है जिनकी ध्वनियाँ उनके करीब आती हैं। तो, q को k के ठीक बाद एकत्रित किया जाता है, x (जर्मन ch की तरह उच्चारित किया जाता है) को h के ठीक बाद एकत्रित किया जाता है और ə (मोटे तौर पर अंग्रेजी शॉर्ट a की तरह उच्चारित किया जाता है) को e के ठीक बाद एकत्रित किया जाता है।
* [[अज़रबैजानी भाषा]] [[[[[[में]]]]]], मानक लैटिन वर्णमाला में आठ अतिरिक्त अक्षर हैं। उनमें से पांच स्वर हैं: i, ı, ö, ü, ə [[[[और]]]] तीन व्यंजन हैं: ç, ş, ğ. वर्णमाला [[तुर्की वर्णमाला]] के समान है, जिसमें समान अक्षरों के [[साथ]] समान ध्वनियाँ लिखी जाती हैं, तीन अतिरिक्त अक्षरों को छोड़कर: q, x और ə उन ध्वनियों के लि[[ए]] जो तुर्की में उपस्थित नहीं हैं। यद्यपि सभी तुर्की अक्षरों को तुर्की की तरह उनके सामान्य वर्णमाला क्रम में संकलित किया गया है, तीन अतिरिक्त अक्षरों को उन अक्षरों के बाद मनमाने ढंग से एकत्रित किया जाता है जिनकी ध्वनियाँ उनके करीब आती हैं। तो, q को k के ठीक बाद एकत्रित किया जाता है, x (जर्मन ch की तरह उच्चारित किया जाता है) को h के ठीक बाद एकत्रित किया जाता है और ə (मोटे तौर पर अंग्रेजी शॉर्ट a की तरह उच्चारित किया जाता है) को e के ठीक बाद एकत्रित किया जाता है।
Line 143: Line 141:
वर्णमाला क्रम के पीछे का सिद्धांत अभी भी उन भाषाओं में लागू किया जा सकता है जो कड़ाई से वर्णमाला का उपयोग नहीं करते हैं - उदाहरण के लिए, उन्हें एक शब्दांश या [[अबुगिडा]] का उपयोग करके लिखा जा सकता है - बशर्ते उपयोग किए गए प्रतीकों में एक स्थापित क्रम हो।
वर्णमाला क्रम के पीछे का सिद्धांत अभी भी उन भाषाओं में लागू किया जा सकता है जो कड़ाई से वर्णमाला का उपयोग नहीं करते हैं - उदाहरण के लिए, उन्हें एक शब्दांश या [[अबुगिडा]] का उपयोग करके लिखा जा सकता है - बशर्ते उपयोग किए गए प्रतीकों में एक स्थापित क्रम हो।


चीनी [[ बत्तख ]] या जापानी [[कांजी]] जैसे [[लॉगोग्राफ]]़िक लेखन प्रणालियों के लिए, [[ रेडिकल-एंड-स्ट्रोक छँटाई ]] की विधि का उपयोग अक्सर प्रतीकों पर एक आदेश को परिभाषित करने के तरीके के रूप में किया जाता है। जापानी कभी-कभी उच्चारण क्रम का उपयोग करते हैं, आमतौर पर गोजोन क्रम के साथ लेकिन कभी-कभी पुराने [[इरोहा]] क्रम के साथ।
चीनी [[ बत्तख ]] या जापानी [[कांजी]] जैसे [[लॉगोग्राफ]]़िक लेखन प्रणालियों के लिए, [[ रेडिकल-एंड-स्ट्रोक छँटाई ]] की विधि का उपयोग प्रायः प्रतीकों पर एक आदेश को परिभाषित करने के तरीके के रूप में किया जाता है। जापानी कभी-कभी उच्चारण क्रम का उपयोग करते हैं, सामान्यतः गोजोन क्रम के साथ लेकिन कभी-कभी पुराने [[इरोहा]] क्रम के साथ।


गणित में, शब्दकोषीय क्रम अनुक्रमों को उस तरीके से क्रमबद्ध करने का एक साधन है जिसका उपयोग वर्णमाला क्रम उत्पन्न करने के लिए किया जाता है।<ref name="BaaderNipkow1999">{{cite book|author1=Franz Baader|author2=Tobias Nipkow|title=टर्म पुनर्लेखन और वह सब|year=1999|publisher=Cambridge University Press|isbn=978-0-521-77920-3|pages=18–19}}</ref>
गणित में, शब्दकोषीय क्रम अनुक्रमों को उस तरीके से क्रमबद्ध करने का एक साधन है जिसका उपयोग वर्णमाला क्रम उत्पन्न करने के लिए किया जाता है।<ref name="BaaderNipkow1999">{{cite book|author1=Franz Baader|author2=Tobias Nipkow|title=टर्म पुनर्लेखन और वह सब|year=1999|publisher=Cambridge University Press|isbn=978-0-521-77920-3|pages=18–19}}</ref>

Revision as of 13:22, 11 July 2023


वर्णमाला क्रम एक ऐसी प्रणाली है जिसमें किसी वर्णमाला के सांकेतिक क्रम में वर्णों की स्थिति के आधार पर वर्ण श्रृंखला को क्रम में रखा जाता है। यह समानुक्रम की विधियों में से एक है। गणित में, एक शब्दकोषीय क्रम अन्य डेटा प्रकारों के लिए वर्णमाला क्रम का सामान्यीकरण है, जैसे संख्याओं का अनुक्रम (गणित) या अन्य गणितीय वस्तुओं के क्रम है।

जब श्रृंखला या अनुक्रम (गणित) पर लागू किया जाता है जिसमें वर्णमाला वर्णों के अलावा अंक, संख्याएं या अधिक विस्तृत प्रकार के तत्व सम्मिलित हो सकते हैं, तो वर्णमाला क्रम को सामान्यतः शब्दकोषीय क्रम कहा जाता है।

यह निर्धारित करने के लिए कि वर्णमाला क्रम में व्यवस्थित करते समय वर्णों की दो पंक्तियों में से कौन सा पहले आता है, उनके पहले अक्षर (वर्णमाला) की तुलना की जाती है। यदि वे भिन्न हैं, तो वह श्रृंखला जिसका पहला अक्षर वर्णमाला में पहले आता है, दूसरी श्रृंखला से पहले आती है। यदि पहले अक्षर समान हैं, तो दूसरे अक्षरों की तुलना की जाती है, इत्यादि। यदि ऐसी स्थिति आ जाती है जहां एक श्रृंखला में तुलना करने के लिए अधिक अक्षर नहीं हैं जबकि दूसरे में है, तो पहली (छोटी) श्रृंखला को वर्णमाला क्रम में पहले स्थान पर माना जाता है।

वर्णमाला क्रम के प्रयोजनों के लिए बड़े अक्षरों को सामान्यतः उनके संबंधित छोटे अक्षरों के समान माना जाता है, यद्यपि उन स्थितियों को संभालने के लिए संकेतो को अपनाया जा सकता है जहां दो श्रृंखला केवल बड़े अक्षरों में भिन्न होते हैं। रिक्त स्थान (प्रतीक), संशोधित अक्षर, जैसे विशेषक वाले अक्षर, और गैर-अक्षर वर्ण जैसे विराम चिह्न वाले श्रृंखला के प्रबंधन के लिए भी विभिन्न संधियाँ उपस्थित हैं।

शब्दों या श्रृंखलाओ के एक सेट को वर्णमाला क्रम में रखने का परिणाम यह होता है कि एक ही अक्षर से प्रारंभ होने वाली सभी श्रृंखलाओ को एक साथ समूहबद्ध किया जाता है; उस समूह के भीतर समान दो-अक्षर अनुक्रम से प्रारंभ होने वाले सभी शब्दों को एक साथ समूहीकृत किया जाता है; इत्यादि। इस प्रकार प्रणाली आसन्न शब्दों के बीच सामान्य प्रारंभिक अक्षरों की संख्या को अधिकतम करने की ओर अग्रसर होती है।

इतिहास

वर्णमाला क्रम का उपयोग पहली बार पहली सहस्राब्दी ईसा पूर्व में उत्तर पश्चिमी सेमिटिक शास्त्रियों द्वारा इस प्रणाली का उपयोग करके किया गया था।[1] यद्यपि, भौगोलिक, कालानुक्रमिक, पदानुक्रमित और वर्गीकरण सहित सामग्री को वर्गीकृत करने और क्रमबद्ध करने की कई अन्य विधियों को सदियों से वर्णमाला क्रम पर प्राथमिकता दी गई थी।[2]

बाइबिल छठी-सातवीं शताब्दी ईसा पूर्व की है। यिर्मयाह की पुस्तक में, पैगंबर वर्णमाला क्रम के आधार पर एटबाश प्रतिस्थापन सिफर का उपयोग करता है। इसी तरह, बाइबिल के लेखकों ने (क्रमबद्ध) हिब्रू वर्णमाला के आधार पर एक्रोस्टिक्स का उपयोग किया था।[3]

विद्वानों के बीच सूचीबद्ध उपकरण के रूप में वर्णमाला क्रम का पहला प्रभावी उपयोग प्राचीन अलेक्जेंड्रिया में हुआ होगा,[4] अलेक्जेंड्रिया की महान लाइब्रेरी में, जिसकी स्थापना लगभग 300 ईसा पूर्व हुई थी। ऐसा माना जाता है कि वहां काम करने वाले कवि और विद्वान कैलीमाचस ने दुनिया की पहली पुस्तकालय सूची बनाई थी, जिसे चित्रों के नाम से जाना जाता था, जिसमें लेखकों के नाम के पहले अक्षर के वर्णमाला क्रम में सूचीपत्र किए गए थे।[2]

पहली शताब्दी ईसा पूर्व में, रोमन लेखक वरो ने लेखकों और शीर्षकों की वर्णानुक्रमिक सूचियाँ संकलित कीं थी।[5] दूसरी शताब्दी ईस्वी में, सेक्स्टस पोम्पेयस फेस्टस ने वर्णानुक्रम में प्रविष्टियों के साथ, वेरियस फ्लैकस, शब्दों के अर्थ पर के कार्यों का एक विश्वकोषीय प्रतीक लिखा था।[6] तीसरी शताब्दी ईस्वी में, हारपोक्रेशन ने सभी अक्षरों द्वारा वर्णमाला के अनुसार एक होमेरिक शब्दकोष लिखा था।[7] 10वीं शताब्दी में, सूडा के लेखक ने स्वन लिपि विविधताओं के साथ वर्णमाला क्रम का उपयोग किया था।

१२वीं शताब्दी के दूसरे भाग में, जब प्रचारकों को बाइबलीय शब्दावली का विश्‍लेषण करने में मदद करने के लिए वर्णमाला के साधन विकसित किए गए, तब परामर्श करने के लिए एक सहायता के रूप में वर्णमाला क्रम पश्चिमी यूरोपीय बौद्धिक जीवन की मुख्य धारा में प्रवेश करने लगा था। इसके परिणामस्वरूप 13वीं शताब्दी में सेंट चेर के ह्यूग के नेतृत्व में पेरिस में डोमिनिकन भिक्षुओं द्वारा बाइबिल के वर्णमाला क्रमबद्धता (प्रकाशन) का संकलन किया गया था। पुराने संदर्भ कार्यों जैसे कि हिब्रू नामों की सेंट जेरोम की व्याख्या को परामर्श की सरलता के लिए वर्णानुक्रमित किया गया था। वर्णमाला क्रम के उपयोग का प्रारंभ में विद्वानों द्वारा विरोध किया गया था, जो अपने छात्रों से अपेक्षा करते थे कि वे अपने अध्ययन के क्षेत्र में अपनी तर्कसंगत संरचनाओं के अनुसार महारत हासिल करें; इसकी सफलता रॉबर्ट किलवर्डबी के सेंट ऑगस्टीन के कार्यों के सूचकांक जैसे उपकरणों द्वारा प्रेरित थी, जिसने पाठकों को उद्धरण के संकलन पर निर्भर होने के अतिरिक्त पूर्ण मूल पाठ तक पहुंचने में मदद की, जो 12 वीं शताब्दी के विद्वतावाद में प्रमुख हो गए थे। वर्णमाला क्रम को अपनाना स्मृति की प्रधानता से लिखित कार्यों की प्रधानता की ओर परिवर्तन का भाग थे।[8] वर्णमाला के आदेश द्वारा सूचना का आदेश देने का विचार 12वीं और 13वीं शताब्दियों में इनसाइक्लोपीडिया के संकलनकर्ताओं के प्रतिरोध से भी मिला, जो सभी धार्मिक चर्च के लोग थे। उन्होंने देव (अर्थात् भगवान) के साथ प्रारंभ करते हुए अपनी सामग्री को धर्मशास्त्रीय रूप से व्यवस्थित करना पसंद किया था।[2]

1604 में रॉबर्ट कॉड्रे को अंग्रेजी के पहले एकभाषी शब्दकोष, तालिका वर्णमाला क्रम में में समझाना पड़ा, अब यदि वह शब्द, जिसे आप खोजना चाहते हैं, (a) से प्रारंभ होता है तो इस तालिका की शुरुआत में देखें, लेकिन यदि (v) के साथ अंत की ओर देखें।[9] यद्यपि 1803 के उत्तरार्ध में सैमुअल टेलर कोलरिज ने प्रारंभिक अक्षरों की दुर्घटना से निर्धारित व्यवस्था वाले विश्वकोशों की निंदा की,[10] आज अनेक सूचियाँ इसी सिद्धांत पर आधारित हैं।

वर्णानुक्रम में व्यवस्था को सूचना तक पहुंच के लोकतंत्रीकरण के लिए एक शक्ति के रूप में देखा जा सकता है, क्योंकि इसकी आवश्यकता को खोजने के लिए व्यापक पूर्व ज्ञान की आवश्यकता नहीं है।[2]


लैटिन लिपि में क्रमीकरण

मूल क्रम और उदाहरण

आधुनिक ISO मूल लैटिन वर्णमाला का मानक क्रम है:

A-B-C-D-E-F-G-H-I-J-K-L-M-N-O-P-Q-R-S-T-U-V-W-X-Y-Z

सरल वर्णमाला क्रम का एक उदाहरण इस प्रकार है:

  • जैसा; एस्टर; एस्ट्रोलैब; खगोल विज्ञान; खगोलभौतिकी; एटमान; अटैक; बा

एक और उदाहरण:

  • बार्नकल; बे; बिन; बेनफिट; बेन्ट

उपरोक्त शब्द वर्णानुक्रम में क्रमबद्ध हैं। एस्टर से पहले As आता है क्योंकि वे उन्हीं दो अक्षरों से प्रारंभ होते हैं और As के बाद कोई और अक्षर नहीं है जबकि एस्टर के पास है। अगले तीन शब्द एस्टर के बाद आते हैं क्योंकि उनका चौथा अक्षर (पहला जो अलग है) r है, जो e (एस्टर का चौथा अक्षर) के बाद आता है वर्णमाला। उन शब्दों को उनके छठे अक्षर (क्रमशः l, n और p) के आधार पर क्रमबद्ध किया गया है। इसके बाद At आता है, जो दूसरे अक्षर में पिछले शब्दों से भिन्न है (t s के बाद आता है)। अतामन At के बाद उसी कारण से आता है जिस तरह एस्टर As के बाद आता है। अटैक उनके तीसरे अक्षरों की तुलना के आधार पर अतामान का अनुसरण करता है, और बा अन्य सभी के बाद आता है क्योंकि इसका पहला अक्षर अलग है।

मल्टीवर्ड श्रृंखला का प्रतिपादन

जब क्रम की जा रही कुछ श्रृंखला में एक से अधिक शब्द होते हैं, यानी, उनमें स्पेस (वर्ण) या हैफ़ेन जैसे अन्य विभाजक होते हैं, तो दो बुनियादी दृष्टिकोण अपनाए जा सकते हैं। पहले दृष्टिकोण में, सभी श्रृंखला को प्रारंभ में उनके पहले शब्द के अनुसार क्रमबद्ध किया जाता है, जैसा कि अनुक्रम में है:

  • ओक; ओक हिल; ओक रिज; ओकले पार्क; ओकले नदी
    जहां अलग-अलग शब्द ओक से प्रारंभ होने वाले सभी श्रृंखला ओकले से प्रारंभ होने वाले सभी श्रृंखलाों से पहले आते हैं, क्योंकि वर्णमाला क्रम में ओक, ओकले से पहले आता है।

दूसरे दृष्टिकोण में, श्रृंखला को ऐसे वर्णानुक्रम में रखा जाता है जैसे कि उनमें कोई स्थान न हो, अनुक्रम देते हुए:

  • ओक; ओक हिल; ओकले पार्क; ओकले नदी; ओक रिज
    जहां ओक रिज अब ओकले श्रृंखला के बाद आता है, जैसा कि अगर इसे ओक्रीज लिखा जाता तो ऐसा होता है।

दूसरा दृष्टिकोण वह है जो सामान्यतः शब्दकोशों में अपनाया जाता है[citation needed], और इस प्रकार प्रकाशन द्वारा इसे प्रायः शब्दकोश क्रम (बहुविकल्पी) कहा जाता है। पहला दृष्टिकोण प्रायः सूचकांक (प्रकाशन) में उपयोग किया जाता है, यद्यपि प्रत्येक प्रकाशक पारंपरिक रूप से अपने स्वयं के मानक निर्धारित करता है कि उसमें किस दृष्टिकोण का उपयोग किया जाए; 1975 से पहले पुस्तक अनुक्रमणिका (ISO 999) के लिए कोई ISO मानक नहीं था।

विशेष स्थितियॉं

संशोधित अक्षर

फ़्रेंच में, संशोधित अक्षरों (जैसे कि विशेषक वाले अक्षर) को वर्णमाला क्रम के प्रयोजनों के लिए आधार अक्षर के समान माना जाता है। उदाहरण के लिए, चट्टान और गुलाब के बीच भूमिका आती है, मानो यह लिखित भूमिका हो। यद्यपि, जो भाषाएँ ऐसे अक्षरों का व्यवस्थित रूप से उपयोग करती हैं, उनके सामान्यतः अपने स्वयं के आदेश नियम होते हैं। देखना § Language-specific conventions नीचे।

उपनाम से क्रमीकरण

अधिकांश संस्कृतियों में जहां परिवार के नाम दिए गए नामों के बाद लिखे जाते हैं, वहां अभी भी पहले परिवार के नाम के आधार पर नामों की सूची (जैसे टेलीफोन निर्देशिकाओं में) को क्रमबद्ध करना वांछित है। इस स्थितियॉं में, नामों को सही ढंग से क्रमबद्ध करने के लिए उन्हें पुन: व्यवस्थित करने की आवश्यकता है। उदाहरण के लिए, जुआन हर्नांडेस और ब्रायन ओ'लेरी को हर्नांडेस, जुआन और ओ'लेरी, ब्रायन के रूप में क्रमबद्ध किया जाना चाहिए, भले ही उन्हें इस तरह नहीं लिखा गया हो। इस नियम को कंप्यूटर संयोजन एल्गोरिदम में कैद करना जटिल है, और सरल प्रयास विफल हो जाएंगे। उदाहरण के लिए, जब तक एल्गोरिथ्म के पास वर्ग के नामों की एक विस्तृत सूची न हो, तब तक यह तय करने का कोई तरीका नहीं है कि गिलियन ल्यूसिले वैन डेर वाल वैन डेर वाल हैं, गिलियन ल्यूसिले, वाल, गिलियन ल्यूसिले वैन डेर, या यहां तक ​​कि ल्यूसिले वैन डेर वाल भी हैं।

शैक्षणिक संदर्भों में उपनाम से क्रमीकरण का प्रायः सामना किया जाता है। एकल बहु-लेखक पेपर के भीतर, लेखकों को अन्य तरीकों जैसे रिवर्स वरिष्ठता या पेपर में योगदान की व्यक्तिपरक डिग्री के अतिरिक्त उपनाम के अनुसार क्रमबद्ध करना, समान योगदान को स्वीकार करने या टालने के एक तरीके के रूप में देखा जाता है। सहयोगी समूहों में असामंजस्य।[11] कुछ क्षेत्रों में ग्रंथ सूची में उद्धरणो को उनके लेखकों के उपनामों के आधार पर क्रमबद्ध करने की प्रथा उन लेखकों के पक्ष में पूर्वाग्रह रचना करती पाई गई है जिनके उपनाम वर्णमाला में पहले आते हैं, जबकि यह प्रभाव उन क्षेत्रों में प्रकट नहीं होता है जिनमें ग्रंथ सूची को कालानुक्रमिक रूप से क्रमबद्ध किया जाता है।[12]


द और अन्य सामान्य शब्द

यदि कोई वाक्यांश किसी बहुत ही सामान्य शब्द से प्रारंभ होता है (जैसे कि, "the", "a" या "an", जिसे व्याकरण में लेख कहा जाता है), तो उस शब्द को कभी-कभी अनदेखा कर दिया जाता है या वाक्यांश के अंत में ले जाया जाता है, लेकिन हमेशा ऐसा नहीं होता है। उदाहरण के लिए, पुस्तक शीर्षक 'समर ऑफ सैम' से पहले पुस्तक द शाइनिंग (उपन्यास) को शाइनिंग, या शाइनिंग, द के रूप में माना जा सकता है। यद्यपि, इसे केवल द शाइनिंग और आफ्टर समर ऑफ़ सैम के रूप में भी माना जा सकता है। इसी तरह, रिंकल इन टाइम को रिंकल इन टाइम A", या "A रिंकल इन टाइम के रूप में माना जा सकता है। एल्गोरिथम द्वारा सभी तीन वर्णानुक्रम विधियाँ बनाना काफी आसान है, लेकिन कई प्रोग्राम इसके अतिरिक्त सरल शब्दकोषीय क्रम पर निर्भर करते हैं।

मैक उपसर्ग

आयरिश और स्कॉटिश उपनामों में उपसर्ग एम और मैक मैक के लिए संक्षिप्त रूप हैं और कभी-कभी इन्हें वर्णानुक्रम में रखा जाता है जैसे कि वर्तनी पूरी तरह से मैक है। इस प्रकार मैकिन्ले को मैकिन्टोश से पहले सूचीबद्ध किया जा सकता है (जैसा कि यह होगा यदि इसे मैकिन्ले के रूप में लिखा गया हो)। कंप्यूटर-सॉर्ट की गई सूचियों के आगमन के बाद से, इस प्रकार का वर्णानुक्रम कम बार सामने आता है, यद्यपि इसका उपयोग अभी भी ब्रिटिश टेलीफोन निर्देशिकाओं में किया जाता है।

सेंट उपसर्ग

उपसर्ग सेंट या सेंट सेंट का संक्षिप्त रूप है, और पारंपरिक रूप से इसे वर्णानुक्रम में रखा जाता है जैसे कि वर्तनी पूरी तरह से सेंट है। इस प्रकार एक गजेटियर में सेंट जॉन्स को सेलम से पहले सूचीबद्ध किया जा सकता है (जैसे कि इसे सेंट जॉन्स के रूप में लिखा गया हो)। कंप्यूटर-सॉर्ट की गई सूचियों के आगमन के बाद से, इस प्रकार का वर्णानुक्रम कम बार सामने आता है, यद्यपि इसका उपयोग अभी भी कभी-कभी किया जाता है।

संयुक्ताक्षर

टाइपोग्राफ़िक संयुक्ताक्षर (दो या दो से अधिक अक्षर एक प्रतीक में विलीन हो जाते हैं) जिन्हें विशिष्ट अक्षर नहीं माना जाता है, जैसे कि अंग्रेजी में Æ और Œ, सामान्यतः ऐसे एकत्रित किए जाते हैं जैसे कि अक्षर अलग-अलग हों - æther और aether को अन्य सभी शब्दों के सापेक्ष समान क्रम दिया जाएगा . यह तब भी सच है जब संयुक्ताक्षर पूरी तरह से शैलीगत नहीं है, जैसे कि ऋणशब्दों और ब्रांड नामों में।

श्रृंखला ्स को क्रमबद्ध करने के लिए विशेष नियमों को अपनाने की आवश्यकता हो सकती है जो केवल इस आधार पर भिन्न होते हैं कि दो अक्षर एक संयुक्ताक्षर से जुड़े हुए हैं या नहीं।

अंकों का उपचार

जब कुछ श्रृंखला ्स में संख्यात्मक अंक (या अन्य गैर-अक्षर वर्ण) होते हैं, तो विभिन्न दृष्टिकोण संभव होते हैं। कभी-कभी ऐसे वर्णों के साथ ऐसा व्यवहार किया जाता है मानो वे वर्णमाला के सभी अक्षरों से पहले या बाद में आए हों। एक अन्य तरीका यह है कि संख्याओं को वर्णानुक्रम में क्रमबद्ध किया जाए जैसे कि उन्हें लिखा जाएगा: उदाहरण के लिए 1776 (फिल्म) को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें सत्रह छिहत्तर लिखा गया हो, और 24 ह्यूरेस डु मैन्स को ऐसे क्रमबद्ध किया जाएगा जैसे कि उन्हें विंग्ट-क्वाट्रे लिखा गया हो... (फ्रेंच में) चौबीस )। जब अंकों या अन्य प्रतीकों का उपयोग अक्षरों के विशेष ग्राफिकल रूपों के रूप में किया जाता है, जैसे कि लीट के लिए 1337 या फिल्म सेवन (1995 फिल्म) (जिसे Se7en के रूप में शैलीबद्ध किया गया था), तो उन्हें इस तरह क्रमबद्ध किया जा सकता है जैसे कि वे वही अक्षर हों। प्राकृतिक सॉर्ट क्रम श्रृंखला को वर्णानुक्रम में क्रमबद्ध करता है, सिवाय इसके कि बहु-अंकीय संख्याओं को एक एकल वर्ण के रूप में माना जाता है और अंकों द्वारा एन्कोड की गई संख्या के मान के आधार पर क्रमबद्ध किया जाता है।

राजाओं और पोपों के स्थितियॉं में, यद्यपि उनकी संख्या रोमन अंकों में होती है और अक्षरों से मिलती-जुलती होती है, उन्हें सामान्यतः संख्यात्मक क्रम में व्यवस्थित किया जाता है: इसलिए, उदाहरण के लिए, भले ही V I के बाद आता है, डेनमार्क के डेनिश राजा क्रिश्चियन IX अपने पूर्ववर्ती के बाद आते हैं डेनमार्क के ईसाई आठवीं

भाषा-विशिष्ट परंपराएँ

जो भाषाएँ विस्श्रृंखलाित लैटिन वर्णमाला का उपयोग करती हैं, उनमें सामान्यतः अतिरिक्त अक्षरों के उपचार के लिए अपनी परंपराएँ होती हैं। इसके अलावा कुछ भाषाओं में कुछ डिग्राफ (शब्दावली) को मिलान प्रयोजनों के लिए एकल अक्षरों के रूप में माना जाता है। उदाहरण के लिए, स्पैनिश शब्दावली ñ को n के बाद एक मूल अक्षर के रूप में मानती है, और पहले डिग्राफ ch और ll को क्रमशः c और l के बाद मूल अक्षर के रूप में मानती थी। अब ch और ll को दो-अक्षर संयोजन के रूप में वर्णित किया गया है। नया वर्णानुक्रम नियम 1994 में रॉयल स्पैनिश अकादमी द्वारा जारी किया गया था। इन डिग्राफ को अभी भी औपचारिक रूप से अक्षरों के रूप में नामित किया गया था, लेकिन 2010 के बाद से वे अब ऐसा नहीं हैं। दूसरी ओर, डिग्राफ आरआर उम्मीद के मुताबिक आरक्यू का पालन करता है (और इससे पहले भी ऐसा किया गया था) 1994 वर्णमाला नियम), जबकि तीव्र उच्चारण (ए, ई, आई, ओ, यू) वाले स्वरों को हमेशा उनके आधार अक्षरों के समानांतर क्रमबद्ध किया गया है, जैसा कि अक्षर ü है।

कुछ मामलों में, जैसे अरबी वर्णमाला और किओवा वर्णमाला, वर्णमाला को पूरी तरह से पुन: व्यवस्थित किया गया है।

विभिन्न भाषाओं में लागू वर्णानुक्रम नियम नीचे सूचीबद्ध हैं।

  • अरबी भाषा में, आज उपयोग की जाने वाली 28 अक्षरों की वर्णमाला के दो मुख्य क्रम हैं। मानक और सबसे अधिक उपयोग किया जाने वाला है hijā alphabet [ar], जिसे प्रारंभिक अरब भाषाविद् नस्र इब्न 'असीम अल-लेथी द्वारा गढ़ा गया था और इसमें एक दृश्य आदेश पद्धति की सुविधा है, जहां उदाहरण के लिए अक्षर बा, ता, Θaa ب ت ث को बा के आकार के आधार पर क्रमबद्ध किया जाता है। मूल अबजद क्रम, जो ध्वन्यात्मक रूप से अन्य सेमेटिक भाषाओं के साथ-साथ लैटिन से मिलता-जुलता है, आज भी उपयोग में है, सामान्यतः रोमन अंकों के अनुरूप दस्तावेज़ में सूचियों को ऑर्डर करने तक ही सीमित है। जब अब्जदिया का उपयोग क्रमांकन में किया जाता है, तो उन अक्षरों को वाक्य के तीन पहले अक्षरों के साथ-साथ संख्याओं से अलग करने के लिए अक्षरों को लिखने का एक अनोखा अमूर्त तरीका इस्तेमाल किया जाना चाहिए। उदाहरण के लिए, एलेफ़ ا जो हिंदी अंक ١ के समान दिखता है, एक छोटा अंडाकार लूप अक्षर के निचले हिस्से की दक्षिणावर्त दिशा में फैला हुआ है, जिसके बाद एक छोटी पूंछ होती है। यद्यपि इन वर्णों का उपयोग शायद ही कभी डिजिटल रूप से किया जाता है, इन्हें ASCII के तहत अरबी गणितीय वर्णमाला के रूप में मान्यता दी गई है, जिसकी सीमाएँ 1EE00 से 1EEFF तक हैं। [13] एक कम सामान्य आदेश है, जिसे ध्वन्यात्मक रूप से आदेश दिया जाता है Sawti Alphabet  [ar], गहरे गले की ध्वनि हा से प्रारंभ होकर लिप मोस्ट मीम तक। यह आदेश फ़राहिदी द्वारा बनाया गया था।
  • अज़रबैजानी भाषा [[[[में]]]], मानक लैटिन वर्णमाला में आठ अतिरिक्त अक्षर हैं। उनमें से पांच स्वर हैं: i, ı, ö, ü, ə [[और]] तीन व्यंजन हैं: ç, ş, ğ. वर्णमाला तुर्की वर्णमाला के समान है, जिसमें समान अक्षरों के साथ समान ध्वनियाँ लिखी जाती हैं, तीन अतिरिक्त अक्षरों को छोड़कर: q, x और ə उन ध्वनियों के लि जो तुर्की में उपस्थित नहीं हैं। यद्यपि सभी तुर्की अक्षरों को तुर्की की तरह उनके सामान्य वर्णमाला क्रम में संकलित किया गया है, तीन अतिरिक्त अक्षरों को उन अक्षरों के बाद मनमाने ढंग से एकत्रित किया जाता है जिनकी ध्वनियाँ उनके करीब आती हैं। तो, q को k के ठीक बाद एकत्रित किया जाता है, x (जर्मन ch की तरह उच्चारित किया जाता है) को h के ठीक बाद एकत्रित किया जाता है और ə (मोटे तौर पर अंग्रेजी शॉर्ट a की तरह उच्चारित किया जाता है) को e के ठीक बाद एकत्रित किया जाता है।
  • ब्रेटन भाषा में, कोई c, q, x नहीं है, लेकिन डिग्राफ ch और c'h हैं, जो b और d के बीच एकत्रित हैं। उदाहरण के लिए: « बुज़ुगेन, चुग, सी'होअर, डेराओउएन`» (केंचुआ, रस, बहन, अश्रु)।
  • चेक भाषा और स्लोवाक भाषा में, उच्चारित स्वरों का द्वितीयक संयोजन भार होता है - अन्य अक्षरों की तुलना में, उन्हें उनके अघोषित रूपों के रूप में माना जाता है (चेक, ए-ए, ई-ए-ए, मैं -आई, ओ-ओ, यू में) -Ú-Ů, Y-Ý, और स्लोवाक में, A-Á-Ä, E-É, I-Í, O-Ó-Ô, U-Ú, Y-Ý), लेकिन फिर उन्हें बिना उच्चारण के क्रमबद्ध किया जाता है अक्षर (उदाहरण के लिए, सही शब्दकोष क्रम है बा, बा, बा, बा, बाब, बाब, बाक, बाक, बाक, बाक [चेक में] और बा, बा, बा, बा, बा, बा, बा, बा, बा, बा, बाब, बाब, बाब, बाक, बाक, बाक, बाक, बाक, बाक [स्लोवाक में])। उच्चारित व्यंजनों का प्राथमिक संयोजन भार होता है और Ď, Ň और Ť (चेक में) और Ď, Ĺ, Ľ, Ň, Ŕ और Ť (स्लोवाक में) के अपवाद के साथ, उनके गैर-उच्चारण समकक्षों के तुरंत बाद संयोजित किया जाता है, जिनका फिर से द्वितीयक भार होता है। Ch (डिग्राफ) को एक अलग अक्षर माना जाता है और यह H और I के बीच में आता है। स्लोवाक में, Dz (डिग्राफ) और DŽ को भी अलग अक्षर माना जाता है और यह Ď और E के बीच स्थित होता है।
  • डेनिश और नॉर्वेजियन वर्णमाला में, स्वीडिश के समान अतिरिक्त स्वर भी उपस्थित हैं (नीचे देखें) लेकिन एक अलग क्रम में और विभिन्न ग्लिफ़ (..., एक्स, वाई, जेड, Æ, Ø, Å) के साथ। इसके अलावा, AA, Å के समतुल्य के रूप में संयोजित होता है। डेनिश वर्णमाला में पारंपरिक रूप से W को V के एक प्रकार के रूप में देखा जाता है, लेकिन आज W को एक अलग अक्षर माना जाता है।
  • डच भाषा में संयोजन IJ (IJ (अक्षर)|IJ का प्रतिनिधित्व करता है) को पहले Y (या कभी-कभी एक अलग अक्षर के रूप में: Y < IJ < Z) के रूप में संयोजित किया जाता था, लेकिन वर्तमान में आईजेसेल ज्यादातर 2 अक्षरों (II < IJ) के रूप में संयोजित किया जाता है। <आईके). अपवाद फ़ोन निर्देशिकाएँ हैं; यहां IJ को हमेशा Y के रूप में संयोजित किया जाता है क्योंकि कई डच पारिवारिक नामों में Y का उपयोग किया जाता है जहां आधुनिक वर्तनी के लिए IJ की आवश्यकता होती है। ध्यान दें कि ij से प्रारंभ होने वाला शब्द जो बड़े अक्षर I के साथ लिखा जाता है, उसे बड़े अक्षर J के साथ भी लिखा जाता है, उदाहरण के लिए, शहर IJmuiden, नदी IJSSEL और देश IJsland (आइसलैंड)।
  • एस्पेरांतो में, सिकमफ़्लक्स उच्चारण वाले व्यंजन (सी-सर्कमफ्लेक्स|ĉ, जी-सर्कमफ्लेक्स|ĝ, एच-सर्कमफ्लेक्स|ĥ, जे-सर्कमफ्लेक्स|ĵ, एस-सर्कमफ्लेक्स|ŝ), साथ ही यू-संक्षिप्त |ŭ (यू) ब्रेव के साथ), अलग-अलग अक्षरों के रूप में गिने जाते हैं और अलग-अलग एकत्रित किए जाते हैं (सी, ई, डी, ई, एफ, जी, ĝ, एच, ĥ, आई, जे, ĵ ... एस, ŝ, टी, यू, यू, वी , z).
  • एस्टोनियाई भाषा में õ, ä, ö और ü को अलग-अलग अक्षर माना जाता है और w के बाद संयोजित किया जाता है। अक्षर š, z और ž केवल ऋणशब्दों और विदेशी उचित नामों में दिखाई देते हैं और एस्टोनियाई वर्णमाला में अक्षर s का अनुसरण करते हैं, जो अन्यथा मूल लैटिन वर्णमाला से भिन्न नहीं है।
  • फिरोज़ी वर्णमाला में कुछ डेनिश, नॉर्वेजियन और स्वीडिश अतिरिक्त अक्षर भी हैं, अर्थात् Æ और Ø। इसके अलावा, फिरोज़ी वर्णमाला आइसलैंडिक एथ का उपयोग करती है, जो डी का अनुसरण करती है। छह स्वरों में से पांच ए, आई, ओ, यू और वाई को उच्चारण मिल सकता है और उसके बाद उन्हें अलग अक्षर माना जाता है। व्यंजन C, Q, X, W और Z नहीं पाए जाते हैं। इसलिए, पहले पाँच अक्षर A, Á, B, D और Ð हैं, और अंतिम पाँच V, Y, Ý, Æ, Ø हैं।
  • फिलिपिनो भाषा में (टैगल)।ओजी) और अन्य फिलीपीनी भाषाओं में, एनजी अक्षर को एक अलग अक्षर माना जाता है। इसका उच्चारण सिंग, पिंग-पोंग आदि में किया जाता है। अपने आप में, इसे नंग कहा जाता है, लेकिन सामान्य फिलिपिनो शब्दावली में, इसे ऐसे लिखा जाता है जैसे कि यह दो अलग-अलग अक्षर (एन और जी) हों। इसके अलावा, अक्षर व्युत्पन्न (जैसे Ñ) तुरंत आधार अक्षर का अनुसरण करते हैं। फ़िलिपिनो को विशेषक चिह्न के साथ भी लिखा जाता है, लेकिन उनका उपयोग बहुत दुर्लभ है (टिल्ड को छोड़कर)।
  • फ़िनिश वर्णमाला और मिलान नियम स्वीडिश वर्णमाला के समान ही हैं।
  • फ़्रेंच भाषा के लिए, किसी दिए गए शब्द का अंतिम उच्चारण क्रम निर्धारित करता है।[14] उदाहरण के लिए, फ़्रेंच में, निम्नलिखित चार शब्दों को इस प्रकार क्रमबद्ध किया जाएगा: कोटे < कोटे < कोटे < कोटे।
  • जर्मन वर्णमाला में डायएरेसिस (डायक्रिटिक) (Ä, Ö, Ü) वाले अक्षरों को सामान्यतः उनके गैर-उम्लॉटेड संस्करणों की तरह ही माना जाता है; ß को हमेशा ss के रूप में क्रमबद्ध किया जाता है। इससे वर्णमाला क्रम Arbeit, Arg, Ärgerlich, Argument, Arm, Assistant, Aßlar, Assoziation बनता है। फ़ोन निर्देशिकाओं और नामों की समान सूचियों के लिए, umlauts को अक्षर संयोजन ae, oe, ue की तरह एकत्रित किया जाना चाहिए क्योंकि कई जर्मन उपनाम umlaut के साथ और e (Müller/Mueller) के साथ गैर-umlauted रूप में दिखाई देते हैं। यह वर्णमाला क्रम बनाता है Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach।
  • हंगेरियन भाषा के स्वरों में उच्चारण, उम्लॉट्स और दोहरे उच्चारण होते हैं, जबकि व्यंजन एकल, दोहरे (डिग्राफ) या ट्रिपल (ट्रिग्राफ) वर्णों के साथ लिखे जाते हैं। मिलान में, उच्चारित स्वर अपने गैर-उच्चारण समकक्षों के बराबर होते हैं और दोहरे और तिहरे वर्ण अपने एकल मूल का अनुसरण करते हैं। हंगेरियन वर्णमाला क्रम है: A=Á, B, C, Cs, D, Dz, Dzs, E=É, F, G, Gy, H, I=Í, J, K, L, Ly, M, N, Ny , O=Ó, Ö=Ő, P, Q, R, S, Sz, T, Ty, U=Ú, Ü=Ű, V, W, X, Y, Z, Zs। (1984 से पहले, dz और dzs को मिलान के लिए एकल अक्षर नहीं माना जाता था, बल्कि इसके अतिरिक्त दो अक्षर, d+z और d+zs माने जाते थे।) इसका मतलब है कि उदा। nádcukor को nádcsomó से पहले आना चाहिए (भले ही s सामान्यतः u से पहले आता है), क्योंकि संयोजन में c, cs से पहले आता है। स्वर की लंबाई में अंतर को केवल तभी ध्यान में रखा जाना चाहिए जब दो शब्द अन्यथा समान हों (उदाहरण के लिए, एगर)। संयोजन में वाक्यांशों के भीतर रिक्त स्थान और हाइफ़न को अनदेखा कर दिया जाता है। Ch कुछ शब्दों में एक डिग्राफ के रूप में भी आता है लेकिन इसे संयोजन के संदर्भ में अपने आप में एक ग्रैफेम के रूप में नहीं माना जाता है।
    हंगेरियाई संयोजन की एक विशेष विशेषता यह है कि डबल डि- और ट्रिग्राफ के अनुबंधित रूप (जैसे ggy gy + gy या से ddzs dzs+dzs से) को इस तरह संकलित किया जाना चाहिए जैसे कि वे पूर्ण रूप से लिखे गए हों (संकुचन के तथ्य और di- या ट्रिग्राफ के तत्वों से स्वतंत्र)। उदाहरण के लिए, kaszinó को kassza से पहले आना चाहिए (भले ही चौथा अक्षर z सामान्यतः वर्णमाला में s के बाद आएगा), क्योंकि kassza शब्द के चौथे अक्षर (ग्राफेम) को दूसरा sz माना जाता है (ssz को sz + sz में विघटित करना), जो i का अनुसरण करता है (kaszinó में)।
  • आइसलैंडिक भाषा में Þ जोड़ा जाता है और D के बाद Ð आता है। प्रत्येक स्वर (ए, ई, आई, ओ, यू, वाई) के बाद तीव्र उच्चारण के साथ उसका संवाददाता आता है: Á, É, Í, Ó, Ú, Ý। कोई Z नहीं है, इसलिए वर्णमाला समाप्त होती है: ... X, Y, Ý, Þ, Æ, Ö।
    • दोनों अक्षरों का उपयोग एंग्लो-सेक्सोन|एंग्लो-सैक्सन शास्त्रियों द्वारा भी किया गया था, जिन्होंने /w/ का प्रतिनिधित्व करने के लिए रूनिक अक्षर व्यान का भी उपयोग किया था।
    • कांटा (अक्षर)|Þ (जिसे कांटा कहा जाता है; लोअरकेस þ) भी एक रूनिक अक्षर है।
    • एथ (अक्षर)|Ð (जिसे एथ कहा जाता है; लोअरकेस ð) एक अतिरिक्त स्ट्रोक के साथ अक्षर डी है।
  • किओवा भाषा ऐतिहासिक लैटिन क्रम के अतिरिक्त, ब्राह्मी लिपियों की तरह ध्वन्यात्मक सिद्धांतों पर आधारित है। स्वर पहले आते हैं, फिर मुंह के आगे से पीछे की ओर क्रमबद्ध व्यंजन को रोकते हैं, और नकारात्मक से सकारात्मक स्वर-शुरुआत के समय, फिर एफ्रिकेट्स, फ्रिकेटिव्स, तरल पदार्थ और अनुनासिक:
ए, एयू, ई, आई, ओ, यू, बी, एफ, पी, वी, डी, जे, टी, टीएच, जी, सी, के, क्यू, सीएच, एक्स, एस, जेड, एल, वाई, डब्ल्यू, एच, एम, एन
  • लिथुआनियाई भाषा में, विशेष रूप से लिथुआनियाई अक्षर अपने लैटिन मूल के बाद चलते हैं। एक और बदलाव यह है कि Y, J के ठीक पहले आता है: ... G, H, I, Į, Y, J, K...
  • पोलिश भाषा में, विशेष रूप से लैटिन वर्णमाला से प्राप्त पोलिश अक्षरों को उनके मूल अक्षरों के बाद एकत्रित किया जाता है: ए, Ą, बी, सी, Ć, डी, ई, Ę, ..., एल, Ł, एम, एन, Ń, ओ , Ó, पी, ..., एस, Ś, टी, ..., जेड, Ź, Ż। मिलान प्रयोजनों के लिए डिग्राफ को ऐसे माना जाता है मानो वे दो अलग-अलग अक्षर हों।
  • पुर्तगाली वर्णमाला में, मिलान क्रम बिल्कुल अंग्रेजी की तरह है: ए, बी, सी, डी, ई, एफ, जी, एच, आई, जे, के, एल, एम, एन, ओ, पी, क्यू, आर, एस, टी, यू, वी, डब्ल्यू, एक्स, वाई, जेड। डायक्रिटिक्स वाले डिग्राफ और अक्षर वर्णमाला में सम्मिलित नहीं हैं।
  • रोमानियाई भाषा में, लैटिन वर्णमाला से प्राप्त विशेष वर्णों को उनके मूल अक्षरों के बाद एकत्रित किया जाता है: ए, Ă, Â, ..., I, Î, ..., S, Ř, T, Ś, ..., Z।
  • सर्बो-क्रोशियाई और अन्य संबंधित दक्षिण स्लाव भाषाओं में, पांच उच्चारण वर्ण और तीन संयुक्त वर्ण मूल के बाद क्रमबद्ध किए जाते हैं: ..., सी, Č, Ć, डी, डीŽ, Đ, ई, ..., एल, एलजे, एम, एन, एनजे, ओ, ..., एस, Š, टी, ..., जेड, Ž।
  • स्पैनिश वर्णमाला में (1994 तक) सीएच और एलएल को एक ही अक्षर के रूप में माना जाता था, जिससे एक क्रम मिलता थाcinco, credo, chispa औरlomo, luz, llama. यह अब सच नहीं है क्योंकि 1994 में रियल एकेडेमिया एस्पनोला ने अधिक पारंपरिक उपयोग को अपनाया था, और अब एलएल को एलके और एलएम के बीच और सीएच को सीजी और सीआई के बीच मिला दिया गया है। विशेषक Á, É, Í, Ó, Ú, Ü वाले छह वर्णों को मूल अक्षर A, E, I, O, U माना जाता है, उदाहरण के लिए:radio, ráfaga, rana, rápido, rastrillo. एकमात्र स्पैनिश-विशिष्ट मिलान प्रश्न Ñ है (eñe) एन के बाद एकत्रित एक अलग पत्र के रूप में।
  • स्वीडिश वर्णमाला में, इसके अंत में तीन अतिरिक्त स्वर रखे गए हैं (..., X, Y, Z, Å, Ä, Ö), डेनिश और नॉर्वेजियन वर्णमाला के समान, लेकिन अलग-अलग ग्लिफ़ और एक अलग मिलान क्रम के साथ . अक्षर W को V के एक प्रकार के रूप में माना गया है, लेकिन Svenska Akademiens Ordlista (2006) के 13वें संस्करण में W को एक अलग अक्षर माना गया था।
  • तुर्की वर्णमाला में छह अतिरिक्त अक्षर हैं: ç, ğ, ı, ö, ş, और ü (लेकिन कोई q, w और x नहीं)। इन्हें c के बाद ç, g के बाद ğ, i से पहले ı, o के बाद ö, s के बाद ş और u के बाद ü से मिलाया जाता है। मूल रूप से, जब 1928 में वर्णमाला की शुरुआत की गई थी, तो ı को i के बाद संकलित किया गया था, लेकिन बाद में क्रम बदल दिया गया ताकि जिन अक्षरों में डॉट्स, सेडिल्स या अन्य सजावटी निशान वाले आकार हों, वे हमेशा संबंधित नंगे आकृतियों वाले अक्षरों का अनुसरण करें। ध्यान दें कि तुर्की शब्दावली में अक्षर I, बिंदुरहित ı का बड़ा अक्षर है, जबकि I, बिंदीदार i का बड़ा अक्षर है।
  • कई तुर्क भाषाओं में (जैसे कि अज़ेरी भाषा या ताश्रृंखला भाषा के लिए यानालिफ़|जनालिफ़ शब्दावली), जाना (फू) अक्षर हुआ करता था, जो जी और एच के बीच आता था। यह अब उपयोग में नहीं है।
  • वियतनामी भाषा में, सात अतिरिक्त अक्षर हैं: ă, â, đ, ê, ô, , ư जबकि f, j, w, z अनुपस्थित हैं, भले ही वे अभी भी कुछ उपयोग में हैं (जैसे इंटरनेट पता, विदेशी ऋण) भाषा)। f को संयोजन ph द्वारा प्रतिस्थापित किया जाता है। w के समान qu है।
  • वोलापुक में ä, ö और ü को अलग-अलग अक्षरों के रूप में गिना जाता है और अलग-अलग संकलित किया जाता है (a, ä, b ... o, ö, p ... u, ü, v) जबकि q और w अनुपस्थित हैं।[15]
  • वेल्श भाषा में डिग्राफ सीएच, डीडी, एफएफ, एनजी, एलएल, पीएच, आरएच और टीएच को एकल अक्षरों के रूप में माना जाता है, और प्रत्येक को जोड़ी के पहले अक्षर के बाद सूचीबद्ध किया जाता है (एनजी को छोड़कर जो जी के बाद सूचीबद्ध है), ए, बी, सी, सीएच, डी, डीडी, ई, एफ, एफएफ, जी, एनजी, एच, इत्यादि ऑर्डर तैयार करना। यद्यपि, कभी-कभी ऐसा हो सकता है कि शब्द संयोजन के परिणामस्वरूप दो अक्षरों का मेल होता है जो एक डिग्राफ नहीं बनाते हैं। एक उदाहरण LLONGYFARCH शब्द है (LLON + GYFARCH से बना है)। इसका परिणाम ऐसे क्रम में होता है, उदाहरण के लिए, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG LLONG में एक डिग्राफ है, लेकिन LLONGYFARCH में नहीं)। अक्षर संयोजन R+H (जैसा कि डिग्राफ आरएच से अलग है) इसी प्रकार यौगिकों में मेल से उत्पन्न हो सकता है, यद्यपि यह ऐसे किसी भी जोड़े का निर्माण नहीं करता है जिसमें गलत पहचान क्रम को प्रभावित कर सकती है। अन्य संभावित रूप से भ्रमित करने वाले अक्षर संयोजनों के लिए - अर्थात्, D+D और L+L - वर्तनी में एक हाइफ़न का उपयोग किया जाता है (उदाहरण के लिए AD-DAL, CHWIL-LYS)।
  • पिनयिन वर्णमाला क्रम में, समान पिनयिन मूल अक्षरों वाले दो चीनी अक्षरों के लिए, यदि मूल अक्षर ई और संशोधित अक्षर ê, या मूल अक्षर यू और संशोधित अक्षर ü का अंतर है, तो संशोधित अक्षर वाला पिनयिन बाद में आता है संशोधित अक्षर के बिना पिनयिन. उदाहरण के लिए, 額 (è)欸(ê̄) , 路(lù)驢(lǘ) , 努(nǔ)女(nǚ) । समान पिनयिन अक्षरों (संशोधित अक्षर ê और ü सहित) के वर्णों को उनके स्वर के अनुसार पहले स्वर (यानी, सपाट स्वर), दूसरे स्वर (चढ़ते स्वर), तीसरे स्वर (गिरते-उठते स्वर) के क्रम में व्यवस्थित किया जाता है। चौथा स्वर (गिरता हुआ स्वर), पाँचवाँ स्वर (तटस्थ स्वर), जैसे 媽(mā)麻(má)馬(mǎ)罵(mà)嗎(ma)।[lower-alpha 1]

स्वचालन

श्रृंखला को वर्णमाला क्रम में रखने के लिए कंप्यूटर प्रोग्रामिंग में संयोजन एल्गोरिदम (छँटाई एल्गोरिथ्म के संयोजन में) का उपयोग किया जाता है। एक मानक उदाहरण [[ यूनिकोड संयोजन एल्गोरिदम ]] है, जिसका उपयोग किसी भी यूनिकोड प्रतीकों वाली श्रृंखला को वर्णमाला क्रम में रखने के लिए किया जा सकता है।[14]इसकी डिफ़ॉल्ट संयोजन तालिका को तैयार करके इसे ऊपर वर्णित अधिकांश भाषा-विशिष्ट परंपराओं के अनुरूप बनाया जा सकता है। ऐसी कई सिलाई सामान्य लोकेल डेटा रिपॉजिटरी में एकत्र की गई हैं।

समान आदेश

वर्णमाला क्रम के पीछे का सिद्धांत अभी भी उन भाषाओं में लागू किया जा सकता है जो कड़ाई से वर्णमाला का उपयोग नहीं करते हैं - उदाहरण के लिए, उन्हें एक शब्दांश या अबुगिडा का उपयोग करके लिखा जा सकता है - बशर्ते उपयोग किए गए प्रतीकों में एक स्थापित क्रम हो।

चीनी बत्तख या जापानी कांजी जैसे लॉगोग्राफ़िक लेखन प्रणालियों के लिए, रेडिकल-एंड-स्ट्रोक छँटाई की विधि का उपयोग प्रायः प्रतीकों पर एक आदेश को परिभाषित करने के तरीके के रूप में किया जाता है। जापानी कभी-कभी उच्चारण क्रम का उपयोग करते हैं, सामान्यतः गोजोन क्रम के साथ लेकिन कभी-कभी पुराने इरोहा क्रम के साथ।

गणित में, शब्दकोषीय क्रम अनुक्रमों को उस तरीके से क्रमबद्ध करने का एक साधन है जिसका उपयोग वर्णमाला क्रम उत्पन्न करने के लिए किया जाता है।[16] कुछ कंप्यूटर एप्लिकेशन वर्णमाला क्रम के एक संस्करण का उपयोग करते हैं जिसे एक बहुत ही सरल कलन विधि का उपयोग करके प्राप्त किया जा सकता है, जो पूरी तरह से वर्णों के लिए ASCII या यूनिकोड कोड पर आधारित है। इसके गैर-मानक प्रभाव हो सकते हैं जैसे सभी बड़े अक्षरों को छोटे अक्षरों से पहले रखना। ASCIIबेटिकल ऑर्डर देखें।

एक तुकबंदी शब्दकोश शब्द के अंतिम से पहले अक्षर तक शब्दों को वर्णानुक्रम में क्रमबद्ध करने पर आधारित है।

यह भी देखें

  • संकलन
  • छँटाई

टिप्पणियाँ

  1. There is an exception: In ABC Chinese–English Dictionary the tone order is "zero tone (neutral tone), first tone (flat tone), second tone (rising tone), third tone (falling-rising tone) and fourth tone (falling tone)".


संदर्भ

  1. Reinhard G. Lehmann: "27-30-22-26. How Many Letters Needs an Alphabet? The Case of Semitic", in: The idea of writing: Writing across borders, edited by Alex de Voogt and Joachim Friedrich Quack, Leiden: Brill 2012, pp. 11–52.
  2. 2.0 2.1 2.2 2.3 Street, Julie (10 June 2020). "ए से ज़ेड तक - वर्णमाला क्रम का आश्चर्यजनक इतिहास" (text and audio). ABC News (ABC Radio National). Australian Broadcasting Corporation. Archived from the original on 2 July 2020. Retrieved 6 July 2020.
  3. e.g. Psalms 25, 34, 37, 111, 112, 119 and 145 of the Hebrew Bible
  4. Daly, Lloyd. Contributions to the History of Alphabetization in Antiquity and the Middle Ages. Brussels, 1967. p. 25.
  5. O'Hara, James (1989). "मेसापस, साइक्लस, और वर्जिल के इतालवी नायकों की सूची का वर्णमाला क्रम". Phoenix. 43 (1): 35–38. doi:10.2307/1088539. JSTOR 1088539.
  6. LIVRE XI – texte latin – traduction + commentaires. Archived from the original on 9 June 2012. Retrieved 8 May 2012.
  7. Gibson, Craig (2002). Interpreting a classic: Demosthenes and his ancient commentators.
  8. Rouse, Mary A.; Rouse, Richard M. (1991), "Statim invenire: Schools, Preachers and New Attitudes to the Page", Authentic Witnesses: Approaches to Medieval Texts and Manuscripts, University of Notre Dame Press, pp. 201–219, ISBN 0-268-00622-9
  9. Cawdrey, Robert (1604). एक तालिका वर्णानुक्रम में. London. p. [A4]v.
  10. Coleridge's Letters, No.507.
  11. Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (January 2007). "बहुलेखक प्रकाशनों में योगदान के लिए लेखक अनुक्रम और श्रेय". PLOS Biol. 5 (1): e18. doi:10.1371/journal.pbio.0050018. PMC 1769438. PMID 17227141.
  12. Stevens, Jeffrey R.; Duque, Juan F. (2018). "Order Matters: Alphabetizing In-Text Citations Biases Citation Rates" (PDF). Psychonomic Bulletin & Review. 26 (3): 1020–1026. doi:10.3758/s13423-018-1532-8. PMID 30288671. S2CID 52922399. Archived (PDF) from the original on 10 November 2018. Retrieved 10 November 2018.
  13. "अरबी गणितीय वर्णमाला चिह्न" (PDF). THE Unicode Standard. Archived (PDF) from the original on 30 October 2022. Retrieved 26 November 2022.
  14. 14.0 14.1 "Unicode Technical Standard #10: Unicode collation algorithm". Unicode, Inc. (unicode.org). 20 March 2008. Archived from the original on 27 August 2008. Retrieved 27 August 2008.
  15. Midgley, Ralph. "Volapük to English dictionary" (PDF). Archived from the original (PDF) on 1 September 2012. Retrieved 24 September 2019.
  16. Franz Baader; Tobias Nipkow (1999). टर्म पुनर्लेखन और वह सब. Cambridge University Press. pp. 18–19. ISBN 978-0-521-77920-3.


अग्रिम पठन