टेक्स्ट एन्कोडिंग इनिशिएटिव: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 4: Line 4:
== टीईआई दिशानिर्देश ==
== टीईआई दिशानिर्देश ==


टीईआई दिशानिर्देश सामूहिक रूप से एक प्रकार के [[एक्सएमएल]]प्रारूप को परिभाषित करते हैं, और अभ्यास के समुदाय के परिभाषित आउटपुट हैं। यह प्रारूप पाठ के लिए अन्य प्रसिद्ध विवृत प्रारूपों (जैसे [[HTML|एचटीएमएल]] और [[OpenDocument|अनिर्णित प्रपत्र]]) से भिन्न है, क्योंकि यह प्रस्तुतिकरण के अतिरिक्त मुख्य रूप से अर्थपूर्ण है; प्रत्येक टैग और विशेषता के शब्दार्थ और व्याख्या निर्दिष्ट हैं।
टीईआई दिशानिर्देश सामूहिक रूप से एक प्रकार के [[एक्सएमएल]]प्रारूप को परिभाषित करते हैं, और अभ्यास के समुदाय के परिभाषित आउटपुट हैं। यह प्रारूप पाठ के लिए अन्य प्रसिद्ध विवृत प्रारूपों (जैसे [[HTML|एचटीएमएल]] और [[OpenDocument|ओपन डॉक्यूमेंट]] ) से भिन्न है, क्योंकि यह प्रस्तुतिकरण के अतिरिक्त मुख्य रूप से अर्थपूर्ण है; प्रत्येक टैग और विशेषता के शब्दार्थ और व्याख्या निर्दिष्ट हैं।


लगभग 500 अलग-अलग पाठ्य घटक और अवधारणाएँ हैं
लगभग 500 अलग-अलग पाठ्य घटक और अवधारणाएँ हैं
Line 18: Line 18:
=== तकनीकी विवरण ===
=== तकनीकी विवरण ===


मानक को दो भागों में विभाजित किया गया है, विस्तारित उदाहरणों और चर्चा के साथ एक विवेचनात्मक पाठ्य विवरण और टैग-दर-टैग परिभाषाओं का सेट इस प्रकार किया गया है। अधिकांश आधुनिक प्रारूपों ([[दस्तावेज़ प्रकार परिभाषा]], [[RELAX NG|रिलैक्स एनजी]] और [[W3C स्कीमा|डब्लू3सी स्कीमा]]) में स्कीमाटा टैग-दर-टैग परिभाषाओं से स्वचालित रूप से उत्पन्न होते हैं। कई उपकरण दिशानिर्देशों के उत्पादन और विशिष्ट परियोजनाओं के लिए दिशानिर्देशों के अनुप्रयोग का समर्थन करते हैं।
मानक को दो भागों में विभाजित किया गया है, विस्तारित उदाहरणों और चर्चा के साथ एक विवेचनात्मक पाठ्य विवरण और टैग-दर-टैग परिभाषाओं का समूह इस प्रकार किया गया है। अधिकांश आधुनिक प्रारूपों ([[दस्तावेज़ प्रकार परिभाषा|डॉक्यूमेंट प्रकार परिभाषा]], [[RELAX NG|रिलैक्स एनजी]] और [[W3C स्कीमा|डब्लू3सी स्कीमा]]) में स्कीमाटा टैग-दर-टैग परिभाषाओं से स्वचालित रूप से उत्पन्न होते हैं। कई उपकरण दिशानिर्देशों के उत्पादन और विशिष्ट परियोजनाओं के लिए दिशानिर्देशों के अनुप्रयोग का समर्थन करते हैं।


अंतर्निहित [[यूनिकोड]] द्वारा लगाए गए प्रतिबंधों से बचने के लिए कई विशेष टैग का उपयोग किया जाता है; ग्लिफ़ उन वर्णों के प्रतिनिधित्व की अनुमति देता है जो यूनिकोड समावेशन के लिए योग्य नहीं हैं<ref name="auto" /> और आवश्यक सख्त रैखिकता पर काबू पाने की अमति देता है।<ref>{{cite web|url=http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-choice.html|title=तत्व पसंद|website=www.tei-c.org}}</ref>
अंतर्निहित [[यूनिकोड]] द्वारा लगाए गए प्रतिबंधों से बचने के लिए कई विशेष टैग का उपयोग किया जाता है; ग्लिफ़ उन वर्णों के प्रतिनिधित्व की अनुमति देता है जो यूनिकोड समावेशन के लिए योग्य नहीं हैं<ref name="auto" /> और आवश्यक सख्त रैखिकता पर काबू पाने की अमति देता है।<ref>{{cite web|url=http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-choice.html|title=तत्व पसंद|website=www.tei-c.org}}</ref>


प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, परंतु दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट उपसमूह का उपयोग करके अनुकूलन का उत्पादन करते हैं। टीईआई इस उद्देश्य के लिए एक परिष्कृत अनुकूलन तंत्र को परिभाषित करता है जिसे ओडीडी के रूप में जाना जाता है। प्रत्येक टीईआई टैग का दस्तावेजीकरण और वर्णन करने के अतिरिक्त, एक ओडीडी विनिर्देश इसके वस्तु मॉडल और अन्य उपयोग बाधाओं को निर्दिष्ट करता है, जिसे स्कीमट्रॉन का उपयोग करके व्यक्त किया जा सकता है।
प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, परंतु दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट उपसमूह का उपयोग करके अनुकूलन का उत्पादन करते हैं। टीईआई इस उद्देश्य के लिए एक परिष्कृत अनुकूलन तंत्र को परिभाषित करता है जिसे ओडीडी के रूप में जाना जाता है। प्रत्येक टीईआई टैग का डोक्युमेंटिंग और वर्णन करने के अतिरिक्त, एक ओडीडी विनिर्देश इसके ऑब्जेक्ट मॉडल और अन्य उपयोग बाधाओं को निर्दिष्ट करता है, जिसे स्कीमट्रॉन का उपयोग करके व्यक्त किया जा सकता है।


टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह पाठ्य भाग के आदान-प्रदान के लिए एक एक्सएमएल - आधारित फ़ाइल स्वरूप को परिभाषित करता है। संपूर्ण टीईआई दिशानिर्देशों में उपलब्ध अवयवों के व्यापक सेट से एक प्रबंधनीय चयन है।
टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह पाठ्य भाग के आदान-प्रदान के लिए एक एक्सएमएल - आधारित फ़ाइल स्वरूप को परिभाषित करता है। संपूर्ण टीईआई दिशानिर्देशों में उपलब्ध अवयवों के व्यापक समूह से एक प्रबंधनीय चयन है।


एक्सएमएल -आधारित प्रारूप के रूप में, टीईआई सीधे [[ओवरलैपिंग मार्कअप]] और गैर-श्रेणीबद्ध संरचनाओं से निपट नहीं सकता है। दिशानिर्देशों द्वारा इस प्रकार के डेटा का प्रतिनिधित्व करने के लिए कई प्रकार के विकल्प सुझाए गए हैं।<ref>{{cite web |url= https://tei-c.org/release/doc/tei-p5-doc/en/html/NH.html |title=20 Non-hierarchical Structures - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2019 |access-date=19 March 2019}}</ref>
एक्सएमएल -आधारित प्रारूप के रूप में, टीईआई सीधे [[ओवरलैपिंग मार्कअप]] और गैर-श्रेणीबद्ध संरचनाओं से निपट नहीं सकता है। दिशानिर्देशों द्वारा इस प्रकार के डेटा का प्रतिनिधित्व करने के लिए कई प्रकार के विकल्प सुझाए गए हैं।<ref>{{cite web |url= https://tei-c.org/release/doc/tei-p5-doc/en/html/NH.html |title=20 Non-hierarchical Structures - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2019 |access-date=19 March 2019}}</ref>
Line 32: Line 32:
=== उदाहरण ===
=== उदाहरण ===


टीईआई दिशानिर्देशों का पाठ उदाहरणों से समृद्ध है। टीईआई विकी पर एक प्रतिदर्श पृष्ठ भी है,<ref>{{cite web |url= http://wiki.tei-c.org/index.php/Samples_of_TEI_texts |title=टीईआई ग्रंथों के नमूने|work=wiki.tei-c.org |year=2011 |access-date=17 April 2012}}</ref> जो वस्तुतःिक दुनिया की परियोजनाओं के उदाहरण देता है जो उनके अंतर्निहित टीईआई को अनावृत करते हैं।
टीईआई दिशानिर्देशों का पाठ उदाहरणों से समृद्ध है। टीईआई विकी पर एक प्रतिदर्श पृष्ठ भी है,<ref>{{cite web |url= http://wiki.tei-c.org/index.php/Samples_of_TEI_texts |title=टीईआई ग्रंथों के नमूने|work=wiki.tei-c.org |year=2011 |access-date=17 April 2012}}</ref> जो वास्तविक संसार की परियोजनाओं के उदाहरण देता है जो उनके अंतर्निहित टीईआई को अनावृत करते हैं।


==== गद्य उपनाम ====
==== गद्य उपनाम ====


टीईआईपाठ्य भाग को ग्रैन्युलैरिटी या ग्रैन्युलैरिटी के मिश्रण के किसी भी स्तर पर वाक्यात्मक रूप से चिह्नित करने की अनुमति देता है। उदाहरण के लिए, इस अनुच्छेद (पी) को वाक्यों और खंडों (सीएल) में चिह्नित किया गया है।<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AI.html#AILCW |title=17 Simple Analytic Mechanisms - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref>
टीईआईपाठ्य भाग को कणमयता या कणमयता के मिश्रण के किसी भी स्तर पर वाक्यात्मक रूप से चिह्नित करने की अनुमति देता है। उदाहरण के लिए, इस अनुच्छेद (पी) को वाक्यों और खंडों (सीएल) में चिह्नित किया गया है।<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AI.html#AILCW |title=17 Simple Analytic Mechanisms - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref>


<syntaxhighlight lang="XML">
<syntaxhighlight lang="XML">
Line 121: Line 121:
वन डॉक्यूमेंट डू इट ऑल (ओडीडी ) एक्सएमएल स्कीमा के लिए एक [[साक्षर प्रोग्रामिंग]] भाषा है।<ref>{{citation|year=2004|last1=Bauman|first1=Syd|last2=Flanders|first2=Julia|contribution=ODD customizations|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Bauman01/EML2004Bauman01.html}}.</ref><ref>{{citation|year=2004|last1=Burnard|first1=Lou|author2-link=Sebastian Rahtz|last2=Rahtz|first2=Sebastian|contribution=RelaxNG with Son of ODD|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Burnard01/EML2004Burnard01.html}}.</ref><ref>{{citation|title=Literate Documentation for XML|last=Reiss|first=Kevin M.|publisher=Digital Humanities 2007|location=Urbana-Champaign, Illinois|year=2007|url=http://dhcommons.tamu.edu/sites/default/files/poster_208_reiss.pdf}}.</ref><ref>{{Cite journal|title=टेक्स्ट एन्कोडिंग पहल के लिए एक पूर्ण स्कीमा परिभाषा भाषा|first1=Lou|last1=Burnard|author2-link=Sebastian Rahtz|first2=Sebastian|last2=Rahtz|date=June 2013|journal=XML London 2013|doi=10.14337/XMLLondon13.Rahtz01|url=http://xmllondon.com/2013/presentations/rahtz/|pages=152–161|isbn=978-0-9926471-0-0|doi-access=free}}</ref>
वन डॉक्यूमेंट डू इट ऑल (ओडीडी ) एक्सएमएल स्कीमा के लिए एक [[साक्षर प्रोग्रामिंग]] भाषा है।<ref>{{citation|year=2004|last1=Bauman|first1=Syd|last2=Flanders|first2=Julia|contribution=ODD customizations|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Bauman01/EML2004Bauman01.html}}.</ref><ref>{{citation|year=2004|last1=Burnard|first1=Lou|author2-link=Sebastian Rahtz|last2=Rahtz|first2=Sebastian|contribution=RelaxNG with Son of ODD|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Burnard01/EML2004Burnard01.html}}.</ref><ref>{{citation|title=Literate Documentation for XML|last=Reiss|first=Kevin M.|publisher=Digital Humanities 2007|location=Urbana-Champaign, Illinois|year=2007|url=http://dhcommons.tamu.edu/sites/default/files/poster_208_reiss.pdf}}.</ref><ref>{{Cite journal|title=टेक्स्ट एन्कोडिंग पहल के लिए एक पूर्ण स्कीमा परिभाषा भाषा|first1=Lou|last1=Burnard|author2-link=Sebastian Rahtz|first2=Sebastian|last2=Rahtz|date=June 2013|journal=XML London 2013|doi=10.14337/XMLLondon13.Rahtz01|url=http://xmllondon.com/2013/presentations/rahtz/|pages=152–161|isbn=978-0-9926471-0-0|doi-access=free}}</ref>


साक्षर-प्रोग्रामिंग शैली में, ओडीडी दस्तावेज़ पाठ एन्कोडिंग पहल के दस्तावेज़ीकरण अवयव मॉड्यूल का उपयोग करके मानव-पठनीय दस्तावेज़ और मशीन-पठनीय मॉडल को जोड़ते हैं। उपकरण [[अंतर्राष्ट्रीयकरण और स्थानीयकरण|स्थानीयकृत और अंतर्राष्ट्रीयकृत]] एचटीएमएल, [[ePub|इपुब]] , या [[PDF|पीडीएफ]] मानव-पठनीय आउटपुट और दस्तावेज़ प्रकार परिभाषाएँ, [[XML स्कीमा (W3C)|एक्सएमएल स्कीमा (डब्लू3सी )]], रिलैक्स एनजी कॉम्पैक्ट सिंटेक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स मशीन-पठनीय आउटपुट उत्पन्न करते हैं।
साक्षर-प्रोग्रामिंग शैली में, ओडीडी डॉक्यूमेंट पाठ एन्कोडिंग पहल के दस्तावेज़ीकरण अवयव मॉड्यूल का उपयोग करके मानव-पठनीय डॉक्यूमेंट और मशीन-पठनीय मॉडल को जोड़ते हैं। उपकरण [[अंतर्राष्ट्रीयकरण और स्थानीयकरण|स्थानीयकृत और अंतर्राष्ट्रीयकृत]] एचटीएमएल, [[ePub|इपुब]] , या [[PDF|पीडीएफ]] मानव-पठनीय आउटपुट और डॉक्यूमेंट प्रकार परिभाषाएँ, [[XML स्कीमा (W3C)|एक्सएमएल स्कीमा (डब्लू3सी )]], रिलैक्स एनजी कॉम्पैक्ट सिंटेक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स मशीन-पठनीय आउटपुट उत्पन्न करते हैं।


रोमा वेब एप्लिकेशन<ref>[https://roma2.tei-c.org/ Roma web application]</ref> ओडीडी प्रारूप के आसपास बनाया गया है और इसका उपयोग दस्तावेज़ प्रकार परिभाषा, एक्सएमएल स्कीमा (डब्लू3सी ), रिलैक्स एनजी कॉम्पैक्ट सिंटैक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स प्रारूपों में स्कीमा उत्पन्न करने के लिए किया जा सकता है, जैसा कि कई एक्सएमएल सत्यापन उपकरण और सेवाओं द्वारा उपयोग किया जाता है।
रोमा वेब एप्लिकेशन<ref>[https://roma2.tei-c.org/ Roma web application]</ref> ओडीडी प्रारूप के निकट बनाया गया है और इसका उपयोग डॉक्यूमेंट प्रकार परिभाषा, एक्सएमएल स्कीमा (डब्लू3सी ), रिलैक्स एनजी कॉम्पैक्ट सिंटैक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स प्रारूपों में स्कीमा उत्पन्न करने के लिए किया जा सकता है, जैसा कि कई एक्सएमएल सत्यापन उपकरण और सेवाओं द्वारा उपयोग किया जाता है।


ओडीडी टीईआई तकनीकी मानकों और सुरक्षा प्राधिकरण के लिए टेक्स्ट एन्कोडिंग पहल द्वारा आंतरिक रूप से उपयोग किया जाने वाला प्रारूप है।<ref>{{citation|year=2007|editor1-first=Lou|editor1-last=Burnard|editor2-first=Syd|editor2-last=Bauman|title=TEI P5: Guidelines for Electronic Text Encoding and Interchange|publisher=TEI Consortium|location=Charlottesville, Virginia, USA|url=http://www.tei-c.org/Guidelines/P5/}}.</ref> चूंकि ओडीडी फाइलें सामान्यतः एक अनुकूलित एक्सएमएल प्रारूप और पूर्ण टीईआई मॉडल के बीच के अंतर का वर्णन करती हैं, ओडीडी का उपयोग एक्सएमएल प्रारूपों का वर्णन करने के लिए भी किया जा सकता है जो टीईआई से पूर्ण रूप से अलग हैं। इसका एक उदाहरण डब्लू3सी का [[अंतर्राष्ट्रीयकरण टैग सेट]] है जो स्कीमा उत्पन्न करने और अपनी शब्दावली का दस्तावेजीकरण करने के लिए ओडीडी प्रारूप का उपयोग करता है।<ref>[http://www.w3.org/TR/its/ W3C ITS] and [http://www.w3.org/TR/its/itstagset.xml TEI ODD file]</ref><ref>{{citation|title=Best Practices for XML Internationalization|editor1-last=Savourel|editor1-first=Yves|editor2-last=Kosek|editor2-first=Jirka|editor3-last=Ishida|editor3-first=Richard|publisher=W3C Working Group|year=2008|url=http://www.w3.org/TR/xml-i18n-bp/|contribution=5.2 ITS and TEI}}.</ref>
ओडीडी टीईआई तकनीकी मानकों और सुरक्षा प्राधिकरण के लिए टेक्स्ट एन्कोडिंग पहल द्वारा आंतरिक रूप से उपयोग किया जाने वाला प्रारूप है।<ref>{{citation|year=2007|editor1-first=Lou|editor1-last=Burnard|editor2-first=Syd|editor2-last=Bauman|title=TEI P5: Guidelines for Electronic Text Encoding and Interchange|publisher=TEI Consortium|location=Charlottesville, Virginia, USA|url=http://www.tei-c.org/Guidelines/P5/}}.</ref> चूंकि ओडीडी फाइलें सामान्यतः एक अनुकूलित एक्सएमएल प्रारूप और पूर्ण टीईआई मॉडल के बीच के अंतर का वर्णन करती हैं, ओडीडी का उपयोग एक्सएमएल प्रारूपों का वर्णन करने के लिए भी किया जा सकता है जो टीईआई से पूर्ण रूप से अलग हैं। इसका एक उदाहरण डब्लू3सी का [[अंतर्राष्ट्रीयकरण टैग सेट|अंतर्राष्ट्रीयकरण टैग समूह]] है जो स्कीमा उत्पन्न करने और अपनी शब्दावली का डोक्युमेंटिंग करने के लिए ओडीडी प्रारूप का उपयोग करता है।<ref>[http://www.w3.org/TR/its/ W3C ITS] and [http://www.w3.org/TR/its/itstagset.xml TEI ODD file]</ref><ref>{{citation|title=Best Practices for XML Internationalization|editor1-last=Savourel|editor1-first=Yves|editor2-last=Kosek|editor2-first=Jirka|editor3-last=Ishida|editor3-first=Richard|publisher=W3C Working Group|year=2008|url=http://www.w3.org/TR/xml-i18n-bp/|contribution=5.2 ITS and TEI}}.</ref>




Line 132: Line 132:


टीईआई अनुकूलन विशेष क्षेत्रों या विशिष्ट समुदायों द्वारा उपयोग के लिए टीईआई एक्सएमएल विनिर्देश की विशेषज्ञता है।
टीईआई अनुकूलन विशेष क्षेत्रों या विशिष्ट समुदायों द्वारा उपयोग के लिए टीईआई एक्सएमएल विनिर्देश की विशेषज्ञता है।
* [[एपिडॉक]] (पुरालेख दस्तावेज़)
* [[एपिडॉक]] (पुरालेख डॉक्यूमेंट)
* चार्टर्स एन्कोडिंग पहल<ref>{{Cite web|url=http://www.cei.lmu.de/|title=Charters Encoding Initiative - Ludwig-Maximilians-Universität München|website=www.cei.lmu.de}}</ref>
* चार्टर्स एन्कोडिंग पहल<ref>{{Cite web|url=http://www.cei.lmu.de/|title=Charters Encoding Initiative - Ludwig-Maximilians-Universität München|website=www.cei.lmu.de}}</ref>
* मध्यकालीन नॉर्डिक पाठ संग्रह(मेनोटा)<ref>{{Cite web|url=https://www.menota.org/forside.xhtml|title=मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)|website=www.menota.org}}</ref>
* मध्यकालीन नॉर्डिक पाठ संग्रह(मेनोटा)<ref>{{Cite web|url=https://www.menota.org/forside.xhtml|title=मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)|website=www.menota.org}}</ref>
टीईआई में अनुकूलन ऊपर उल्लिखित ओडीडी तंत्र के माध्यम से किया जाता है। वस्तुतः में इसके P5 संस्करण के पश्चात से, टीईआई दिशानिर्देशों के सभी तथाकथित 'टीईआई अनुरूप' उपयोग टीईआई ओडीडी फ़ाइल में प्रलेखित टीईआई अनुकूलन पर आधारित हैं। यहां तक कि जब उपयोगकर्ता सत्यापित करने के लिए ऑफ-द-शेल्फ पूर्व-निर्मित स्कीमा में से किसी एक को चुनते हैं, तो इन्हें स्वतंत्र रूप से उपलब्ध अनुकूलन फ़ाइलों से बनाया गया है।
टीईआई में अनुकूलन ऊपर उल्लिखित ओडीडी तंत्र के माध्यम से किया जाता है। ऑब्जेक्टतः में इसके P5 संस्करण के पश्चात से, टीईआई दिशानिर्देशों के सभी तथाकथित 'टीईआई अनुरूप' उपयोग टीईआई ओडीडी फ़ाइल में प्रलेखित टीईआई अनुकूलन पर आधारित हैं। यहां तक कि जब उपयोगकर्ता सत्यापित करने के लिए ऑफ-द-शेल्फ पूर्व-निर्मित स्कीमा में से किसी एक को चुनते हैं, तो इन्हें स्वतंत्र रूप से उपलब्ध अनुकूलन फ़ाइलों से बनाया गया है।


== परियोजनाओं ==
== परियोजनाओं ==
इस प्रारूप का उपयोग दुनिया भर में कई परियोजनाओं द्वारा किया जाता है। व्यावहारिक रूप से सभी परियोजनाएँ एक या अधिक विश्वविद्यालयों से जुड़ी होती हैं। टीईआई का उपयोग करके टेक्स्ट को एन्कोड करने वाली कुछ प्रसिद्ध परियोजनाओं में सम्मलित हैं:
इस प्रारूप का उपयोग संसार भर में कई परियोजनाओं द्वारा किया जाता है। व्यावहारिक रूप से सभी परियोजनाएँ एक या अधिक विश्वविद्यालयों से जुड़ी होती हैं। टीईआई का उपयोग करके टेक्स्ट को एन्कोड करने वाली कुछ प्रसिद्ध परियोजनाओं में सम्मलित हैं:


{| class="wikitable"
{| class="wikitable"
Line 200: Line 200:


== इतिहास ==
== इतिहास ==
टीईआई के निर्माण से पूर्व, मानविकी विद्वानों के पास इलेक्ट्रॉनिक ग्रंथों को इस प्रकार से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा कर सके ([[सुसान हॉकी|हॉकी]] 1993, पृष्ठ 41) है। 1987 में, मानविकी, भाषाविज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों का एक समूह वासर कॉलेज में दिशानिर्देशों का एक सेट प्रस्तुत करने के लिए बुलाया गया, जिसे "पॉकीप्सी सिद्धांत" के रूप में जाना जाता है। इन दिशानिर्देशों ने पूर्व टीईआई मानक, पी1 के विकास को निर्देशित किया।<ref>{{cite journal|last=Ahronheim|first=J.R.|title=Descriptive metadata: Emerging standards.|journal=Journal of Academic Librarianship|year=1998|volume=24|issue=5|pages=395–403|doi=10.1016/S0099-1333(98)90079-9}}</ref><ref>{{cite journal|last=Cantara |first=L.|title=The text-encoding initiative: Part 1|journal=OCLC Systems & Services|year=2005|volume=21|issue=1|pages=36–39|doi=10.1108/10650750510578136}}</ref>
टीईआई के निर्माण से पूर्व, मानविकी विद्वानों के निकट इलेक्ट्रॉनिक ग्रंथों को इस प्रकार से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा कर सकते ([[सुसान हॉकी|हॉकी]] 1993, पृष्ठ 41) है। 1987 में, मानविकी, भाषाविज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों का एक समूह वासर कॉलेज में दिशानिर्देशों का एक समूह प्रस्तुत करने के लिए बुलाया गया, जिसे "पॉकीप्सी सिद्धांत" के रूप में जाना जाता है। इन दिशानिर्देशों ने पूर्व टीईआई मानक, पी1 के विकास को निर्देशित किया था।<ref>{{cite journal|last=Ahronheim|first=J.R.|title=Descriptive metadata: Emerging standards.|journal=Journal of Academic Librarianship|year=1998|volume=24|issue=5|pages=395–403|doi=10.1016/S0099-1333(98)90079-9}}</ref><ref>{{cite journal|last=Cantara |first=L.|title=The text-encoding initiative: Part 1|journal=OCLC Systems & Services|year=2005|volume=21|issue=1|pages=36–39|doi=10.1108/10650750510578136}}</ref>
* 1987 - कंप्यूटर और मानविकी संघ द्वारा कार्य शुरू किया गया,<ref>{{Cite web|url=https://ach.org/|title=The Association for Computers and the Humanities &#124;|website=ach.org}}</ref> टीईआई क्या बनेगा, इस पर [[कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन]], और [[साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन]] जो बाद में टीईआई बन जाएगा।<ref>"Historical background", [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AB.html#ABTEI section iv.2] of TEI P5:  Guidelines for Electronic Text Encoding and Interchange.</ref> इसका समापन वासर योजना सम्मेलन के समापन समय में हुआ।<ref>{{cite web |url= http://www.tei-c.org/Vault/SC/teipcp1.txt |title= वासर योजना सम्मेलन का समापन वक्तव्य|work=tei-c.org |year=2009 |access-date=15 April 2012}}</ref>
* 1987 - कंप्यूटर और मानविकी संघ द्वारा कार्य प्रारंभ किया गया था,<ref>{{Cite web|url=https://ach.org/|title=The Association for Computers and the Humanities &#124;|website=ach.org}}</ref> टीईआई क्या बनेगा, इस पर [[कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन]], और [[साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन]] जो बाद में टीईआई बन जाएगा।<ref>"Historical background", [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AB.html#ABTEI section iv.2] of TEI P5:  Guidelines for Electronic Text Encoding and Interchange.</ref> इसका समापन वासर योजना सम्मेलन के समापन समय में हुआ था।<ref>{{cite web |url= http://www.tei-c.org/Vault/SC/teipcp1.txt |title= वासर योजना सम्मेलन का समापन वक्तव्य|work=tei-c.org |year=2009 |access-date=15 April 2012}}</ref>
* 1994 - टीईआई पी3 जारी किया गया,<ref>{{cite web|url=http://www.tei-c.org/Guidelines/|title=टीईआई दिशानिर्देश|access-date=2010-06-18}}</ref> [[लो बर्नार्ड]] (ऑक्सफ़ोर्ड विश्वविद्यालय में) और [[माइकल स्पर्बर्ग-मैकक्वीन]] (तब [[शिकागो में इलिनोइस विश्वविद्यालय]] में, बाद में [[W3C|डब्लू3सी]] में) द्वारा सह-संपादित किया गया।
* 1994 - टीईआई पी3 जारी किया गया,<ref>{{cite web|url=http://www.tei-c.org/Guidelines/|title=टीईआई दिशानिर्देश|access-date=2010-06-18}}</ref> [[लो बर्नार्ड]] (ऑक्सफ़ोर्ड विश्वविद्यालय में) और [[माइकल स्पर्बर्ग-मैकक्वीन]] (तब [[शिकागो में इलिनोइस विश्वविद्यालय]] में, बाद में [[W3C|डब्लू3सी]] में) द्वारा सह-संपादित किया गया था।
* 1999 - टीईआई पी3 अद्यतन किया गया।
* 1999 - टीईआई पी3 अद्यतन किया गया था।
* 2002 - टीईआई पी4 जारी किया गया, एसजीएमएल से एक्सएमएल की ओर बढ़ते हुए; यूनिकोड को अपनाना, जिसका एक्सएमएल पारसर्स को समर्थन करना आवश्यक है।<ref>{{citation|title=XML Basics|chapter=2|chapter-url=http://www.xmlnews.org/docs/xml-basics.html |access-date=2011-07-09}}</ref>
* 2002 - टीईआई पी4 जारी किया गया, एसजीएमएल से एक्सएमएल की ओर बढ़ते हुए; यूनिकोड को अपनाना, जिसका एक्सएमएल पारसर्स को समर्थन करना आवश्यक है।<ref>{{citation|title=XML Basics|chapter=2|chapter-url=http://www.xmlnews.org/docs/xml-basics.html |access-date=2011-07-09}}</ref>
* 2007 - टीईआई पी5 जारी किया गया,जिसमें डब्लू3सी से <code>xml:lang</code> और <code>xml:id</code> विशेषताओं के साथ एकीकरण सम्मलित है।<ref>{{cite web|url=http://www.w3.org/TR/REC-xml/|title=एक्स्टेंसिबल मार्कअप लैंग्वेज (XML) 1.0 (पांचवां संस्करण)|work=w3.org}}</ref>(ये पूर्व टीईआई नेमस्पेस में विशेषताएँ थीं), हैश का उपयोग करने के लिए स्थानीय पॉइंटिंग विशेषताओं का नियमितीकरण (जैसा कि एचटीएमएल में उपयोग किया जाता है) और पीटीआर और एक्सपीटीआर टैग का एकीकरण। कई नवीन परिवर्धन के साथ ये परिवर्तन पी5 को अधिक नियमित बनाते हैं और इसे डब्लू3सी द्वारा प्रचारित और अन्य एक्सएमएल वेरिएंट द्वारा उपयोग किए जाने वाले वर्तमान एक्सएमएल अभ्यास के करीब लाते हैं। टीईआई पी5 के रखरखाव और फीचर अपडेट संस्करण 2007 से वर्ष में कम से कम दो बार जारी किए गए हैं।
* 2007 - टीईआई पी5 जारी किया गया,जिसमें डब्लू3सी से <code>xml:lang</code> और <code>xml:id</code> विशेषताओं के साथ एकीकरण सम्मलित है।<ref>{{cite web|url=http://www.w3.org/TR/REC-xml/|title=एक्स्टेंसिबल मार्कअप लैंग्वेज (XML) 1.0 (पांचवां संस्करण)|work=w3.org}}</ref> (ये पूर्व टीईआई नेमस्पेस में विशेषताएँ थीं), हैश का उपयोग करने के लिए स्थानीय पॉइंटिंग विशेषताओं का नियमितीकरण (जैसा कि एचटीएमएल में उपयोग किया जाता है) और पीटीआर और एक्सपीटीआर टैग का एकीकरण है । कई नवीन परिवर्धन के साथ ये परिवर्तन पी5 को अधिक नियमित बनाते हैं और इसे डब्लू3सी द्वारा प्रचारित और अन्य एक्सएमएल प्रकार द्वारा उपयोग किए जाने वाले वर्तमान एक्सएमएल अभ्यास के निकट लाते हैं। टीईआई पी5 के रखरखाव और फीचर अपडेट संस्करण 2007 से वर्ष में कम से कम दो बार जारी किए गए हैं।
* 2011 - [[आनुवंशिक संपादन]] के समर्थन के साथ टीईआई पी5 v2.0.1 जारी किया गया<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/readme-2.0.1.html |title=P5 version 2.0.1 release notes |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref> (कई अन्य परिवर्धनों के बीच आनुवंशिक संपादन सुविधाएँ पाठों को उनके विशिष्ट शब्दार्थ की व्याख्या किए बिना एन्कोड करने की अनुमति देती हैं)।
* 2011 - [[आनुवंशिक संपादन]] के समर्थन के साथ टीईआई पी5 v2.0.1 जारी किया गया<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/readme-2.0.1.html |title=P5 version 2.0.1 release notes |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref> (कई अन्य परिवर्धनों के बीच आनुवंशिक संपादन सुविधाएँ पाठों को उनके विशिष्ट शब्दार्थ की व्याख्या किए बिना एन्कोड करने की अनुमति देती हैं)।
* 2017 - टीईआई को एलायंस ऑफ अंकीय मानविकी संगठन की ओर से एंटोनियो ज़म्पोली पुरस्कार से सम्मानित किया गया।<ref>{{Cite web | url=https://tei-c.org/ | title=TEI: Text Encoding Initiative}}</ref>
* 2017 - टीईआई को एलायंस ऑफ अंकीय मानविकी संगठन की ओर से एंटोनियो ज़म्पोली पुरस्कार से सम्मानित किया गया था।<ref>{{Cite web | url=https://tei-c.org/ | title=TEI: Text Encoding Initiative}}</ref>





Revision as of 10:47, 28 June 2023

Text Encoding InitiativeTEI Logo.svg

पाठ एन्कोडिंग पहल (टीईआई) अंकीय मानविकी के शैक्षणिक क्षेत्र में अभ्यास का पाठ-केंद्रित समुदाय पाठ-केंद्रित समुदाय है, जो 1980 के दशक से निरन्तर कार्य कर रहा है। समुदाय वर्तमान में एक मेलिंग सूची, बैठकें और सम्मेलन श्रृंखला चलाता है, और टीईआई तकनीकी मानक, एक वैज्ञानिक पत्रिका,[1] एक विकी ,एक गिटहब रिपॉजिटरी और एक टूलचेन बनाए रखता है।

टीईआई दिशानिर्देश

टीईआई दिशानिर्देश सामूहिक रूप से एक प्रकार के एक्सएमएलप्रारूप को परिभाषित करते हैं, और अभ्यास के समुदाय के परिभाषित आउटपुट हैं। यह प्रारूप पाठ के लिए अन्य प्रसिद्ध विवृत प्रारूपों (जैसे एचटीएमएल और ओपन डॉक्यूमेंट ) से भिन्न है, क्योंकि यह प्रस्तुतिकरण के अतिरिक्त मुख्य रूप से अर्थपूर्ण है; प्रत्येक टैग और विशेषता के शब्दार्थ और व्याख्या निर्दिष्ट हैं।

लगभग 500 अलग-अलग पाठ्य घटक और अवधारणाएँ हैं

(word,[2] sentence,[3] character,[4] glyph,[5] person,[6]

आदि); प्रत्येक एक या अधिक शैक्षणिक विषयों पर आधारित है और उदाहरण दिए गए हैं।

तकनीकी विवरण

मानक को दो भागों में विभाजित किया गया है, विस्तारित उदाहरणों और चर्चा के साथ एक विवेचनात्मक पाठ्य विवरण और टैग-दर-टैग परिभाषाओं का समूह इस प्रकार किया गया है। अधिकांश आधुनिक प्रारूपों (डॉक्यूमेंट प्रकार परिभाषा, रिलैक्स एनजी और डब्लू3सी स्कीमा) में स्कीमाटा टैग-दर-टैग परिभाषाओं से स्वचालित रूप से उत्पन्न होते हैं। कई उपकरण दिशानिर्देशों के उत्पादन और विशिष्ट परियोजनाओं के लिए दिशानिर्देशों के अनुप्रयोग का समर्थन करते हैं।

अंतर्निहित यूनिकोड द्वारा लगाए गए प्रतिबंधों से बचने के लिए कई विशेष टैग का उपयोग किया जाता है; ग्लिफ़ उन वर्णों के प्रतिनिधित्व की अनुमति देता है जो यूनिकोड समावेशन के लिए योग्य नहीं हैं[2] और आवश्यक सख्त रैखिकता पर काबू पाने की अमति देता है।[7]

प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, परंतु दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट उपसमूह का उपयोग करके अनुकूलन का उत्पादन करते हैं। टीईआई इस उद्देश्य के लिए एक परिष्कृत अनुकूलन तंत्र को परिभाषित करता है जिसे ओडीडी के रूप में जाना जाता है। प्रत्येक टीईआई टैग का डोक्युमेंटिंग और वर्णन करने के अतिरिक्त, एक ओडीडी विनिर्देश इसके ऑब्जेक्ट मॉडल और अन्य उपयोग बाधाओं को निर्दिष्ट करता है, जिसे स्कीमट्रॉन का उपयोग करके व्यक्त किया जा सकता है।

टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह पाठ्य भाग के आदान-प्रदान के लिए एक एक्सएमएल - आधारित फ़ाइल स्वरूप को परिभाषित करता है। संपूर्ण टीईआई दिशानिर्देशों में उपलब्ध अवयवों के व्यापक समूह से एक प्रबंधनीय चयन है।

एक्सएमएल -आधारित प्रारूप के रूप में, टीईआई सीधे ओवरलैपिंग मार्कअप और गैर-श्रेणीबद्ध संरचनाओं से निपट नहीं सकता है। दिशानिर्देशों द्वारा इस प्रकार के डेटा का प्रतिनिधित्व करने के लिए कई प्रकार के विकल्प सुझाए गए हैं।[8]


उदाहरण

टीईआई दिशानिर्देशों का पाठ उदाहरणों से समृद्ध है। टीईआई विकी पर एक प्रतिदर्श पृष्ठ भी है,[9] जो वास्तविक संसार की परियोजनाओं के उदाहरण देता है जो उनके अंतर्निहित टीईआई को अनावृत करते हैं।

गद्य उपनाम

टीईआईपाठ्य भाग को कणमयता या कणमयता के मिश्रण के किसी भी स्तर पर वाक्यात्मक रूप से चिह्नित करने की अनुमति देता है। उदाहरण के लिए, इस अनुच्छेद (पी) को वाक्यों और खंडों (सीएल) में चिह्नित किया गया है।[10]

 <s>
  <cl>It was about the beginning of September, 1664,
  <cl>that I, among the rest of my neighbours,
       heard in ordinary discourse
   <cl>that the plague was returned again to Holland; </cl>
   </cl>
  </cl>
  <cl>for it had been very violent there, and particularly at
     Amsterdam and Rotterdam, in the year 1663, </cl>
  <cl>whither, <cl>they say,</cl> it was brought,
  <cl>some said</cl> from Italy, others from the Levant, among some goods
  <cl>which were brought home by their Turkey fleet;</cl>
  </cl>
  <cl>others said it was brought from Candia;
     others from Cyprus. </cl>
 </s>
 <s>
  <cl>It mattered not <cl>from whence it came;</cl>
  </cl>
  <cl>but all agreed <cl>it was come into Holland again.</cl>
  </cl>
 </s>


पद्य

टीईआई में पद्य को चिह्नित करने के लिए टैग हैं। यह उदाहरण (टीईआई दिशानिर्देशों के फ्रेंच अनुवाद से लिया गया) एक सॉनेट दिखाता है।[11]

<div type="sonnet">
 <lg type="quatrain">
  <l>Les amoureux fervents et les savants austères</l>
  <l> Aiment également, dans leur mûre saison,</l>
  <l> Les chats puissants et doux, orgueil de la maison,</l>
  <l> Qui comme eux sont frileux et comme eux sédentaires.</l>
 </lg>
 <lg type="quatrain">
  <l>Amis de la science et de la volupté</l>
  <l> Ils cherchent le silence et l'horreur des ténèbres ;</l>
  <l> L'Érèbe les eût pris pour ses coursiers funèbres,</l>
  <l> S'ils pouvaient au servage incliner leur fierté.</l>
 </lg>
 <lg type="tercet">
  <l>Ils prennent en songeant les nobles attitudes</l>
  <l>Des grands sphinx allongés au fond des solitudes,</l>
  <l>Qui semblent s'endormir dans un rêve sans fin ;</l>
 </lg>
 <lg type="tercet">
  <l>Leurs reins féconds sont pleins d'étincelles magiques,</l>
  <l> Et des parcelles d'or, ainsi qu'un sable fin,</l>
  <l>Étoilent vaguement leurs prunelles mystiques.</l>
 </lg>
</div>

चयन उपनाम

चयन उपनाम का उपयोग पाठ के उन अनुभागों को दर्शाने के लिए किया जाता है जिन्हें एक से अधिक संभावित विधि से एन्कोड या टैग किया जा सकता है। निम्नलिखित उदाहरण में, मानक में एक के आधार पर, विकल्प का उपयोग दो बार किया जाता है, एक बार मूल और सत्य संख्या को इंगित करने के लिए, और एक बार मूल और नियमित वर्तनी को इंगित करने के लिए है।[12]

<p xml:id="p23">Lastly, That, upon his solemn oath to observe all the above
articles, the said man-mountain shall have a daily allowance of
meat and drink sufficient for the support of <choice>
  <sic>1724</sic>
  <corr>1728</corr>
 </choice> of our subjects,
with free access to our royal person, and other marks of our
<choice>
  <orig>favour</orig>
  <reg>favor</reg>
 </choice>.


ओडीडी

वन डॉक्यूमेंट डू इट ऑल (ओडीडी ) एक्सएमएल स्कीमा के लिए एक साक्षर प्रोग्रामिंग भाषा है।[13][14][15][16]

साक्षर-प्रोग्रामिंग शैली में, ओडीडी डॉक्यूमेंट पाठ एन्कोडिंग पहल के दस्तावेज़ीकरण अवयव मॉड्यूल का उपयोग करके मानव-पठनीय डॉक्यूमेंट और मशीन-पठनीय मॉडल को जोड़ते हैं। उपकरण स्थानीयकृत और अंतर्राष्ट्रीयकृत एचटीएमएल, इपुब , या पीडीएफ मानव-पठनीय आउटपुट और डॉक्यूमेंट प्रकार परिभाषाएँ, एक्सएमएल स्कीमा (डब्लू3सी ), रिलैक्स एनजी कॉम्पैक्ट सिंटेक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स मशीन-पठनीय आउटपुट उत्पन्न करते हैं।

रोमा वेब एप्लिकेशन[17] ओडीडी प्रारूप के निकट बनाया गया है और इसका उपयोग डॉक्यूमेंट प्रकार परिभाषा, एक्सएमएल स्कीमा (डब्लू3सी ), रिलैक्स एनजी कॉम्पैक्ट सिंटैक्स, या रिलैक्स एनजी एक्सएमएल सिंटेक्स प्रारूपों में स्कीमा उत्पन्न करने के लिए किया जा सकता है, जैसा कि कई एक्सएमएल सत्यापन उपकरण और सेवाओं द्वारा उपयोग किया जाता है।

ओडीडी टीईआई तकनीकी मानकों और सुरक्षा प्राधिकरण के लिए टेक्स्ट एन्कोडिंग पहल द्वारा आंतरिक रूप से उपयोग किया जाने वाला प्रारूप है।[18] चूंकि ओडीडी फाइलें सामान्यतः एक अनुकूलित एक्सएमएल प्रारूप और पूर्ण टीईआई मॉडल के बीच के अंतर का वर्णन करती हैं, ओडीडी का उपयोग एक्सएमएल प्रारूपों का वर्णन करने के लिए भी किया जा सकता है जो टीईआई से पूर्ण रूप से अलग हैं। इसका एक उदाहरण डब्लू3सी का अंतर्राष्ट्रीयकरण टैग समूह है जो स्कीमा उत्पन्न करने और अपनी शब्दावली का डोक्युमेंटिंग करने के लिए ओडीडी प्रारूप का उपयोग करता है।[19][20]


टीईआई अनुकूलन

टीईआई अनुकूलन विशेष क्षेत्रों या विशिष्ट समुदायों द्वारा उपयोग के लिए टीईआई एक्सएमएल विनिर्देश की विशेषज्ञता है।

  • एपिडॉक (पुरालेख डॉक्यूमेंट)
  • चार्टर्स एन्कोडिंग पहल[21]
  • मध्यकालीन नॉर्डिक पाठ संग्रह(मेनोटा)[22]

टीईआई में अनुकूलन ऊपर उल्लिखित ओडीडी तंत्र के माध्यम से किया जाता है। ऑब्जेक्टतः में इसके P5 संस्करण के पश्चात से, टीईआई दिशानिर्देशों के सभी तथाकथित 'टीईआई अनुरूप' उपयोग टीईआई ओडीडी फ़ाइल में प्रलेखित टीईआई अनुकूलन पर आधारित हैं। यहां तक कि जब उपयोगकर्ता सत्यापित करने के लिए ऑफ-द-शेल्फ पूर्व-निर्मित स्कीमा में से किसी एक को चुनते हैं, तो इन्हें स्वतंत्र रूप से उपलब्ध अनुकूलन फ़ाइलों से बनाया गया है।

परियोजनाओं

इस प्रारूप का उपयोग संसार भर में कई परियोजनाओं द्वारा किया जाता है। व्यावहारिक रूप से सभी परियोजनाएँ एक या अधिक विश्वविद्यालयों से जुड़ी होती हैं। टीईआई का उपयोग करके टेक्स्ट को एन्कोड करने वाली कुछ प्रसिद्ध परियोजनाओं में सम्मलित हैं:

टीईआई परियोजनाएं
Project URL Strengths
British National Corpus http://www.natcorp.ox.ac.uk 100 million word snapshot of current English
Oxford Text Archive https://ota.bodleian.ox.ac.uk/repository/xmlui/ >1 GB of Linguistic data and electronic texts in 25 languages
Perseus Project https://www.perseus.tufts.edu/ Greek and Latin texts
EpiDoc https://sourceforge.net/p/epidoc/wiki/Home/ Epigraphy and Papyrology
Women Writers Project https://wwp.northeastern.edu/ Early modern women writers (Margaret Cavendish, Eliza Haywood, etc.)
New Zealand Electronic Text Centre http://www.nzetc.org/ New Zealand and Pacific Islands texts
The SWORD Project https://www.crosswire.org/sword/ Bible software, dictionaries, Christian literature
FreeDict https://freedict.org/ Bilingual dictionaries
Text Creation Partnership https://textcreationpartnership.org/ Early English and American books
CELT https://celt.ucc.ie/publishd.html Ancient and Medieval Irish Manuscripts
ISTEX https://www.istex.fr/ Archives of scientific publications
CAB https://cab.geschkult.fu-berlin.de/ An Edition of the Zoroastrian Rituals in the Avestan Language


इतिहास

टीईआई के निर्माण से पूर्व, मानविकी विद्वानों के निकट इलेक्ट्रॉनिक ग्रंथों को इस प्रकार से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा कर सकते (हॉकी 1993, पृष्ठ 41) है। 1987 में, मानविकी, भाषाविज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों का एक समूह वासर कॉलेज में दिशानिर्देशों का एक समूह प्रस्तुत करने के लिए बुलाया गया, जिसे "पॉकीप्सी सिद्धांत" के रूप में जाना जाता है। इन दिशानिर्देशों ने पूर्व टीईआई मानक, पी1 के विकास को निर्देशित किया था।[23][24]

  • 1987 - कंप्यूटर और मानविकी संघ द्वारा कार्य प्रारंभ किया गया था,[25] टीईआई क्या बनेगा, इस पर कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन, और साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन जो बाद में टीईआई बन जाएगा।[26] इसका समापन वासर योजना सम्मेलन के समापन समय में हुआ था।[27]
  • 1994 - टीईआई पी3 जारी किया गया,[28] लो बर्नार्ड (ऑक्सफ़ोर्ड विश्वविद्यालय में) और माइकल स्पर्बर्ग-मैकक्वीन (तब शिकागो में इलिनोइस विश्वविद्यालय में, बाद में डब्लू3सी में) द्वारा सह-संपादित किया गया था।
  • 1999 - टीईआई पी3 अद्यतन किया गया था।
  • 2002 - टीईआई पी4 जारी किया गया, एसजीएमएल से एक्सएमएल की ओर बढ़ते हुए; यूनिकोड को अपनाना, जिसका एक्सएमएल पारसर्स को समर्थन करना आवश्यक है।[29]
  • 2007 - टीईआई पी5 जारी किया गया,जिसमें डब्लू3सी से xml:lang और xml:id विशेषताओं के साथ एकीकरण सम्मलित है।[30] (ये पूर्व टीईआई नेमस्पेस में विशेषताएँ थीं), हैश का उपयोग करने के लिए स्थानीय पॉइंटिंग विशेषताओं का नियमितीकरण (जैसा कि एचटीएमएल में उपयोग किया जाता है) और पीटीआर और एक्सपीटीआर टैग का एकीकरण है । कई नवीन परिवर्धन के साथ ये परिवर्तन पी5 को अधिक नियमित बनाते हैं और इसे डब्लू3सी द्वारा प्रचारित और अन्य एक्सएमएल प्रकार द्वारा उपयोग किए जाने वाले वर्तमान एक्सएमएल अभ्यास के निकट लाते हैं। टीईआई पी5 के रखरखाव और फीचर अपडेट संस्करण 2007 से वर्ष में कम से कम दो बार जारी किए गए हैं।
  • 2011 - आनुवंशिक संपादन के समर्थन के साथ टीईआई पी5 v2.0.1 जारी किया गया[31] (कई अन्य परिवर्धनों के बीच आनुवंशिक संपादन सुविधाएँ पाठों को उनके विशिष्ट शब्दार्थ की व्याख्या किए बिना एन्कोड करने की अनुमति देती हैं)।
  • 2017 - टीईआई को एलायंस ऑफ अंकीय मानविकी संगठन की ओर से एंटोनियो ज़म्पोली पुरस्कार से सम्मानित किया गया था।[32]


संदर्भ

  1. "टेक्स्ट एन्कोडिंग पहल का जर्नल". Open Edition Journals. Retrieved 29 June 2022.
  2. 2.0 2.1 "TEI तत्व w (शब्द)". tei-c.org.
  3. "टीईआई तत्व एस (एस-यूनिट)". tei-c.org.
  4. "टीई तत्व सी (चरित्र)". tei-c.org.
  5. "TEI तत्व जी (चरित्र या ग्लिफ़)". tei-c.org.
  6. "टीईआई तत्व व्यक्ति (व्यक्ति)". tei-c.org.
  7. "तत्व पसंद". www.tei-c.org.
  8. "20 Non-hierarchical Structures - TEI P5: — Guidelines for Electronic Text Encoding and Interchange". tei-c.org. 2019. Retrieved 19 March 2019.
  9. "टीईआई ग्रंथों के नमूने". wiki.tei-c.org. 2011. Retrieved 17 April 2012.
  10. "17 Simple Analytic Mechanisms - TEI P5: — Guidelines for Electronic Text Encoding and Interchange". tei-c.org. 2012. Retrieved 15 April 2012.
  11. "टीईआई तत्व एलजी (कृमि का समूह)". tei-c.org. 2012. Retrieved 15 April 2012.
  12. "TEI तत्व पसंद". tei-c.org. 2012. Retrieved 15 April 2012.
  13. Bauman, Syd; Flanders, Julia (2004), "ODD customizations", Extreme Markup Languages 2004.
  14. Burnard, Lou; Rahtz, Sebastian (2004), "RelaxNG with Son of ODD", Extreme Markup Languages 2004.
  15. Reiss, Kevin M. (2007), Literate Documentation for XML (PDF), Urbana-Champaign, Illinois: Digital Humanities 2007.
  16. Burnard, Lou; Rahtz, Sebastian (June 2013). "टेक्स्ट एन्कोडिंग पहल के लिए एक पूर्ण स्कीमा परिभाषा भाषा". XML London 2013: 152–161. doi:10.14337/XMLLondon13.Rahtz01. ISBN 978-0-9926471-0-0.
  17. Roma web application
  18. Burnard, Lou; Bauman, Syd, eds. (2007), TEI P5: Guidelines for Electronic Text Encoding and Interchange, Charlottesville, Virginia, USA: TEI Consortium.
  19. W3C ITS and TEI ODD file
  20. Savourel, Yves; Kosek, Jirka; Ishida, Richard, eds. (2008), "5.2 ITS and TEI", Best Practices for XML Internationalization, W3C Working Group.
  21. "Charters Encoding Initiative - Ludwig-Maximilians-Universität München". www.cei.lmu.de.
  22. "मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)". www.menota.org.
  23. Ahronheim, J.R. (1998). "Descriptive metadata: Emerging standards". Journal of Academic Librarianship. 24 (5): 395–403. doi:10.1016/S0099-1333(98)90079-9.
  24. Cantara, L. (2005). "The text-encoding initiative: Part 1". OCLC Systems & Services. 21 (1): 36–39. doi:10.1108/10650750510578136.
  25. "The Association for Computers and the Humanities |". ach.org.
  26. "Historical background", section iv.2 of TEI P5: Guidelines for Electronic Text Encoding and Interchange.
  27. "वासर योजना सम्मेलन का समापन वक्तव्य". tei-c.org. 2009. Retrieved 15 April 2012.
  28. "टीईआई दिशानिर्देश". Retrieved 2010-06-18.
  29. "2", XML Basics, retrieved 2011-07-09
  30. "एक्स्टेंसिबल मार्कअप लैंग्वेज (XML) 1.0 (पांचवां संस्करण)". w3.org.
  31. "P5 version 2.0.1 release notes". tei-c.org. 2012. Retrieved 15 April 2012.
  32. "TEI: Text Encoding Initiative".


बाहरी संबंध