टेक्स्ट एन्कोडिंग इनिशिएटिव: Difference between revisions
(Created page with "{{short description|Academic community concerned with practices for semantic markup of texts}} thumbटेक्स्ट एन...") |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Academic community concerned with practices for semantic markup of texts}} | {{short description|Academic community concerned with practices for semantic markup of texts}} | ||
[[File:Text Encoding InitiativeTEI Logo.svg|thumb]]टेक्स्ट एन्कोडिंग इनिशिएटिव (टीईआई) एक [[लिखित भाषा]] है | [[डिजिटल मानविकी]] के अकादमिक विषयों की सूची में अभ्यास का पाठ-केंद्रित समुदाय, जो 1980 के दशक से लगातार काम कर रहा है। समुदाय वर्तमान में एक मेलिंग सूची, बैठकें और सम्मेलन श्रृंखला चलाता है, और | [[File:Text Encoding InitiativeTEI Logo.svg|thumb]]टेक्स्ट एन्कोडिंग इनिशिएटिव (टीईआई) एक [[लिखित भाषा]] है | [[डिजिटल मानविकी]] के अकादमिक विषयों की सूची में अभ्यास का पाठ-केंद्रित समुदाय, जो 1980 के दशक से लगातार काम कर रहा है। समुदाय वर्तमान में एक मेलिंग सूची, बैठकें और सम्मेलन श्रृंखला चलाता है, और टीईआई [[तकनीकी मानक]], एक [[वैज्ञानिक पत्रिका]], का रखरखाव करता है।<ref>{{cite web |title=टेक्स्ट एन्कोडिंग पहल का जर्नल|url=https://journals.openedition.org/jtei/ |website=Open Edition Journals |access-date=29 June 2022}}</ref> एक [[ सप्ताह ]], एक गिटहब रिपॉजिटरी और एक [[ toolchain ]]। | ||
== टीईआई दिशानिर्देश == | == टीईआई दिशानिर्देश == | ||
Line 18: | Line 18: | ||
अंतर्निहित [[यूनिकोड]] द्वारा लगाए गए प्रतिबंधों को दरकिनार करने के लिए कई विशेष टैग का उपयोग किया जाता है; {{mono|glyph}} उन पात्रों के प्रतिनिधित्व की अनुमति देने के लिए जो यूनिकोड समावेशन के योग्य नहीं हैं<ref name="auto"/>और {{mono|choice}} आवश्यक सख्त रैखिकता को दूर करने की अनुमति देने के लिए।<ref>{{cite web|url=http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-choice.html|title=तत्व पसंद|website=www.tei-c.org}}</ref> | अंतर्निहित [[यूनिकोड]] द्वारा लगाए गए प्रतिबंधों को दरकिनार करने के लिए कई विशेष टैग का उपयोग किया जाता है; {{mono|glyph}} उन पात्रों के प्रतिनिधित्व की अनुमति देने के लिए जो यूनिकोड समावेशन के योग्य नहीं हैं<ref name="auto"/>और {{mono|choice}} आवश्यक सख्त रैखिकता को दूर करने की अनुमति देने के लिए।<ref>{{cite web|url=http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-choice.html|title=तत्व पसंद|website=www.tei-c.org}}</ref> | ||
प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, लेकिन दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट सबसेट का उपयोग करके एक अनुकूलन का उत्पादन करते हैं। | प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, लेकिन दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट सबसेट का उपयोग करके एक अनुकूलन का उत्पादन करते हैं। टीईआई इस उद्देश्य के लिए ओडीडी के रूप में ज्ञात एक परिष्कृत अनुकूलन तंत्र को परिभाषित करता है। प्रत्येक टीईआई टैग का दस्तावेजीकरण और वर्णन करने के अलावा, एक ओडीडी विनिर्देश इसके सामग्री मॉडल और अन्य उपयोग बाधाओं को निर्दिष्ट करता है, जिसे स्कीमाट्रॉन का उपयोग करके व्यक्त किया जा सकता है। | ||
टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह ग्रंथों के आदान-प्रदान के लिए एक XML- आधारित फ़ाइल स्वरूप को परिभाषित करता है। यह पूर्ण टीईआई दिशानिर्देशों में उपलब्ध तत्वों के व्यापक सेट से एक प्रबंधनीय चयन है। | टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह ग्रंथों के आदान-प्रदान के लिए एक XML- आधारित फ़ाइल स्वरूप को परिभाषित करता है। यह पूर्ण टीईआई दिशानिर्देशों में उपलब्ध तत्वों के व्यापक सेट से एक प्रबंधनीय चयन है। | ||
XML-आधारित प्रारूप के रूप में, | XML-आधारित प्रारूप के रूप में, टीईआई सीधे [[ओवरलैपिंग मार्कअप]] और गैर-श्रेणीबद्ध संरचनाओं से निपट नहीं सकता है। इस प्रकार के डेटा का प्रतिनिधित्व करने के लिए विभिन्न प्रकार के विकल्प दिशानिर्देशों द्वारा सुझाए गए हैं।<ref>{{cite web |url= https://tei-c.org/release/doc/tei-p5-doc/en/html/NH.html |title=20 Non-hierarchical Structures - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2019 |access-date=19 March 2019}}</ref> | ||
Line 31: | Line 31: | ||
==== गद्य टैग ==== | ==== गद्य टैग ==== | ||
टीईआई ग्रंथों को किसी भी स्तर के ग्रैन्युलैरिटी, या ग्रैन्युलैरिटी के मिश्रण पर सिंटैक्टिक रूप से चिह्नित करने की अनुमति देता है। उदाहरण के लिए, इस अनुच्छेद (पी) को वाक्यों और खंडों (सीएल) में चिह्नित किया गया है।<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AI.html#AILCW |title=17 Simple Analytic Mechanisms - TEI P5: — Guidelines for Electronic Text Encoding and Interchange |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref> | |||
<syntaxhighlight lang="XML"> | <syntaxhighlight lang="XML"> | ||
Line 63: | Line 63: | ||
==== श्लोक ==== | ==== श्लोक ==== | ||
टीईआई के पास पद्य को चिन्हित करने के लिए टैग हैं। यह उदाहरण (टीईआई दिशानिर्देशों के फ्रेंच अनुवाद से लिया गया) एक सॉनेट दिखाता है।<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/fr/html/ref-lg |title=टीईआई तत्व एलजी (कृमि का समूह)|work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref> | |||
<syntaxhighlight lang="XML"> | <syntaxhighlight lang="XML"> | ||
Line 113: | Line 113: | ||
== ओडीडी == | == ओडीडी == | ||
वन डॉक्यूमेंट डू इट ऑल ( | वन डॉक्यूमेंट डू इट ऑल (ओडीडी ) XML स्कीमा के लिए एक [[साक्षर प्रोग्रामिंग]] भाषा है।<ref>{{citation|year=2004|last1=Bauman|first1=Syd|last2=Flanders|first2=Julia|contribution=ODD customizations|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Bauman01/EML2004Bauman01.html}}.</ref><ref>{{citation|year=2004|last1=Burnard|first1=Lou|author2-link=Sebastian Rahtz|last2=Rahtz|first2=Sebastian|contribution=RelaxNG with Son of ODD|title=Extreme Markup Languages 2004|url=http://conferences.idealliance.org/extreme/html/2004/Burnard01/EML2004Burnard01.html}}.</ref><ref>{{citation|title=Literate Documentation for XML|last=Reiss|first=Kevin M.|publisher=Digital Humanities 2007|location=Urbana-Champaign, Illinois|year=2007|url=http://dhcommons.tamu.edu/sites/default/files/poster_208_reiss.pdf}}.</ref><ref>{{Cite journal|title=टेक्स्ट एन्कोडिंग पहल के लिए एक पूर्ण स्कीमा परिभाषा भाषा|first1=Lou|last1=Burnard|author2-link=Sebastian Rahtz|first2=Sebastian|last2=Rahtz|date=June 2013|journal=XML London 2013|doi=10.14337/XMLLondon13.Rahtz01|url=http://xmllondon.com/2013/presentations/rahtz/|pages=152–161|isbn=978-0-9926471-0-0|doi-access=free}}</ref> | ||
साक्षर-प्रोग्रामिंग शैली में, | साक्षर-प्रोग्रामिंग शैली में, ओडीडी दस्तावेज़ पाठ एन्कोडिंग पहल के दस्तावेज़ीकरण तत्व मॉड्यूल का उपयोग करके मानव-पठनीय दस्तावेज़ीकरण और मशीन-पठनीय मॉडल को जोड़ते हैं। उपकरण [[अंतर्राष्ट्रीयकरण और स्थानीयकरण]] HTML, [[ePub]], या [[PDF]] मानव-पठनीय आउटपुट और दस्तावेज़ प्रकार परिभाषाएँ, [[XML स्कीमा (W3C)]], RELAX NG कॉम्पैक्ट सिंटेक्स, या रिलैक्स NG XML सिंटेक्स मशीन-पठनीय आउटपुट उत्पन्न करते हैं। | ||
रोमा वेब एप्लिकेशन<ref>[https://roma2.tei-c.org/ Roma web application]</ref> | रोमा वेब एप्लिकेशन<ref>[https://roma2.tei-c.org/ Roma web application]</ref> ओडीडी प्रारूप के आसपास बनाया गया है और इसका उपयोग दस्तावेज़ प्रकार परिभाषा, XML स्कीमा (W3C), RELAX NG कॉम्पैक्ट सिंटैक्स, या आराम NG XML सिंटेक्स प्रारूपों में स्कीमा उत्पन्न करने के लिए कर सकता है, जैसा कि कई XML सत्यापन उपकरण और सेवाओं द्वारा उपयोग किया जाता है। | ||
ओडीडी टीईआई तकनीकी मानकों और सुरक्षा प्राधिकरण के लिए टेक्स्ट एन्कोडिंग पहल द्वारा आंतरिक रूप से उपयोग किया जाने वाला प्रारूप है।<ref>{{citation|year=2007|editor1-first=Lou|editor1-last=Burnard|editor2-first=Syd|editor2-last=Bauman|title=TEI P5: Guidelines for Electronic Text Encoding and Interchange|publisher=TEI Consortium|location=Charlottesville, Virginia, USA|url=http://www.tei-c.org/Guidelines/P5/}}.</ref> हालाँकि ओडीडी फाइलें आम तौर पर एक अनुकूलित XML प्रारूप और पूर्ण टीईआई मॉडल के बीच के अंतर का वर्णन करती हैं, ओडीडी का उपयोग XML स्वरूपों का वर्णन करने के लिए भी किया जा सकता है जो टीईआई से पूरी तरह से अलग हैं। इसका एक उदाहरण W3C| है W3C का [[अंतर्राष्ट्रीयकरण टैग सेट]] जो स्कीमा उत्पन्न करने और इसकी शब्दावली को दस्तावेज करने के लिए ओडीडी प्रारूप का उपयोग करता है।<ref>[http://www.w3.org/TR/its/ W3C ITS] and [http://www.w3.org/TR/its/itstagset.xml TEI ODD file]</ref><ref>{{citation|title=Best Practices for XML Internationalization|editor1-last=Savourel|editor1-first=Yves|editor2-last=Kosek|editor2-first=Jirka|editor3-last=Ishida|editor3-first=Richard|publisher=W3C Working Group|year=2008|url=http://www.w3.org/TR/xml-i18n-bp/|contribution=5.2 ITS and TEI}}.</ref> | |||
Line 127: | Line 127: | ||
* चार्टर्स एन्कोडिंग पहल<ref>{{Cite web|url=http://www.cei.lmu.de/|title=Charters Encoding Initiative - Ludwig-Maximilians-Universität München|website=www.cei.lmu.de}}</ref> | * चार्टर्स एन्कोडिंग पहल<ref>{{Cite web|url=http://www.cei.lmu.de/|title=Charters Encoding Initiative - Ludwig-Maximilians-Universität München|website=www.cei.lmu.de}}</ref> | ||
* मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)<ref>{{Cite web|url=https://www.menota.org/forside.xhtml|title=मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)|website=www.menota.org}}</ref> | * मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)<ref>{{Cite web|url=https://www.menota.org/forside.xhtml|title=मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)|website=www.menota.org}}</ref> | ||
टीईआई में अनुकूलन ऊपर वर्णित ओडीडी तंत्र के माध्यम से किया जाता है। वास्तव में इसके P5 संस्करण के बाद से, | टीईआई में अनुकूलन ऊपर वर्णित ओडीडी तंत्र के माध्यम से किया जाता है। वास्तव में इसके P5 संस्करण के बाद से, टीईआई दिशानिर्देशों के सभी तथाकथित 'टीईआई अनुरूप' उपयोग टीईआई ओडीडी फ़ाइल में प्रलेखित टीईआई अनुकूलन पर आधारित हैं। यहां तक कि जब उपयोगकर्ता ऑफ-द-शेल्फ प्री-जेनरेट किए गए स्कीमा में से किसी एक को मान्य करने के लिए चुनते हैं, तो ये स्वतंत्र रूप से उपलब्ध अनुकूलन फ़ाइलों से बनाए गए हैं। | ||
== प्रोजेक्ट्स == | == प्रोजेक्ट्स == | ||
Line 193: | Line 193: | ||
== इतिहास == | == इतिहास == | ||
टीईआई के निर्माण से पहले, मानविकी विद्वानों के पास इलेक्ट्रॉनिक पाठ्य सामग्री को इस तरह से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा करे ([[सुसान हॉकी]] 1993, पृष्ठ 41)। 1987 में, वासर कॉलेज में मानविकी, भाषा विज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों के एक समूह ने "पोकीकीसी सिद्धांतों" के रूप में जाने जाने वाले दिशानिर्देशों का एक सेट प्रस्तुत किया। इन दिशानिर्देशों ने पहले TEI मानक, P1 के विकास को निर्देशित किया।<ref>{{cite journal|last=Ahronheim|first=J.R.|title=Descriptive metadata: Emerging standards.|journal=Journal of Academic Librarianship|year=1998|volume=24|issue=5|pages=395–403|doi=10.1016/S0099-1333(98)90079-9}}</ref><ref>{{cite journal|last=Cantara |first=L.|title=The text-encoding initiative: Part 1|journal=OCLC Systems & Services|year=2005|volume=21|issue=1|pages=36–39|doi=10.1108/10650750510578136}}</ref> | टीईआई के निर्माण से पहले, मानविकी विद्वानों के पास इलेक्ट्रॉनिक पाठ्य सामग्री को इस तरह से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा करे ([[सुसान हॉकी]] 1993, पृष्ठ 41)। 1987 में, वासर कॉलेज में मानविकी, भाषा विज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों के एक समूह ने "पोकीकीसी सिद्धांतों" के रूप में जाने जाने वाले दिशानिर्देशों का एक सेट प्रस्तुत किया। इन दिशानिर्देशों ने पहले TEI मानक, P1 के विकास को निर्देशित किया।<ref>{{cite journal|last=Ahronheim|first=J.R.|title=Descriptive metadata: Emerging standards.|journal=Journal of Academic Librarianship|year=1998|volume=24|issue=5|pages=395–403|doi=10.1016/S0099-1333(98)90079-9}}</ref><ref>{{cite journal|last=Cantara |first=L.|title=The text-encoding initiative: Part 1|journal=OCLC Systems & Services|year=2005|volume=21|issue=1|pages=36–39|doi=10.1108/10650750510578136}}</ref> | ||
* 1987 - कंप्यूटर और मानविकी संघ द्वारा काम शुरू किया गया,<ref>{{Cite web|url=https://ach.org/|title=The Association for Computers and the Humanities ||website=ach.org}}</ref> [[कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन]], और [[साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन]] जो बाद में | * 1987 - कंप्यूटर और मानविकी संघ द्वारा काम शुरू किया गया,<ref>{{Cite web|url=https://ach.org/|title=The Association for Computers and the Humanities ||website=ach.org}}</ref> [[कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन]], और [[साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन]] जो बाद में टीईआई बन जाएगा।<ref>"Historical background", [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AB.html#ABTEI section iv.2] of TEI P5: Guidelines for Electronic Text Encoding and Interchange.</ref> इसकी परिणति वासर योजना सम्मेलन के समापन वक्तव्य में हुई।<ref>{{cite web |url= http://www.tei-c.org/Vault/SC/teipcp1.txt |title= वासर योजना सम्मेलन का समापन वक्तव्य|work=tei-c.org |year=2009 |access-date=15 April 2012}}</ref> | ||
* 1994 - | * 1994 - टीईआई P3 जारी,<ref>{{cite web|url=http://www.tei-c.org/Guidelines/|title=टीईआई दिशानिर्देश|access-date=2010-06-18}}</ref> [[लो बर्नार्ड]] (ऑक्सफ़ोर्ड विश्वविद्यालय में) और [[माइकल स्पर्बर्ग-मैकक्वीन]] (तब [[शिकागो में इलिनोइस विश्वविद्यालय]] में, बाद में [[W3C]] में) द्वारा सह-संपादित किया गया। | ||
* 1999 - टीईआई पी3 अपडेट किया गया। | * 1999 - टीईआई पी3 अपडेट किया गया। | ||
* 2002 - टीईआई पी4 जारी, एसजीएमएल से एक्सएमएल में स्थानांतरित; यूनिकोड को अपनाना, जिसका समर्थन करने के लिए XML पारसर्स की आवश्यकता होती है।<ref>{{citation|title=XML Basics|chapter=2|chapter-url=http://www.xmlnews.org/docs/xml-basics.html |access-date=2011-07-09}}</ref> | * 2002 - टीईआई पी4 जारी, एसजीएमएल से एक्सएमएल में स्थानांतरित; यूनिकोड को अपनाना, जिसका समर्थन करने के लिए XML पारसर्स की आवश्यकता होती है।<ref>{{citation|title=XML Basics|chapter=2|chapter-url=http://www.xmlnews.org/docs/xml-basics.html |access-date=2011-07-09}}</ref> | ||
* 2007 - | * 2007 - टीईआई P5 जारी किया गया, जिसमें एकीकरण शामिल है <code>xml:lang</code> और <code>xml:id</code> W3C से गुण<ref>{{cite web|url=http://www.w3.org/TR/REC-xml/|title=एक्स्टेंसिबल मार्कअप लैंग्वेज (XML) 1.0 (पांचवां संस्करण)|work=w3.org}}</ref> (ये पहले टीईआई नेमस्पेस में विशेषताएँ थीं), हैश का उपयोग करने के लिए स्थानीय पॉइंटिंग विशेषताओं का नियमितीकरण (जैसा कि HTML में उपयोग किया जाता है) और ptr और xptr टैग का एकीकरण। कई और नए संयोजनों के साथ ये परिवर्तन P5 को अधिक नियमित बनाते हैं और इसे W3C द्वारा प्रचारित और अन्य XML वेरिएंट द्वारा उपयोग किए जाने वाले वर्तमान xml अभ्यास के करीब लाते हैं। 2007 से टीईआई पी5 के रखरखाव और फीचर अपडेट संस्करणों को वर्ष में कम से कम दो बार जारी किया गया है। | ||
* 2011 - [[आनुवंशिक संपादन]] के समर्थन के साथ | * 2011 - [[आनुवंशिक संपादन]] के समर्थन के साथ टीईआई P5 v2.0.1 जारी किया गया<ref>{{cite web |url= http://www.tei-c.org/release/doc/tei-p5-doc/readme-2.0.1.html |title=P5 version 2.0.1 release notes |work=tei-c.org |year=2012 |access-date=15 April 2012}}</ref> (कई अन्य परिवर्धनों के बीच अनुवांशिक संपादन विशेषताएं टेक्स्ट को उनके विशिष्ट शब्दार्थ के बिना व्याख्या के एन्कोडिंग की अनुमति देती हैं)। | ||
* 2017 - टीईआई को डिजिटल मानविकी संगठनों के गठबंधन से यूरोपीय_भाषा_संसाधन_एसोसिएशन#एंटोनियो_ज़ामपोली_पुरस्कार से सम्मानित किया गया।<ref>{{Cite web | url=https://tei-c.org/ | title=TEI: Text Encoding Initiative}}</ref> | * 2017 - टीईआई को डिजिटल मानविकी संगठनों के गठबंधन से यूरोपीय_भाषा_संसाधन_एसोसिएशन#एंटोनियो_ज़ामपोली_पुरस्कार से सम्मानित किया गया।<ref>{{Cite web | url=https://tei-c.org/ | title=TEI: Text Encoding Initiative}}</ref> | ||
Revision as of 23:03, 27 June 2023
टेक्स्ट एन्कोडिंग इनिशिएटिव (टीईआई) एक लिखित भाषा है | डिजिटल मानविकी के अकादमिक विषयों की सूची में अभ्यास का पाठ-केंद्रित समुदाय, जो 1980 के दशक से लगातार काम कर रहा है। समुदाय वर्तमान में एक मेलिंग सूची, बैठकें और सम्मेलन श्रृंखला चलाता है, और टीईआई तकनीकी मानक, एक वैज्ञानिक पत्रिका, का रखरखाव करता है।[1] एक सप्ताह , एक गिटहब रिपॉजिटरी और एक toolchain ।
टीईआई दिशानिर्देश
टीईआई दिशानिर्देश सामूहिक रूप से एक प्रकार के एक्सएमएल प्रारूप को परिभाषित करते हैं, और अभ्यास के समुदाय के परिभाषित आउटपुट हैं। प्रारूप पाठ के लिए अन्य प्रसिद्ध खुले स्वरूपों (जैसे HTML और OpenDocument) से भिन्न है, क्योंकि यह प्रस्तुतिकरण के बजाय मुख्य रूप से सिमेंटिक है; प्रत्येक टैग और विशेषता के शब्दार्थ और व्याख्या निर्दिष्ट हैं। कुछ 500 विभिन्न शाब्दिक घटक और अवधारणाएँ हैं (word,[2] sentence,[3] character,[4] glyph,[5] person,[6] वगैरह।); प्रत्येक एक या एक से अधिक अकादमिक विषयों पर आधारित है और उदाहरण दिए गए हैं।
तकनीकी विवरण
मानक को दो भागों में विभाजित किया गया है, विस्तारित उदाहरणों और चर्चा के साथ एक विवेकपूर्ण पाठ्य विवरण और टैग-बाय-टैग परिभाषाओं का सेट। अधिकांश आधुनिक स्वरूपों में स्कीमाटा (दस्तावेज़ प्रकार परिभाषा, RELAX NG और W3C स्कीमा) स्वचालित रूप से टैग-दर-टैग परिभाषाओं से उत्पन्न होते हैं। कई उपकरण विशिष्ट परियोजनाओं के लिए दिशानिर्देशों के उत्पादन और दिशानिर्देशों के आवेदन का समर्थन करते हैं।
अंतर्निहित यूनिकोड द्वारा लगाए गए प्रतिबंधों को दरकिनार करने के लिए कई विशेष टैग का उपयोग किया जाता है; glyph उन पात्रों के प्रतिनिधित्व की अनुमति देने के लिए जो यूनिकोड समावेशन के योग्य नहीं हैं[2]और choice आवश्यक सख्त रैखिकता को दूर करने की अनुमति देने के लिए।[7] प्रारूप के अधिकांश उपयोगकर्ता टैग की पूरी श्रृंखला का उपयोग नहीं करते हैं, लेकिन दिशानिर्देशों द्वारा परिभाषित टैग और विशेषताओं के प्रोजेक्ट-विशिष्ट सबसेट का उपयोग करके एक अनुकूलन का उत्पादन करते हैं। टीईआई इस उद्देश्य के लिए ओडीडी के रूप में ज्ञात एक परिष्कृत अनुकूलन तंत्र को परिभाषित करता है। प्रत्येक टीईआई टैग का दस्तावेजीकरण और वर्णन करने के अलावा, एक ओडीडी विनिर्देश इसके सामग्री मॉडल और अन्य उपयोग बाधाओं को निर्दिष्ट करता है, जिसे स्कीमाट्रॉन का उपयोग करके व्यक्त किया जा सकता है।
टीईआई लाइट ऐसे अनुकूलन का एक उदाहरण है। यह ग्रंथों के आदान-प्रदान के लिए एक XML- आधारित फ़ाइल स्वरूप को परिभाषित करता है। यह पूर्ण टीईआई दिशानिर्देशों में उपलब्ध तत्वों के व्यापक सेट से एक प्रबंधनीय चयन है।
XML-आधारित प्रारूप के रूप में, टीईआई सीधे ओवरलैपिंग मार्कअप और गैर-श्रेणीबद्ध संरचनाओं से निपट नहीं सकता है। इस प्रकार के डेटा का प्रतिनिधित्व करने के लिए विभिन्न प्रकार के विकल्प दिशानिर्देशों द्वारा सुझाए गए हैं।[8]
उदाहरण
टीईआई दिशानिर्देशों का पाठ उदाहरणों से समृद्ध है। टीईआई विकी पर एक नमूना पृष्ठ भी है,[9] जो वास्तविक दुनिया की परियोजनाओं का उदाहरण देता है जो उनके अंतर्निहित टीईआई को उजागर करता है।
गद्य टैग
टीईआई ग्रंथों को किसी भी स्तर के ग्रैन्युलैरिटी, या ग्रैन्युलैरिटी के मिश्रण पर सिंटैक्टिक रूप से चिह्नित करने की अनुमति देता है। उदाहरण के लिए, इस अनुच्छेद (पी) को वाक्यों और खंडों (सीएल) में चिह्नित किया गया है।[10]
<s>
<cl>It was about the beginning of September, 1664,
<cl>that I, among the rest of my neighbours,
heard in ordinary discourse
<cl>that the plague was returned again to Holland; </cl>
</cl>
</cl>
<cl>for it had been very violent there, and particularly at
Amsterdam and Rotterdam, in the year 1663, </cl>
<cl>whither, <cl>they say,</cl> it was brought,
<cl>some said</cl> from Italy, others from the Levant, among some goods
<cl>which were brought home by their Turkey fleet;</cl>
</cl>
<cl>others said it was brought from Candia;
others from Cyprus. </cl>
</s>
<s>
<cl>It mattered not <cl>from whence it came;</cl>
</cl>
<cl>but all agreed <cl>it was come into Holland again.</cl>
</cl>
</s>
श्लोक
टीईआई के पास पद्य को चिन्हित करने के लिए टैग हैं। यह उदाहरण (टीईआई दिशानिर्देशों के फ्रेंच अनुवाद से लिया गया) एक सॉनेट दिखाता है।[11]
<div type="sonnet">
<lg type="quatrain">
<l>Les amoureux fervents et les savants austères</l>
<l> Aiment également, dans leur mûre saison,</l>
<l> Les chats puissants et doux, orgueil de la maison,</l>
<l> Qui comme eux sont frileux et comme eux sédentaires.</l>
</lg>
<lg type="quatrain">
<l>Amis de la science et de la volupté</l>
<l> Ils cherchent le silence et l'horreur des ténèbres ;</l>
<l> L'Érèbe les eût pris pour ses coursiers funèbres,</l>
<l> S'ils pouvaient au servage incliner leur fierté.</l>
</lg>
<lg type="tercet">
<l>Ils prennent en songeant les nobles attitudes</l>
<l>Des grands sphinx allongés au fond des solitudes,</l>
<l>Qui semblent s'endormir dans un rêve sans fin ;</l>
</lg>
<lg type="tercet">
<l>Leurs reins féconds sont pleins d'étincelles magiques,</l>
<l> Et des parcelles d'or, ainsi qu'un sable fin,</l>
<l>Étoilent vaguement leurs prunelles mystiques.</l>
</lg>
</div>
==== च्वाइस टैग ==== choice}ce टैग का उपयोग पाठ के उन अनुभागों को दर्शाने के लिए किया जाता है जिन्हें एक से अधिक संभावित तरीकों से एन्कोड या टैग किया जा सकता है। निम्नलिखित उदाहरण में, मानक में एक के आधार पर, choice का उपयोग दो बार किया जाता है, एक बार एक मूल और एक सही संख्या को इंगित करने के लिए, और एक बार एक मूल और नियमित वर्तनी को इंगित करने के लिए।[12]
<p xml:id="p23">Lastly, That, upon his solemn oath to observe all the above
articles, the said man-mountain shall have a daily allowance of
meat and drink sufficient for the support of <choice>
<sic>1724</sic>
<corr>1728</corr>
</choice> of our subjects,
with free access to our royal person, and other marks of our
<choice>
<orig>favour</orig>
<reg>favor</reg>
</choice>.
ओडीडी
वन डॉक्यूमेंट डू इट ऑल (ओडीडी ) XML स्कीमा के लिए एक साक्षर प्रोग्रामिंग भाषा है।[13][14][15][16] साक्षर-प्रोग्रामिंग शैली में, ओडीडी दस्तावेज़ पाठ एन्कोडिंग पहल के दस्तावेज़ीकरण तत्व मॉड्यूल का उपयोग करके मानव-पठनीय दस्तावेज़ीकरण और मशीन-पठनीय मॉडल को जोड़ते हैं। उपकरण अंतर्राष्ट्रीयकरण और स्थानीयकरण HTML, ePub, या PDF मानव-पठनीय आउटपुट और दस्तावेज़ प्रकार परिभाषाएँ, XML स्कीमा (W3C), RELAX NG कॉम्पैक्ट सिंटेक्स, या रिलैक्स NG XML सिंटेक्स मशीन-पठनीय आउटपुट उत्पन्न करते हैं।
रोमा वेब एप्लिकेशन[17] ओडीडी प्रारूप के आसपास बनाया गया है और इसका उपयोग दस्तावेज़ प्रकार परिभाषा, XML स्कीमा (W3C), RELAX NG कॉम्पैक्ट सिंटैक्स, या आराम NG XML सिंटेक्स प्रारूपों में स्कीमा उत्पन्न करने के लिए कर सकता है, जैसा कि कई XML सत्यापन उपकरण और सेवाओं द्वारा उपयोग किया जाता है।
ओडीडी टीईआई तकनीकी मानकों और सुरक्षा प्राधिकरण के लिए टेक्स्ट एन्कोडिंग पहल द्वारा आंतरिक रूप से उपयोग किया जाने वाला प्रारूप है।[18] हालाँकि ओडीडी फाइलें आम तौर पर एक अनुकूलित XML प्रारूप और पूर्ण टीईआई मॉडल के बीच के अंतर का वर्णन करती हैं, ओडीडी का उपयोग XML स्वरूपों का वर्णन करने के लिए भी किया जा सकता है जो टीईआई से पूरी तरह से अलग हैं। इसका एक उदाहरण W3C| है W3C का अंतर्राष्ट्रीयकरण टैग सेट जो स्कीमा उत्पन्न करने और इसकी शब्दावली को दस्तावेज करने के लिए ओडीडी प्रारूप का उपयोग करता है।[19][20]
टीईआई अनुकूलन
टीईआई अनुकूलन विशेष क्षेत्रों में या विशिष्ट समुदायों द्वारा उपयोग के लिए टीईआई एक्सएमएल विनिर्देश के विशेषज्ञ हैं।
- एपिडॉक (एपिग्राफिक दस्तावेज़)
- चार्टर्स एन्कोडिंग पहल[21]
- मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)[22]
टीईआई में अनुकूलन ऊपर वर्णित ओडीडी तंत्र के माध्यम से किया जाता है। वास्तव में इसके P5 संस्करण के बाद से, टीईआई दिशानिर्देशों के सभी तथाकथित 'टीईआई अनुरूप' उपयोग टीईआई ओडीडी फ़ाइल में प्रलेखित टीईआई अनुकूलन पर आधारित हैं। यहां तक कि जब उपयोगकर्ता ऑफ-द-शेल्फ प्री-जेनरेट किए गए स्कीमा में से किसी एक को मान्य करने के लिए चुनते हैं, तो ये स्वतंत्र रूप से उपलब्ध अनुकूलन फ़ाइलों से बनाए गए हैं।
प्रोजेक्ट्स
प्रारूप का उपयोग दुनिया भर में कई परियोजनाओं द्वारा किया जाता है। व्यावहारिक रूप से सभी परियोजनाएं एक या एक से अधिक विश्वविद्यालयों से जुड़ी हैं। कुछ प्रसिद्ध परियोजनाएं जो टीईआई का उपयोग करते हुए ग्रंथों को सांकेतिक शब्दों में बदलना शामिल हैं:
इतिहास
टीईआई के निर्माण से पहले, मानविकी विद्वानों के पास इलेक्ट्रॉनिक पाठ्य सामग्री को इस तरह से एन्कोड करने के लिए कोई सामान्य मानक नहीं थे जो उनके शैक्षणिक लक्ष्यों को पूरा करे (सुसान हॉकी 1993, पृष्ठ 41)। 1987 में, वासर कॉलेज में मानविकी, भाषा विज्ञान और कंप्यूटिंग के क्षेत्रों का प्रतिनिधित्व करने वाले विद्वानों के एक समूह ने "पोकीकीसी सिद्धांतों" के रूप में जाने जाने वाले दिशानिर्देशों का एक सेट प्रस्तुत किया। इन दिशानिर्देशों ने पहले TEI मानक, P1 के विकास को निर्देशित किया।[23][24]
- 1987 - कंप्यूटर और मानविकी संघ द्वारा काम शुरू किया गया,[25] कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन, और साहित्यिक और भाषाई कम्प्यूटिंग के लिए एसोसिएशन जो बाद में टीईआई बन जाएगा।[26] इसकी परिणति वासर योजना सम्मेलन के समापन वक्तव्य में हुई।[27]
- 1994 - टीईआई P3 जारी,[28] लो बर्नार्ड (ऑक्सफ़ोर्ड विश्वविद्यालय में) और माइकल स्पर्बर्ग-मैकक्वीन (तब शिकागो में इलिनोइस विश्वविद्यालय में, बाद में W3C में) द्वारा सह-संपादित किया गया।
- 1999 - टीईआई पी3 अपडेट किया गया।
- 2002 - टीईआई पी4 जारी, एसजीएमएल से एक्सएमएल में स्थानांतरित; यूनिकोड को अपनाना, जिसका समर्थन करने के लिए XML पारसर्स की आवश्यकता होती है।[29]
- 2007 - टीईआई P5 जारी किया गया, जिसमें एकीकरण शामिल है
xml:lang
औरxml:id
W3C से गुण[30] (ये पहले टीईआई नेमस्पेस में विशेषताएँ थीं), हैश का उपयोग करने के लिए स्थानीय पॉइंटिंग विशेषताओं का नियमितीकरण (जैसा कि HTML में उपयोग किया जाता है) और ptr और xptr टैग का एकीकरण। कई और नए संयोजनों के साथ ये परिवर्तन P5 को अधिक नियमित बनाते हैं और इसे W3C द्वारा प्रचारित और अन्य XML वेरिएंट द्वारा उपयोग किए जाने वाले वर्तमान xml अभ्यास के करीब लाते हैं। 2007 से टीईआई पी5 के रखरखाव और फीचर अपडेट संस्करणों को वर्ष में कम से कम दो बार जारी किया गया है। - 2011 - आनुवंशिक संपादन के समर्थन के साथ टीईआई P5 v2.0.1 जारी किया गया[31] (कई अन्य परिवर्धनों के बीच अनुवांशिक संपादन विशेषताएं टेक्स्ट को उनके विशिष्ट शब्दार्थ के बिना व्याख्या के एन्कोडिंग की अनुमति देती हैं)।
- 2017 - टीईआई को डिजिटल मानविकी संगठनों के गठबंधन से यूरोपीय_भाषा_संसाधन_एसोसिएशन#एंटोनियो_ज़ामपोली_पुरस्कार से सम्मानित किया गया।[32]
संदर्भ
- ↑ "टेक्स्ट एन्कोडिंग पहल का जर्नल". Open Edition Journals. Retrieved 29 June 2022.
- ↑ 2.0 2.1 "TEI तत्व w (शब्द)". tei-c.org.
- ↑ "टीईआई तत्व एस (एस-यूनिट)". tei-c.org.
- ↑ "टीई तत्व सी (चरित्र)". tei-c.org.
- ↑ "TEI तत्व जी (चरित्र या ग्लिफ़)". tei-c.org.
- ↑ "टीईआई तत्व व्यक्ति (व्यक्ति)". tei-c.org.
- ↑ "तत्व पसंद". www.tei-c.org.
- ↑ "20 Non-hierarchical Structures - TEI P5: — Guidelines for Electronic Text Encoding and Interchange". tei-c.org. 2019. Retrieved 19 March 2019.
- ↑ "टीईआई ग्रंथों के नमूने". wiki.tei-c.org. 2011. Retrieved 17 April 2012.
- ↑ "17 Simple Analytic Mechanisms - TEI P5: — Guidelines for Electronic Text Encoding and Interchange". tei-c.org. 2012. Retrieved 15 April 2012.
- ↑ "टीईआई तत्व एलजी (कृमि का समूह)". tei-c.org. 2012. Retrieved 15 April 2012.
- ↑ "TEI तत्व पसंद". tei-c.org. 2012. Retrieved 15 April 2012.
- ↑ Bauman, Syd; Flanders, Julia (2004), "ODD customizations", Extreme Markup Languages 2004.
- ↑ Burnard, Lou; Rahtz, Sebastian (2004), "RelaxNG with Son of ODD", Extreme Markup Languages 2004.
- ↑ Reiss, Kevin M. (2007), Literate Documentation for XML (PDF), Urbana-Champaign, Illinois: Digital Humanities 2007.
- ↑ Burnard, Lou; Rahtz, Sebastian (June 2013). "टेक्स्ट एन्कोडिंग पहल के लिए एक पूर्ण स्कीमा परिभाषा भाषा". XML London 2013: 152–161. doi:10.14337/XMLLondon13.Rahtz01. ISBN 978-0-9926471-0-0.
- ↑ Roma web application
- ↑ Burnard, Lou; Bauman, Syd, eds. (2007), TEI P5: Guidelines for Electronic Text Encoding and Interchange, Charlottesville, Virginia, USA: TEI Consortium.
- ↑ W3C ITS and TEI ODD file
- ↑ Savourel, Yves; Kosek, Jirka; Ishida, Richard, eds. (2008), "5.2 ITS and TEI", Best Practices for XML Internationalization, W3C Working Group.
- ↑ "Charters Encoding Initiative - Ludwig-Maximilians-Universität München". www.cei.lmu.de.
- ↑ "मध्यकालीन नॉर्डिक टेक्स्ट आर्काइव (मेनोटा)". www.menota.org.
- ↑ Ahronheim, J.R. (1998). "Descriptive metadata: Emerging standards". Journal of Academic Librarianship. 24 (5): 395–403. doi:10.1016/S0099-1333(98)90079-9.
- ↑ Cantara, L. (2005). "The text-encoding initiative: Part 1". OCLC Systems & Services. 21 (1): 36–39. doi:10.1108/10650750510578136.
- ↑ "The Association for Computers and the Humanities |". ach.org.
- ↑ "Historical background", section iv.2 of TEI P5: Guidelines for Electronic Text Encoding and Interchange.
- ↑ "वासर योजना सम्मेलन का समापन वक्तव्य". tei-c.org. 2009. Retrieved 15 April 2012.
- ↑ "टीईआई दिशानिर्देश". Retrieved 2010-06-18.
- ↑ "2", XML Basics, retrieved 2011-07-09
- ↑ "एक्स्टेंसिबल मार्कअप लैंग्वेज (XML) 1.0 (पांचवां संस्करण)". w3.org.
- ↑ "P5 version 2.0.1 release notes". tei-c.org. 2012. Retrieved 15 April 2012.
- ↑ "TEI: Text Encoding Initiative".
बाहरी संबंध
- TEI Consortium Web site with a list of TEI projects, a form for adding your project and wiki
- Journal of the TEI
- TEI Lite: An Introduction to Text Encoding for Interchange
- TEI @ Oxford (hosted at Oxford University) with development and backup versions of much of the core content.
- TEI GitHub site (hosted at GitHub) with repository and issue tracker
- Larger list of TEI Projects
- What is the TEI? (Introductory overview by Lou Burnard)