स्टाइलोमेट्री: Difference between revisions
No edit summary |
No edit summary |
||
(7 intermediate revisions by 3 users not shown) | |||
Line 2: | Line 2: | ||
{{linguistics}} | {{linguistics}} | ||
स्टाइलोमेट्री सामान्यतः लिखित भाषा में स्टाइलिस्टिक्स (भाषाविज्ञान) का अनुप्रयोग है।<ref name="structureofstyle">[[Shlomo Argamon|Argamon, Shlomo]], Kevin Burns, and [[Shlomo Dubnov]], eds. The structure of style: algorithmic approaches to understanding manner and meaning. Springer Science & Business Media, 2010.</ref> इस प्रकार इसे संगीत पर भी सफलतापूर्वक क्रियान्वित किया गया है,<ref>{{cite news| url=http://news.bbc.co.uk/1/hi/5083986.stm?ls | work=BBC News | first=Richard | last=Westcott | title=हिट संगीत को एक विज्ञान बनाना| date=15 June 2006}}</ref> चित्रों,<ref>{{cite web |website=The Conversation |last1=Sethi |first1=Ricky |url=https://theconversation.com/using-computers-to-better-understand-art-56887 |title=कला को बेहतर ढंग से समझने के लिए कंप्यूटर का उपयोग करना|date=2016-06-07 |access-date=2021-12-01 }}</ref> और | '''स्टाइलोमेट्री''' सामान्यतः लिखित भाषा में स्टाइलिस्टिक्स (भाषाविज्ञान) का अनुप्रयोग है।<ref name="structureofstyle">[[Shlomo Argamon|Argamon, Shlomo]], Kevin Burns, and [[Shlomo Dubnov]], eds. The structure of style: algorithmic approaches to understanding manner and meaning. Springer Science & Business Media, 2010.</ref> इस प्रकार इसे संगीत पर भी सफलतापूर्वक क्रियान्वित किया गया है,<ref>{{cite news| url=http://news.bbc.co.uk/1/hi/5083986.stm?ls | work=BBC News | first=Richard | last=Westcott | title=हिट संगीत को एक विज्ञान बनाना| date=15 June 2006}}</ref> चित्रों,<ref>{{cite web |website=The Conversation |last1=Sethi |first1=Ricky |url=https://theconversation.com/using-computers-to-better-understand-art-56887 |title=कला को बेहतर ढंग से समझने के लिए कंप्यूटर का उपयोग करना|date=2016-06-07 |access-date=2021-12-01 }}</ref> और चेस<ref>{{cite conference | url = https://openreview.net/forum?id=9RFFgpQAOzk | title = Detecting Individual Decision-Making Style: Exploring Behavioral Stylometry in Chess | first1=Reid | last1=McIlroy-Young | first2=Yu | last2=Wang | first3=Siddhartha | last3=Sen | first4=Jon | last4=Kleinberg | first5=Ashton | last5=Anderson | year = 2021 | conference = 35th Conference on Neural Information Processing Systems }}</ref> अन्य अवधारणा इसे भाषाई अनुशासन के रूप में परिभाषित करती है जो किसी लेखक की शैली का मूल्यांकन उनके कार्य के लिए [[सांख्यिकीय विश्लेषण]] के अनुप्रयोग के माध्यम से करता है।<ref>{{Cite book|title=Intelligence and Security Informatics: IEEE ISI 2008 International Workshops: PAISI, PACCF and SOCO 2008, Taipei, Taiwan, June 17, 2008, Proceedings|last1=Yang|first1=Christopher C.|last2=Chen|first2=Hsinchun|last3=Chau|first3=Michael|last4=Chang|first4=Kuiyu|last5=Lang|first5=Sheau-Dong|last6=Chen|first6=Patrick|last7=Carley|first7=Kathleen M.|last8=Hsieh|first8=Raymond|last9=Zeng|first9=Daniel|date=2008|publisher=Springer Science & Business Media|isbn=9783540691365|location=Berlin|pages=252}}</ref> | ||
स्टाइलोमेट्री का उपयोग | स्टाइलोमेट्री का उपयोग अधिकांशतः अज्ञात कार्य या विवादित दस्तावेज़ों को लेखकत्व देने के लिए किया जाता है।<ref>{{Cite book|title=Intelligence and Security Informatics: Pacific Asia Workshop, PAISI 2009, Bangkok, Thailand, April 27, 2009. Proceedings|last1=Chen|first1=Hsinchun|last2=Yang|first2=Christopher C.|last3=Chau|first3=Michael|last4=Li|first4=Shu-Hsing|date=2009|publisher=Springer Science & Business Media|isbn=9783642013928|location=Berlin|pages=15}}</ref> इसमें नियमबद्ध के साथ-साथ अकादमिक और साहित्यिक अनुप्रयोग भी हैं, जिसमें शेक्सपियर एट्रिब्यूशन अध्ययन के प्रश्न से लेकर फोरेंसिक भाषा विज्ञान तक शेक्सपियर के कार्यों के लेखकत्व और टेक्स्ट [[पठनीयता]] के विश्लेषण के साथ पद्धतिगत समानताएं हैं। | ||
इस प्रकार स्टाइलोमेट्री का उपयोग छद्म नाम वाले या अज्ञात लेखकों को | इस प्रकार स्टाइलोमेट्री का उपयोग छद्म नाम वाले या अज्ञात लेखकों को अनावृत करने के लिए, या पूर्ण पहचान के अभाव में लेखक के बारे में कुछ जानकारी प्रकट करने के लिए किया जा सकता है। इस प्रकार लेखक अपने संचार की सार्थक पदार्थ को बदले बिना अपनी स्वयं की शैलीगत विशेषताओं को समाप्त करके इस पहचान का विरोध करने के लिए प्रतिकूल शैलीमिति का उपयोग कर सकते हैं। इस प्रकार यह उन विश्लेषणों को पराजित कर सकता है जो इसकी संभावना को ध्यान में नहीं रखते हैं, किन्तु प्रतिकूल वातावरण में स्टाइलोमेट्री की अंतिम प्रभावशीलता अनिश्चित है: स्टाइलोमेट्रिक पहचान विश्वसनीय नहीं हो सकती है, किन्तु न ही गैर-पहचान की आश्वासन दी जा सकती है; प्रतिकूल शैलीमिति का अभ्यास स्वयं पता लगाने योग्य हो सकता है। | ||
==इतिहास== | ==इतिहास== | ||
इस प्रकार प्रामाणिकता | इस प्रकार प्रामाणिकता लेखक की पहचान और अन्य प्रश्नों के प्रमाण के लिए ग्रंथों का विश्लेषण करने की पुरानी तकनीकों से स्टाइलोमेट्री का विकास हुआ था। | ||
अनुशासन के आधुनिक अभ्यास को अंग्रेजी पुनर्जागरण नाटक में लेखकीय समस्याओं के अध्ययन से प्रचार मिला | अनुशासन के आधुनिक अभ्यास को अंग्रेजी पुनर्जागरण नाटक में लेखकीय समस्याओं के अध्ययन से प्रचार मिला था। इस प्रकार शोधकर्ताओं और पाठकों ने देखा कि उस युग के कुछ नाटककारों की भाषा प्राथमिकताओं के विशिष्ट क्रम थे, और उन्होंने अनिश्चित या सहयोगात्मक कार्यों के लेखकों की पहचान करने के लिए उन क्रम का उपयोग करने का प्रयास किया गया। प्रारंभिक प्रयास सदैव सफल नहीं रहे: जो की 1901 में, शोधकर्ता ने जॉन फ्लेचर (नाटककार) या जॉन फ्लेचर की पसंद 'em को, उनके संकुचनात्मक रूप को, उनके सहयोग में फ्लेचर और [[फिलिप मासिंगर]] के बीच अंतर करने के लिए मार्कर के रूप में उपयोग करने का प्रयास किया था किन्तु उन्होंने गलती से मैसिंगर के कार्यों का संस्करण नियोजित कर दिया जिसमें संपादक ने 'em के सभी उदाहरणों का विस्तार किया था।<ref>[[Samuel Schoenbaum]], ''Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method,'' p. 171.</ref> | ||
स्टाइलोमेट्री की मूल बातें पोलिश दार्शनिक विंसेंटी लुटोस्लाव्स्की द्वारा प्रिंसिपेस डी स्टाइलोमेट्री (1890) में स्थापित की गई थीं। लुटोस्लाव्स्की ने प्लेटो के संवादों का कालक्रम विकसित करने के लिए इस पद्धति का उपयोग | स्टाइलोमेट्री की मूल बातें पोलिश दार्शनिक विंसेंटी लुटोस्लाव्स्की द्वारा प्रिंसिपेस डी स्टाइलोमेट्री (1890) में स्थापित की गई थीं। इस प्रकार लुटोस्लाव्स्की ने प्लेटो के संवादों का कालक्रम विकसित करने के लिए इस पद्धति का उपयोग किया गया था।<ref>{{Cite journal|last=Lutoslawski|first=W.|date=1898|title=Principes de stylométrie appliqués à la chronologie des œuvres de Platon|journal=Revue des Études Grecques|volume=11|issue=41|pages=61–81|doi=10.3406/reg.1898.5847|issn=0035-2039}}</ref> | ||
इस प्रकार | इस प्रकार बड़ी मात्रा में डेटा का विश्लेषण करने के लिए कंप्यूटर और उनकी क्षमताओं के विकास ने इस प्रकार के प्रयास को परिमाण के क्रम में बढ़ाया। चूंकि, डेटा विश्लेषण के लिए कंप्यूटर की महान क्षमता अच्छी गुणवत्ता वाले आउटपुट की आश्वासन नहीं देती है। 1960 के दशक की प्रारंभिक में, रेव. ए. क्यू. मॉर्टन ने सेंट पॉल को उत्तरदायी ठहराते हुए न्यू टेस्टामेंट के चौदह पत्रों का कंप्यूटर विश्लेषण तैयार किया, जिसने संकेत दिया कि छह अलग-अलग लेखकों ने उस कार्य को लिखा था। [[जेम्स जॉयस]] के कार्यों पर क्रियान्वित की गई उनकी पद्धति की जांच से यह परिणाम मिला कि [[यूलिसिस (उपन्यास)]], जॉयस का बहु-परिप्रेक्ष्य, बहु-शैली उपन्यास, पांच अलग-अलग व्यक्तियों द्वारा रचा गया था, इस प्रकार जिनमें से किसी का भी स्पष्ट रूप से क्राफ्टिंग में कोई भाग नहीं था। जॉयस का पहला उपन्यास, [[एक युवा व्यक्ति के रूप में कलाकार का एक चित्र|युवा व्यक्ति के रूप में कलाकार का चित्र]] <ref>[[Samuel Schoenbaum]], ''Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method,'' p. 196.</ref> चूंकि, समय के साथ और अभ्यास के साथ, शोधकर्ताओं और विद्वानों ने उत्तम परिणाम प्राप्त करने के लिए अपने विधियों को परिष्कृत किया है। उल्लेखनीय प्रारंभिक सफलता फ्रेडरिक मोस्टेलर और डेविड वालेस द्वारा [[द फेडरलिस्ट पेपर्स]] के बारह के विवादित लेखकत्व का समाधान था।<ref>{{Cite book | ||
|author1=F. Mosteller |author2=D. Wallace | |author1=F. Mosteller |author2=D. Wallace | ||
|name-list-style=amp | title = Inference and Disputed Authorship: The Federalist | |name-list-style=amp | title = Inference and Disputed Authorship: The Federalist | ||
Line 21: | Line 21: | ||
| publisher = [[Addison-Wesley]] | | publisher = [[Addison-Wesley]] | ||
| year = 1964 | | year = 1964 | ||
}}</ref> चूंकि प्रारंभिक मान्यताओं और विधियों से संबंधित अभी भी प्रश्न हैं (और, संभवतः, सदैव रहेंगे), इस प्रकार अब कुछ लोग इस मूल आधार पर विवाद करते हैं कि लिखित ग्रंथों का भाषाई विश्लेषण मूल्यवान जानकारी और अंतर्दृष्टि उत्पन्न कर सकता है। (वास्तव में, यह कंप्यूटर के आगमन से पहले भी स्पष्ट था: [[साइरस होय]] और अन्य लोगों द्वारा फ्लेचर कैनन में पाठ्य/भाषाई विश्लेषण के सफल अनुप्रयोग से 1950 के दशक के अंत और 1960 के दशक की प्रारंभिक में स्पष्ट परिणाम | }}</ref> चूंकि प्रारंभिक मान्यताओं और विधियों से संबंधित अभी भी प्रश्न हैं (और, संभवतः, सदैव रहेंगे), इस प्रकार अब कुछ लोग इस मूल आधार पर विवाद करते हैं कि लिखित ग्रंथों का भाषाई विश्लेषण मूल्यवान जानकारी और अंतर्दृष्टि उत्पन्न कर सकता है। (वास्तव में, यह कंप्यूटर के आगमन से पहले भी स्पष्ट था: [[साइरस होय]] और अन्य लोगों द्वारा फ्लेचर कैनन में पाठ्य/भाषाई विश्लेषण के सफल अनुप्रयोग से 1950 के दशक के अंत और 1960 के दशक की प्रारंभिक में स्पष्ट परिणाम मिले थे।) | ||
=='''अनुप्रयोग'''== | =='''अनुप्रयोग'''== | ||
स्टाइलोमेट्री के अनुप्रयोगों में साहित्यिक अध्ययन, ऐतिहासिक अध्ययन, सामाजिक अध्ययन, सूचना पुनर्प्राप्ति और कई फोरेंसिक स्थितियों और अध्ययन सम्मिलित | स्टाइलोमेट्री के अनुप्रयोगों में साहित्यिक अध्ययन, ऐतिहासिक अध्ययन, सामाजिक अध्ययन, सूचना पुनर्प्राप्ति और कई फोरेंसिक स्थितियों और अध्ययन सम्मिलित हैं।<ref>{{Cite book|last=Chaski|first=Carole|author-link=Carole Chaski|title=फोरेंसिक सेटिंग में लेखक की पहचान|url=http://www.oxfordhandbooks.com/view/10.1093/oxfordhb/9780199572120.001.0001/oxfordhb-9780199572120-e-36|journal=The Oxford Handbook of Language and Law|language=en|publisher=Oxford University Press|year=2012|isbn=9780199572120|doi=10.1093/oxfordhb/9780199572120.001.0001|editor1-last=Solan|editor1-first=Lawrence M|editor2-last=Tiersma|editor2-first=Peter M}}</ref><ref name="WechtRago2005">{{cite book|url=https://books.google.com/books?id=oIjLBQAAQBAJ|title=Forensic Science and Law: Investigative Applications in Criminal, Civil and Family Justice|author1=Chaski|first=Carole|date=22 December 2005|publisher=CRC Press|isbn=978-1-4200-5811-6|editor-last=Wecht|editor-first=Cyril H.|editor-last2=Rago|editor-first2=John T.}}</ref> इसे [[कोड स्टाइलोमेट्री]] पर भी क्रियान्वित किया जा सकता है <ref>{{Cite news|url=https://www.theregister.co.uk/2018/03/16/identifying_anonymous_programmers/|title=FYI: AI tools can unmask anonymous coders from their binary executables|last=Claburn|first=Thomas|date=March 16, 2018|work=The Register|access-date=August 2, 2018}}</ref> और पदार्थ समानता का पता लगाना या स्टाइलोमेट्री जो दस्तावेज़ के अंदर लेखन शैली में परिवर्तन के आधार पर साहित्यिक चोरी का पता लगाना है।<ref>{{cite journal |last1=Bensalem |first1=Imene |last2=Rosso |first2=Paolo |last3=Chikhi |first3=Salim |title=साहित्यिक चोरी के एकमात्र आंतरिक साक्ष्य के रूप में कैरेक्टर एन-ग्राम के उपयोग पर|journal=Language Resources and Evaluation |year=2019 |volume=53 |issue=3 |pages=363–396 |doi=10.1007/s10579-019-09444-w|s2cid=86630897 |hdl=10251/159151 |hdl-access=free }}</ref> इस प्रकार स्टाइलोमेट्री का उपयोग यह अनुमान लगाने के लिए भी किया जा सकता है कि कोई व्यक्ति अपनी [[कीस्ट्रोक गतिशीलता]] के आधार पर अंग्रेजी बोलने वाला है या नहीं बोलने वाला है।<ref>{{Cite journal|last=Brizan|first=David|date=October 2015|title=टाइपिस्ट अनुभूति और जनसांख्यिकी की भविष्यवाणी करने के लिए भाषाई रूप से उन्नत कीस्ट्रोक गतिशीलता का उपयोग करना|journal=International Journal of Human-Computer Studies|volume=82|pages=57–68|doi=10.1016/j.ijhcs.2015.04.005}}</ref> | ||
एक विधि के रूप में स्टाइलोमेट्री पुनरीक्षण के समय टेक्स्ट के विरूपण के प्रति संवेदनशील है।<ref>{{Cite book|title=Rethinking Plato: A Cartesian Quest for the Real Plato|last=Alican|first=Necip Fikri|date=2012|publisher=Rodopi|isbn=9789042035379|location=Amsterdam|pages=183}}</ref> लेखक द्वारा अपने करियर के समय विभिन्न शैलियों को अपनाने का भी स्थिति है, जैसा कि [[प्लेटो]] के स्थितियों में प्रदर्शित किया गया था, जिन्होंने सुकराती समस्या को संबोधित करने वाले प्रारंभिक और मध्य संवादों के लिए अपनाई गई विभिन्न शैलीगत नीतियों को चुना था।<ref>{{Cite book|url=https://books.google.com/books?id=UmQJZPvu6uYC&q=stylometry+weakness&pg=PA160|title=ग्रीक और रोमन राजनीतिक विचार का कैम्ब्रिज इतिहास|last=Rowe|first=Christopher|date=2000|publisher=Cambridge University Press|isbn=0521481368|location=Cambridge, UK|pages=160}}</ref> | एक विधि के रूप में स्टाइलोमेट्री पुनरीक्षण के समय टेक्स्ट के विरूपण के प्रति संवेदनशील है।<ref>{{Cite book|title=Rethinking Plato: A Cartesian Quest for the Real Plato|last=Alican|first=Necip Fikri|date=2012|publisher=Rodopi|isbn=9789042035379|location=Amsterdam|pages=183}}</ref> लेखक द्वारा अपने करियर के समय विभिन्न शैलियों को अपनाने का भी स्थिति है, जैसा कि [[प्लेटो]] के स्थितियों में प्रदर्शित किया गया था, जिन्होंने सुकराती समस्या को संबोधित करने वाले प्रारंभिक और मध्य संवादों के लिए अपनाई गई विभिन्न शैलीगत नीतियों को चुना था।<ref>{{Cite book|url=https://books.google.com/books?id=UmQJZPvu6uYC&q=stylometry+weakness&pg=PA160|title=ग्रीक और रोमन राजनीतिक विचार का कैम्ब्रिज इतिहास|last=Rowe|first=Christopher|date=2000|publisher=Cambridge University Press|isbn=0521481368|location=Cambridge, UK|pages=160}}</ref> | ||
==सुविधाएँ== | ==सुविधाएँ== | ||
लेखकीय विशेषता के लिए इंटरेस्ट की पाठ्य विशेषताएं ओर विशिष्ट अभिव्यक्तियों या निर्माणों की घटनाओं की गणना करना है (उदाहरण के लिए यह जांचना कि लेखक इंटरपंक्शन का उपयोग कैसे करता है या कितनी बार लेखक एजेंट रहित निष्क्रिय निर्माणों का उपयोग करता है) और दूसरी ओर पठनीयता विश्लेषण के लिए उपयोग किए जाने वाले समान हैं जैसे शाब्दिक भिन्नता और वाक्यविन्यास भिन्नता के उपाय है <ref>{{cite journal |last1=Stamatatos |first1=Efstathios |date=2009 |title=आधुनिक लेखकत्व एट्रिब्यूशन विधियों का एक सर्वेक्षण|journal=JASIST |volume=60 |issue=3|pages=538–556 |doi=10.1002/asi.21001 }}</ref> चूंकि लेखकों के पास | लेखकीय विशेषता के लिए इंटरेस्ट की पाठ्य विशेषताएं ओर विशिष्ट अभिव्यक्तियों या निर्माणों की घटनाओं की गणना करना है (उदाहरण के लिए यह जांचना कि लेखक इंटरपंक्शन का उपयोग कैसे करता है या कितनी बार लेखक एजेंट रहित निष्क्रिय निर्माणों का उपयोग करता है) और दूसरी ओर पठनीयता विश्लेषण के लिए उपयोग किए जाने वाले समान हैं जैसे शाब्दिक भिन्नता और वाक्यविन्यास भिन्नता के उपाय है <ref>{{cite journal |last1=Stamatatos |first1=Efstathios |date=2009 |title=आधुनिक लेखकत्व एट्रिब्यूशन विधियों का एक सर्वेक्षण|journal=JASIST |volume=60 |issue=3|pages=538–556 |doi=10.1002/asi.21001 }}</ref> चूंकि लेखकों के पास अधिकांशतः कुछ विषयों के लिए प्राथमिकताएं होती हैं, इसलिए लेखकत्व गुण में शोध प्रयोग फीचर समूह से संज्ञा, विशेषण और क्रिया जैसे पदार्थ शब्दों को हटा देते हैं, केवल टेक्स्ट के संरचनात्मक तत्वों को बनाए रखते हैं जिससे लेखक की विशेषताओं के अतिरिक्त विषय पर उनके मॉडल को ओवरफिट करने से बचा जा सकता है। <ref>{{cite journal |last1=Stamatatos |first1=Efstathios |date=2018 |title=लेखकीय विशेषता को बढ़ाने के लिए विषय-संबंधित जानकारी को छिपाना|journal=JASIS |volume=69 |issue=3}} | ||
</ref><ref>{{cite conference |url= |title=सामयिक जानकारी का उपयोग किए बिना लेखकत्व प्रोफ़ाइलिंग|last1=Karlgren |first1=Jussi |last2=Esposito |first2=Lewis|last3=Gratton|first3=Chantal|last4=Kanerva|first4=Pentti|author-link4=Pentti Kanerva |date=2018|publisher=CEUR-WS |book-title=CLEF Working Notes}}</ref> शैलीगत विशेषताओं की गणना | </ref><ref>{{cite conference |url= |title=सामयिक जानकारी का उपयोग किए बिना लेखकत्व प्रोफ़ाइलिंग|last1=Karlgren |first1=Jussi |last2=Esposito |first2=Lewis|last3=Gratton|first3=Chantal|last4=Kanerva|first4=Pentti|author-link4=Pentti Kanerva |date=2018|publisher=CEUR-WS |book-title=CLEF Working Notes}}</ref> इस प्रकार शैलीगत विशेषताओं की गणना अधिकांशतः किसी टेक्स्ट या किसी लेखक के संपूर्ण एकत्रित कार्यों के औसत के रूप में की जाती है, जिससे औसत शब्द लंबाई या औसत वाक्य लंबाई जैसे माप प्राप्त होते हैं। यह मॉडल को उन लेखकों की पहचान करने में सक्षम बनाता है जिनके पास शब्दाडंबरपूर्ण या संक्षिप्त वाक्यों के लिए स्पष्ट प्राथमिकता है किन्तु भिन्नता छिपाते हैं: लंबे और छोटे वाक्यों के मिश्रण वाले लेखक का औसत निरंतर मध्य-लंबाई वाले वाक्यों वाले लेखक के समान होता है। इस तरह की भिन्नता को पकड़ने के लिए, कुछ प्रयोग औसत देखी गई आवृत्तियों के अतिरिक्त अवलोकनों पर अनुक्रमों या क्रम का उपयोग करते हैं, उदाहरण के लिए नोटिंग कि लेखक निश्चित तनाव या बल क्रम के लिए प्राथमिकता दिखाता है, <ref> | ||
{{cite journal |last1=Corbara |first1=Silvia|last2=Moreo |first2=Alejandro|last3=Sebastiani|first3=Fabrizio |date=2022 |title=Syllabic quantity patterns as rhythmic features for Latin authorship attribution |url=https://asistdl.onlinelibrary.wiley.com/doi/full/10.1002/asi.24660 |journal=JASIST |volume=74 |pages=128–141 |arxiv=2110.14203 |doi=10.1002/asi.24660|s2cid=239998537 }} | {{cite journal |last1=Corbara |first1=Silvia|last2=Moreo |first2=Alejandro|last3=Sebastiani|first3=Fabrizio |date=2022 |title=Syllabic quantity patterns as rhythmic features for Latin authorship attribution |url=https://asistdl.onlinelibrary.wiley.com/doi/full/10.1002/asi.24660 |journal=JASIST |volume=74 |pages=128–141 |arxiv=2110.14203 |doi=10.1002/asi.24660|s2cid=239998537 }} | ||
</ref><ref> | </ref><ref> | ||
Line 38: | Line 38: | ||
</ref><ref> | </ref><ref> | ||
{{cite thesis |type=MSc |last=Eriksson |first=Linda |date=2014 |title=Sequential Aggregation of Textual Features for Domain Independent Author Identification |publisher=KTH Royal Institute of Technology}} | {{cite thesis |type=MSc |last=Eriksson |first=Linda |date=2014 |title=Sequential Aggregation of Textual Features for Domain Independent Author Identification |publisher=KTH Royal Institute of Technology}} | ||
</ref> इस प्रकार मेंडेनहॉल द्वारा लेखकत्व की पहचान के सबसे पहले विधियों में से एक | </ref> इस प्रकार मेंडेनहॉल द्वारा लेखकत्व की पहचान के सबसे पहले विधियों में से एक अपने अवलोकनों को बिना औसत किए एकत्रित करना कहा जा सकता है।<ref> | ||
{{cite journal |last1=Mendenhall |first1=T C|date=1887 |title=The characteristic curves of composition |journal=Science |volume=9 |issue=214S |pages=237–246|doi=10.1126/science.ns-9.214S.237 |pmid=17736020 |url=https://zenodo.org/record/1448355}} | {{cite journal |last1=Mendenhall |first1=T C|date=1887 |title=The characteristic curves of composition |journal=Science |volume=9 |issue=214S |pages=237–246|doi=10.1126/science.ns-9.214S.237 |pmid=17736020 |url=https://zenodo.org/record/1448355}} | ||
</ref> | </ref> | ||
Line 45: | Line 45: | ||
==एडवर्सरियल स्टाइलोमेट्री== | ==एडवर्सरियल स्टाइलोमेट्री== | ||
{{main|एडवरसैरियल स्टाइलोमेट्री}} | {{main|एडवरसैरियल स्टाइलोमेट्री}} | ||
एडवरसैरियल स्टाइलोमेट्री लेखक की पहचान या उनकी विशेषताओं की खोज करने के लिए स्टाइलोमेट्री की क्षमता को कम करने के लिए लेखन शैली को बदलने का अभ्यास है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=5}} इस कार्य को लेखकत्व अस्पष्टता या लेखकत्व अज्ञातीकरण के रूप में भी जाना जाता है। स्टाइलोमेट्री | एडवरसैरियल स्टाइलोमेट्री लेखक की पहचान या उनकी विशेषताओं की खोज करने के लिए स्टाइलोमेट्री की क्षमता को कम करने के लिए लेखन शैली को बदलने का अभ्यास है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=5}} इस कार्य को लेखकत्व अस्पष्टता या लेखकत्व अज्ञातीकरण के रूप में भी जाना जाता है। स्टाइलोमेट्री अस्पष्ट लेखकों को अनावृत करने या छद्म नामों को किसी लेखक की अन्य पहचान से जोड़ने की क्षमता में महत्वपूर्ण [[गोपनीयता]] चुनौती प्रस्तुत करती है,{{sfn|Gröndahl|Asokan|2020a|p=3}} जो, उदाहरण के लिए, [[मुखबिर|व्हिसिलब्लोअर]] के लिए कठिनाइयाँ उत्पन्न करता है,{{sfn|Kacmarcik|Gamon|2006|p=444}} कार्यकर्ता,{{sfn|Mahmood|Ahmad|Shafiq|Srinivasan|2019|p=54}} और [[धोखा]]धड़ी करने वाले और धोखेबाज़ {{sfn|Afroz|Brennan|Greenstadt|2012|p=461}} [[ यंत्र अधिगम |यंत्र अधिगम]] तकनीक और टेक्स्ट [[ पाठ निगम |निगम]] विकसित होने के कारण गोपनीयता कठिन परिस्थिति बढ़ने की उम्मीद है।{{sfn|Gröndahl|Asokan|2020a|p=28}} | ||
सभी प्रतिकूल शैलीमिति स्रोत टेक्स्ट को ईमानदारी से [[व्याख्या (कम्प्यूटेशनल भाषाविज्ञान)]] करने के मूल विचार को साझा करती है जिससे अर्थ अपरिवर्तित रहे किन्तु शैलीगत संकेत अस्पष्ट रहें है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=6}}{{sfn|Potthast|Hagen|Stein|2016|p=10}} इस प्रकार ऐसा विश्वसनीय पैराफ़्रेज़ स्टाइलोमेट्रिक क्लासिफायरियर के लिए [[प्रतिकूल उदाहरण]] है।{{sfn|Saedi|Dras|2020|p=181}} इसके लिए कई व्यापक दृष्टिकोण उपस्थित हैं, कुछ ओवरलैप के साथ: | सभी प्रतिकूल शैलीमिति स्रोत टेक्स्ट को ईमानदारी से [[व्याख्या (कम्प्यूटेशनल भाषाविज्ञान)]] करने के मूल विचार को साझा करती है जिससे अर्थ अपरिवर्तित रहे किन्तु शैलीगत संकेत अस्पष्ट रहें है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=6}}{{sfn|Potthast|Hagen|Stein|2016|p=10}} इस प्रकार ऐसा विश्वसनीय पैराफ़्रेज़ स्टाइलोमेट्रिक क्लासिफायरियर के लिए [[प्रतिकूल उदाहरण]] है।{{sfn|Saedi|Dras|2020|p=181}} इसके लिए कई व्यापक दृष्टिकोण उपस्थित हैं, कुछ ओवरलैप के साथ: प्रतिलिपि , लेखक की अपनी शैली को दूसरे की शैली से प्रतिस्थापित करता है; अनुवाद, मशीनी अनुवाद को इस आशा के साथ क्रियान्वित करना कि यह स्रोत टेक्स्ट में विशिष्ट शैली को समाप्त कर देता है; और अस्पष्टता, किसी टेक्स्ट की शैली को साभिप्राय संशोधित करना जिससे वह लेखक की अपनी शैली से मेल नही खाते है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=6}} | ||
शैली को मैन्युअल रूप से अस्पष्ट करना संभव है, किन्तु श्रमसाध्य;{{sfn|Gröndahl|Asokan|2020a|p=21-22}} कुछ परिस्थितियों में, यह उत्तम | शैली को मैन्युअल रूप से अस्पष्ट करना संभव है, किन्तु श्रमसाध्य;{{sfn|Gröndahl|Asokan|2020a|p=21-22}} कुछ परिस्थितियों में, यह उत्तम या आवश्यक है।{{sfn|Wang|Juola|Riddell|2022|p=2}} स्वचालित टूलींग, या तो अर्ध- या पूर्ण-स्वचालित, लेखक की सहायता कर सकती है।{{sfn|Gröndahl|Asokan|2020a|p=21-22}} इस प्रकार कार्य को सर्वोत्तम विधि से कैसे निष्पादित किया जाए और ऐसे उपकरणों का डिज़ाइन संवृत शोध प्रश्न है।{{sfn|Neal|Sundararajan|Fatima|Yan|2018|p=27}}{{sfn|Gröndahl|Asokan|2020a|p=28}} जबकि कुछ दृष्टिकोणों को विशेष स्टाइलोमेट्रिक विश्लेषणों को पराजित करने में सक्षम दिखाया गया है,{{sfn|Brennan|Afroz|Greenstadt|2012|p=2}} विशेष रूप से वे जो प्रतिकूलता की संभावना को ध्यान में नहीं रखते हैं,{{sfn|Zhai|Rusert|Shafiq|Srinivasan|2022|p=7373}} अज्ञात विश्लेषणों के सामने सुरक्षा स्थापित करना कथन है।{{sfn|Emmery|Kádár|Chrupała|2021|p=2388-2389}} पैराफ़्रेज़ की विश्वसनीयता सुनिश्चित करना स्वचालित उपकरणों के लिए महत्वपूर्ण चुनौती है।{{sfn|Gröndahl|Asokan|2020a|p=28}} | ||
यह अनिश्चित है कि प्रतिकूल स्टाइलोमेट्री का अभ्यास अपने आप में पता लगाने योग्य है या नहीं है। कुछ अध्ययनों में पाया गया है कि विशेष विधियों ने आउटपुट टेक्स्ट में सिग्नल उत्पन्न किए हैं, किन्तु स्टाइलोमेट्रिस्ट जो अनिश्चित है कि किन विधियों का उपयोग किया गया था, वह विश्वसनीय रूप से उनका पता लगाने में सक्षम नहीं हो सकता है।{{sfn|Gröndahl|Asokan|2020a|p=28}} | यह अनिश्चित है कि प्रतिकूल स्टाइलोमेट्री का अभ्यास अपने आप में पता लगाने योग्य है या नहीं है। कुछ अध्ययनों में पाया गया है कि विशेष विधियों ने आउटपुट टेक्स्ट में सिग्नल उत्पन्न किए हैं, किन्तु स्टाइलोमेट्रिस्ट जो अनिश्चित है कि किन विधियों का उपयोग किया गया था, वह विश्वसनीय रूप से उनका पता लगाने में सक्षम नहीं हो सकता है।{{sfn|Gröndahl|Asokan|2020a|p=28}} | ||
==वर्तमान शोध== | ==वर्तमान शोध == | ||
आधुनिक स्टाइलोमेट्री सांख्यिकीय विश्लेषण के लिए [[कंप्यूटर]] का उपयोग करती है, और कृत्रिम बुद्धि और [[इंटरनेट]] के माध्यम से उपलब्ध ग्रंथों के बढ़ते टेक्स्ट संग्रह तक पहुंच का उपयोग करती है।<ref name="sigirws">[[Shlomo Argamon|Argamon, Shlomo]], [[Jussi Karlgren]], and [[James G. Shanahan]]. Stylistic analysis of text for information access. Papers from the workshop held in conjunction with the | आधुनिक स्टाइलोमेट्री सांख्यिकीय विश्लेषण के लिए [[कंप्यूटर]] का उपयोग करती है, और कृत्रिम बुद्धि और [[इंटरनेट]] के माध्यम से उपलब्ध ग्रंथों के बढ़ते टेक्स्ट संग्रह तक पहुंच का उपयोग करती है।<ref name="sigirws">[[Shlomo Argamon|Argamon, Shlomo]], [[Jussi Karlgren]], and [[James G. Shanahan]]. Stylistic analysis of text for information access. Papers from the workshop held in conjunction with the | ||
28th Annual International ACM Conference on Research and | 28th Annual International ACM Conference on Research and | ||
Development in Information Retrieval, August 13–19, 2005, | Development in Information Retrieval, August 13–19, 2005, | ||
Salvador, Bahia, Brazil. Swedish institute of computer science, 2005.</ref> सॉफ्टवेयर सिस्टम जैसे सिग्नेचर <ref>{{cite web|url=http://www.philocomp.net/texts/signature.htm |title=सिग्नेचर स्टाइलोमेट्रिक सिस्टम|publisher=PhiloComp |access-date=2014-01-03}}</ref> (ऑक्सफोर्ड विश्वविद्यालय के डॉ. पीटर मिलिकन द्वारा निर्मित फ्रीवेयर), जेजीएएपी <ref>{{cite web|url=http://www.jgaap.com |title=जजाप|publisher=जजाप|date=2012-09-04 |access-date=2012-10-15}}</ref> (जावा ग्राफिकल ऑथरशिप एट्रिब्यूशन प्रोग्राम-डुक्सेन विश्वविद्यालय के डॉ. [[पैट्रिक जुओला]] द्वारा निर्मित फ्रीवेयर), स्टाइलो <ref name="styloR">{{cite web |url=https://sites.google.com/site/computationalstylistics/stylo |title=आर पैकेज के लिए स्टाइलो|publisher=Computational Stylistics Group |date=2014-10-24 |access-date=2014-10-24 |archive-date=2014-12-21 |archive-url=https://web.archive.org/web/20141221100741/https://sites.google.com/site/computationalstylistics/stylo |url-status=dead }}</ref><ref name="styloRlit">{{cite journal|author1=Eder, Maciej|author2=Rybicki, Jan|author3=Kestemont, Mike|year=2016|title=Stylometry with R: a package for computational text analysis|journal=R Journal|volume=8|issue=1|pages=107–121|url=https://journal.r-project.org/archive/2016-1/eder-rybicki-kestemont.pdf|doi=10.32614/RJ-2016-007|doi-access=free}}</ref> (विभिन्न प्रकार के स्टाइलोमेट्रिक विश्लेषणों के लिए ओपन-सोर्स आर पैकेज, जिसमें ऑथरशिप एट्रिब्यूशन भी सम्मिलित | Salvador, Bahia, Brazil. Swedish institute of computer science, 2005.</ref> सॉफ्टवेयर सिस्टम जैसे सिग्नेचर <ref>{{cite web|url=http://www.philocomp.net/texts/signature.htm |title=सिग्नेचर स्टाइलोमेट्रिक सिस्टम|publisher=PhiloComp |access-date=2014-01-03}}</ref> (ऑक्सफोर्ड विश्वविद्यालय के डॉ. पीटर मिलिकन द्वारा निर्मित फ्रीवेयर), जेजीएएपी <ref>{{cite web|url=http://www.jgaap.com |title=जजाप|publisher=जजाप|date=2012-09-04 |access-date=2012-10-15}}</ref> (जावा ग्राफिकल ऑथरशिप एट्रिब्यूशन प्रोग्राम-डुक्सेन विश्वविद्यालय के डॉ. [[पैट्रिक जुओला]] द्वारा निर्मित फ्रीवेयर), स्टाइलो <ref name="styloR">{{cite web |url=https://sites.google.com/site/computationalstylistics/stylo |title=आर पैकेज के लिए स्टाइलो|publisher=Computational Stylistics Group |date=2014-10-24 |access-date=2014-10-24 |archive-date=2014-12-21 |archive-url=https://web.archive.org/web/20141221100741/https://sites.google.com/site/computationalstylistics/stylo |url-status=dead }}</ref><ref name="styloRlit">{{cite journal|author1=Eder, Maciej|author2=Rybicki, Jan|author3=Kestemont, Mike|year=2016|title=Stylometry with R: a package for computational text analysis|journal=R Journal|volume=8|issue=1|pages=107–121|url=https://journal.r-project.org/archive/2016-1/eder-rybicki-kestemont.pdf|doi=10.32614/RJ-2016-007|doi-access=free}}</ref> (विभिन्न प्रकार के स्टाइलोमेट्रिक विश्लेषणों के लिए ओपन-सोर्स आर पैकेज, जिसमें ऑथरशिप एट्रिब्यूशन भी सम्मिलित है, इस प्रकार जिसे [[मैसीज एडर]], [[जान रयबिकी]] और [[माइक केस्टेमोंट]] द्वारा विकसित किया गया है) और स्टाइलिन <ref>{{cite techreport |author1=Daelemans, Walter |author2=Hoste, Véronique |name-list-style=amp |url=http://stylene.be |title=STYLENE: an Environment for Stylometry and Readability Research for Dutch |publisher=CLiPS Technical Report Series |year=2013 |issn=2033-3544 |issue=4 }}</ref> डचों के लिए (एंटवर्प विश्वविद्यालय के प्रोफेसर [[वाल्टर डेलेमैन्स]] और गेन्ट विश्वविद्यालय के डॉ. वेरोनिक होस्टे द्वारा ऑनलाइन फ्रीवेयर) इसके उपयोग को गैर-विशेषज्ञों के लिए भी तेजी से व्यावहारिक बनाता है। | ||
==शैक्षणिक समिष्ट और आयोजन== | ==शैक्षणिक समिष्ट और आयोजन== | ||
Line 65: | Line 65: | ||
===फोरेंसिक भाषाविज्ञान=== | ===फोरेंसिक भाषाविज्ञान=== | ||
[[फोरेंसिक भाषाविदों का अंतर्राष्ट्रीय संघ]] (आईएएफएल) इंटरनेशनल एसोसिएशन ऑफ फोरेंसिक लिंग्विस्ट्स के द्विवार्षिक सम्मेलन ([[ बंदरगाह | पोर्ट]] में 2016 में 13वां संस्करण) का आयोजन करता है और अपने केंद्रीय विषयों में से के रूप में [[फोरेंसिक स्टाइलिस्टिक्स]] के साथ द इंटरनेशनल जर्नल ऑफ स्पीच, लैंग्वेज एंड द लॉ प्रकाशित करता है। | [[फोरेंसिक भाषाविदों का अंतर्राष्ट्रीय संघ]] (आईएएफएल) इंटरनेशनल एसोसिएशन ऑफ फोरेंसिक लिंग्विस्ट्स के द्विवार्षिक सम्मेलन ([[ बंदरगाह |पोर्ट]] में 2016 में 13वां संस्करण) का आयोजन करता है और अपने केंद्रीय विषयों में से के रूप में [[फोरेंसिक स्टाइलिस्टिक्स]] के साथ द इंटरनेशनल जर्नल ऑफ स्पीच, लैंग्वेज एंड द लॉ प्रकाशित करता है। | ||
===एएएआई=== | ===एएएआई=== | ||
Line 74: | Line 74: | ||
==इंटरेस्ट का केस अध्ययन== | ==इंटरेस्ट का केस अध्ययन== | ||
* 1439 में, [[लोरेंजो वल्ला]] ने दिखाया कि [[कॉन्स्टेंटाइन का दान]] [[जालसाजी]] था, यह तर्क आंशिक रूप से चौथी शताब्दी के प्रामाणिक दस्तावेजों में प्रयुक्त [[लैटिन]] के साथ तुलना पर आधारित था। | * 1439 में, [[लोरेंजो वल्ला]] ने दिखाया कि [[कॉन्स्टेंटाइन का दान]] [[जालसाजी]] था, यह तर्क आंशिक रूप से चौथी शताब्दी के प्रामाणिक दस्तावेजों में प्रयुक्त [[लैटिन]] के साथ तुलना पर आधारित था। | ||
* 1952 में, स्वीडिश पादरी [[डिक हेलैंडर]] को स्ट्रांगनास का बिशप चुना गया था। अभियान प्रतिस्पर्धी था और इस प्रकार हेलैंडर पर स्ट्रांगनास के बिशप पद के मतदाताओं के लिए अन्य उम्मीदवारों के बारे में सैकड़ों | * 1952 में, स्वीडिश पादरी [[डिक हेलैंडर]] को स्ट्रांगनास का बिशप चुना गया था। अभियान प्रतिस्पर्धी था और इस प्रकार हेलैंडर पर स्ट्रांगनास के बिशप पद के मतदाताओं के लिए अन्य उम्मीदवारों के बारे में सैकड़ों अस्पष्ट अपमानजनक पत्रों की श्रृंखला लिखने का आरोप लगाया गया था। हेलैंडर को पहले पत्र लिखने का दोषी ठहराया गया और बिशप के रूप में अपना पद खो दिया था, इस प्रकार किन्तु बाद में आंशिक रूप से दोषमुक्त कर दिया गया था। पत्रों का अध्ययन कई स्टाइलोमेट्रिक उपायों (और टाइपराइटर विशेषताओं) और विभिन्न अदालती स्थितियों और आगे की परीक्षाओं का उपयोग करके किया गया था, जिनमें से कई को 1978 में उनकी मृत्यु तक हेलैंडर द्वारा स्वयं अनुबंधित किया गया था, स्टाइलोमेट्रिक विधि और साक्ष्य के रूप में इसके मूल्य पर कुछ विस्तार से चर्चा की गई थी। .<ref name="nobel">Text processing text analysis and generation – text typology and attribution. Proceedings of Nobel symposium 51 / ed. by [[Sture Allén]] Stockholm : Almqvist & Wiksell international 1982 653 pp. Data linguistica; 16 Nobel symposium; 51 {{ISBN|91-22-00594-3}}</ref><ref name="karlgrenblog">{{cite web|last1=Karlgren|first1=Jussi|author-link1=Jussi Karlgren|title=Helander: An Authorship Attribution Case|url=https://jussikarlgren.wordpress.com/2003/01/01/helander-an-authorship-attribution-case/|access-date=4 October 2017|date=2003}}</ref> | ||
* 1975 में, [[रोनाल्ड रीगन]] के कैलिफ़ोर्निया के गवर्नर के रूप में कार्य करने के बाद, उन्होंने सैकड़ों स्टेशनों को सिंडिकेटेड साप्ताहिक रेडियो कमेंट्री देना प्रारंभ किया था। इस प्रकार 2001 में उनके 90वें जन्मदिन पर उनके व्यक्तिगत नोट्स सार्वजनिक होने के बाद, अध्ययन में स्टाइलोस्टैटिस्टिकल विधियों का उपयोग करके यह निर्धारित किया गया कि उनमें से कौन सी इंटरैक्शन उनके द्वारा लिखी गई थी और कौन सी उनके विभिन्न सहयोगियों द्वारा लिखी गई थी।<ref>{{Cite journal | author = Airoldi, Edoardo M. |author-link1=Edoardo Airoldi | author2= Fienberg, Stephen E. | author3=Skinner, Kiron K. | author3-link = Kiron K. Skinner | title = Whose Ideas? Whose Words? Authorship of Ronald Reagan's Radio Addresses | journal = PS: Political Science & Politics | volume = 40 | issue = 3 | pages = 501–506 |date=July 2007 | doi = 10.1017/S1049096507070874 | url = http://www.stat.columbia.edu/~gelman/stuff_for_blog/Airoldi_PS_Final.pdf |citeseerx=10.1.1.190.5798 |s2cid=18730541 }}</ref> | * 1975 में, [[रोनाल्ड रीगन]] के कैलिफ़ोर्निया के गवर्नर के रूप में कार्य करने के बाद, उन्होंने सैकड़ों स्टेशनों को सिंडिकेटेड साप्ताहिक रेडियो कमेंट्री देना प्रारंभ किया था। इस प्रकार 2001 में उनके 90वें जन्मदिन पर उनके व्यक्तिगत नोट्स सार्वजनिक होने के बाद, अध्ययन में स्टाइलोस्टैटिस्टिकल विधियों का उपयोग करके यह निर्धारित किया गया कि उनमें से कौन सी इंटरैक्शन उनके द्वारा लिखी गई थी और कौन सी उनके विभिन्न सहयोगियों द्वारा लिखी गई थी।<ref>{{Cite journal | author = Airoldi, Edoardo M. |author-link1=Edoardo Airoldi | author2= Fienberg, Stephen E. | author3=Skinner, Kiron K. | author3-link = Kiron K. Skinner | title = Whose Ideas? Whose Words? Authorship of Ronald Reagan's Radio Addresses | journal = PS: Political Science & Politics | volume = 40 | issue = 3 | pages = 501–506 |date=July 2007 | doi = 10.1017/S1049096507070874 | url = http://www.stat.columbia.edu/~gelman/stuff_for_blog/Airoldi_PS_Final.pdf |citeseerx=10.1.1.190.5798 |s2cid=18730541 }}</ref> | ||
*1996 में, [[वासर कॉलेज]] के प्रोफेसर [[डोनाल्ड फोस्टर (प्रोफेसर)]] द्वारा प्रस्तुत विवादास्पद, छद्म नाम से लिखी गई पुस्तक [[प्राथमिक रंग (उपन्यास)]] का स्टाइलोमेट्रिक विश्लेषण <ref>[http://www.salon.com/2000/11/02/foster_5/ ''Author Unknown'' by Gavin McNett Salon November 2, 2000]</ref> लेखक की सही पहचान [[जो क्लेन]] के रूप में करने के बाद विषय को व्यापक दर्शकों के ध्यान में लाया गया। (हस्तलेख विश्लेषण द्वारा लेखकत्व की पुष्टि के बाद ही यह स्थिति सुलझाया गया।) | *1996 में, [[वासर कॉलेज]] के प्रोफेसर [[डोनाल्ड फोस्टर (प्रोफेसर)]] द्वारा प्रस्तुत विवादास्पद, छद्म नाम से लिखी गई पुस्तक [[प्राथमिक रंग (उपन्यास)]] का स्टाइलोमेट्रिक विश्लेषण <ref>[http://www.salon.com/2000/11/02/foster_5/ ''Author Unknown'' by Gavin McNett Salon November 2, 2000]</ref> लेखक की सही पहचान [[जो क्लेन]] के रूप में करने के बाद विषय को व्यापक दर्शकों के ध्यान में लाया गया। (हस्तलेख विश्लेषण द्वारा लेखकत्व की पुष्टि के बाद ही यह स्थिति सुलझाया गया।) | ||
* 1996 में, यूनाबॉम्बर घोषणापत्र की तुलना संदिग्धों में से एक, [[थिओडोर कैज़िंस्की]] द्वारा लिखे गए पत्रों के साथ करने के लिए स्टाइलोमेट्रिक विधियों का उपयोग किया गया था, जिसके परिणामस्वरूप काकज़िनस्की की आशंका हुई और बाद में उसे दोषी ठहराया गया था।<ref name="pain">{{cite news|access-date=July 5, 2008|url=https://www.nytimes.com/1996/04/10/us/in-unabom-case-pain-for-suspect-s-family.html|title=अनबॉम मामले में, संदिग्ध के परिवार के लिए दर्द|work=The New York Times|first=Pam|last=Belluck|date=April 10, 1996|url-status=live|archive-url=https://web.archive.org/web/20170810092506/http://www.nytimes.com/1996/04/10/us/in-unabom-case-pain-for-suspect-s-family.html|archive-date=August 10, 2017|df=mdy-all}}</ref> | * 1996 में, यूनाबॉम्बर घोषणापत्र की तुलना संदिग्धों में से एक, [[थिओडोर कैज़िंस्की]] द्वारा लिखे गए पत्रों के साथ करने के लिए स्टाइलोमेट्रिक विधियों का उपयोग किया गया था, जिसके परिणामस्वरूप काकज़िनस्की की आशंका हुई और बाद में उसे दोषी ठहराया गया था।<ref name="pain">{{cite news|access-date=July 5, 2008|url=https://www.nytimes.com/1996/04/10/us/in-unabom-case-pain-for-suspect-s-family.html|title=अनबॉम मामले में, संदिग्ध के परिवार के लिए दर्द|work=The New York Times|first=Pam|last=Belluck|date=April 10, 1996|url-status=live|archive-url=https://web.archive.org/web/20170810092506/http://www.nytimes.com/1996/04/10/us/in-unabom-case-pain-for-suspect-s-family.html|archive-date=August 10, 2017|df=mdy-all}}</ref> | ||
*अप्रैल 2015 में, स्टाइलोमेट्री तकनीकों का उपयोग करने वाले शोधकर्ताओं ने [[विलियम शेक्सपियर]] के कार्य के रूप में नाटक, [[ दोहरा झूठ |दोहरा झूठ]] की पहचान की थी।<ref>{{cite web|url=https://www.latimes.com/science/sciencenow/la-sci-sn-shakespeare-play-linguistic-analysis-20150410-story.html |title=अध्ययन से पता चला है कि शेक्सपियर के एक विवादित नाटक पर उस्ताद की छाप है|work=[[Los Angeles Times]] |date=2015-04-10 |access-date=2015-04-13}}</ref><ref>{{cite journal |last1=Boyd |first1=Ryan L. |last2=Pennebaker |first2=James W. |title=Did Shakespeare Write Double Falsehood? Identifying Individuals by Creating Psychological Signatures With Text Analysis |journal=Psychological Science |year=2015 |volume=26 |issue=5 |pages=570–582 |doi=10.1177/0956797614566658 |pmid=25854277 |s2cid=13022405 |url=https://journals.sagepub.com/doi/full/10.1177/0956797614566658}}</ref> शोधकर्ताओं ने शेक्सपियर और [[जॉन फ्लेचर (नाटककार)]] के 54 नाटकों का विश्लेषण किया, और औसत वाक्य लंबाई की तुलना की, असामान्य शब्दों के उपयोग का अध्ययन किया और उनकी भाषा की जटिलता और मनोवैज्ञानिक वैधता (भाषा विज्ञान) की मात्रा निर्धारित की थी। | *अप्रैल 2015 में, स्टाइलोमेट्री तकनीकों का उपयोग करने वाले शोधकर्ताओं ने [[विलियम शेक्सपियर]] के कार्य के रूप में नाटक, [[ दोहरा झूठ |दोहरा झूठ]] की पहचान की थी।<ref>{{cite web|url=https://www.latimes.com/science/sciencenow/la-sci-sn-shakespeare-play-linguistic-analysis-20150410-story.html |title=अध्ययन से पता चला है कि शेक्सपियर के एक विवादित नाटक पर उस्ताद की छाप है|work=[[Los Angeles Times]] |date=2015-04-10 |access-date=2015-04-13}}</ref><ref>{{cite journal |last1=Boyd |first1=Ryan L. |last2=Pennebaker |first2=James W. |title=Did Shakespeare Write Double Falsehood? Identifying Individuals by Creating Psychological Signatures With Text Analysis |journal=Psychological Science |year=2015 |volume=26 |issue=5 |pages=570–582 |doi=10.1177/0956797614566658 |pmid=25854277 |s2cid=13022405 |url=https://journals.sagepub.com/doi/full/10.1177/0956797614566658}}</ref> शोधकर्ताओं ने शेक्सपियर और [[जॉन फ्लेचर (नाटककार)]] के 54 नाटकों का विश्लेषण किया, और औसत वाक्य लंबाई की तुलना की, असामान्य शब्दों के उपयोग का अध्ययन किया था और इस प्रकार उनकी भाषा की जटिलता और मनोवैज्ञानिक वैधता (भाषा विज्ञान) की मात्रा निर्धारित की थी। | ||
* 2016 में, मैकडोनाल्ड पी. जैक्सन, न्यूजीलैंड के [[ऑकलैंड विश्वविद्यालय]] में अंग्रेजी के एमेरिटस प्रोफेसर और न्यूजीलैंड की रॉयल सोसाइटी के फेलो, जिन्होंने अपना पूरा शैक्षणिक करियर लेखकत्व गुण का विश्लेषण करते हुए बिताया था, ने हू वॉट्ट द नाम से किताब लिखी थी। क्रिसमस से पहले की रात?: क्लेमेंट क्लार्क मूर बनाम का विश्लेषण हेनरी लिविंगस्टन प्रश्न,<ref>{{cite book |last1=Jackson |first1=MacDonald P |title=Who Wrote "The Night Before Christmas"? Analyzing the Clement Clarke Moore Vs. Henry Livingston Question |date=April 27, 2016 |publisher=McFarland & Co |isbn=978-1476664439}}</ref> जिसमें वह विरोधी तर्कों का मूल्यांकन करता है और, पहली बार, लंबे समय से चले आ रहे विवाद की जांच करने के लिए आधुनिक कम्प्यूटेशनल शैली विज्ञान की लेखक-एट्रिब्यूशन तकनीकों का उपयोग करता है। जैक्सन कई प्रकार के परीक्षणों को नियोजित करता है और नया, स्वरों का सांख्यिकीय विश्लेषण प्रस्तुत करता है; उन्होंने निष्कर्ष निकाला कि लिविंगस्टन क्लासिक कार्य के सच्चे लेखक हैं। | * 2016 में, मैकडोनाल्ड पी. जैक्सन, न्यूजीलैंड के [[ऑकलैंड विश्वविद्यालय]] में अंग्रेजी के एमेरिटस प्रोफेसर और न्यूजीलैंड की रॉयल सोसाइटी के फेलो, जिन्होंने अपना पूरा शैक्षणिक करियर लेखकत्व गुण का विश्लेषण करते हुए बिताया था, ने हू वॉट्ट द नाम से किताब लिखी थी। क्रिसमस से पहले की रात?: क्लेमेंट क्लार्क मूर बनाम का विश्लेषण हेनरी लिविंगस्टन प्रश्न,<ref>{{cite book |last1=Jackson |first1=MacDonald P |title=Who Wrote "The Night Before Christmas"? Analyzing the Clement Clarke Moore Vs. Henry Livingston Question |date=April 27, 2016 |publisher=McFarland & Co |isbn=978-1476664439}}</ref> जिसमें वह विरोधी तर्कों का मूल्यांकन करता है और, पहली बार, लंबे समय से चले आ रहे विवाद की जांच करने के लिए आधुनिक कम्प्यूटेशनल शैली विज्ञान की लेखक-एट्रिब्यूशन तकनीकों का उपयोग करता है। जैक्सन कई प्रकार के परीक्षणों को नियोजित करता है और नया, स्वरों का सांख्यिकीय विश्लेषण प्रस्तुत करता है; उन्होंने निष्कर्ष निकाला कि लिविंगस्टन क्लासिक कार्य के सच्चे लेखक हैं। | ||
*2017 में, साइमन फुलर और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने अध्ययन प्रकाशित किया जिसमें प्रमाणित किया गया कि बेस्टसेलिंग लेखक [[जेम्स पैटरसन]] अपने स्पष्ट रूप से सह-लेखक उपन्यासों में कोई लेखन नहीं करते हैं।<ref name=":0">{{cite journal|last1=Fuller|first1=Simon|last2=O'Sullivan|first2=James|date=2017|title=Structure over Style: Collaborative Authorship and the Revival of Literary Capitalism|url=http://www.digitalhumanities.org/dhq/vol/11/1/000286/000286.html|journal=Digital Humanities Quarterly|volume=11|issue=1|access-date=April 20, 2017}}</ref><ref name=":1">{{Cite magazine|url=https://www.newyorker.com/magazine/2018/06/18/bill-clinton-and-james-pattersons-concussive-collaboration|title=बिल क्लिंटन और जेम्स पैटरसन का प्रेरक सहयोग|last=Lane|first=Anthony|date=June 18, 2018|magazine=The New Yorker|access-date=2018-06-07|language=en-US}}</ref><ref name=":2">{{cite web|url=https://theconversation.com/why-you-dont-need-to-write-much-to-be-the-worlds-bestselling-author-75261|title=दुनिया का सबसे ज़्यादा बिकने वाला लेखक बनने के लिए आपको ज़्यादा लिखने की ज़रूरत क्यों नहीं है?|date=April 3, 2017|work=The Conversation|access-date=April 20, 2017}}</ref> ओ'सुलिवन के अनुसार, पूर्व अमेरिकी राष्ट्रपति [[बिल क्लिंटन]] के साथ उनका सहयोग, [[राष्ट्रपति लापता है (उपन्यास)]], इस नियम का अपवाद है।<ref name=":3">{{Cite web|url=https://www.theguardian.com/books/booksblog/2018/jun/07/bill-clinton-james-patterson-the-president-is-missing-co-authors|title=Bill Clinton and James Patterson are co-authors – but who did the writing?|last=O'Sullivan|first=James|date=2018-06-07|website=The Guardian|language=en|access-date=2018-06-07}}</ref> | *2017 में, साइमन फुलर और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने अध्ययन प्रकाशित किया जिसमें प्रमाणित किया गया कि बेस्टसेलिंग लेखक [[जेम्स पैटरसन]] अपने स्पष्ट रूप से सह-लेखक उपन्यासों में कोई लेखन नहीं करते हैं।<ref name=":0">{{cite journal|last1=Fuller|first1=Simon|last2=O'Sullivan|first2=James|date=2017|title=Structure over Style: Collaborative Authorship and the Revival of Literary Capitalism|url=http://www.digitalhumanities.org/dhq/vol/11/1/000286/000286.html|journal=Digital Humanities Quarterly|volume=11|issue=1|access-date=April 20, 2017}}</ref><ref name=":1">{{Cite magazine|url=https://www.newyorker.com/magazine/2018/06/18/bill-clinton-and-james-pattersons-concussive-collaboration|title=बिल क्लिंटन और जेम्स पैटरसन का प्रेरक सहयोग|last=Lane|first=Anthony|date=June 18, 2018|magazine=The New Yorker|access-date=2018-06-07|language=en-US}}</ref><ref name=":2">{{cite web|url=https://theconversation.com/why-you-dont-need-to-write-much-to-be-the-worlds-bestselling-author-75261|title=दुनिया का सबसे ज़्यादा बिकने वाला लेखक बनने के लिए आपको ज़्यादा लिखने की ज़रूरत क्यों नहीं है?|date=April 3, 2017|work=The Conversation|access-date=April 20, 2017}}</ref> ओ'सुलिवन के अनुसार, पूर्व अमेरिकी राष्ट्रपति [[बिल क्लिंटन]] के साथ उनका सहयोग, [[राष्ट्रपति लापता है (उपन्यास)]], इस नियम का अपवाद है।<ref name=":3">{{Cite web|url=https://www.theguardian.com/books/booksblog/2018/jun/07/bill-clinton-james-patterson-the-president-is-missing-co-authors|title=Bill Clinton and James Patterson are co-authors – but who did the writing?|last=O'Sullivan|first=James|date=2018-06-07|website=The Guardian|language=en|access-date=2018-06-07}}</ref> | ||
* 2017 में, भाषाविदों, कंप्यूटर वैज्ञानिकों और विद्वानों के समूह ने [[ऐलेना फेरांटे]] के लेखकत्व का विश्लेषण किया था। [[पडुआ विश्वविद्यालय]] में बनाए गए कोष के आधार पर जिसमें 40 लेखकों द्वारा लिखे गए 150 उपन्यास सम्मिलित | * 2017 में, भाषाविदों, कंप्यूटर वैज्ञानिकों और विद्वानों के समूह ने [[ऐलेना फेरांटे]] के लेखकत्व का विश्लेषण किया था। [[पडुआ विश्वविद्यालय]] में बनाए गए कोष के आधार पर जिसमें 40 लेखकों द्वारा लिखे गए 150 उपन्यास सम्मिलित हैं, इस प्रकार उन्होंने फेरांटे की शैली का उसके सात उपन्यासों के आधार पर विश्लेषण किया था। उदाहरण के लिए, स्टाइलो का उपयोग करके वे उनकी लेखन शैली की तुलना 39 अन्य उपन्यासकारों से करने में सक्षम थे।<ref name="styloR" /> निष्कर्ष उन सभी के लिए समान था: [[डोमेनिको स्टारनोन]] ऐलेना फेरांटे के गुप्त लेखक हैं।<ref>{{Cite journal|last1=Savoy|first1=Jacques|title=Is Starnone really the author behind Ferrante?|url=https://academic.oup.com/dsh/article/33/4/902/5001585|journal=Digital Scholarship in the Humanities|volume=33|issue=4|pages=902–918|year=2018|language=en|doi=10.1093/llc/fqy016}}</ref> | ||
* 2018 में, हार्वर्ड विश्वविद्यालय में सांख्यिकी के वरिष्ठ व्याख्याता, [[मार्क ग्लिकमैन]] ने हार्वर्ड के पूर्व सांख्यिकी छात्र रयान सॉन्ग और नोवा स्कोटिया में डलहौजी विश्वविद्यालय के प्रोफेसर जेसन ब्राउन के साथ कार्य किया, और यह पता लगाने के लिए स्टाइलोमेट्री का उपयोग किया कि, सबसे अधिक संभावना है[[द बीटल्स]] का गीत [[ मेरे जीवन में |मेरे जीवन में]] जॉन लेनन द्वारा रचा गया था, किन्तु 50% संभावना है कि पॉल मेकार्टनी ने [[मध्य आठ]] लिखा था।<ref>Reuell, Peter: [https://news.harvard.edu/gazette/story/2018/09/harvard-statistician-examines-beatles-mystery/ "You say John, I say Paul. But what does stylometry say?"] </ref><ref>{{cite journal |last1=Glickman |first1=Mark |last2=Brown |first2=Jason |last3=Song |first3=Ryan |title=(A) Data in the Life: Authorship Attribution in Lennon-McCartney Songs |journal=Harvard Data Science Review |date=2019 |volume=1 |issue=1 |doi=10.1162/99608f92.130f856e|s2cid=189762434 |doi-access=free }}</ref> | * 2018 में, हार्वर्ड विश्वविद्यालय में सांख्यिकी के वरिष्ठ व्याख्याता, [[मार्क ग्लिकमैन]] ने हार्वर्ड के पूर्व सांख्यिकी छात्र रयान सॉन्ग और नोवा स्कोटिया में डलहौजी विश्वविद्यालय के प्रोफेसर जेसन ब्राउन के साथ कार्य किया, और यह पता लगाने के लिए स्टाइलोमेट्री का उपयोग किया कि, सबसे अधिक संभावना है[[द बीटल्स]] का गीत [[ मेरे जीवन में |मेरे जीवन में]] जॉन लेनन द्वारा रचा गया था, किन्तु 50% संभावना है कि पॉल मेकार्टनी ने [[मध्य आठ]] लिखा था।<ref>Reuell, Peter: [https://news.harvard.edu/gazette/story/2018/09/harvard-statistician-examines-beatles-mystery/ "You say John, I say Paul. But what does stylometry say?"] </ref><ref>{{cite journal |last1=Glickman |first1=Mark |last2=Brown |first2=Jason |last3=Song |first3=Ryan |title=(A) Data in the Life: Authorship Attribution in Lennon-McCartney Songs |journal=Harvard Data Science Review |date=2019 |volume=1 |issue=1 |doi=10.1162/99608f92.130f856e|s2cid=189762434 |doi-access=free }}</ref> | ||
*2019 में, ईटीएसओ प्रोजेक्ट: स्टाइलोमेट्री को स्पैनिश गोल्डन एज थिएटर में क्रियान्वित किया गया था,<ref>[http://etso.es/ The ETSO project.]</ref> इस प्रकार फिल्म का निर्देशन अल्वारो कुएलर गोंजालेज और जर्मन वेगा गार्सिया-लुएंगोस ने किया है। स्टाइलोमेट्रिकल विश्लेषण क्रियान्वित करने के बाद, महिलाओं और पालक बच्चों का श्रेय [[लोप डी वेगा]] को दिया गया <ref>{{Cite web |url=https://www.abc.es/cultura/abci-monstruo-naturaleza-llamado-lope-201811280249_noticia.html |title=लोप नामक प्रकृति का एक राक्षस|trans-title=A monster of nature called Lope |date=2018-11-28 |website=abc |language=es |access-date=2019-08-11 }}</ref><ref>{{Cite web |url=https://www.elnortedecastilla.es/culturas/teatro/rastreadores-digitales-siglo-20181223133815-nt.html |title=स्वर्ण युग में डिजिटल ट्रैकर|trans-title=Digital trackers in the Golden Age |date=2018-12-23 |website=El Norte de Castilla |language=es |access-date=2019-08-11 }}</ref> अनुमोदित किया गया था, और ला मोन्ज़ा अल्फ़ेरेज़ में लेखकत्व समस्या का पता चला था, जो पेरेज़ डी मोंटालबैन के लिए उत्तरदायी नाटक था, जो इन विश्लेषणों और ऐतिहासिक और भाषाविज्ञान अनुसंधान के माध्यम से, अंततः जुआन रुइज़ डी अलारकोन को उत्तरदायी ठहराया गया था।<ref>{{Cite web|url=https://www.latribunadeciudadreal.es/noticia/Z6F846F17-0F70-FEF3-449E11A2A1C6BD36/201907/Juan-Ruiz-de-Alarcon-aumenta-su-obra-cinco-siglos-despues|title=Juan Ruiz de Alarcón aumenta su obra cinco siglos después|trans-title=Juan Ruiz de Alarcón increases his work five centuries after|last=Real|first=La Tribuna de Ciudad|date=2019-07-09|website=La Tribuna de Ciudad Real|language=es|access-date=2019-08-11}}</ref><ref>{{Cite news |url=http://www.psoechamberi.com/esp/tags/suplemento/2019/n6_julio28/08_right_daniel_Miguela%C3%B1ez_01.html |date=28 July 2019 |issue=6 |author=Migueláñez, Daniel |page=8 |title=El Holmes de la filología. |newspaper=PSOE Chamberí |access-date=2019-08-11 |archive-date=2020-07-18 |archive-url=https://web.archive.org/web/20200718220716/http://www.psoechamberi.com/esp/tags/suplemento/2019/n6_julio28/08_right_daniel_Miguela%C3%B1ez_01.html |url-status=dead }}</ref><ref>{{Cite web|url=https://www.lanzadigital.com/cultura/sor-juana-ines-centro-las-42-jornadas-de-teatro-clasico/|title=Sor Juana Inés centró las 42 Jornadas de Teatro Clásico|date=2019-07-14|website=Lanza Digital|language=es-ES|access-date=2019-08-11}}</ref><ref>{{Cite web|url=https://www.elnortedecastilla.es/culturas/teatro/monja-alferez-perez-20190710071933-nt.html|title='La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón|trans-title='La monja alférez' is no longer by Pérez de Montalbán, but by Ruiz de Alarcón|date=2019-07-10|website=El Norte de Castilla|language=es|access-date=2019-08-11}}</ref> 2023 में, उसी प्रोजेक्ट में लोप डी वेगा को ला फ्रांसेसा लॉरा (द फ्रेंचवूमन लॉरा) के लेखक के रूप में पाया गया, जबकि पांडुलिपि उनकी मृत्यु के वर्षों बाद लिखी गई थी।<ref>{{Cite web |title=कृत्रिम बुद्धिमत्ता प्रमुख स्पेनिश नाटककार लोप डी वेगा को उनकी मृत्यु के वर्षों बाद लिखी पांडुलिपि से एक नाटक के लेखक के रूप में खोजने में मदद करती है|url=https://www.newsendip.com/artificial-intelligence-helps-find-prominent-spanish-playwright-lope-de-vega-as-the-author-of-a-play-from-a-manuscript-written-years-after-his-death/ |website= newsendip.com |date=31 January 2023 |access-date=8 February 2023 |language=en }}</ref> इस प्रकार कॉमेडी को लोप डी वेगा के दिवंगत कार्य के रूप में वर्गीकृत किया गया था और यह 1628 से 1630 तक की थी, क्योंकि फ्रांस के प्रति इसके पूर्ण व्यवहार का श्रेय तीस साल के युद्ध के समय स्पेन और फ्रांस के बीच क्षणिक अच्छे संबंधों को दिया जा सकता है, जिसमें इंग्लैंड सामान्य दुश्मन था। .<ref>{{Cite news |title=आर्टिफिशियल इंटेलिजेंस ने स्पेन के 'स्वर्ण युग' के टाइटन के खोए हुए काम को उजागर किया|url=https://www.theguardian.com/world/2023/feb/05/artificial-intelligence-uncovers-lost-work-by-titan-of-spains-golden-age |last=Jones |first=Sam |date=5 February 2023 |work=The Guardian |access-date=8 February 2023 }}</ref> इस विश्लेषण में, जांच के अनुसार टेक्स्ट के 500 सबसे अधिक बार आने वाले शब्दों की तुलना बाकी कार्यों के 500 से की गई है। ला फ्रांसेसा लॉरा के स्थितियों में, खोज से पता चला कि जिन 100 कार्यों के साथ यह निकटतम था, उनमें से लगभग सभी लोप डी वेगा के थे। इस प्रकार कार्यों के लेखकत्व पर पारंपरिक भाषाविज्ञान विश्लेषण ने कृत्रिम बुद्धि की जांच की पुष्टि की है।<ref>{{Cite news |url=https://elpais.com/cultura/2023-01-31/la-inteligencia-artificial-atribuye-a-lope-de-vega-una-obra-anonima-del-fondo-de-manuscritos-de-la-biblioteca-nacional.html |title=La inteligencia artificial atribuye a Lope de Vega una obra anónima del fondo de manuscritos de la Biblioteca Nacional |trans-title=Artificial intelligence attributes an anonymous work from the National Library's manuscript collection to Lope de Vega |access-date=2023-02-08 |last=Morales |first=Manuel |date=2023-01-31 |work=[[El País]] |language=es }}</ref> | *2019 में, ईटीएसओ प्रोजेक्ट: स्टाइलोमेट्री को स्पैनिश गोल्डन एज थिएटर में क्रियान्वित किया गया था,<ref>[http://etso.es/ The ETSO project.]</ref> इस प्रकार फिल्म का निर्देशन अल्वारो कुएलर गोंजालेज और जर्मन वेगा गार्सिया-लुएंगोस ने किया है। स्टाइलोमेट्रिकल विश्लेषण क्रियान्वित करने के बाद, महिलाओं और पालक बच्चों का श्रेय [[लोप डी वेगा]] को दिया गया <ref>{{Cite web |url=https://www.abc.es/cultura/abci-monstruo-naturaleza-llamado-lope-201811280249_noticia.html |title=लोप नामक प्रकृति का एक राक्षस|trans-title=A monster of nature called Lope |date=2018-11-28 |website=abc |language=es |access-date=2019-08-11 }}</ref><ref>{{Cite web |url=https://www.elnortedecastilla.es/culturas/teatro/rastreadores-digitales-siglo-20181223133815-nt.html |title=स्वर्ण युग में डिजिटल ट्रैकर|trans-title=Digital trackers in the Golden Age |date=2018-12-23 |website=El Norte de Castilla |language=es |access-date=2019-08-11 }}</ref> अनुमोदित किया गया था, और ला मोन्ज़ा अल्फ़ेरेज़ में लेखकत्व समस्या का पता चला था, जो पेरेज़ डी मोंटालबैन के लिए उत्तरदायी नाटक था, जो इन विश्लेषणों और ऐतिहासिक और भाषाविज्ञान अनुसंधान के माध्यम से, अंततः जुआन रुइज़ डी अलारकोन को उत्तरदायी ठहराया गया था।<ref>{{Cite web|url=https://www.latribunadeciudadreal.es/noticia/Z6F846F17-0F70-FEF3-449E11A2A1C6BD36/201907/Juan-Ruiz-de-Alarcon-aumenta-su-obra-cinco-siglos-despues|title=Juan Ruiz de Alarcón aumenta su obra cinco siglos después|trans-title=Juan Ruiz de Alarcón increases his work five centuries after|last=Real|first=La Tribuna de Ciudad|date=2019-07-09|website=La Tribuna de Ciudad Real|language=es|access-date=2019-08-11}}</ref><ref>{{Cite news |url=http://www.psoechamberi.com/esp/tags/suplemento/2019/n6_julio28/08_right_daniel_Miguela%C3%B1ez_01.html |date=28 July 2019 |issue=6 |author=Migueláñez, Daniel |page=8 |title=El Holmes de la filología. |newspaper=PSOE Chamberí |access-date=2019-08-11 |archive-date=2020-07-18 |archive-url=https://web.archive.org/web/20200718220716/http://www.psoechamberi.com/esp/tags/suplemento/2019/n6_julio28/08_right_daniel_Miguela%C3%B1ez_01.html |url-status=dead }}</ref><ref>{{Cite web|url=https://www.lanzadigital.com/cultura/sor-juana-ines-centro-las-42-jornadas-de-teatro-clasico/|title=Sor Juana Inés centró las 42 Jornadas de Teatro Clásico|date=2019-07-14|website=Lanza Digital|language=es-ES|access-date=2019-08-11}}</ref><ref>{{Cite web|url=https://www.elnortedecastilla.es/culturas/teatro/monja-alferez-perez-20190710071933-nt.html|title='La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón|trans-title='La monja alférez' is no longer by Pérez de Montalbán, but by Ruiz de Alarcón|date=2019-07-10|website=El Norte de Castilla|language=es|access-date=2019-08-11}}</ref> इस प्रकार 2023 में, उसी प्रोजेक्ट में लोप डी वेगा को ला फ्रांसेसा लॉरा (द फ्रेंचवूमन लॉरा) के लेखक के रूप में पाया गया, जबकि पांडुलिपि उनकी मृत्यु के वर्षों बाद लिखी गई थी।<ref>{{Cite web |title=कृत्रिम बुद्धिमत्ता प्रमुख स्पेनिश नाटककार लोप डी वेगा को उनकी मृत्यु के वर्षों बाद लिखी पांडुलिपि से एक नाटक के लेखक के रूप में खोजने में मदद करती है|url=https://www.newsendip.com/artificial-intelligence-helps-find-prominent-spanish-playwright-lope-de-vega-as-the-author-of-a-play-from-a-manuscript-written-years-after-his-death/ |website= newsendip.com |date=31 January 2023 |access-date=8 February 2023 |language=en }}</ref> इस प्रकार कॉमेडी को लोप डी वेगा के दिवंगत कार्य के रूप में वर्गीकृत किया गया था और यह 1628 से 1630 तक की थी, क्योंकि फ्रांस के प्रति इसके पूर्ण व्यवहार का श्रेय तीस साल के युद्ध के समय स्पेन और फ्रांस के बीच क्षणिक अच्छे संबंधों को दिया जा सकता है, जिसमें इंग्लैंड सामान्य दुश्मन था। .<ref>{{Cite news |title=आर्टिफिशियल इंटेलिजेंस ने स्पेन के 'स्वर्ण युग' के टाइटन के खोए हुए काम को उजागर किया|url=https://www.theguardian.com/world/2023/feb/05/artificial-intelligence-uncovers-lost-work-by-titan-of-spains-golden-age |last=Jones |first=Sam |date=5 February 2023 |work=The Guardian |access-date=8 February 2023 }}</ref> इस विश्लेषण में, जांच के अनुसार टेक्स्ट के 500 सबसे अधिक बार आने वाले शब्दों की तुलना बाकी कार्यों के 500 से की गई है। ला फ्रांसेसा लॉरा के स्थितियों में, खोज से पता चला कि जिन 100 कार्यों के साथ यह निकटतम था, उनमें से लगभग सभी लोप डी वेगा के थे। इस प्रकार कार्यों के लेखकत्व पर पारंपरिक भाषाविज्ञान विश्लेषण ने कृत्रिम बुद्धि की जांच की पुष्टि की है।<ref>{{Cite news |url=https://elpais.com/cultura/2023-01-31/la-inteligencia-artificial-atribuye-a-lope-de-vega-una-obra-anonima-del-fondo-de-manuscritos-de-la-biblioteca-nacional.html |title=La inteligencia artificial atribuye a Lope de Vega una obra anónima del fondo de manuscritos de la Biblioteca Nacional |trans-title=Artificial intelligence attributes an anonymous work from the National Library's manuscript collection to Lope de Vega |access-date=2023-02-08 |last=Morales |first=Manuel |date=2023-01-31 |work=[[El País]] |language=es }}</ref> | ||
*2020 में, राचेल मैक्कार्थी और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने तर्क दिया कि एमिली ब्रोंटे [[वर्थरिंग हाइट्स]] की सच्ची लेखिका हैं, इस प्रकार जिससे कुछ आलोचकों की अटकलें समाप्त हो गईं कि उपन्यास उनके किसी भाई-बहन द्वारा लिखा गया हो सकता है, विशेष रूप से या तो ब्रैनवेल ब्रोंटे या चार्लोट ब्रोंटे ने किया था।<ref>{{Cite journal|last1=McCarthy|first1=Rachel|last2=O'Sullivan|first2=James|title=Who wrote Wuthering Heights?|url=https://academic.oup.com/dsh/article/doi/10.1093/llc/fqaa031/5862913|journal=Digital Scholarship in the Humanities|volume=36|issue=2|pages=383–391|year=2020|language=en|doi=10.1093/llc/fqaa031}}</ref> | *2020 में, राचेल मैक्कार्थी और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने तर्क दिया कि एमिली ब्रोंटे [[वर्थरिंग हाइट्स]] की सच्ची लेखिका हैं, इस प्रकार जिससे कुछ आलोचकों की अटकलें समाप्त हो गईं कि उपन्यास उनके किसी भाई-बहन द्वारा लिखा गया हो सकता है, विशेष रूप से या तो ब्रैनवेल ब्रोंटे या चार्लोट ब्रोंटे ने किया था।<ref>{{Cite journal|last1=McCarthy|first1=Rachel|last2=O'Sullivan|first2=James|title=Who wrote Wuthering Heights?|url=https://academic.oup.com/dsh/article/doi/10.1093/llc/fqaa031/5862913|journal=Digital Scholarship in the Humanities|volume=36|issue=2|pages=383–391|year=2020|language=en|doi=10.1093/llc/fqaa031}}</ref> | ||
*2020 में, हार्टमुट इल्सेमैन ने आर स्टाइलो प्रोग्राम सूट से रोलिंग डेल्टा और रोलिंग क्लासीफाई का उपयोग यह दिखाने के लिए किया कि मार्लो कॉर्पस शैलीगत रूप से अमानवीय है, और दो टैम्बुरलेन्स के लेखक संभवतः ही मार्लो के शेष आधिकारिक कॉर्पस में उपस्थित थे।<ref>Ilsemann, Harmut (2020) "Phantom Marlowe: Paradigmenwechsel in Autorschaftsbestimmungen des englischen Renaissancedramas". Düren: Shaker, [[index.php?title=Special:BookSources/9783844074123|ISBN 978-3-8440-7412-3]]</ref><ref>{{Cite journal|last1=Ilsemann|first1=Harmut|title=मार्लो कॉर्पस पर दोबारा गौर किया गया|url=https://academic.oup.com/dsh/article-abstract/36/2/333/5825419|journal=Digital Scholarship in the Humanities|volume=36|issue=2|pages=333–360|year=2020|language=en|doi=10.1093/llc/fqaa010}}</ref><ref>{{Cite journal|last1=Ilsemann|first1=Harmut|title="द मार्लो कॉर्पस रिविज़िटेड" और फैंटम मार्लो का एक संक्षिप्त पूरक|url=https://academic.oup.com/dsh/advance-article-abstract/doi/10.1093/llc/fqab078/6397020|journal=Digital Scholarship in the Humanities|year=2021|volume=37 |issue=2 |pages=462–468 |language=en|doi=10.1093/llc/fqab078}}</ref> | *2020 में, हार्टमुट इल्सेमैन ने आर स्टाइलो प्रोग्राम सूट से रोलिंग डेल्टा और रोलिंग क्लासीफाई का उपयोग यह दिखाने के लिए किया कि मार्लो कॉर्पस शैलीगत रूप से अमानवीय है, और दो टैम्बुरलेन्स के लेखक संभवतः ही मार्लो के शेष आधिकारिक कॉर्पस में उपस्थित थे।<ref>Ilsemann, Harmut (2020) "Phantom Marlowe: Paradigmenwechsel in Autorschaftsbestimmungen des englischen Renaissancedramas". Düren: Shaker, [[index.php?title=Special:BookSources/9783844074123|ISBN 978-3-8440-7412-3]]</ref><ref>{{Cite journal|last1=Ilsemann|first1=Harmut|title=मार्लो कॉर्पस पर दोबारा गौर किया गया|url=https://academic.oup.com/dsh/article-abstract/36/2/333/5825419|journal=Digital Scholarship in the Humanities|volume=36|issue=2|pages=333–360|year=2020|language=en|doi=10.1093/llc/fqaa010}}</ref><ref>{{Cite journal|last1=Ilsemann|first1=Harmut|title="द मार्लो कॉर्पस रिविज़िटेड" और फैंटम मार्लो का एक संक्षिप्त पूरक|url=https://academic.oup.com/dsh/advance-article-abstract/doi/10.1093/llc/fqab078/6397020|journal=Digital Scholarship in the Humanities|year=2021|volume=37 |issue=2 |pages=462–468 |language=en|doi=10.1093/llc/fqab078}}</ref> | ||
* 2022 में, इतालवी विद्वान सिमोन रेबोरा और मास्सिमो साल्गारो ने जॉन एफ. बरोज़ की "डेल्टा डिस्टेंस" पद्धति का उपयोग करते हुए दिखाया कि [[फ़ेलिक्स साल्टेन]] 1906 के | * 2022 में, इतालवी विद्वान सिमोन रेबोरा और मास्सिमो साल्गारो ने जॉन एफ. बरोज़ की "डेल्टा डिस्टेंस" पद्धति का उपयोग करते हुए दिखाया कि [[फ़ेलिक्स साल्टेन]] 1906 के अस्पष्ट उपन्यास [[जोसेफिन मटज़ेनबैकर]] के सबसे संभावित लेखक हैं, अंतिम पृष्ठों को बाहर रखा गया है।<ref>{{Cite journal | author=Rebora, Simone & Salgaro, Massimo | title=Is Felix Salten the Author of the Mutzenbacher Novel (1906)? Yes and no | journal=Language and Literature: International Journal of Stylistics | year=2022 | volume=31 | issue=2 | pages=243–264 | doi=10.1177/09639470221090384 | s2cid=248135373 | url-access=subscription | url=https://journals.sagepub.com/doi/abs/10.1177/09639470221090384 }}</ref> | ||
==डेटा और विधियाँ== | ==डेटा और विधियाँ== | ||
चूँकि स्टाइलोमेट्री में वर्णनात्मक उपयोग के दोनों स्थितियों हैं, जिनका उपयोग संग्रह की पदार्थ को चित्रित करने के लिए किया जाता है, और इस प्रकार पहचानात्मक उपयोग के स्थितियों, जैसे लेखकों या पाठों की श्रेणियों की पहचान करना, ऊपर दिए गए डेटा और सुविधाओं का विश्लेषण करने के लिए उपयोग की जाने वाली विधियां वस्तुओं को समूह में वर्गीकृत करने या फीचर भिन्नता के समिष्ट पर वस्तुओं को वितरित करने के लिए बनाई गई विधियों से भिन्न होती हैं। अधिकांश विधियाँ प्रकृति में सांख्यिकीय हैं, जैसे [[क्लस्टर विश्लेषण]] और [[विभेदक विश्लेषण]], सामान्यतः भाषाविज्ञान डेटा और विशेषताओं पर आधारित होती हैं, और आधुनिक मशीन सीखने के विधियों के लिए उपयोगी अनुप्रयोग डोमेन हैं। | चूँकि स्टाइलोमेट्री में वर्णनात्मक उपयोग के दोनों स्थितियों हैं, जिनका उपयोग संग्रह की पदार्थ को चित्रित करने के लिए किया जाता है, और इस प्रकार पहचानात्मक उपयोग के स्थितियों, जैसे लेखकों या पाठों की श्रेणियों की पहचान करना, ऊपर दिए गए डेटा और सुविधाओं का विश्लेषण करने के लिए उपयोग की जाने वाली विधियां वस्तुओं को समूह में वर्गीकृत करने या फीचर भिन्नता के समिष्ट पर वस्तुओं को वितरित करने के लिए बनाई गई विधियों से भिन्न होती हैं। अधिकांश विधियाँ प्रकृति में सांख्यिकीय हैं, जैसे [[क्लस्टर विश्लेषण]] और [[विभेदक विश्लेषण]], सामान्यतः भाषाविज्ञान डेटा और विशेषताओं पर आधारित होती हैं, और आधुनिक मशीन सीखने के विधियों के लिए उपयोगी अनुप्रयोग डोमेन हैं। | ||
जबकि इसके पश्चात् , स्टाइलोमेट्री ने किसी टेक्स्ट के सबसे विरल या सबसे हड़ताली तत्वों पर बल दिया था, समकालीन तकनीकें भाषण के सामान्य भागो में भी पहचान क्रम को अलग कर सकती हैं। अधिकांश प्रणालियाँ शाब्दिक आँकड़ों पर आधारित होती हैं, अर्थात टेक्स्ट (या उसके लेखक) को चित्रित करने के लिए टेक्स्ट में शब्दों और शब्दों की आवृत्तियों का उपयोग करता है। इस प्रकार इस संदर्भ में, सूचना पुनर्प्राप्ति के विपरीत, [[अंग्रेजी में सबसे आम शब्द|अंग्रेजी में सबसे सामान्य शब्द]] के देखे गए घटना क्रम उन सामयिक शब्दों की तुलना में अधिक रोचक हैं जो कम बार होते हैं।<ref name="biber">[[Douglas Biber|Biber, Douglas]]. Variation across speech and writing. Cambridge University Press, 1991.</ref><ref name="karlgrencutting">{{cite journal|last1=Karlgren|first1=Jussi|author-link1=Jussi Karlgren|last2=Cutting|first2=Douglass|author-link2=Doug Cutting|title=विभेदक विश्लेषण का उपयोग करके सरल मेट्रिक्स के साथ पाठ शैलियों को पहचानना|journal=Proceedings of the International Conference on Computational Linguistics|volume=2|pages=1071|date=1994|doi=10.3115/991250.991324|bibcode=1994cmp.lg...10008K|arxiv=cmp-lg/9410008|s2cid=1297432}}</ref> | जबकि इसके पश्चात् , स्टाइलोमेट्री ने किसी टेक्स्ट के सबसे विरल या सबसे हड़ताली तत्वों पर बल दिया था, समकालीन तकनीकें भाषण के सामान्य भागो में भी पहचान क्रम को अलग कर सकती हैं। इस प्रकार अधिकांश प्रणालियाँ शाब्दिक आँकड़ों पर आधारित होती हैं, अर्थात टेक्स्ट (या उसके लेखक) को चित्रित करने के लिए टेक्स्ट में शब्दों और शब्दों की आवृत्तियों का उपयोग करता है। इस प्रकार इस संदर्भ में, सूचना पुनर्प्राप्ति के विपरीत, [[अंग्रेजी में सबसे आम शब्द|अंग्रेजी में सबसे सामान्य शब्द]] के देखे गए घटना क्रम उन सामयिक शब्दों की तुलना में अधिक रोचक हैं जो कम बार होते हैं।<ref name="biber">[[Douglas Biber|Biber, Douglas]]. Variation across speech and writing. Cambridge University Press, 1991.</ref><ref name="karlgrencutting">{{cite journal|last1=Karlgren|first1=Jussi|author-link1=Jussi Karlgren|last2=Cutting|first2=Douglass|author-link2=Doug Cutting|title=विभेदक विश्लेषण का उपयोग करके सरल मेट्रिक्स के साथ पाठ शैलियों को पहचानना|journal=Proceedings of the International Conference on Computational Linguistics|volume=2|pages=1071|date=1994|doi=10.3115/991250.991324|bibcode=1994cmp.lg...10008K|arxiv=cmp-lg/9410008|s2cid=1297432}}</ref> | ||
प्राथमिक स्टाइलोमेट्रिक विधि [[लेखक अपरिवर्तनीय]] है: किसी दिए गए लेखक द्वारा लिखे गए सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने वाले विश्लेषण को स्वीकार करने के लिए सभी ग्रंथों, या कम से कम सभी ग्रंथों द्वारा समान रूप से रखी गई संपत्ति लेखक अपरिवर्तनीय का उदाहरण लेखक द्वारा प्रयुक्त [[फ़ंक्शन शब्द|फलन शब्द]] की आवृत्ति है। | प्राथमिक स्टाइलोमेट्रिक विधि [[लेखक अपरिवर्तनीय]] है: किसी दिए गए लेखक द्वारा लिखे गए सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने वाले विश्लेषण को स्वीकार करने के लिए सभी ग्रंथों, या कम से कम सभी ग्रंथों द्वारा समान रूप से रखी गई संपत्ति लेखक अपरिवर्तनीय का उदाहरण लेखक द्वारा प्रयुक्त [[फ़ंक्शन शब्द|फलन शब्द]] की आवृत्ति है। | ||
Line 101: | Line 99: | ||
स्टाइलोमेट्रिक डेटा को [[जिपफ-मंडेलब्रॉट कानून|जिपफ-मंडेलब्रॉट नियम]] के अनुसार वितरित किया जाता है। वितरण अत्यंत कांटेदार और [[ लेप्टोकुर्टिक |लेप्टोकुर्टिक]] है, इस प्रकार यही कारण है कि शोधकर्ता इसे हल करने के लिए आंकड़ों का उपयोग नहीं कर सकता है। लेखकत्व एट्रिब्यूशन समस्याएं. फिर भी, [[डेटा परिवर्तन (सांख्यिकी)]] को क्रियान्वित करके गाऊसी सांख्यिकी का उपयोग पूरी तरह से संभव है।<ref>Van Droogenbroeck F.J., "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics" (2019) [https://www.academia.edu/40029629]</ref> | स्टाइलोमेट्रिक डेटा को [[जिपफ-मंडेलब्रॉट कानून|जिपफ-मंडेलब्रॉट नियम]] के अनुसार वितरित किया जाता है। वितरण अत्यंत कांटेदार और [[ लेप्टोकुर्टिक |लेप्टोकुर्टिक]] है, इस प्रकार यही कारण है कि शोधकर्ता इसे हल करने के लिए आंकड़ों का उपयोग नहीं कर सकता है। लेखकत्व एट्रिब्यूशन समस्याएं. फिर भी, [[डेटा परिवर्तन (सांख्यिकी)]] को क्रियान्वित करके गाऊसी सांख्यिकी का उपयोग पूरी तरह से संभव है।<ref>Van Droogenbroeck F.J., "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics" (2019) [https://www.academia.edu/40029629]</ref> | ||
===[[तंत्रिका नेटवर्क]]=== | ===[[तंत्रिका नेटवर्क]]=== | ||
तंत्रिका नेटवर्क, सांख्यिकीय मशीन सीखने के विधियों का विशेष स्थिति, का उपयोग ग्रंथों के लेखकत्व का विश्लेषण करने के लिए किया गया है। निर्विवाद लेखकत्व के ग्रंथों का उपयोग तंत्रिका नेटवर्क को [[पश्चप्रचार]] जैसी प्रक्रियाओं द्वारा प्रशिक्षित करने के लिए किया जाता है, जैसे कि प्रशिक्षण त्रुटि की गणना की जाती है और स्पष्टता बढ़ाने के लिए प्रक्रिया को अद्यतन करने के लिए उपयोग किया जाता है। इस प्रकार गैर-रेखीय प्रतिगमन के समान प्रक्रिया के माध्यम से, नेटवर्क नए पाठों के लिए अपनी पहचान क्षमता को सामान्यीकृत करने की क्षमता प्राप्त करता है, जिसे अभी तक प्रदर्शित नहीं किया गया है, और इस प्रकार उन्हें आत्मविश्वास की निश्चित डिग्री के अनुसार वर्गीकृत किया जाता है। ऐसी तकनीकों को विलियम शेक्सपियर के उनके समकालीन जॉन फ्लेचर (नाटककार) और [[क्रिस्टोफर मार्लो]] के साथ सहयोग के लंबे समय से चले आ रहे प्रमाणों पर क्रियान्वित किया गया था,<ref>{{cite journal |last1=Matthews |first1=Robert A. J. |last2=Merriam |first2=Thomas V. N |title=Neural Computation in Stylometry I: An Application to the Works of Shakespeare and Fletcher |journal=Literary and Linguistic Computing |date=1993 |volume=8 |issue=4 |pages=203–209 |doi=10.1093/llc/8.4.203}}</ref><ref>{{cite journal |last1=Merriam |first1=Thomas V. N |last2=Matthews |first2=Robert A. J. |title=Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe |journal=Literary and Linguistic Computing |date=1994 |volume=9 |issue=1 |pages=1–6 |doi=10.1093/llc/9.1.1}}</ref> और अधिक पारंपरिक विद्वता के आधार पर इस राय की पुष्टि की कि ऐसा सहयोग वास्तव में हुआ था। | तंत्रिका नेटवर्क, सांख्यिकीय मशीन सीखने के विधियों का विशेष स्थिति, का उपयोग ग्रंथों के लेखकत्व का विश्लेषण करने के लिए किया गया है। इस प्रकार निर्विवाद लेखकत्व के ग्रंथों का उपयोग तंत्रिका नेटवर्क को [[पश्चप्रचार]] जैसी प्रक्रियाओं द्वारा प्रशिक्षित करने के लिए किया जाता है, जैसे कि प्रशिक्षण त्रुटि की गणना की जाती है और स्पष्टता बढ़ाने के लिए प्रक्रिया को अद्यतन करने के लिए उपयोग किया जाता है। इस प्रकार गैर-रेखीय प्रतिगमन के समान प्रक्रिया के माध्यम से, नेटवर्क नए पाठों के लिए अपनी पहचान क्षमता को सामान्यीकृत करने की क्षमता प्राप्त करता है, जिसे अभी तक प्रदर्शित नहीं किया गया है, और इस प्रकार उन्हें आत्मविश्वास की निश्चित डिग्री के अनुसार वर्गीकृत किया जाता है। ऐसी तकनीकों को विलियम शेक्सपियर के उनके समकालीन जॉन फ्लेचर (नाटककार) और [[क्रिस्टोफर मार्लो]] के साथ सहयोग के लंबे समय से चले आ रहे प्रमाणों पर क्रियान्वित किया गया था,<ref>{{cite journal |last1=Matthews |first1=Robert A. J. |last2=Merriam |first2=Thomas V. N |title=Neural Computation in Stylometry I: An Application to the Works of Shakespeare and Fletcher |journal=Literary and Linguistic Computing |date=1993 |volume=8 |issue=4 |pages=203–209 |doi=10.1093/llc/8.4.203}}</ref><ref>{{cite journal |last1=Merriam |first1=Thomas V. N |last2=Matthews |first2=Robert A. J. |title=Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe |journal=Literary and Linguistic Computing |date=1994 |volume=9 |issue=1 |pages=1–6 |doi=10.1093/llc/9.1.1}}</ref> और अधिक पारंपरिक विद्वता के आधार पर इस राय की पुष्टि की कि ऐसा सहयोग वास्तव में हुआ था। | ||
1999 के अध्ययन से पता चला कि तंत्रिका नेटवर्क आयोजन उन कविताओं के लेखकत्व को निर्धारित करने में 70% स्पष्टता तक पहुंच गया था, इस प्रकार जिनका उसने अभी तक विश्लेषण नहीं किया था। व्रीजे यूनिवर्सिटिट के इस अध्ययन में केवल डेन जैसे अक्षर अनुक्रमों का उपयोग करके तीन डच लेखकों की कविताओं की पहचान की जांच की गई थी।<ref name="oxfordjournalsllc">{{cite journal|author=JF Hoorn|author2=SL Frank|author3=W Kowalczyk|author4=F van der Ham |title=अक्षर अनुक्रमों का उपयोग करके कवियों की तंत्रिका नेटवर्क पहचान|journal=Literary and Linguistic Computing|volume=14|issue=3|pages=311–338|date=2012-09-03 |doi=10.1093/llc/14.3.311}}</ref> एक अध्ययन में निरंतर प्रमाणीकरण (सीए) के लिए क्रियान्वित लेखकत्व सत्यापन मॉडल के लिए गहन विश्वास नेटवर्क (डीबीएन) का उपयोग किया गया था।<ref name="BROC2017">{{cite journal | last1 = Brocardo | first1 = ML | last2 = Traore | first2 = I | last3 = Woungang | first3 = I | last4 = Obaidat | first4 = MS | year = 2017 | title = गहरे विश्वास नेटवर्क सिस्टम का उपयोग करके लेखकत्व सत्यापन| journal = Int J Commun Syst | volume = 30| issue = 12| page = e3259| doi = 10.1002/dac.3259 | s2cid = 40745740 }}</ref> विश्लेषण की इस पद्धति के साथ समस्या यह है कि नेटवर्क अपने प्रशिक्षण समूह के आधार पर पक्षपाती हो सकता है, इस प्रकार संभवतः उन लेखकों का चयन करना जिनका नेटवर्क ने अधिक बार विश्लेषण किया है।<ref name="oxfordjournalsllc"/> | 1999 के अध्ययन से पता चला कि तंत्रिका नेटवर्क आयोजन उन कविताओं के लेखकत्व को निर्धारित करने में 70% स्पष्टता तक पहुंच गया था, इस प्रकार जिनका उसने अभी तक विश्लेषण नहीं किया था। व्रीजे यूनिवर्सिटिट के इस अध्ययन में केवल डेन जैसे अक्षर अनुक्रमों का उपयोग करके तीन डच लेखकों की कविताओं की पहचान की जांच की गई थी।<ref name="oxfordjournalsllc">{{cite journal|author=JF Hoorn|author2=SL Frank|author3=W Kowalczyk|author4=F van der Ham |title=अक्षर अनुक्रमों का उपयोग करके कवियों की तंत्रिका नेटवर्क पहचान|journal=Literary and Linguistic Computing|volume=14|issue=3|pages=311–338|date=2012-09-03 |doi=10.1093/llc/14.3.311}}</ref> एक अध्ययन में निरंतर प्रमाणीकरण (सीए) के लिए क्रियान्वित लेखकत्व सत्यापन मॉडल के लिए गहन विश्वास नेटवर्क (डीबीएन) का उपयोग किया गया था।<ref name="BROC2017">{{cite journal | last1 = Brocardo | first1 = ML | last2 = Traore | first2 = I | last3 = Woungang | first3 = I | last4 = Obaidat | first4 = MS | year = 2017 | title = गहरे विश्वास नेटवर्क सिस्टम का उपयोग करके लेखकत्व सत्यापन| journal = Int J Commun Syst | volume = 30| issue = 12| page = e3259| doi = 10.1002/dac.3259 | s2cid = 40745740 }}</ref> विश्लेषण की इस पद्धति के साथ समस्या यह है कि नेटवर्क अपने प्रशिक्षण समूह के आधार पर पक्षपाती हो सकता है, इस प्रकार संभवतः उन लेखकों का चयन करना जिनका नेटवर्क ने अधिक बार विश्लेषण किया है।<ref name="oxfordjournalsllc"/> | ||
===आनुवंशिक एल्गोरिदम=== | ===आनुवंशिक एल्गोरिदम=== | ||
[[जेनेटिक एल्गोरिद्म]] स्टाइलोमेट्री के लिए उपयोग की जाने वाली अन्य मशीन लर्निंग तकनीक है। इस प्रकार इसमें ऐसी विधि सम्मिलित | [[जेनेटिक एल्गोरिद्म]] स्टाइलोमेट्री के लिए उपयोग की जाने वाली अन्य मशीन लर्निंग तकनीक है। इस प्रकार इसमें ऐसी विधि सम्मिलित है जो नियमों के समूह से प्रारंभ होती है। उदाहरण नियम हो सकता है, यदि प्रत्येक हजार शब्दों में 1.7 बार से अधिक प्रकट होता है, जिससे टेक्स्ट लेखक एक्स है। आयोजन टेक्स्ट के साथ प्रस्तुत किया गया है और लेखकत्व निर्धारित करने के लिए नियमों का उपयोग करता है। इस प्रकार नियमों का परीक्षण ज्ञात पाठों के समूह के विरुद्ध किया जाता है और प्रत्येक नियम को फिटनेस स्कोर दिया जाता है। सबसे कम अंक वाले 50 नियमों का उपयोग नहीं किया जाता है। अतिरिक्त 50 नियमों में छोटे-छोटे बदलाव किए गए हैं और 50 नए नियम लाए गए हैं। इसे तब तक दोहराया जाता है जब तक कि विकसित नियम पाठों का सही विवरण नही देते है। | ||
===विरल जोड़े=== | ===विरल जोड़े=== | ||
शैली की पहचान करने की विधि को विरल जोड़े कहा जाता है, और यह संयोजन की व्यक्तिगत आदतों पर निर्भर करता है। किसी विशेष लेखक के लिए कुछ शब्दों का उपयोग, अन्य पूर्वानुमानित शब्दों के उपयोग के साथ अज्ञात रूप से जुड़ा हो सकता है। | शैली की पहचान करने की विधि को विरल जोड़े कहा जाता है, और यह संयोजन की व्यक्तिगत आदतों पर निर्भर करता है। इस प्रकार किसी विशेष लेखक के लिए कुछ शब्दों का उपयोग, अन्य पूर्वानुमानित शब्दों के उपयोग के साथ अज्ञात रूप से जुड़ा हो सकता है। | ||
==त्वरित संदेश सेवा में लेखकत्व एट्रिब्यूशन== | ==त्वरित संदेश सेवा में लेखकत्व एट्रिब्यूशन== | ||
Line 128: | Line 124: | ||
==टिप्पणियाँ== | ==टिप्पणियाँ== | ||
{{Reflist|30em}} | {{Reflist|30em}} | ||
==संदर्भ== | ==संदर्भ== | ||
Line 155: | Line 150: | ||
* {{cite journal |last1=Zenkov |first1=Andrei V. |title=A Method of Text Attribution Based on the Statistics of Numerals |journal=Journal of Quantitative Linguistics |date=2018 |volume=25 |issue=3 |pages=256–270 |doi=10.1080/09296174.2017.1371915|s2cid=49692378 }} | * {{cite journal |last1=Zenkov |first1=Andrei V. |title=A Method of Text Attribution Based on the Statistics of Numerals |journal=Journal of Quantitative Linguistics |date=2018 |volume=25 |issue=3 |pages=256–270 |doi=10.1080/09296174.2017.1371915|s2cid=49692378 }} | ||
* {{ Cite book | doi = 10.18653/v1/2022.acl-long.509 | doi-access = free | arxiv = 2203.11849 | chapter = A Girl Has A Name, And It's ... Adversarial Authorship Attribution for Deobfuscation | title = Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) | year = 2022 | last1 = Zhai | first1 = Wanyue | last2 = Rusert | first2 = Jonathan | last3 = Shafiq | first3 = Zubair | last4 = Srinivasan | first4 = Padmini | pages = 7372–7384 | s2cid = 248780012 }} | * {{ Cite book | doi = 10.18653/v1/2022.acl-long.509 | doi-access = free | arxiv = 2203.11849 | chapter = A Girl Has A Name, And It's ... Adversarial Authorship Attribution for Deobfuscation | title = Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) | year = 2022 | last1 = Zhai | first1 = Wanyue | last2 = Rusert | first2 = Jonathan | last3 = Shafiq | first3 = Zubair | last4 = Srinivasan | first4 = Padmini | pages = 7372–7384 | s2cid = 248780012 }} | ||
===अग्रिम पठन=== | ===अग्रिम पठन=== | ||
See also the academic journal ''Literary and Linguistic Computing'', now ''Digital Scholarship in the Humanities'' (published by the [[University of Oxford]]) and the ''Language Resources and Evaluation'' journal (previously ''Computers and the Humanities''). | See also the academic journal ''Literary and Linguistic Computing'', now ''Digital Scholarship in the Humanities'' (published by the [[University of Oxford]]) and the ''Language Resources and Evaluation'' journal (previously ''Computers and the Humanities''). | ||
==बाहरी संबंध== | ==बाहरी संबंध== | ||
*[http://www.ach.org/ Association for Computers and the Humanities] | *[http://www.ach.org/ Association for Computers and the Humanities] | ||
Line 170: | Line 159: | ||
*[https://github.com/evllabs/JGAAP ''JGAAP'' Authorship Attribution Program] | *[https://github.com/evllabs/JGAAP ''JGAAP'' Authorship Attribution Program] | ||
*[https://www.npr.org/2013/07/26/205794448/uncovering-the-mystery-of-j-k-rowlings-latest-novel Uncovering the Mystery of J.K. Rowling's Latest Novel] | *[https://www.npr.org/2013/07/26/205794448/uncovering-the-mystery-of-j-k-rowlings-latest-novel Uncovering the Mystery of J.K. Rowling's Latest Novel] | ||
[[Category: | [[Category:Articles with hatnote templates targeting a nonexistent page]] | ||
[[Category:CS1 English-language sources (en)]] | |||
[[Category:CS1 errors]] | |||
[[Category:CS1 español-language sources (es)]] | |||
[[Category:CS1 maint]] | |||
[[Category:Citation Style 1 templates|M]] | |||
[[Category:Collapse templates]] | |||
[[Category:Created On 06/07/2023]] | [[Category:Created On 06/07/2023]] | ||
[[Category:Lua-based templates]] | |||
[[Category:Machine Translated Page]] | |||
[[Category:Navigational boxes| ]] | |||
[[Category:Navigational boxes without horizontal lists]] | |||
[[Category:Pages with script errors]] | |||
[[Category:Sidebars with styles needing conversion]] | |||
[[Category:Template documentation pages|Documentation/doc]] | |||
[[Category:Templates Translated in Hindi]] | |||
[[Category:Templates Vigyan Ready]] | |||
[[Category:Templates based on the Citation/CS1 Lua module]] | |||
[[Category:Templates generating COinS|Cite magazine]] | |||
[[Category:Templates generating microformats]] | |||
[[Category:Templates that add a tracking category]] | |||
[[Category:Templates that are not mobile friendly]] | |||
[[Category:Templates that generate short descriptions]] | |||
[[Category:Templates using TemplateData]] | |||
[[Category:Wikipedia fully protected templates|Cite magazine]] | |||
[[Category:Wikipedia metatemplates]] | |||
[[Category:अध्ययन के कम्प्यूटेशनल क्षेत्र]] | |||
[[Category:डिजिटल मानविकी]] | |||
[[Category:निजी पहचान]] | |||
[[Category:फोरेंसिक अनुशासन]] | |||
[[Category:मात्रात्मक भाषाविज्ञान]] | |||
[[Category:लेखकीय बहस]] | |||
[[Category:शैलीविज्ञान]] |
Latest revision as of 10:19, 2 August 2023
Part of a series on |
Linguistics |
---|
Portal |
स्टाइलोमेट्री सामान्यतः लिखित भाषा में स्टाइलिस्टिक्स (भाषाविज्ञान) का अनुप्रयोग है।[1] इस प्रकार इसे संगीत पर भी सफलतापूर्वक क्रियान्वित किया गया है,[2] चित्रों,[3] और चेस[4] अन्य अवधारणा इसे भाषाई अनुशासन के रूप में परिभाषित करती है जो किसी लेखक की शैली का मूल्यांकन उनके कार्य के लिए सांख्यिकीय विश्लेषण के अनुप्रयोग के माध्यम से करता है।[5]
स्टाइलोमेट्री का उपयोग अधिकांशतः अज्ञात कार्य या विवादित दस्तावेज़ों को लेखकत्व देने के लिए किया जाता है।[6] इसमें नियमबद्ध के साथ-साथ अकादमिक और साहित्यिक अनुप्रयोग भी हैं, जिसमें शेक्सपियर एट्रिब्यूशन अध्ययन के प्रश्न से लेकर फोरेंसिक भाषा विज्ञान तक शेक्सपियर के कार्यों के लेखकत्व और टेक्स्ट पठनीयता के विश्लेषण के साथ पद्धतिगत समानताएं हैं।
इस प्रकार स्टाइलोमेट्री का उपयोग छद्म नाम वाले या अज्ञात लेखकों को अनावृत करने के लिए, या पूर्ण पहचान के अभाव में लेखक के बारे में कुछ जानकारी प्रकट करने के लिए किया जा सकता है। इस प्रकार लेखक अपने संचार की सार्थक पदार्थ को बदले बिना अपनी स्वयं की शैलीगत विशेषताओं को समाप्त करके इस पहचान का विरोध करने के लिए प्रतिकूल शैलीमिति का उपयोग कर सकते हैं। इस प्रकार यह उन विश्लेषणों को पराजित कर सकता है जो इसकी संभावना को ध्यान में नहीं रखते हैं, किन्तु प्रतिकूल वातावरण में स्टाइलोमेट्री की अंतिम प्रभावशीलता अनिश्चित है: स्टाइलोमेट्रिक पहचान विश्वसनीय नहीं हो सकती है, किन्तु न ही गैर-पहचान की आश्वासन दी जा सकती है; प्रतिकूल शैलीमिति का अभ्यास स्वयं पता लगाने योग्य हो सकता है।
इतिहास
इस प्रकार प्रामाणिकता लेखक की पहचान और अन्य प्रश्नों के प्रमाण के लिए ग्रंथों का विश्लेषण करने की पुरानी तकनीकों से स्टाइलोमेट्री का विकास हुआ था।
अनुशासन के आधुनिक अभ्यास को अंग्रेजी पुनर्जागरण नाटक में लेखकीय समस्याओं के अध्ययन से प्रचार मिला था। इस प्रकार शोधकर्ताओं और पाठकों ने देखा कि उस युग के कुछ नाटककारों की भाषा प्राथमिकताओं के विशिष्ट क्रम थे, और उन्होंने अनिश्चित या सहयोगात्मक कार्यों के लेखकों की पहचान करने के लिए उन क्रम का उपयोग करने का प्रयास किया गया। प्रारंभिक प्रयास सदैव सफल नहीं रहे: जो की 1901 में, शोधकर्ता ने जॉन फ्लेचर (नाटककार) या जॉन फ्लेचर की पसंद 'em को, उनके संकुचनात्मक रूप को, उनके सहयोग में फ्लेचर और फिलिप मासिंगर के बीच अंतर करने के लिए मार्कर के रूप में उपयोग करने का प्रयास किया था किन्तु उन्होंने गलती से मैसिंगर के कार्यों का संस्करण नियोजित कर दिया जिसमें संपादक ने 'em के सभी उदाहरणों का विस्तार किया था।[7]
स्टाइलोमेट्री की मूल बातें पोलिश दार्शनिक विंसेंटी लुटोस्लाव्स्की द्वारा प्रिंसिपेस डी स्टाइलोमेट्री (1890) में स्थापित की गई थीं। इस प्रकार लुटोस्लाव्स्की ने प्लेटो के संवादों का कालक्रम विकसित करने के लिए इस पद्धति का उपयोग किया गया था।[8]
इस प्रकार बड़ी मात्रा में डेटा का विश्लेषण करने के लिए कंप्यूटर और उनकी क्षमताओं के विकास ने इस प्रकार के प्रयास को परिमाण के क्रम में बढ़ाया। चूंकि, डेटा विश्लेषण के लिए कंप्यूटर की महान क्षमता अच्छी गुणवत्ता वाले आउटपुट की आश्वासन नहीं देती है। 1960 के दशक की प्रारंभिक में, रेव. ए. क्यू. मॉर्टन ने सेंट पॉल को उत्तरदायी ठहराते हुए न्यू टेस्टामेंट के चौदह पत्रों का कंप्यूटर विश्लेषण तैयार किया, जिसने संकेत दिया कि छह अलग-अलग लेखकों ने उस कार्य को लिखा था। जेम्स जॉयस के कार्यों पर क्रियान्वित की गई उनकी पद्धति की जांच से यह परिणाम मिला कि यूलिसिस (उपन्यास), जॉयस का बहु-परिप्रेक्ष्य, बहु-शैली उपन्यास, पांच अलग-अलग व्यक्तियों द्वारा रचा गया था, इस प्रकार जिनमें से किसी का भी स्पष्ट रूप से क्राफ्टिंग में कोई भाग नहीं था। जॉयस का पहला उपन्यास, युवा व्यक्ति के रूप में कलाकार का चित्र [9] चूंकि, समय के साथ और अभ्यास के साथ, शोधकर्ताओं और विद्वानों ने उत्तम परिणाम प्राप्त करने के लिए अपने विधियों को परिष्कृत किया है। उल्लेखनीय प्रारंभिक सफलता फ्रेडरिक मोस्टेलर और डेविड वालेस द्वारा द फेडरलिस्ट पेपर्स के बारह के विवादित लेखकत्व का समाधान था।[10] चूंकि प्रारंभिक मान्यताओं और विधियों से संबंधित अभी भी प्रश्न हैं (और, संभवतः, सदैव रहेंगे), इस प्रकार अब कुछ लोग इस मूल आधार पर विवाद करते हैं कि लिखित ग्रंथों का भाषाई विश्लेषण मूल्यवान जानकारी और अंतर्दृष्टि उत्पन्न कर सकता है। (वास्तव में, यह कंप्यूटर के आगमन से पहले भी स्पष्ट था: साइरस होय और अन्य लोगों द्वारा फ्लेचर कैनन में पाठ्य/भाषाई विश्लेषण के सफल अनुप्रयोग से 1950 के दशक के अंत और 1960 के दशक की प्रारंभिक में स्पष्ट परिणाम मिले थे।)
अनुप्रयोग
स्टाइलोमेट्री के अनुप्रयोगों में साहित्यिक अध्ययन, ऐतिहासिक अध्ययन, सामाजिक अध्ययन, सूचना पुनर्प्राप्ति और कई फोरेंसिक स्थितियों और अध्ययन सम्मिलित हैं।[11][12] इसे कोड स्टाइलोमेट्री पर भी क्रियान्वित किया जा सकता है [13] और पदार्थ समानता का पता लगाना या स्टाइलोमेट्री जो दस्तावेज़ के अंदर लेखन शैली में परिवर्तन के आधार पर साहित्यिक चोरी का पता लगाना है।[14] इस प्रकार स्टाइलोमेट्री का उपयोग यह अनुमान लगाने के लिए भी किया जा सकता है कि कोई व्यक्ति अपनी कीस्ट्रोक गतिशीलता के आधार पर अंग्रेजी बोलने वाला है या नहीं बोलने वाला है।[15]
एक विधि के रूप में स्टाइलोमेट्री पुनरीक्षण के समय टेक्स्ट के विरूपण के प्रति संवेदनशील है।[16] लेखक द्वारा अपने करियर के समय विभिन्न शैलियों को अपनाने का भी स्थिति है, जैसा कि प्लेटो के स्थितियों में प्रदर्शित किया गया था, जिन्होंने सुकराती समस्या को संबोधित करने वाले प्रारंभिक और मध्य संवादों के लिए अपनाई गई विभिन्न शैलीगत नीतियों को चुना था।[17]
सुविधाएँ
लेखकीय विशेषता के लिए इंटरेस्ट की पाठ्य विशेषताएं ओर विशिष्ट अभिव्यक्तियों या निर्माणों की घटनाओं की गणना करना है (उदाहरण के लिए यह जांचना कि लेखक इंटरपंक्शन का उपयोग कैसे करता है या कितनी बार लेखक एजेंट रहित निष्क्रिय निर्माणों का उपयोग करता है) और दूसरी ओर पठनीयता विश्लेषण के लिए उपयोग किए जाने वाले समान हैं जैसे शाब्दिक भिन्नता और वाक्यविन्यास भिन्नता के उपाय है [18] चूंकि लेखकों के पास अधिकांशतः कुछ विषयों के लिए प्राथमिकताएं होती हैं, इसलिए लेखकत्व गुण में शोध प्रयोग फीचर समूह से संज्ञा, विशेषण और क्रिया जैसे पदार्थ शब्दों को हटा देते हैं, केवल टेक्स्ट के संरचनात्मक तत्वों को बनाए रखते हैं जिससे लेखक की विशेषताओं के अतिरिक्त विषय पर उनके मॉडल को ओवरफिट करने से बचा जा सकता है। [19][20] इस प्रकार शैलीगत विशेषताओं की गणना अधिकांशतः किसी टेक्स्ट या किसी लेखक के संपूर्ण एकत्रित कार्यों के औसत के रूप में की जाती है, जिससे औसत शब्द लंबाई या औसत वाक्य लंबाई जैसे माप प्राप्त होते हैं। यह मॉडल को उन लेखकों की पहचान करने में सक्षम बनाता है जिनके पास शब्दाडंबरपूर्ण या संक्षिप्त वाक्यों के लिए स्पष्ट प्राथमिकता है किन्तु भिन्नता छिपाते हैं: लंबे और छोटे वाक्यों के मिश्रण वाले लेखक का औसत निरंतर मध्य-लंबाई वाले वाक्यों वाले लेखक के समान होता है। इस तरह की भिन्नता को पकड़ने के लिए, कुछ प्रयोग औसत देखी गई आवृत्तियों के अतिरिक्त अवलोकनों पर अनुक्रमों या क्रम का उपयोग करते हैं, उदाहरण के लिए नोटिंग कि लेखक निश्चित तनाव या बल क्रम के लिए प्राथमिकता दिखाता है, [21][22] या कि लेखक छोटे वाक्य के साथ लंबे वाक्यों का क्रम अपनाता है। [23][24] इस प्रकार मेंडेनहॉल द्वारा लेखकत्व की पहचान के सबसे पहले विधियों में से एक अपने अवलोकनों को बिना औसत किए एकत्रित करना कहा जा सकता है।[25]
वर्तमान लेखकत्व एट्रिब्यूशन मॉडल लेखक की शैली के लिए जो विशिष्ट है उसे स्वचालित रूप से कैप्चर करने के लिए शब्द एम्बेडिंग का उपयोग करते हैं, इस प्रकार किन्तु वे अधिक पारंपरिक मॉडल के समान कारणों से विवेकपूर्ण फीचर इंजीनियरिंग पर भी विश्वास करते हैं।[26][27]
एडवर्सरियल स्टाइलोमेट्री
एडवरसैरियल स्टाइलोमेट्री लेखक की पहचान या उनकी विशेषताओं की खोज करने के लिए स्टाइलोमेट्री की क्षमता को कम करने के लिए लेखन शैली को बदलने का अभ्यास है।[28] इस कार्य को लेखकत्व अस्पष्टता या लेखकत्व अज्ञातीकरण के रूप में भी जाना जाता है। स्टाइलोमेट्री अस्पष्ट लेखकों को अनावृत करने या छद्म नामों को किसी लेखक की अन्य पहचान से जोड़ने की क्षमता में महत्वपूर्ण गोपनीयता चुनौती प्रस्तुत करती है,[29] जो, उदाहरण के लिए, व्हिसिलब्लोअर के लिए कठिनाइयाँ उत्पन्न करता है,[30] कार्यकर्ता,[31] और धोखाधड़ी करने वाले और धोखेबाज़ [32] यंत्र अधिगम तकनीक और टेक्स्ट निगम विकसित होने के कारण गोपनीयता कठिन परिस्थिति बढ़ने की उम्मीद है।[33]
सभी प्रतिकूल शैलीमिति स्रोत टेक्स्ट को ईमानदारी से व्याख्या (कम्प्यूटेशनल भाषाविज्ञान) करने के मूल विचार को साझा करती है जिससे अर्थ अपरिवर्तित रहे किन्तु शैलीगत संकेत अस्पष्ट रहें है।[34][35] इस प्रकार ऐसा विश्वसनीय पैराफ़्रेज़ स्टाइलोमेट्रिक क्लासिफायरियर के लिए प्रतिकूल उदाहरण है।[36] इसके लिए कई व्यापक दृष्टिकोण उपस्थित हैं, कुछ ओवरलैप के साथ: प्रतिलिपि , लेखक की अपनी शैली को दूसरे की शैली से प्रतिस्थापित करता है; अनुवाद, मशीनी अनुवाद को इस आशा के साथ क्रियान्वित करना कि यह स्रोत टेक्स्ट में विशिष्ट शैली को समाप्त कर देता है; और अस्पष्टता, किसी टेक्स्ट की शैली को साभिप्राय संशोधित करना जिससे वह लेखक की अपनी शैली से मेल नही खाते है।[34]
शैली को मैन्युअल रूप से अस्पष्ट करना संभव है, किन्तु श्रमसाध्य;[37] कुछ परिस्थितियों में, यह उत्तम या आवश्यक है।[38] स्वचालित टूलींग, या तो अर्ध- या पूर्ण-स्वचालित, लेखक की सहायता कर सकती है।[37] इस प्रकार कार्य को सर्वोत्तम विधि से कैसे निष्पादित किया जाए और ऐसे उपकरणों का डिज़ाइन संवृत शोध प्रश्न है।[39][33] जबकि कुछ दृष्टिकोणों को विशेष स्टाइलोमेट्रिक विश्लेषणों को पराजित करने में सक्षम दिखाया गया है,[40] विशेष रूप से वे जो प्रतिकूलता की संभावना को ध्यान में नहीं रखते हैं,[41] अज्ञात विश्लेषणों के सामने सुरक्षा स्थापित करना कथन है।[42] पैराफ़्रेज़ की विश्वसनीयता सुनिश्चित करना स्वचालित उपकरणों के लिए महत्वपूर्ण चुनौती है।[33]
यह अनिश्चित है कि प्रतिकूल स्टाइलोमेट्री का अभ्यास अपने आप में पता लगाने योग्य है या नहीं है। कुछ अध्ययनों में पाया गया है कि विशेष विधियों ने आउटपुट टेक्स्ट में सिग्नल उत्पन्न किए हैं, किन्तु स्टाइलोमेट्रिस्ट जो अनिश्चित है कि किन विधियों का उपयोग किया गया था, वह विश्वसनीय रूप से उनका पता लगाने में सक्षम नहीं हो सकता है।[33]
वर्तमान शोध
आधुनिक स्टाइलोमेट्री सांख्यिकीय विश्लेषण के लिए कंप्यूटर का उपयोग करती है, और कृत्रिम बुद्धि और इंटरनेट के माध्यम से उपलब्ध ग्रंथों के बढ़ते टेक्स्ट संग्रह तक पहुंच का उपयोग करती है।[43] सॉफ्टवेयर सिस्टम जैसे सिग्नेचर [44] (ऑक्सफोर्ड विश्वविद्यालय के डॉ. पीटर मिलिकन द्वारा निर्मित फ्रीवेयर), जेजीएएपी [45] (जावा ग्राफिकल ऑथरशिप एट्रिब्यूशन प्रोग्राम-डुक्सेन विश्वविद्यालय के डॉ. पैट्रिक जुओला द्वारा निर्मित फ्रीवेयर), स्टाइलो [46][47] (विभिन्न प्रकार के स्टाइलोमेट्रिक विश्लेषणों के लिए ओपन-सोर्स आर पैकेज, जिसमें ऑथरशिप एट्रिब्यूशन भी सम्मिलित है, इस प्रकार जिसे मैसीज एडर, जान रयबिकी और माइक केस्टेमोंट द्वारा विकसित किया गया है) और स्टाइलिन [48] डचों के लिए (एंटवर्प विश्वविद्यालय के प्रोफेसर वाल्टर डेलेमैन्स और गेन्ट विश्वविद्यालय के डॉ. वेरोनिक होस्टे द्वारा ऑनलाइन फ्रीवेयर) इसके उपयोग को गैर-विशेषज्ञों के लिए भी तेजी से व्यावहारिक बनाता है।
शैक्षणिक समिष्ट और आयोजन
स्टाइलोमेट्रिक विधियों का उपयोग कई शैक्षणिक विषयों के लिए किया जाता है, जैसे भाषाविज्ञान, कोशलेखन, या साहित्यिक अध्ययन के अनुप्रयोग के रूप में,[1] प्राकृतिक भाषा प्रसंस्करण और मशीन लर्निंग के संयोजन में, और साहित्यिक चोरी का पता लगाने, लेखकत्व विश्लेषण, या सूचना पुनर्प्राप्ति के लिए क्रियान्वित किया जाता है।[43]
फोरेंसिक भाषाविज्ञान
फोरेंसिक भाषाविदों का अंतर्राष्ट्रीय संघ (आईएएफएल) इंटरनेशनल एसोसिएशन ऑफ फोरेंसिक लिंग्विस्ट्स के द्विवार्षिक सम्मेलन (पोर्ट में 2016 में 13वां संस्करण) का आयोजन करता है और अपने केंद्रीय विषयों में से के रूप में फोरेंसिक स्टाइलिस्टिक्स के साथ द इंटरनेशनल जर्नल ऑफ स्पीच, लैंग्वेज एंड द लॉ प्रकाशित करता है।
एएएआई
आर्टिफिशियल इंटेलिजेंस की उन्नति के लिए एसोसिएशन (एएएआई) ने टेक्स्ट के व्यक्तिपरक और शैलीगत विश्लेषण पर कई आयोजनों की होस्ट की है।[49][50][51]
पैन
पैन कार्यशालाएँ (मूल रूप से, साहित्यिक चोरी विश्लेषण, लेखकत्व की पहचान, और निकट-डुप्लिकेट का पता लगाना, बाद में साहित्यिक चोरी, लेखकत्व और सामाजिक सॉफ़्टवेयर के दुरुपयोग को प्रदर्शित करने पर अधिक सामान्यतः कार्यशाला) 2007 से मुख्य रूप से सूचना पहुंच सम्मेलनों जैसे सूचना पर एसीएम विशेष इंटरेस्ट समूह के संयोजन में आयोजित की गईं थी। इस प्रकार पुनर्प्राप्ति, सूचना पुनर्प्राप्ति मूल्यांकन के लिए फ़ोरम, और मूल्यांकन फ़ोरम के सम्मेलन और प्रयोगशालाएँ पैन साहित्यिक चोरी का पता लगाने के लिए साझा चुनौती कार्य तैयार करता है,[52] लेखकत्व की पहचान,[53] लेखक लिंग पहचान,[54] लेखक प्रोफाइलिंग,[55] बर्बरता का पता लगाना,[56] और अन्य संबंधित टेक्स्ट विश्लेषण कार्य, जिनमें से कई स्टाइलोमेट्री पर निर्भर हैं।
इंटरेस्ट का केस अध्ययन
- 1439 में, लोरेंजो वल्ला ने दिखाया कि कॉन्स्टेंटाइन का दान जालसाजी था, यह तर्क आंशिक रूप से चौथी शताब्दी के प्रामाणिक दस्तावेजों में प्रयुक्त लैटिन के साथ तुलना पर आधारित था।
- 1952 में, स्वीडिश पादरी डिक हेलैंडर को स्ट्रांगनास का बिशप चुना गया था। अभियान प्रतिस्पर्धी था और इस प्रकार हेलैंडर पर स्ट्रांगनास के बिशप पद के मतदाताओं के लिए अन्य उम्मीदवारों के बारे में सैकड़ों अस्पष्ट अपमानजनक पत्रों की श्रृंखला लिखने का आरोप लगाया गया था। हेलैंडर को पहले पत्र लिखने का दोषी ठहराया गया और बिशप के रूप में अपना पद खो दिया था, इस प्रकार किन्तु बाद में आंशिक रूप से दोषमुक्त कर दिया गया था। पत्रों का अध्ययन कई स्टाइलोमेट्रिक उपायों (और टाइपराइटर विशेषताओं) और विभिन्न अदालती स्थितियों और आगे की परीक्षाओं का उपयोग करके किया गया था, जिनमें से कई को 1978 में उनकी मृत्यु तक हेलैंडर द्वारा स्वयं अनुबंधित किया गया था, स्टाइलोमेट्रिक विधि और साक्ष्य के रूप में इसके मूल्य पर कुछ विस्तार से चर्चा की गई थी। .[57][58]
- 1975 में, रोनाल्ड रीगन के कैलिफ़ोर्निया के गवर्नर के रूप में कार्य करने के बाद, उन्होंने सैकड़ों स्टेशनों को सिंडिकेटेड साप्ताहिक रेडियो कमेंट्री देना प्रारंभ किया था। इस प्रकार 2001 में उनके 90वें जन्मदिन पर उनके व्यक्तिगत नोट्स सार्वजनिक होने के बाद, अध्ययन में स्टाइलोस्टैटिस्टिकल विधियों का उपयोग करके यह निर्धारित किया गया कि उनमें से कौन सी इंटरैक्शन उनके द्वारा लिखी गई थी और कौन सी उनके विभिन्न सहयोगियों द्वारा लिखी गई थी।[59]
- 1996 में, वासर कॉलेज के प्रोफेसर डोनाल्ड फोस्टर (प्रोफेसर) द्वारा प्रस्तुत विवादास्पद, छद्म नाम से लिखी गई पुस्तक प्राथमिक रंग (उपन्यास) का स्टाइलोमेट्रिक विश्लेषण [60] लेखक की सही पहचान जो क्लेन के रूप में करने के बाद विषय को व्यापक दर्शकों के ध्यान में लाया गया। (हस्तलेख विश्लेषण द्वारा लेखकत्व की पुष्टि के बाद ही यह स्थिति सुलझाया गया।)
- 1996 में, यूनाबॉम्बर घोषणापत्र की तुलना संदिग्धों में से एक, थिओडोर कैज़िंस्की द्वारा लिखे गए पत्रों के साथ करने के लिए स्टाइलोमेट्रिक विधियों का उपयोग किया गया था, जिसके परिणामस्वरूप काकज़िनस्की की आशंका हुई और बाद में उसे दोषी ठहराया गया था।[61]
- अप्रैल 2015 में, स्टाइलोमेट्री तकनीकों का उपयोग करने वाले शोधकर्ताओं ने विलियम शेक्सपियर के कार्य के रूप में नाटक, दोहरा झूठ की पहचान की थी।[62][63] शोधकर्ताओं ने शेक्सपियर और जॉन फ्लेचर (नाटककार) के 54 नाटकों का विश्लेषण किया, और औसत वाक्य लंबाई की तुलना की, असामान्य शब्दों के उपयोग का अध्ययन किया था और इस प्रकार उनकी भाषा की जटिलता और मनोवैज्ञानिक वैधता (भाषा विज्ञान) की मात्रा निर्धारित की थी।
- 2016 में, मैकडोनाल्ड पी. जैक्सन, न्यूजीलैंड के ऑकलैंड विश्वविद्यालय में अंग्रेजी के एमेरिटस प्रोफेसर और न्यूजीलैंड की रॉयल सोसाइटी के फेलो, जिन्होंने अपना पूरा शैक्षणिक करियर लेखकत्व गुण का विश्लेषण करते हुए बिताया था, ने हू वॉट्ट द नाम से किताब लिखी थी। क्रिसमस से पहले की रात?: क्लेमेंट क्लार्क मूर बनाम का विश्लेषण हेनरी लिविंगस्टन प्रश्न,[64] जिसमें वह विरोधी तर्कों का मूल्यांकन करता है और, पहली बार, लंबे समय से चले आ रहे विवाद की जांच करने के लिए आधुनिक कम्प्यूटेशनल शैली विज्ञान की लेखक-एट्रिब्यूशन तकनीकों का उपयोग करता है। जैक्सन कई प्रकार के परीक्षणों को नियोजित करता है और नया, स्वरों का सांख्यिकीय विश्लेषण प्रस्तुत करता है; उन्होंने निष्कर्ष निकाला कि लिविंगस्टन क्लासिक कार्य के सच्चे लेखक हैं।
- 2017 में, साइमन फुलर और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने अध्ययन प्रकाशित किया जिसमें प्रमाणित किया गया कि बेस्टसेलिंग लेखक जेम्स पैटरसन अपने स्पष्ट रूप से सह-लेखक उपन्यासों में कोई लेखन नहीं करते हैं।[65][66][67] ओ'सुलिवन के अनुसार, पूर्व अमेरिकी राष्ट्रपति बिल क्लिंटन के साथ उनका सहयोग, राष्ट्रपति लापता है (उपन्यास), इस नियम का अपवाद है।[68]
- 2017 में, भाषाविदों, कंप्यूटर वैज्ञानिकों और विद्वानों के समूह ने ऐलेना फेरांटे के लेखकत्व का विश्लेषण किया था। पडुआ विश्वविद्यालय में बनाए गए कोष के आधार पर जिसमें 40 लेखकों द्वारा लिखे गए 150 उपन्यास सम्मिलित हैं, इस प्रकार उन्होंने फेरांटे की शैली का उसके सात उपन्यासों के आधार पर विश्लेषण किया था। उदाहरण के लिए, स्टाइलो का उपयोग करके वे उनकी लेखन शैली की तुलना 39 अन्य उपन्यासकारों से करने में सक्षम थे।[46] निष्कर्ष उन सभी के लिए समान था: डोमेनिको स्टारनोन ऐलेना फेरांटे के गुप्त लेखक हैं।[69]
- 2018 में, हार्वर्ड विश्वविद्यालय में सांख्यिकी के वरिष्ठ व्याख्याता, मार्क ग्लिकमैन ने हार्वर्ड के पूर्व सांख्यिकी छात्र रयान सॉन्ग और नोवा स्कोटिया में डलहौजी विश्वविद्यालय के प्रोफेसर जेसन ब्राउन के साथ कार्य किया, और यह पता लगाने के लिए स्टाइलोमेट्री का उपयोग किया कि, सबसे अधिक संभावना हैद बीटल्स का गीत मेरे जीवन में जॉन लेनन द्वारा रचा गया था, किन्तु 50% संभावना है कि पॉल मेकार्टनी ने मध्य आठ लिखा था।[70][71]
- 2019 में, ईटीएसओ प्रोजेक्ट: स्टाइलोमेट्री को स्पैनिश गोल्डन एज थिएटर में क्रियान्वित किया गया था,[72] इस प्रकार फिल्म का निर्देशन अल्वारो कुएलर गोंजालेज और जर्मन वेगा गार्सिया-लुएंगोस ने किया है। स्टाइलोमेट्रिकल विश्लेषण क्रियान्वित करने के बाद, महिलाओं और पालक बच्चों का श्रेय लोप डी वेगा को दिया गया [73][74] अनुमोदित किया गया था, और ला मोन्ज़ा अल्फ़ेरेज़ में लेखकत्व समस्या का पता चला था, जो पेरेज़ डी मोंटालबैन के लिए उत्तरदायी नाटक था, जो इन विश्लेषणों और ऐतिहासिक और भाषाविज्ञान अनुसंधान के माध्यम से, अंततः जुआन रुइज़ डी अलारकोन को उत्तरदायी ठहराया गया था।[75][76][77][78] इस प्रकार 2023 में, उसी प्रोजेक्ट में लोप डी वेगा को ला फ्रांसेसा लॉरा (द फ्रेंचवूमन लॉरा) के लेखक के रूप में पाया गया, जबकि पांडुलिपि उनकी मृत्यु के वर्षों बाद लिखी गई थी।[79] इस प्रकार कॉमेडी को लोप डी वेगा के दिवंगत कार्य के रूप में वर्गीकृत किया गया था और यह 1628 से 1630 तक की थी, क्योंकि फ्रांस के प्रति इसके पूर्ण व्यवहार का श्रेय तीस साल के युद्ध के समय स्पेन और फ्रांस के बीच क्षणिक अच्छे संबंधों को दिया जा सकता है, जिसमें इंग्लैंड सामान्य दुश्मन था। .[80] इस विश्लेषण में, जांच के अनुसार टेक्स्ट के 500 सबसे अधिक बार आने वाले शब्दों की तुलना बाकी कार्यों के 500 से की गई है। ला फ्रांसेसा लॉरा के स्थितियों में, खोज से पता चला कि जिन 100 कार्यों के साथ यह निकटतम था, उनमें से लगभग सभी लोप डी वेगा के थे। इस प्रकार कार्यों के लेखकत्व पर पारंपरिक भाषाविज्ञान विश्लेषण ने कृत्रिम बुद्धि की जांच की पुष्टि की है।[81]
- 2020 में, राचेल मैक्कार्थी और जेम्स ओ'सुल्लीवन (आयरिश अकादमिक) या जेम्स ओ'सुल्लीवन ने तर्क दिया कि एमिली ब्रोंटे वर्थरिंग हाइट्स की सच्ची लेखिका हैं, इस प्रकार जिससे कुछ आलोचकों की अटकलें समाप्त हो गईं कि उपन्यास उनके किसी भाई-बहन द्वारा लिखा गया हो सकता है, विशेष रूप से या तो ब्रैनवेल ब्रोंटे या चार्लोट ब्रोंटे ने किया था।[82]
- 2020 में, हार्टमुट इल्सेमैन ने आर स्टाइलो प्रोग्राम सूट से रोलिंग डेल्टा और रोलिंग क्लासीफाई का उपयोग यह दिखाने के लिए किया कि मार्लो कॉर्पस शैलीगत रूप से अमानवीय है, और दो टैम्बुरलेन्स के लेखक संभवतः ही मार्लो के शेष आधिकारिक कॉर्पस में उपस्थित थे।[83][84][85]
- 2022 में, इतालवी विद्वान सिमोन रेबोरा और मास्सिमो साल्गारो ने जॉन एफ. बरोज़ की "डेल्टा डिस्टेंस" पद्धति का उपयोग करते हुए दिखाया कि फ़ेलिक्स साल्टेन 1906 के अस्पष्ट उपन्यास जोसेफिन मटज़ेनबैकर के सबसे संभावित लेखक हैं, अंतिम पृष्ठों को बाहर रखा गया है।[86]
डेटा और विधियाँ
चूँकि स्टाइलोमेट्री में वर्णनात्मक उपयोग के दोनों स्थितियों हैं, जिनका उपयोग संग्रह की पदार्थ को चित्रित करने के लिए किया जाता है, और इस प्रकार पहचानात्मक उपयोग के स्थितियों, जैसे लेखकों या पाठों की श्रेणियों की पहचान करना, ऊपर दिए गए डेटा और सुविधाओं का विश्लेषण करने के लिए उपयोग की जाने वाली विधियां वस्तुओं को समूह में वर्गीकृत करने या फीचर भिन्नता के समिष्ट पर वस्तुओं को वितरित करने के लिए बनाई गई विधियों से भिन्न होती हैं। अधिकांश विधियाँ प्रकृति में सांख्यिकीय हैं, जैसे क्लस्टर विश्लेषण और विभेदक विश्लेषण, सामान्यतः भाषाविज्ञान डेटा और विशेषताओं पर आधारित होती हैं, और आधुनिक मशीन सीखने के विधियों के लिए उपयोगी अनुप्रयोग डोमेन हैं।
जबकि इसके पश्चात् , स्टाइलोमेट्री ने किसी टेक्स्ट के सबसे विरल या सबसे हड़ताली तत्वों पर बल दिया था, समकालीन तकनीकें भाषण के सामान्य भागो में भी पहचान क्रम को अलग कर सकती हैं। इस प्रकार अधिकांश प्रणालियाँ शाब्दिक आँकड़ों पर आधारित होती हैं, अर्थात टेक्स्ट (या उसके लेखक) को चित्रित करने के लिए टेक्स्ट में शब्दों और शब्दों की आवृत्तियों का उपयोग करता है। इस प्रकार इस संदर्भ में, सूचना पुनर्प्राप्ति के विपरीत, अंग्रेजी में सबसे सामान्य शब्द के देखे गए घटना क्रम उन सामयिक शब्दों की तुलना में अधिक रोचक हैं जो कम बार होते हैं।[87][88]
प्राथमिक स्टाइलोमेट्रिक विधि लेखक अपरिवर्तनीय है: किसी दिए गए लेखक द्वारा लिखे गए सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने वाले विश्लेषण को स्वीकार करने के लिए सभी ग्रंथों, या कम से कम सभी ग्रंथों द्वारा समान रूप से रखी गई संपत्ति लेखक अपरिवर्तनीय का उदाहरण लेखक द्वारा प्रयुक्त फलन शब्द की आवृत्ति है।
ऐसी ही विधि में, 50 सबसे सामान्य शब्दों को खोजने के लिए टेक्स्ट का विश्लेषण किया जाता है। फिर टेक्स्ट को 5,000 शब्द खंडों में विभाजित किया जाता है और उस खंड में उन 50 शब्दों की आवृत्ति का पता लगाने के लिए प्रत्येक खंड का विश्लेषण किया जाता है। यह प्रत्येक टुकड़े के लिए अद्वितीय 50-संख्या पहचानकर्ता उत्पन्न करता है। ये संख्याएँ टेक्स्ट के प्रत्येक भाग को 50-आयामी समिष्ट में बिंदु पर रखती हैं। इस 50-आयामी समिष्ट को प्रमुख घटक विश्लेषण (पीसीए) का उपयोग करके विमान में समतल किया गया है। इसके परिणामस्वरूप उन बिंदुओं का प्रदर्शन होता है जो लेखक की शैली के अनुरूप होते हैं। यदि दो साहित्यिक कृतियों को ही तल पर रखा जाता है, जिससे परिणामी क्रम यह दिखा सकता है कि क्या दोनों कृतियाँ ही लेखक या अलग-अलग लेखकों की हैं।
गाऊसी सांख्यिकी
स्टाइलोमेट्रिक डेटा को जिपफ-मंडेलब्रॉट नियम के अनुसार वितरित किया जाता है। वितरण अत्यंत कांटेदार और लेप्टोकुर्टिक है, इस प्रकार यही कारण है कि शोधकर्ता इसे हल करने के लिए आंकड़ों का उपयोग नहीं कर सकता है। लेखकत्व एट्रिब्यूशन समस्याएं. फिर भी, डेटा परिवर्तन (सांख्यिकी) को क्रियान्वित करके गाऊसी सांख्यिकी का उपयोग पूरी तरह से संभव है।[89]
तंत्रिका नेटवर्क
तंत्रिका नेटवर्क, सांख्यिकीय मशीन सीखने के विधियों का विशेष स्थिति, का उपयोग ग्रंथों के लेखकत्व का विश्लेषण करने के लिए किया गया है। इस प्रकार निर्विवाद लेखकत्व के ग्रंथों का उपयोग तंत्रिका नेटवर्क को पश्चप्रचार जैसी प्रक्रियाओं द्वारा प्रशिक्षित करने के लिए किया जाता है, जैसे कि प्रशिक्षण त्रुटि की गणना की जाती है और स्पष्टता बढ़ाने के लिए प्रक्रिया को अद्यतन करने के लिए उपयोग किया जाता है। इस प्रकार गैर-रेखीय प्रतिगमन के समान प्रक्रिया के माध्यम से, नेटवर्क नए पाठों के लिए अपनी पहचान क्षमता को सामान्यीकृत करने की क्षमता प्राप्त करता है, जिसे अभी तक प्रदर्शित नहीं किया गया है, और इस प्रकार उन्हें आत्मविश्वास की निश्चित डिग्री के अनुसार वर्गीकृत किया जाता है। ऐसी तकनीकों को विलियम शेक्सपियर के उनके समकालीन जॉन फ्लेचर (नाटककार) और क्रिस्टोफर मार्लो के साथ सहयोग के लंबे समय से चले आ रहे प्रमाणों पर क्रियान्वित किया गया था,[90][91] और अधिक पारंपरिक विद्वता के आधार पर इस राय की पुष्टि की कि ऐसा सहयोग वास्तव में हुआ था।
1999 के अध्ययन से पता चला कि तंत्रिका नेटवर्क आयोजन उन कविताओं के लेखकत्व को निर्धारित करने में 70% स्पष्टता तक पहुंच गया था, इस प्रकार जिनका उसने अभी तक विश्लेषण नहीं किया था। व्रीजे यूनिवर्सिटिट के इस अध्ययन में केवल डेन जैसे अक्षर अनुक्रमों का उपयोग करके तीन डच लेखकों की कविताओं की पहचान की जांच की गई थी।[92] एक अध्ययन में निरंतर प्रमाणीकरण (सीए) के लिए क्रियान्वित लेखकत्व सत्यापन मॉडल के लिए गहन विश्वास नेटवर्क (डीबीएन) का उपयोग किया गया था।[93] विश्लेषण की इस पद्धति के साथ समस्या यह है कि नेटवर्क अपने प्रशिक्षण समूह के आधार पर पक्षपाती हो सकता है, इस प्रकार संभवतः उन लेखकों का चयन करना जिनका नेटवर्क ने अधिक बार विश्लेषण किया है।[92]
आनुवंशिक एल्गोरिदम
जेनेटिक एल्गोरिद्म स्टाइलोमेट्री के लिए उपयोग की जाने वाली अन्य मशीन लर्निंग तकनीक है। इस प्रकार इसमें ऐसी विधि सम्मिलित है जो नियमों के समूह से प्रारंभ होती है। उदाहरण नियम हो सकता है, यदि प्रत्येक हजार शब्दों में 1.7 बार से अधिक प्रकट होता है, जिससे टेक्स्ट लेखक एक्स है। आयोजन टेक्स्ट के साथ प्रस्तुत किया गया है और लेखकत्व निर्धारित करने के लिए नियमों का उपयोग करता है। इस प्रकार नियमों का परीक्षण ज्ञात पाठों के समूह के विरुद्ध किया जाता है और प्रत्येक नियम को फिटनेस स्कोर दिया जाता है। सबसे कम अंक वाले 50 नियमों का उपयोग नहीं किया जाता है। अतिरिक्त 50 नियमों में छोटे-छोटे बदलाव किए गए हैं और 50 नए नियम लाए गए हैं। इसे तब तक दोहराया जाता है जब तक कि विकसित नियम पाठों का सही विवरण नही देते है।
विरल जोड़े
शैली की पहचान करने की विधि को विरल जोड़े कहा जाता है, और यह संयोजन की व्यक्तिगत आदतों पर निर्भर करता है। इस प्रकार किसी विशेष लेखक के लिए कुछ शब्दों का उपयोग, अन्य पूर्वानुमानित शब्दों के उपयोग के साथ अज्ञात रूप से जुड़ा हो सकता है।
त्वरित संदेश सेवा में लेखकत्व एट्रिब्यूशन
इंटरनेट के प्रसार ने लेखकत्व श्रेय का ध्यान ऑनलाइन टेक्स्ट (वेब पेज, ब्लॉग इत्यादि), इलेक्ट्रॉनिक संदेश (ई-मेल, ट्वीट, पोस्ट इत्यादि), और अन्य प्रकार की लिखित जानकारी की ओर समिष्टांतरित कर दिया है जो कि से बहुत छोटी हैं। इस प्रकार औसत पुस्तक, रंग, पृष्ठ लेआउट, फ़ॉन्ट, ग्राफिक्स , इमोटिकॉन इत्यादि जैसे अभिव्यंजक तत्वों के संदर्भ में बहुत कम औपचारिक और अधिक विविध है। इस प्रकार संरचना और वाक्यविन्यास दोनों के स्तर पर ऐसे तथ्यों को ध्यान में रखने के प्रयासों की सूचना दी गई थी।[94] इसके अतिरिक्त, साभिप्राय शैलीगत विकल्पों का विवरण करने के लिए पदार्थ-विशिष्ट और विशिष्ट संकेत (उदाहरण के लिए, विषय मॉडल और व्याकरण जांच उपकरण) प्रस्तुत किए गए थे।[95]
त्वरित संदेश द्वारा चैट की पदार्थ को वर्गीकृत करने के लिए मानक स्टाइलोमेट्रिक सुविधाओं को नियोजित किया गया है,[96] या प्रतिभागियों का व्यवहार,[97] किन्तु चैट प्रतिभागियों की पहचान करने के प्रयास अभी भी कम और प्रारंभिक हैं। इस प्रकार इसके अतिरिक्त, चैट डेटा और किसी अन्य प्रकार की लिखित जानकारी के बीच बड़ा अंतर होने के अतिरिक्त मौखिक इंटरैक्शन और चैट इंटरैक्शन के बीच समानता को उपेक्षा कर दिया गया है।
यह भी देखें
- डेटा पुनः पहचान
- डिजिटल वॉटरमार्किंग
- भाषाविज्ञान और मॉर्मन की पुस्तक या स्टाइलोमेट्री (वर्डप्रिंट अध्ययन) या भाषाविज्ञान और मॉर्मन की पुस्तक, स्टाइलोमेट्री (वर्डप्रिंट अध्ययन)
- मोशे युगल
- मात्रात्मक भाषाविज्ञान
- स्टेग्नोग्राफ़ी
- लिखोमुद्रण
टिप्पणियाँ
- ↑ 1.0 1.1 Argamon, Shlomo, Kevin Burns, and Shlomo Dubnov, eds. The structure of style: algorithmic approaches to understanding manner and meaning. Springer Science & Business Media, 2010.
- ↑ Westcott, Richard (15 June 2006). "हिट संगीत को एक विज्ञान बनाना". BBC News.
- ↑ Sethi, Ricky (2016-06-07). "कला को बेहतर ढंग से समझने के लिए कंप्यूटर का उपयोग करना". The Conversation. Retrieved 2021-12-01.
- ↑ McIlroy-Young, Reid; Wang, Yu; Sen, Siddhartha; Kleinberg, Jon; Anderson, Ashton (2021). Detecting Individual Decision-Making Style: Exploring Behavioral Stylometry in Chess. 35th Conference on Neural Information Processing Systems.
- ↑ Yang, Christopher C.; Chen, Hsinchun; Chau, Michael; Chang, Kuiyu; Lang, Sheau-Dong; Chen, Patrick; Carley, Kathleen M.; Hsieh, Raymond; Zeng, Daniel (2008). Intelligence and Security Informatics: IEEE ISI 2008 International Workshops: PAISI, PACCF and SOCO 2008, Taipei, Taiwan, June 17, 2008, Proceedings. Berlin: Springer Science & Business Media. p. 252. ISBN 9783540691365.
- ↑ Chen, Hsinchun; Yang, Christopher C.; Chau, Michael; Li, Shu-Hsing (2009). Intelligence and Security Informatics: Pacific Asia Workshop, PAISI 2009, Bangkok, Thailand, April 27, 2009. Proceedings. Berlin: Springer Science & Business Media. p. 15. ISBN 9783642013928.
- ↑ Samuel Schoenbaum, Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method, p. 171.
- ↑ Lutoslawski, W. (1898). "Principes de stylométrie appliqués à la chronologie des œuvres de Platon". Revue des Études Grecques. 11 (41): 61–81. doi:10.3406/reg.1898.5847. ISSN 0035-2039.
- ↑ Samuel Schoenbaum, Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method, p. 196.
- ↑ F. Mosteller & D. Wallace (1964). Inference and Disputed Authorship: The Federalist. Reading, MA: Addison-Wesley.
- ↑ Chaski, Carole (2012). Solan, Lawrence M; Tiersma, Peter M (eds.). फोरेंसिक सेटिंग में लेखक की पहचान. doi:10.1093/oxfordhb/9780199572120.001.0001. ISBN 9780199572120.
{{cite book}}
:|journal=
ignored (help) - ↑ Chaski, Carole (22 December 2005). Wecht, Cyril H.; Rago, John T. (eds.). Forensic Science and Law: Investigative Applications in Criminal, Civil and Family Justice. CRC Press. ISBN 978-1-4200-5811-6.
- ↑ Claburn, Thomas (March 16, 2018). "FYI: AI tools can unmask anonymous coders from their binary executables". The Register. Retrieved August 2, 2018.
- ↑ Bensalem, Imene; Rosso, Paolo; Chikhi, Salim (2019). "साहित्यिक चोरी के एकमात्र आंतरिक साक्ष्य के रूप में कैरेक्टर एन-ग्राम के उपयोग पर". Language Resources and Evaluation. 53 (3): 363–396. doi:10.1007/s10579-019-09444-w. hdl:10251/159151. S2CID 86630897.
- ↑ Brizan, David (October 2015). "टाइपिस्ट अनुभूति और जनसांख्यिकी की भविष्यवाणी करने के लिए भाषाई रूप से उन्नत कीस्ट्रोक गतिशीलता का उपयोग करना". International Journal of Human-Computer Studies. 82: 57–68. doi:10.1016/j.ijhcs.2015.04.005.
- ↑ Alican, Necip Fikri (2012). Rethinking Plato: A Cartesian Quest for the Real Plato. Amsterdam: Rodopi. p. 183. ISBN 9789042035379.
- ↑ Rowe, Christopher (2000). ग्रीक और रोमन राजनीतिक विचार का कैम्ब्रिज इतिहास. Cambridge, UK: Cambridge University Press. p. 160. ISBN 0521481368.
- ↑ Stamatatos, Efstathios (2009). "आधुनिक लेखकत्व एट्रिब्यूशन विधियों का एक सर्वेक्षण". JASIST. 60 (3): 538–556. doi:10.1002/asi.21001.
- ↑ Stamatatos, Efstathios (2018). "लेखकीय विशेषता को बढ़ाने के लिए विषय-संबंधित जानकारी को छिपाना". JASIS. 69 (3).
- ↑ Karlgren, Jussi; Esposito, Lewis; Gratton, Chantal; Kanerva, Pentti (2018). "सामयिक जानकारी का उपयोग किए बिना लेखकत्व प्रोफ़ाइलिंग". CLEF Working Notes. CEUR-WS.
- ↑ Corbara, Silvia; Moreo, Alejandro; Sebastiani, Fabrizio (2022). "Syllabic quantity patterns as rhythmic features for Latin authorship attribution". JASIST. 74: 128–141. arXiv:2110.14203. doi:10.1002/asi.24660. S2CID 239998537.
- ↑ Corbara, Silvia; Chulvi, Berta; Rosso, Paolo; Moreo, Alejandro (2022). "Rhythmic and Psycholinguistic Features for Authorship Tasks in the Spanish Parliament: Evaluation and Analysis". Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF. Springer. pp. 79–92. doi:10.1007/978-3-031-13643-6_6.
- ↑ Karlgren, Jussi; Eriksson, Gunnar (2007). "Authors, Genre, and Linguistic Convention". SIGIR Workshop on Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection. SIGIR. PAN.
- ↑ Eriksson, Linda (2014). Sequential Aggregation of Textual Features for Domain Independent Author Identification (MSc). KTH Royal Institute of Technology.
- ↑ Mendenhall, T C (1887). "The characteristic curves of composition". Science. 9 (214S): 237–246. doi:10.1126/science.ns-9.214S.237. PMID 17736020.
- ↑ Chen, Beichen (2021). पुस्तक समानताओं के लिए एंबेडिंग (PDF) (MSc). KTH Royal Institute of Technology.
- ↑ Stamatatos, Efstathios; Kestemont, Mike; Kredens, Krzysztof; Pezik, Piotr; Heini, Annina (2022). "Overview of the Authorship Verification Task at PAN 2022". In Faggioli; Ferro; Hanbury; Potthast (eds.). CLEF 2022 Labs and Workshops, Notebook Papers. CEUR-WS. Retrieved September 6, 2022.
- ↑ Neal et al. 2018, p. 5.
- ↑ Gröndahl & Asokan 2020a, p. 3.
- ↑ Kacmarcik & Gamon 2006, p. 444.
- ↑ Mahmood et al. 2019, p. 54.
- ↑ Afroz, Brennan & Greenstadt 2012, p. 461.
- ↑ 33.0 33.1 33.2 33.3 Gröndahl & Asokan 2020a, p. 28.
- ↑ 34.0 34.1 Neal et al. 2018, p. 6.
- ↑ Potthast, Hagen & Stein 2016, p. 10.
- ↑ Saedi & Dras 2020, p. 181.
- ↑ 37.0 37.1 Gröndahl & Asokan 2020a, p. 21-22.
- ↑ Wang, Juola & Riddell 2022, p. 2.
- ↑ Neal et al. 2018, p. 27.
- ↑ Brennan, Afroz & Greenstadt 2012, p. 2.
- ↑ Zhai et al. 2022, p. 7373.
- ↑ Emmery, Kádár & Chrupała 2021, p. 2388-2389.
- ↑ 43.0 43.1 Argamon, Shlomo, Jussi Karlgren, and James G. Shanahan. Stylistic analysis of text for information access. Papers from the workshop held in conjunction with the 28th Annual International ACM Conference on Research and Development in Information Retrieval, August 13–19, 2005, Salvador, Bahia, Brazil. Swedish institute of computer science, 2005.
- ↑ "सिग्नेचर स्टाइलोमेट्रिक सिस्टम". PhiloComp. Retrieved 2014-01-03.
- ↑ "जजाप". जजाप. 2012-09-04. Retrieved 2012-10-15.
- ↑ 46.0 46.1 "आर पैकेज के लिए स्टाइलो". Computational Stylistics Group. 2014-10-24. Archived from the original on 2014-12-21. Retrieved 2014-10-24.
- ↑ Eder, Maciej; Rybicki, Jan; Kestemont, Mike (2016). "Stylometry with R: a package for computational text analysis" (PDF). R Journal. 8 (1): 107–121. doi:10.32614/RJ-2016-007.
- ↑ Daelemans, Walter & Hoste, Véronique (2013). STYLENE: an Environment for Stylometry and Readability Research for Dutch (Technical report). CLiPS Technical Report Series. ISSN 2033-3544.
- ↑ Yan Qu, James G. Shanahan, and Janyce Wiebe. "Exploring attitude and affect in text: Theories and applications." AAAI Spring Symposium Technical report SS-04-07. AAAI Press, Menlo Park, CA. 2004.
- ↑ Jussi Karlgren, Björn Gambäck, and Pentti Kanerva. "Acquiring (and Using) Linguistic (and World) Knowledge for Information Access." (2002). AAAI Spring Symposium. Technical report SS-02-09. AAAI Press, Menlo Park, CA. 2002.
- ↑ Shlomo Argamon, Shlomo Dubnov, and Julie Jupp. "Style and Meaning in Language, Art, Music, and Design" (2004). AAAI Fall Symposium. Technical report FS-04-07.
- ↑ Potthast, Martin, Benno Stein, Alberto Barrón-Cedeño, and Paolo Rosso. "An evaluation framework for plagiarism detection." In Proceedings of the 23rd international conference on computational linguistics: Posters, pp. 997–1005. Association for Computational Linguistics, 2010.
- ↑ Stamatatos, Efstathios, Walter Daelemans, Ben Verhoeven, Patrick Juola, Aurelio López-López, Martin Potthast, and Benno Stein. "Overview of the Author Identification Task at PAN 2014." In CLEF (Working Notes), pp. 877–897. 2014.
- ↑ Rangel, Francisco, Paolo Rosso, Martin Potthast, and Benno Stein. "Overview of the 5th author profiling task at pan 2017: Gender and language variety identification in twitter." Working Notes Papers of the CLEF (2017).
- ↑ Rangel Pardo, Francisco Manuel, Fabio Celli, Paolo Rosso, Martin Potthast, Benno Stein, and Walter Daelemans. "Overview of the 3rd Author Profiling Task at PAN 2015." In CLEF 2015 Evaluation Labs and Workshop Working Notes Papers, pp. 1–8. 2015.
- ↑ Potthast, Martin, Benno Stein, and Teresa Holfeld. "Overview of the 1st International Competition on Wikipedia Vandalism Detection." In CLEF (Notebook Papers/LABs/Workshops). 2010.
- ↑ Text processing text analysis and generation – text typology and attribution. Proceedings of Nobel symposium 51 / ed. by Sture Allén Stockholm : Almqvist & Wiksell international 1982 653 pp. Data linguistica; 16 Nobel symposium; 51 ISBN 91-22-00594-3
- ↑ Karlgren, Jussi (2003). "Helander: An Authorship Attribution Case". Retrieved 4 October 2017.
- ↑ Airoldi, Edoardo M.; Fienberg, Stephen E.; Skinner, Kiron K. (July 2007). "Whose Ideas? Whose Words? Authorship of Ronald Reagan's Radio Addresses" (PDF). PS: Political Science & Politics. 40 (3): 501–506. CiteSeerX 10.1.1.190.5798. doi:10.1017/S1049096507070874. S2CID 18730541.
- ↑ Author Unknown by Gavin McNett Salon November 2, 2000
- ↑ Belluck, Pam (April 10, 1996). "अनबॉम मामले में, संदिग्ध के परिवार के लिए दर्द". The New York Times. Archived from the original on August 10, 2017. Retrieved July 5, 2008.
- ↑ "अध्ययन से पता चला है कि शेक्सपियर के एक विवादित नाटक पर उस्ताद की छाप है". Los Angeles Times. 2015-04-10. Retrieved 2015-04-13.
- ↑ Boyd, Ryan L.; Pennebaker, James W. (2015). "Did Shakespeare Write Double Falsehood? Identifying Individuals by Creating Psychological Signatures With Text Analysis". Psychological Science. 26 (5): 570–582. doi:10.1177/0956797614566658. PMID 25854277. S2CID 13022405.
- ↑ Jackson, MacDonald P (April 27, 2016). Who Wrote "The Night Before Christmas"? Analyzing the Clement Clarke Moore Vs. Henry Livingston Question. McFarland & Co. ISBN 978-1476664439.
- ↑ Fuller, Simon; O'Sullivan, James (2017). "Structure over Style: Collaborative Authorship and the Revival of Literary Capitalism". Digital Humanities Quarterly. 11 (1). Retrieved April 20, 2017.
- ↑ Lane, Anthony (June 18, 2018). "बिल क्लिंटन और जेम्स पैटरसन का प्रेरक सहयोग". The New Yorker (in English). Retrieved 2018-06-07.
- ↑ "दुनिया का सबसे ज़्यादा बिकने वाला लेखक बनने के लिए आपको ज़्यादा लिखने की ज़रूरत क्यों नहीं है?". The Conversation. April 3, 2017. Retrieved April 20, 2017.
- ↑ O'Sullivan, James (2018-06-07). "Bill Clinton and James Patterson are co-authors – but who did the writing?". The Guardian (in English). Retrieved 2018-06-07.
- ↑ Savoy, Jacques (2018). "Is Starnone really the author behind Ferrante?". Digital Scholarship in the Humanities (in English). 33 (4): 902–918. doi:10.1093/llc/fqy016.
- ↑ Reuell, Peter: "You say John, I say Paul. But what does stylometry say?"
- ↑ Glickman, Mark; Brown, Jason; Song, Ryan (2019). "(A) Data in the Life: Authorship Attribution in Lennon-McCartney Songs". Harvard Data Science Review. 1 (1). doi:10.1162/99608f92.130f856e. S2CID 189762434.
- ↑ The ETSO project.
- ↑ "लोप नामक प्रकृति का एक राक्षस" [A monster of nature called Lope]. abc (in español). 2018-11-28. Retrieved 2019-08-11.
- ↑ "स्वर्ण युग में डिजिटल ट्रैकर" [Digital trackers in the Golden Age]. El Norte de Castilla (in español). 2018-12-23. Retrieved 2019-08-11.
- ↑ Real, La Tribuna de Ciudad (2019-07-09). "Juan Ruiz de Alarcón aumenta su obra cinco siglos después" [Juan Ruiz de Alarcón increases his work five centuries after]. La Tribuna de Ciudad Real (in español). Retrieved 2019-08-11.
- ↑ Migueláñez, Daniel (28 July 2019). "El Holmes de la filología". PSOE Chamberí. No. 6. p. 8. Archived from the original on 2020-07-18. Retrieved 2019-08-11.
- ↑ "Sor Juana Inés centró las 42 Jornadas de Teatro Clásico". Lanza Digital (in español). 2019-07-14. Retrieved 2019-08-11.
- ↑ "'La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón" ['La monja alférez' is no longer by Pérez de Montalbán, but by Ruiz de Alarcón]. El Norte de Castilla (in español). 2019-07-10. Retrieved 2019-08-11.
- ↑ "कृत्रिम बुद्धिमत्ता प्रमुख स्पेनिश नाटककार लोप डी वेगा को उनकी मृत्यु के वर्षों बाद लिखी पांडुलिपि से एक नाटक के लेखक के रूप में खोजने में मदद करती है". newsendip.com (in English). 31 January 2023. Retrieved 8 February 2023.
- ↑ Jones, Sam (5 February 2023). "आर्टिफिशियल इंटेलिजेंस ने स्पेन के 'स्वर्ण युग' के टाइटन के खोए हुए काम को उजागर किया". The Guardian. Retrieved 8 February 2023.
- ↑ Morales, Manuel (2023-01-31). "La inteligencia artificial atribuye a Lope de Vega una obra anónima del fondo de manuscritos de la Biblioteca Nacional" [Artificial intelligence attributes an anonymous work from the National Library's manuscript collection to Lope de Vega]. El País (in español). Retrieved 2023-02-08.
- ↑ McCarthy, Rachel; O'Sullivan, James (2020). "Who wrote Wuthering Heights?". Digital Scholarship in the Humanities (in English). 36 (2): 383–391. doi:10.1093/llc/fqaa031.
- ↑ Ilsemann, Harmut (2020) "Phantom Marlowe: Paradigmenwechsel in Autorschaftsbestimmungen des englischen Renaissancedramas". Düren: Shaker, ISBN 978-3-8440-7412-3
- ↑ Ilsemann, Harmut (2020). "मार्लो कॉर्पस पर दोबारा गौर किया गया". Digital Scholarship in the Humanities (in English). 36 (2): 333–360. doi:10.1093/llc/fqaa010.
- ↑ Ilsemann, Harmut (2021). ""द मार्लो कॉर्पस रिविज़िटेड" और फैंटम मार्लो का एक संक्षिप्त पूरक". Digital Scholarship in the Humanities (in English). 37 (2): 462–468. doi:10.1093/llc/fqab078.
- ↑ Rebora, Simone & Salgaro, Massimo (2022). "Is Felix Salten the Author of the Mutzenbacher Novel (1906)? Yes and no". Language and Literature: International Journal of Stylistics. 31 (2): 243–264. doi:10.1177/09639470221090384. S2CID 248135373.
{{cite journal}}
: CS1 maint: multiple names: authors list (link) - ↑ Biber, Douglas. Variation across speech and writing. Cambridge University Press, 1991.
- ↑ Karlgren, Jussi; Cutting, Douglass (1994). "विभेदक विश्लेषण का उपयोग करके सरल मेट्रिक्स के साथ पाठ शैलियों को पहचानना". Proceedings of the International Conference on Computational Linguistics. 2: 1071. arXiv:cmp-lg/9410008. Bibcode:1994cmp.lg...10008K. doi:10.3115/991250.991324. S2CID 1297432.
- ↑ Van Droogenbroeck F.J., "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics" (2019) [1]
- ↑ Matthews, Robert A. J.; Merriam, Thomas V. N (1993). "Neural Computation in Stylometry I: An Application to the Works of Shakespeare and Fletcher". Literary and Linguistic Computing. 8 (4): 203–209. doi:10.1093/llc/8.4.203.
- ↑ Merriam, Thomas V. N; Matthews, Robert A. J. (1994). "Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe". Literary and Linguistic Computing. 9 (1): 1–6. doi:10.1093/llc/9.1.1.
- ↑ 92.0 92.1 JF Hoorn; SL Frank; W Kowalczyk; F van der Ham (2012-09-03). "अक्षर अनुक्रमों का उपयोग करके कवियों की तंत्रिका नेटवर्क पहचान". Literary and Linguistic Computing. 14 (3): 311–338. doi:10.1093/llc/14.3.311.
- ↑ Brocardo, ML; Traore, I; Woungang, I; Obaidat, MS (2017). "गहरे विश्वास नेटवर्क सिस्टम का उपयोग करके लेखकत्व सत्यापन". Int J Commun Syst. 30 (12): e3259. doi:10.1002/dac.3259. S2CID 40745740.
- ↑ de Vel, O.; Anderson, A.; Corney, M.; Mohay, G. (2001-12-01). "लेखक की पहचान फोरेंसिक के लिए खनन ई-मेल सामग्री". SIGMOD Rec. 30 (4): 55–64. CiteSeerX 10.1.1.408.4231. doi:10.1145/604264.604272. ISSN 0163-5808. S2CID 1623521.
- ↑ Argamon, Shlomo; Koppel, Moshe; Pennebaker, James W.; Schler, Jonathan (2009-02-01). "किसी अज्ञात पाठ के लेखक की स्वचालित प्रोफ़ाइलिंग". Commun. ACM. 52 (2): 119–123. CiteSeerX 10.1.1.136.9952. doi:10.1145/1461928.1461959. ISSN 0001-0782. S2CID 5413411.
- ↑ "Classification of Instant Messaging Communications for Forensics Analysis – TechRepublic". TechRepublic. Retrieved 2016-01-26.
- ↑ Zhou, L.; Zhang, Dongsong (2004-01-01). Can online behavior unveil deceivers? – an exploratory investigation of deception in instant messaging. pp. 9 pp.–. doi:10.1109/HICSS.2004.1265079. ISBN 978-0-7695-2056-8. S2CID 7154702.
{{cite book}}
:|journal=
ignored (help)
संदर्भ
- Afroz, Sadia; Brennan, Michael; Greenstadt, Rachel (2012). "Detecting Hoaxes, Frauds, and Deception in Writing Style Online". 2012 IEEE Symposium on Security and Privacy. pp. 461–475. doi:10.1109/SP.2012.34. ISBN 978-1-4673-1244-8.
- Brennan, Michael; Afroz, Sadia; Greenstadt, Rachel (2012). "Adversarial stylometry: Circumventing Authorship Recognition to Preserve Privacy and Anonymity" (PDF). ACM Transactions on Information and System Security. 15 (3): 1–22. doi:10.1145/2382448.2382450. S2CID 16176436.
- Brennan, Michael Robert; Greenstadt, Rachel. "Practical Attacks Against Authorship Recognition Techniques". Innovative Applications of Artificial Intelligence.
- Brocardo, Marcelo Luiz; Issa Traore; Sherif Saad; Isaac Woungang (2013). Authorship Verification for Short Messages Using Stylometry. IEEE Intl. Conference on Computer, Information and Telecommunication Systems (CITS). doi:10.1109/CITS.2013.6705711.
- Can, Fazli; Patton, Jon M. (2004). "Change of writing style with time". Computers and the Humanities. 38 (1): 61–82. CiteSeerX 10.1.1.1.8850. doi:10.1023/b:chum.0000009225.28847.77. S2CID 38242388.
- Emmery, Chris; Kádár, Ákos; Chrupała, Grzegorz (2021). "Adversarial Stylometry in the Wild: Transferable Lexical Substitution Attacks on Author Profiling". Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume. pp. 2388–2402. arXiv:2101.11310. doi:10.18653/v1/2021.eacl-main.203. S2CID 231719026.
- Gröndahl, Tommi; Asokan, N. (2020a). "Text Analysis in Adversarial Settings: Does Deception Leave a Stylistic Trace?". ACM Computing Surveys. 52 (3): 1–36. arXiv:1902.08939. doi:10.1145/3310331. S2CID 67856540.
- Hope, Jonathan (1994). The Authorship of Shakespeare's Plays. Cambridge: Cambridge University Press. ISBN 9780521417372.
- Hoy, Cyrus (1956–1962). "The Shares of Fletcher and His Collaborators in the Beaumont and Fletcher Canon (I-VII)". Studies in Bibliography. 7–15.
- Juola, Patrick (2006). "Authorship Attribution" (PDF). Foundations and Trends in Information Retrieval. 1 (3): 3. CiteSeerX 10.1.1.219.1605. doi:10.1561/1500000005.
- Kacmarcik, Gary; Gamon, Michael (17 July 2006). "Obfuscating document stylometry to preserve author anonymity". Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions. pp. 444–451.
- Kenny, Anthony (1982). The Computation of Style: An Introduction to Statistics for Students of Literature and Humanities. Oxford: Pergamon Press.
- Mahmood, Asad; Ahmad, Faizan; Shafiq, Zubair; Srinivasan, Padmini; Zaffar, Fareed (2019). "A Girl Has No Name: Automated Authorship Obfuscation using Mutant-X". Proceedings on Privacy Enhancing Technologies. 2019 (4): 54–71. doi:10.2478/popets-2019-0058. S2CID 197621394.
- Neal, Tempestt; Sundararajan, Kalaivani; Fatima, Aneez; Yan, Yiming; Xiang, Yingfei; Woodard, Damon (2018). "Surveying Stylometry Techniques and Applications". ACM Computing Surveys. 50 (6): 1–36. doi:10.1145/3132039. S2CID 21360798.
- Potthast, Martin; Hagen, Matthias; Stein, Benno (2016). Author Obfuscation: Attacking the State of the Art in Authorship Verification (PDF). Conference and Labs of the Evaluation Forum.
- Romaine, Suzanne (1982). Socio-Historical Linguistics. Cambridge: Cambridge University Press.
- Saedi, Chakaveh; Dras, Mark (December 2020). "Large Scale Author Obfuscation Using Siamese Variational Auto-Encoder: The SiamAO System". Proceedings of the Ninth Joint Conference on Lexical and Computational Semantics. pp. 179–189.
- Samuels, M. L. (1972). Linguistic Evolution: With Special Reference to English. Cambridge: Cambridge University Press.
- Schoenbaum, Samuel (1966). Internal Evidence and Elizabethan Dramatic Authorship: An Essay in Literary History and Method. Evanston, IL, USA: Northwestern University Press.
- Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
- Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
- Wang, Haining; Juola, Patrick; Riddell, Allen (2022). "Reproduction and Replication of an Adversarial Stylometry Experiment". arXiv:2208.07395.
{{cite journal}}
: Cite journal requires|journal=
(help) - Zenkov, Andrei V. (2018). "A Method of Text Attribution Based on the Statistics of Numerals". Journal of Quantitative Linguistics. 25 (3): 256–270. doi:10.1080/09296174.2017.1371915. S2CID 49692378.
- Zhai, Wanyue; Rusert, Jonathan; Shafiq, Zubair; Srinivasan, Padmini (2022). "A Girl Has A Name, And It's ... Adversarial Authorship Attribution for Deobfuscation". Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). pp. 7372–7384. arXiv:2203.11849. doi:10.18653/v1/2022.acl-long.509. S2CID 248780012.
अग्रिम पठन
See also the academic journal Literary and Linguistic Computing, now Digital Scholarship in the Humanities (published by the University of Oxford) and the Language Resources and Evaluation journal (previously Computers and the Humanities).