प्राकृतिक-भाषा की समझ

From Vigyanwiki

प्राकृतिक लैंग्वेज की समझ (एनएलयू) या प्राकृतिक लैंग्वेज की व्याख्या (एनएलआई)[1] आर्टिफिशियल इंटेलिजेंस में प्राकृतिक लैंग्वेज प्रोसेसिंग का एक उप-विषय है, जो मशीनी अध्ययन से संबंधित है और इस प्रकार प्राकृतिक लैंग्वेज की समझ को एआई-कठिन समस्या के रूप में माना जाता है।[2]

स्वचालित तर्क, [3] मशीनी अनुवाद,[4] प्रश्न उत्तर,[5] समाचार-एकत्रीकरण, पाठ वर्गीकरण, वॉइस एक्टिवेशन, आर्काइव और बड़े पैमाने पर कान्टेन्ट अनैलिसिस के कारण इस क्षेत्र में काफी व्यावसायिक रुचि हुई है।

डेनियल बोब्रो द्वारा 1964 में एमआईटी में पीएचडी शोध-प्रबन्ध के लिए लिखा गया प्रोग्राम छात्र, कंप्यूटर द्वारा प्राकृतिक लैंग्वेज को समझने के प्रारंभिक ज्ञात प्रयासों में से एक है।[6][7][8][9][10] जॉन मैक्कार्थी द्वारा आर्टिफिशियल इंटेलिजेंस शब्द गढ़े जाने के आठ साल बाद, बोब्रो के शोध प्रबंध कंप्यूटर समस्या समाधान प्रणाली के लिए प्राकृतिक लैंग्वेज को समझने की विधि बताई कि इनपुट शीर्षक कैसे कंप्यूटर बीजगणित शब्द समस्याओं को हल करने के लिए सरल प्राकृतिक लैंग्वेज इनपुट को समझ सकता है।

एक साल बाद, 1965 में, एमआईटी में जोसेफ वीज़ेनबाम ने एलिज़ा को एक इंटरैक्टिव प्रोग्राम लिखा था, जिसमें मनोचिकित्सा की दृष्टि से किसी भी विषय पर अंग्रेजी में संवाद होता था। एलिजा ने साधारण पद-व्याख्या तथा मुख्य शब्दों के स्थान पर कैंड वाक्यांशों में स्थान दिया और वीज़ेनबाम ने प्रोग्राम को वास्तविक दुनिया के ज्ञान का डेटाबेस या समृद्ध शब्दकोश देने की समस्या को दरकिनार कर दिया था। फिर भी एलिजा ने टॉय प्रोजेक्ट के रूप में आश्चर्यजनक लोकप्रियता प्राप्त की और इस प्रकार इसे आस्क कॉम द्वारा उपयोग की जाने वाली उपस्थित व्यावसायिक प्रणालियों के लिए बहुत ही प्रारंभिक प्रीकर्सर के रूप में देखा जा सकता है।[11]

1969 में, स्टैनफोर्ड विश्वविद्यालय में रोजर शंक ने प्राकृतिक-लैंग्वेज की समझ के लिए वैचारिक निर्भरता सिद्धांत प्रस्तुत किया।[12] सिडनी लैम्ब के काम से आंशिक रूप से प्रभावित यह मॉडल, येल विश्वविद्यालय में शैंक के छात्रों, जैसे रॉबर्ट विलेंस्की, वेंडी लेहर्ट और जेनेट कोलोडनर द्वारा व्यापक रूप से उपयोग किया गया था।

1970 में विलियम ए वुड्स ने प्राकृतिक लैंग्वेज इनपुट का प्रतिनिधित्व करने के लिए ऑगमेंटेड ट्रांजीशन नेटवर्क एटीएन की शुरुआत की।[13] और इस प्रकार वाक्यांश संरचना नियमों के अतिरिक्त एटीएन ने परिमित स्टेट ऑटोमेटा के समतुल्य सेट का उपयोग किया है। एटीएन और उनके अधिक सामान्य प्रारूप जिन्हें सामान्यीकृत एटीएन कहा जाता है, सामान्यीकृत एटीएन का उपयोग कई वर्षों तक किया जाता रहा है।

1971 में, टेरी विनोग्रैड ने एमआईटी में अपनी पीएचडी थीसिस के लिए एसएचआरडीएलयू लिखना समाप्त किया। एसएचआरडीएलयू वस्तुओं को स्थानांतरित करने के लिए एक रोबोटिक हाथ को निर्देशित करने के लिए बच्चों के ब्लॉक की प्रतिबंधित दुनिया में सरल अंग्रेजी वाक्यों को समझ सकता है। एसएचआरडीएलयू के सफल प्रदर्शन ने क्षेत्र में निरंतर अनुसंधान के लिए महत्वपूर्ण गति प्रदान की।[14][15] संज्ञानात्मक प्रक्रिया के रूप में अपनी पुस्तक लैंग्वेज के प्रकाशन के साथ विनोग्रैड ने क्षेत्र में एक बड़ा प्रभाव जारी रखा था।[16] स्टैनफोर्ड में, विनोग्राड बाद में लेरी पेज को सलाह दिया जिन्होंने गूगल की सह-स्थापना की थी।


1970 और 1980 के दशक में, श्री इंटरनेशनल ने प्राकृतिक लैंग्वेज प्रोसेसिंग समूह के क्षेत्र में अनुसंधान और विकास के रूप में जारी रखा था और इस प्रकार अनुसंधान पर आधारित कई व्यावसायिक प्रयास किए गए, उदाहरण के लिए 1982 में गैरी हेंड्रिक्स ने व्यक्तिगत कंप्यूटरों पर डेटाबेस प्रश्नों के लिए एक प्राकृतिक लैंग्वेज इंटरफ़ेस विकसित करने के लिए मूल रूप से एक कंपनी के रूप में सिमेंटेक कॉर्पोरेशन का गठन किया। चूंकि माउस संचालित ग्राफिकल यूज़र इंटरफ़ेस के आगमन के साथ सिमेंटेक ने दिशा बदल दी थी और उसी समय के आसपास कई अन्य व्यावसायिक प्रयास प्रारंभ किए गए थे, उदाहरण के लिए आर्टिफिशियल इंटेलिजेंस कॉरपोरेशन में लैरी आर हैरिस और कॉग्निटिव प्रणाली कॉर्प में रोजर शैंक और उनके छात्र के रूप में है।[17][18] 1983 में, माइकल डायर ने येल में बोरिस प्रणाली विकसित किया, जो रोजर शैंक और डब्लू .जी लेहर्ट के काम के समान था।[19]

तीसरी सहस्राब्दी में आईबीएम वाटसन (कंप्यूटर) जैसे टेक्स्ट वर्गीकरण के लिए मशीन लर्निंग का उपयोग करने वाली प्रणालियों के रूप में देखी गई थी। चूंकि विशेषज्ञ इस बात पर बहस करते हैं कि ऐसी प्रणालियाँ कितनी समझ प्रदर्शित करती हैं। उदाहरण के लिए जॉन सियरल के अनुसार वॉटसन प्रश्नों को समझ भी नहीं पाए थे।[20]

जॉन बॉल, संज्ञानात्मक वैज्ञानिक और पेटोम थ्योरी के आविष्कारक इस आकलन का समर्थन करते हैं कि प्राकृतिक लैंग्वेज प्रोसेसिंग ने सेवा और ई-कॉमर्स में मानव उत्पादकता का समर्थन करने के लिए अनुप्रयोगों के लिए पैठ बना ली है, लेकिन अनुप्रयोग के क्षेत्र को कम करके इसे काफी सीमा तक संभव बनाया गया है। मानव लैंग्वेज में कुछ अनुरोध करने के हजारों विधि हैं, जो अभी भी पारंपरिक प्राकृतिक लैंग्वेज प्रोसेसिंग को चुनौती देते हैं। मशीनों के साथ एक सार्थक बातचीत तभी संभव होती है जब हम वाक्य के दूसरे शब्दों के अर्थ के आधार पर हर शब्द का सही अर्थ से मिलान करते है और ठीक उसी प्रकार जैसे एक 3 साल का बच्चा बिना अनुमान लगाए करता है।

क्षेत्र और संदर्भ

छत्र शब्द प्राकृतिक-लैंग्वेज की समझ को कंप्यूटर अनुप्रयोगों के विविध सेट पर लागू किया जा सकता है, जिसमें छोटे अपेक्षाकृत सरल कार्य जैसे कि रोबोट को जारी किए गए है, छोटे आदेश, अत्यधिक जटिल प्रयास जैसे समाचार पत्रों के लेखों या कविता अंशों की पूर्ण समझ सम्मलित हैं। कई वास्तविक दुनिया के अनुप्रयोग दो चरम सीमाओं के बीच आते हैं, उदाहरण के लिए ईमेल के स्वचालित विश्लेषण के लिए दस्तावेज़ वर्गीकरण और एक निगम में एक उपयुक्त विभाग के लिए उनके मार्ग को पाठ की गहन समझ की आवश्यकता नहीं होती है,[21] लेकिन निश्चित स्कीमाटा के साथ डेटाबेस तालिकाओं के लिए सरल प्रश्नों के प्रबंधन की तुलना में बहुत बड़ी शब्दावली और अधिक विविध सिंटैक्स से निपटने की आवश्यकता है।

वर्षों के समय प्राकृतिक लैंग्वेज या अंग्रेजी जैसे वाक्यों को कंप्यूटर पर संसाधित करने के विभिन्न प्रयास जटिलता के भिन्न-भिन्न अंशों पर हुए हैं। कुछ प्रयासों के परिणाम स्वरूप गहरी समझ वाली प्रणालियाँ नहीं बन पाई हैं, लेकिन समग्र प्रणाली उपयोगिता में सहायता मिली है। उदाहरण के लिए, वेन रेटलिफ़ ने मूल रूप से स्टार ट्रेक में अंग्रेजी बोलने वाले कंप्यूटर की नकल करने के लिए अंग्रेजी जैसे सिंटैक्स के साथ वल्कन प्रोग्राम विकसित किया था। वल्कन बाद में डीबीएएशइ प्रणाली बन गया, जिसके उपयोग में आसान सिंटैक्स ने व्यक्तिगत कंप्यूटर डेटाबेस उद्योग को प्रभावी ढंग से लॉन्च किया।[22][23] उपयोग में आसान या अंग्रेजी जैसे सिंटैक्स वाली प्रणालियाँ, चूंकि उन प्रणालियों से काफी भिन्न हैं जो एक समृद्ध शब्दकोश का उपयोग करती हैं और इसमें प्राकृतिक लैंग्वेज के वाक्यों के शब्दार्थों का एक आंतरिक ज्ञान प्रतिनिधित्व और तर्क अक्सर पहले क्रम तर्क के रूप में सम्मलित होता है।

इसलिए एक प्रणाली द्वारा लक्षित समझ की चौड़ाई और गहराई प्रणाली की जटिलता और निहित चुनौतियों और इसके साथ निपटने वाले अनुप्रयोगों के प्रकार दोनों को निर्धारित करती है। एक प्रणाली की चौड़ाई इसकी शब्दावली व्याकरण के आकार से मापी जाती है। गहराई को उस डिग्री से मापा जाता है जिस तक इसकी समझ एक धाराप्रवाह देशी समय की समझ के बराबर होती है। सबसे संकीर्ण और सतही तौर पर,अंग्रेजी जैसे कमांड दुभाषियों को न्यूनतम जटिलता की आवश्यकता होती है, लेकिन अनुप्रयोगों की एक छोटी श्रृंखला होती है। संकीर्ण लेकिन गहरी प्रणालियाँ समझने के तंत्र का पता लगाती हैं और मॉडल बनाती हैं,[24] लेकिन उनका अभी भी सीमित उपयोग है। प्रणाली जो किसी दस्तावेज़ की सामग्री को समझने का प्रयास करते हैं जैसे कि साधारण कीवर्ड मिलान से परे एक समाचार रिलीज़ और एक उपयोगकर्ता के लिए इसकी उपयुक्तता का न्याय करने के लिए व्यापक हैं और महत्वपूर्ण जटिलता की आवश्यकता होती है,[25] लेकिन वे अभी भी कुछ उथली ऐसी प्रणालियाँ हैं जो बहुत व्यापक और बहुत गहरी दोनों हैं, कला की वर्तमान स्थिति से परे हैं।

अवयव और वास्तुकला

उपयोग किए गए दृष्टिकोण के अतिरिक्त, अधिकांश प्राकृतिक-भाषा-समझ प्रणालियाँ कुछ सामान्य घटकों को साझा करती हैं। आंतरिक प्रतिनिधित्व में वाक्यों को तोड़ने के लिए प्रणाली को लैंग्वेज के एक शब्दकोष और एक पार्सर और व्याकरण के नियमों की आवश्यकता होती है। एक उपयुक्त सत्तामीमांसा (सूचना विज्ञान) के साथ एक समृद्ध शब्दकोश के निर्माण के लिए महत्वपूर्ण प्रयास की आवश्यकता होती है, उदाहरण के लिए, शब्दतंत्र शब्दकोष के लिए कई व्यक्ति वर्षों के प्रयास की आवश्यकता होती है।[26]

समझ को निर्देशित करने के लिए प्रणाली को शब्दार्थ से सिद्धांत की भी आवश्यकता होती है। किसी भाषा-समझ प्रणाली की व्याख्या क्षमता उसके द्वारा उपयोग किए जाने वाले सिमेंटिक सिद्धांत पर निर्भर करती है। कंप्यूटर-स्वचालित सिमेंटिक व्याख्या के आधार के रूप में लैंग्वेज के प्रतिस्पर्धी सिमेंटिक सिद्धांतों में उनकी उपयुक्तता में विशिष्ट ट्रेड-ऑफ हैं।[27] ये भोले-भाले शब्दार्थ या स्टोकेस्टिक सिमेंटिक विश्लेषण से लेकर संदर्भ से अर्थ निकालने के लिए व्यावहारिकता के उपयोग तक हैं।[28][29][30] सिमेंटिक पार्सर प्राकृतिक-लैंग्वेज के ग्रंथों को औपचारिक अर्थ के प्रतिनिधित्व में परिवर्तित करते हैं।[31]

प्राकृतिक-लैंग्वेज समझ के उन्नत अनुप्रयोग भी उनके ढांचे के भीतर तार्किक निष्कर्ष को सम्मलित करने का प्रयास करते हैं। यह आमतौर पर व्युत्पन्न अर्थ को विधेय तर्क में अभिकथनों के एक सेट में मैप करके प्राप्त किया जाता है, फिर निष्कर्ष पर पहुंचने के लिए तार्किक कटौती का उपयोग किया जाता है। इसलिए, लिस्प (प्रोग्रामिंग भाषा) जैसी कार्यात्मक भाषाओं पर आधारित प्रणालियों को तार्किक अभिकथनों का प्रतिनिधित्व करने के लिए एक उपप्रणाली को सम्मलित करने की आवश्यकता होती है, जबकि तर्क-उन्मुख प्रणालियाँ जैसे कि लैंग्वेज प्रोलॉग का उपयोग करने वाले आमतौर पर अंतर्निहित तार्किक प्रतिनिधित्व ढांचे के विस्तार पर भरोसा करते हैं।[32][33]

प्राकृतिक लैंग्वेज की समझ में संदर्भ (लैंग्वेज का प्रयोग) का प्रबंधन विशेष चुनौतियां प्रस्तुत कर सकता है। विभिन्न प्रकार के उदाहरणों और प्रतिउदाहरणों में बड़ी विविधता के परिणामस्वरूप संदर्भ के औपचारिक शब्दार्थ (प्राकृतिक भाषा) के कई दृष्टिकोण के रूप में सामने आया है। [34]

यह भी देखें

टिप्पणियाँ

  1. Semaan, P. (2012). Natural Language Generation: An Overview. Journal of Computer Science & Research (JCSCR)-ISSN, 50-57
  2. Roman V. Yampolskiy. Turing Test as a Defining Feature of AI-Completeness . In Artificial Intelligence, Evolutionary Computation and Metaheuristics (AIECM) --In the footsteps of Alan Turing. Xin-She Yang (Ed.). pp. 3-17. (Chapter 1). Springer, London. 2013. http://cecs.louisville.edu/ry/TuringTestasaDefiningFeature04270003.pdf
  3. Van Harmelen, Frank, Vladimir Lifschitz, and Bruce Porter, eds. Handbook of knowledge representation. Vol. 1. Elsevier, 2008.
  4. Macherey, Klaus, Franz Josef Och, and Hermann Ney. "Natural language understanding using statistical machine translation." Seventh European Conference on Speech Communication and Technology. 2001.
  5. Hirschman, Lynette, and Robert Gaizauskas. "Natural language question answering: the view from here." natural language engineering 7.4 (2001): 275-300.
  6. American Association for Artificial Intelligence Brief History of AI [1]
  7. Daniel Bobrow's PhD Thesis Natural Language Input for a Computer Problem Solving System.
  8. Machines who think by Pamela McCorduck 2004 ISBN 1-56881-205-1 page 286
  9. Russell, Stuart J.; Norvig, Peter (2003), Artificial Intelligence: A Modern Approach Prentice Hall, ISBN 0-13-790395-2, http://aima.cs.berkeley.edu/, p. 19
  10. Computer Science Logo Style: Beyond programming by Brian Harvey 1997 ISBN 0-262-58150-7 page 278
  11. Weizenbaum, Joseph (1976). Computer power and human reason: from judgment to calculation W. H. Freeman and Company. ISBN 0-7167-0463-3 pages 188-189
  12. Roger Schank, 1969, A conceptual dependency parser for natural language Proceedings of the 1969 conference on Computational linguistics, Sång-Säby, Sweden, pages 1-3
  13. Woods, William A (1970). "Transition Network Grammars for Natural Language Analysis". Communications of the ACM 13 (10): 591–606 [2]
  14. Artificial intelligence: critical concepts, Volume 1 by Ronald Chrisley, Sander Begeer 2000 ISBN 0-415-19332-X page 89
  15. Terry Winograd's SHRDLU page at Stanford SHRDLU
  16. Winograd, Terry (1983), Language as a Cognitive Process, Addison–Wesley, Reading, MA.
  17. Larry R. Harris, Research at the Artificial Intelligence corp. ACM SIGART Bulletin, issue 79, January 1982 [3]
  18. Inside case-based reasoning by Christopher K. Riesbeck, Roger C. Schank 1989 ISBN 0-89859-767-6 page xiii
  19. In Depth Understanding: A Model of Integrated Process for Narrative Comprehension.. Michael G. Dyer. MIT Press. ISBN 0-262-04073-5
  20. Searle, John (23 February 2011). "वाटसन नहीं जानता कि यह 'जियोपार्डी!' पर जीता". Wall Street Journal.
  21. An approach to hierarchical email categorization by Peifeng Li et al. in Natural language processing and information systems edited by Zoubida Kedad, Nadira Lammari 2007 ISBN 3-540-73350-7
  22. InfoWorld, Nov 13, 1989, page 144
  23. InfoWorld, April 19, 1984, page 71
  24. Building Working Models of Full Natural-Language Understanding in Limited Pragmatic Domains by James Mason 2010 [4]
  25. Mining the Web: discovering knowledge from hypertext data by Soumen Chakrabarti 2002 ISBN 1-55860-754-4 page 289
  26. G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4, pp. 235-244.
  27. Using computers in linguistics: a practical guide by John Lawler, Helen Aristar Dry 198 ISBN 0-415-16792-2 page 209
  28. Naive semantics for natural language understanding by Kathleen Dahlgren 1988 ISBN 0-89838-287-4
  29. Stochastically-based semantic analysis by Wolfgang Minker, Alex Waibel, Joseph Mariani 1999 ISBN 0-7923-8571-3
  30. Pragmatics and natural language understanding by Georgia M. Green 1996 ISBN 0-8058-2166-X
  31. Wong, Yuk Wah, and Raymond J. Mooney. "Learning for semantic parsing with statistical machine translation." Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics. Association for Computational Linguistics, 2006.
  32. Natural Language Processing Prolog Programmers by M. Covington, 1994 ISBN 0-13-629478-2
  33. Natural language processing in Prolog by Gerald Gazdar, Christopher S. Mellish 1989 ISBN 0-201-18053-7
  34. Formal aspects of context by Pierre Bonzon et al 2000 ISBN 0-7923-6350-7
  35. Programming with Natural Language Is Actually Going to Work—Wolfram Blog
  36. Van Valin, Jr, Robert D. "एनएलपी से एनएलयू तक" (PDF).
  37. Ball, John. "पैट इंक द्वारा बहुभाषी एनएलयू". Pat.ai.
[Category:Natural language processi