स्वचालित भाषा अनुवादक (ऑटोमैटिक लैंग्वेज ट्रांसलेटर): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
[[आईबीएम]] का स्वचालित भाषा अनुवादक मशीनी अनुवाद प्रणाली थी जो [[रूसी भाषा]] के दस्तावेजों को [[अंग्रेजी भाषा]] में परिवर्तित करती थी। इसमें [[ऑप्टिकल डिस्क]] का उपयोग किया गया था जो 170,000 शब्द-दर-शब्द और कथन-दर-कथन अनुवाद संग्रहीत करता था और उन्हें उच्च गति से देखने के लिए कस्टम कंप्यूटर का उपयोग करता था। अमेरिकी वायु सेना के विदेशी प्रौद्योगिकी प्रभाग के लिए निर्मित, एएन/जीएसक्यू-16 (या एक्सडब्ल्यू-2), जैसा कि वायु सेना को ज्ञात था, का उपयोग मुख्य रूप से पश्चिमी वैज्ञानिकों को वितरण के लिए सोवियत तकनीकी दस्तावेजों को परिवर्तित करने के लिए किया गया था। अनुवादक 1959 में स्थापित किया गया था, 1964 में नाटकीय रूप से उन्नत किया गया था, और अंततः 1970 में [[सिस्ट्रान]] चलाने वाले [[मेनफ़्रेम कंप्यूटर]] द्वारा प्रतिस्थापित किया गया था।
[[आईबीएम]] का '''ऑटोमैटिक लैंग्वेज ट्रांसलेटर''' मशीन अनुवाद सिस्टम थी जो [[रूसी भाषा|रूसी]] लैंग्वेज के डाक्यूमेंट को [[अंग्रेजी भाषा|अंग्रेजी]] लैंग्वेज में परिवर्तित करती थी। इसमें [[ऑप्टिकल डिस्क]] का उपयोग किया गया था जो 170,000 शब्द-दर-शब्द और कथन-दर-कथन अनुवाद संग्रहीत करता था और उन्हें उच्च गति से देखने के लिए कस्टम कंप्यूटर का उपयोग करता था। अमेरिकी वायु सेना के विदेशी प्रौद्योगिकी प्रभाग के लिए निर्मित, एएन/जीएसक्यू-16 (या एक्सडब्ल्यू-2), जैसा कि वायु सेना को ज्ञात था, जिसका उपयोग मुख्य रूप से पश्चिमी वैज्ञानिकों को वितरण के लिए सोवियत तकनीकी डाक्यूमेंट को परिवर्तित करने के लिए किया गया था। ट्रांसलेटर 1959 में स्थापित किया गया था, 1964 में नाटकीय रूप से उन्नत किया गया था, और अंततः 1970 में [[सिस्ट्रान]] चलाने वाले [[मेनफ़्रेम कंप्यूटर]] द्वारा प्रतिस्थापित किया गया था।


==इतिहास==
==इतिहास==


===फ़ोटोस्कोपिक स्टोर===
===फ़ोटोस्कोपिक स्टोर===
अनुवादक का काम जून 1953 में [[अमेरिकी नौसेना]] से लॉस एंजिल्स के [[अंतर्राष्ट्रीय टेलीमीटर निगम]] (आईटीसी) के साथ अनुबंध के तहत शुरू हुआ। यह किसी अनुवाद प्रणाली के लिए नहीं था, बल्कि प्लास्टिक डिस्क में एम्बेडेड छोटे काले आयतों से युक्त उच्च प्रदर्शन वाले फोटोग्राफिक ऑनलाइन स्टोरेज माध्यम के लिए शुद्ध अनुसंधान और विकास अनुबंध था। जब प्रारंभिक अनुबंध समाप्त हो गया, तब [[ रोम वायु विकास केंद्र |रोम वायु विकास केंद्र]] (आरएडीसी) ने 1954 और उसके बाद आगे की फंडिंग शुरू की।<ref name=hutch171>Hutchins, pg. 171</ref>
ट्रांसलेटर का कार्य जून 1953 में [[अमेरिकी नौसेना]] से लॉस एंजिल्स के [[अंतर्राष्ट्रीय टेलीमीटर निगम]] (आईटीसी) के साथ अनुबंध के अनुसार प्रारंभ हुआ था। यह किसी अनुवाद सिस्टम के लिए नहीं था, किन्तु प्लास्टिक डिस्क में एम्बेडेड ब्लैक आयतों से युक्त उच्च प्रदर्शन वाले फोटोग्राफिक ऑनलाइन स्टोरेज माध्यम के लिए शुद्ध अनुसंधान और विकास अनुबंध था। जब प्रारंभिक अनुबंध समाप्त हो गया था, तब [[ रोम वायु विकास केंद्र |रोम वायु विकास केंद्र]] (आरएडीसी) ने 1954 और उसके बाद आगे की फंडिंग प्रारंभ की था।<ref name=hutch171>Hutchins, pg. 171</ref>
इस प्रणाली को आईटीसी में इंजीनियरिंग के प्रमुख गिल्बर्ट किंग ने टीम के साथ विकसित किया था जिसमें लुई रिडेनॉर भी शामिल थे। यह 16 इंच की प्लास्टिक डिस्क में विकसित हुआ, जिसमें सूक्ष्म काले आयतों या स्पष्ट धब्बों की श्रृंखला के रूप में डेटा दर्ज किया गया। भंडारण के लिए डिस्क के केवल सबसे बाहरी 4 इंच का उपयोग किया गया, जिससे पहुंच वाले हिस्से की रैखिक गति बढ़ गई। जब डिस्क 2,400 आरपीएम पर घूमती है तो इसकी पहुंच गति लगभग 1 एमबीटी/सेकंड होती है। कुल मिलाकर, सिस्टम ने 30 Mbits संग्रहीत किया, जिससे यह अपने युग का उच्चतम घनत्व वाला ऑनलाइन सिस्टम बन गया।<ref name=hutch171/>{{efn|These numbers for the early disk systems appear to be inaccurate – another document from the same author suggests that these figures are actually for the later version used on the Mark II translator.}}
 
इस सिस्टम को आईटीसी में इंजीनियरिंग के प्रमुख गिल्बर्ट किंग ने टीम के साथ विकसित किया था जिसमें लुई रिडेनॉर भी सम्मिलित थे। यह 16 इंच की प्लास्टिक डिस्क में विकसित हुआ था, जिसमें सूक्ष्म काले आयतों या स्पष्ट धब्बों की श्रृंखला के रूप में डेटा अंकित किया गया था। भंडारण के लिए डिस्क के केवल सबसे बाहरी 4 इंच का उपयोग किया गया, जिससे पहुंच वाले हिस्से की रैखिक गति बढ़ गई। जब डिस्क 2,400 आरपीएम पर घूमती है तो इसकी पहुंच गति लगभग 1 एमबीटी/सेकंड होती है। कुल मिलाकर, सिस्टम ने 30 Mbits संग्रहीत किया, जिससे यह अपने युग का उच्चतम घनत्व वाला ऑनलाइन सिस्टम बन गया।<ref name="hutch171" />{{efn|These numbers for the early disk systems appear to be inaccurate – another document from the same author suggests that these figures are actually for the later version used on the Mark II translator.}}


===मार्क I===
===मार्क I===
1954 में आईबीएम ने मशीनी अनुवाद का प्रभावशाली प्रदर्शन किया, जिसे आज [[जॉर्जटाउन-आईबीएम प्रयोग]] के रूप में जाना जाता है। [[आईबीएम 704]] मेनफ्रेम कंप्यूटर पर चलने पर, अनुवाद प्रणाली कार्बनिक रसायन विज्ञान के क्षेत्र तक सीमित रूसी के केवल 250 शब्द और उनके संयोजन के लिए केवल 6 व्याकरण नियमों को जानती थी। फिर भी, परिणाम बेहद आशाजनक थे, और प्रेस में व्यापक रूप से रिपोर्ट किया गया।<ref>John Hutchins, [http://www.hutchinsweb.me.uk/GU-IBM-2005.pdf "The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954"] {{Webarchive|url=https://web.archive.org/web/20160303171327/http://www.hutchinsweb.me.uk/GU-IBM-2005.pdf |date=3 March 2016 }}</ref>
1954 में आईबीएम ने मशीनी अनुवाद का प्रभावशाली प्रदर्शन किया, जिसे आज [[जॉर्जटाउन-आईबीएम प्रयोग]] के रूप में जाना जाता है। [[आईबीएम 704]] मेनफ्रेम कंप्यूटर पर चलने पर, अनुवाद सिस्टम कार्बनिक रसायन विज्ञान के क्षेत्र तक सीमित रूसी के केवल 250 शब्द और उनके संयोजन के लिए केवल 6 व्याकरण नियमों को जानती थी। फिर भी, परिणाम बेहद आशाजनक थे, और प्रेस में व्यापक रूप से रिपोर्ट किया गया।<ref>John Hutchins, [http://www.hutchinsweb.me.uk/GU-IBM-2005.pdf "The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954"] {{Webarchive|url=https://web.archive.org/web/20160303171327/http://www.hutchinsweb.me.uk/GU-IBM-2005.pdf |date=3 March 2016 }}</ref>
उस समय, उभरते मशीनी अनुवाद क्षेत्र के अधिकांश शोधकर्ताओं ने महसूस किया कि उचित अनुवाद प्रदान करने में बड़ी चुनौती बड़ी लाइब्रेरी का निर्माण करना था, क्योंकि उस युग के भंडारण उपकरण इस भूमिका में उपयोगी होने के लिए बहुत छोटे और बहुत धीमे थे।<ref name=hutch172>Hutchins, pg. 172</ref> किंग को लगा कि फोटोस्कोपिक स्टोर समस्या का स्वाभाविक समाधान है, और उन्होंने फोटोस्टोर पर आधारित स्वचालित अनुवाद प्रणाली का विचार वायु सेना को दिया। आरएडीसी ने दिलचस्पी दिखाई और मई 1956 में शोध अनुदान प्रदान किया। उस समय, वायु सेना ने [[वाशिंगटन विश्वविद्यालय]] के शोधकर्ताओं को भी अनुदान प्रदान किया जो परियोजना के लिए इष्टतम अनुवाद शब्दकोश बनाने की समस्या पर काम कर रहे थे।
उस समय, उभरते मशीनी अनुवाद क्षेत्र के अधिकांश शोधकर्ताओं ने महसूस किया कि उचित अनुवाद प्रदान करने में बड़ी चुनौती बड़ी लाइब्रेरी का निर्माण करना था, क्योंकि उस युग के भंडारण उपकरण इस भूमिका में उपयोगी होने के लिए बहुत छोटे और बहुत धीमे थे।<ref name=hutch172>Hutchins, pg. 172</ref> किंग को लगा कि फोटोस्कोपिक स्टोर समस्या का स्वाभाविक समाधान है, और उन्होंने फोटोस्टोर पर आधारित ऑटोमैटिक अनुवाद सिस्टम का विचार वायु सेना को दिया। आरएडीसी ने दिलचस्पी दिखाई और मई 1956 में शोध अनुदान प्रदान किया। उस समय, वायु सेना ने [[वाशिंगटन विश्वविद्यालय]] के शोधकर्ताओं को भी अनुदान प्रदान किया जो परियोजना के लिए इष्टतम अनुवाद शब्दकोश बनाने की समस्या पर कार्य कर रहे थे।


किंग ने अनुवाद के लिए शब्द-दर-शब्द सरल दृष्टिकोण की वकालत की। उन्होंने सोचा कि भाषा में प्राकृतिक अतिरेक के कारण खराब अनुवाद को भी समझा जा सकता है, और अस्पष्ट शब्दों का सामना करने पर स्थानीय संदर्भ ही उचित अनुमान प्रदान करने के लिए पर्याप्त है। उन्होंने कहा कि वाक्य में शब्दों का अनुमान लगाने में .50 की संभावना प्राप्त करने में मानव की सफलता काफी हद तक उसके अनुभव और पहले से खोजे गए शब्दों के वास्तविक अर्थों के कारण है।<ref name="King, 1956">King, 1956</ref> दूसरे शब्दों में, केवल शब्दों का अनुवाद करने से मनुष्य किसी दस्तावेज़ को प्रभावी ढंग से पढ़ सकेगा, क्योंकि वे पहले के शब्दों द्वारा प्रदान किए गए संदर्भ से उचित अर्थ निकालने में सक्षम होंगे।
किंग ने अनुवाद के लिए शब्द-दर-शब्द सरल दृष्टिकोण की वकालत की। उन्होंने सोचा कि लैंग्वेज में प्राकृतिक अतिरेक के कारण खराब अनुवाद को भी समझा जा सकता है, और अस्पष्ट शब्दों का सामना करने पर स्थानीय संदर्भ ही उचित अनुमान प्रदान करने के लिए पर्याप्त है। उन्होंने कहा कि वाक्य में शब्दों का अनुमान लगाने में .50 की संभावना प्राप्त करने में मानव की सफलता काफी हद तक उसके अनुभव और पहले से खोजे गए शब्दों के वास्तविक अर्थों के कारण है।<ref name="King, 1956">King, 1956</ref> दूसरे शब्दों में, केवल शब्दों का अनुवाद करने से मनुष्य किसी डाक्यूमेंट़ को प्रभावी ढंग से पढ़ सकेगा, क्योंकि वे पहले के शब्दों द्वारा प्रदान किए गए संदर्भ से उचित अर्थ निकालने में सक्षम होंगे।


1958 में किंग आईबीएम के थॉमस जे. वॉटसन रिसर्च सेंटर में चले गए और फोटोस्टोर-आधारित अनुवादक का विकास जारी रखा। समय के साथ, किंग ने शुद्ध शब्द-दर-शब्द अनुवादक के दृष्टिकोण को बदल कर उस अनुवादक में बदल दिया जो तने और अंत को संग्रहीत करता था, जो शब्दों को भागों में तोड़ देता था जिन्हें फिर से साथ जोड़कर पूर्ण शब्द बनाया जा सकता था।<ref name="King, 1956" />
1958 में किंग आईबीएम के थॉमस जे. वॉटसन रिसर्च सेंटर में चले गए और फोटोस्टोर-आधारित ट्रांसलेटर का विकास जारी रखा। समय के साथ, किंग ने शुद्ध शब्द-दर-शब्द ट्रांसलेटर के दृष्टिकोण को बदल कर उस ट्रांसलेटर में बदल दिया जो तने और अंत को संग्रहीत करता था, जो शब्दों को भागों में तोड़ देता था जिन्हें फिर से साथ जोड़कर पूर्ण शब्द बनाया जा सकता था।<ref name="King, 1956" />


पहली मशीन, मार्क I, का प्रदर्शन जुलाई 1959 में किया गया था और इसमें 65,000 शब्दों का शब्दकोश और लुकअप करने के लिए कस्टम ट्यूब-आधारित कंप्यूटर शामिल था।<ref name=hutch172/>कस्टम सिरिलिक टर्मिनलों का उपयोग करके टेक्स्ट को [[छिद्रित कार्ड]] पर हाथ से कॉपी किया जाता था, और फिर अनुवाद के लिए मशीन में इनपुट किया जाता था। परिणाम प्रभावशाली से कम थे, लेकिन यह सुझाव देने के लिए पर्याप्त थे कि बड़ी और तेज़ मशीन उचित विकास होगा। इस बीच, मार्क I को सोवियत समाचार पत्र, [[ सच्चाई |सच्चाई]] के अनुवादों पर लागू किया गया था। परिणाम संदिग्ध बने रहे, लेकिन किंग ने [[ अमेरिकी वैज्ञानिक |अमेरिकी वैज्ञानिक]] में यह कहते हुए इसे सफल घोषित किया कि प्रणाली को, परिचालन मूल्यांकन में, सरकार द्वारा काफी उपयोगी पाया गया।<ref name=hutch172/>
पहली मशीन, मार्क I, का प्रदर्शन जुलाई 1959 में किया गया था और इसमें 65,000 शब्दों का शब्दकोश और लुकअप करने के लिए कस्टम ट्यूब-आधारित कंप्यूटर सम्मिलित था।<ref name=hutch172/>कस्टम सिरिलिक टर्मिनलों का उपयोग करके टेक्स्ट को [[छिद्रित कार्ड]] पर हाथ से कॉपी किया जाता था, और फिर अनुवाद के लिए मशीन में इनपुट किया जाता था। परिणाम प्रभावशाली से कम थे, लेकिन यह सुझाव देने के लिए पर्याप्त थे कि बड़ी और तेज़ मशीन उचित विकास होगा। इस बीच, मार्क I को सोवियत समाचार पत्र, [[ सच्चाई |सच्चाई]] के अनुवादों पर लागू किया गया था। परिणाम संदिग्ध बने रहे, लेकिन किंग ने [[ अमेरिकी वैज्ञानिक |अमेरिकी वैज्ञानिक]] में यह कहते हुए इसे सफल घोषित किया कि सिस्टम को, परिचालन मूल्यांकन में, सरकार द्वारा काफी उपयोगी पाया गया।<ref name=hutch172/>




===मार्क II===
===मार्क II===
4 अक्टूबर 1957 को [[ सोवियत संघ |सोवियत संघ]] ने पहला कृत्रिम उपग्रह [[स्पुतनिक 1]] लॉन्च किया। इससे अमेरिका में चिंता की लहर फैल गई, जिसका अपना [[प्रोजेक्ट वैनगार्ड]] असफल रहा और फिर शानदार अंदाज में बार-बार विफल साबित हुआ। घटनाओं के इस शर्मनाक मोड़ के कारण अमेरिकी विज्ञान और प्रौद्योगिकी में भारी निवेश हुआ, जिसमें [[DARPA]], [[NASA]] का गठन और कई तरह के खुफिया प्रयास शामिल थे, जो इस तरह से फिर से आश्चर्यचकित होने से बचने का प्रयास करेंगे।
4 अक्टूबर 1957 को [[ सोवियत संघ |सोवियत संघ]] ने पहला कृत्रिम उपग्रह [[स्पुतनिक 1]] लॉन्च किया। इससे अमेरिका में चिंता की लहर फैल गई, जिसका अपना [[प्रोजेक्ट वैनगार्ड]] असफल रहा और फिर शानदार अंदाज में बार-बार विफल साबित हुआ। घटनाओं के इस शर्मनाक मोड़ के कारण अमेरिकी विज्ञान और प्रौद्योगिकी में भारी निवेश हुआ, जिसमें [[DARPA]], [[NASA]] का गठन और कई तरह के खुफिया प्रयास सम्मिलित थे, जो इस तरह से फिर से आश्चर्यचकित होने से बचने का प्रयास करेंगे।


थोड़े समय के बाद, खुफिया प्रयासों को [[राइट पैटरसन वायु सेना बेस]] पर विदेशी प्रौद्योगिकी प्रभाग (एफटीडी, जिसे अब [[राष्ट्रीय वायु और अंतरिक्ष खुफिया केंद्र]] के रूप में जाना जाता है) के रूप में केंद्रीकृत किया गया, जो वायु सेना द्वारा रक्षा खुफिया एजेंसी और अन्य से इनपुट के साथ चलाया जाता है। संगठन. एफटीडी को सोवियत और अन्य [[वारसॉ ब्लॉक]] तकनीकी और वैज्ञानिक पत्रिकाओं के अनुवाद का काम सौंपा गया था ताकि पश्चिम में शोधकर्ता [[लौह पर्दा]] के पीछे के विकास पर अपडेट रह सकें। इनमें से अधिकांश दस्तावेज़ सार्वजनिक रूप से उपलब्ध थे, लेकिन एफटीडी ने अनुरोध पर अन्य सामग्रियों के कई एकमुश्त अनुवाद भी किए।
थोड़े समय के बाद, खुफिया प्रयासों को [[राइट पैटरसन वायु सेना बेस]] पर विदेशी प्रौद्योगिकी प्रभाग (एफटीडी, जिसे अब [[राष्ट्रीय वायु और अंतरिक्ष खुफिया केंद्र]] के रूप में जाना जाता है) के रूप में केंद्रीकृत किया गया, जो वायु सेना द्वारा रक्षा खुफिया एजेंसी और अन्य से इनपुट के साथ चलाया जाता है। संगठन. एफटीडी को सोवियत और अन्य [[वारसॉ ब्लॉक]] तकनीकी और वैज्ञानिक पत्रिकाओं के अनुवाद का कार्य सौंपा गया था ताकि पश्चिम में शोधकर्ता [[लौह पर्दा]] के पीछे के विकास पर अपडेट रह सकें। इनमें से अधिकांश डाक्यूमेंट़ सार्वजनिक रूप से उपलब्ध थे, लेकिन एफटीडी ने अनुरोध पर अन्य सामग्रियों के कई एकमुश्त अनुवाद भी किए।


यह मानते हुए कि योग्य अनुवादकों की कमी थी, एफटीडी को आईबीएम में किंग के प्रयासों में अत्यधिक रुचि हो गई। उन्नत मशीन के लिए फंडिंग जल्द ही आने वाली थी, और 2,400 आरपीएम पर घूमने वाली तेज और उच्च क्षमता वाली 10 इंच ग्लास-आधारित ऑप्टिकल डिस्क वाले ट्रांजिस्टरयुक्त कंप्यूटर पर आधारित मार्क II प्रणाली पर काम शुरू हुआ। अन्य अतिरिक्त तीसरे पक्ष द्वारा प्रदान की गई ऑप्टिकल कैरेक्टर पहचान थी, जिससे उन्हें उम्मीद थी कि रूसी पाठ को मशीन-पठनीय कार्डों में कॉपी करने की समय लेने वाली प्रक्रिया समाप्त हो जाएगी।<ref name=hutch172/>
यह मानते हुए कि योग्य ट्रांसलेटरों की कमी थी, एफटीडी को आईबीएम में किंग के प्रयासों में अत्यधिक रुचि हो गई। उन्नत मशीन के लिए फंडिंग जल्द ही आने वाली थी, और 2,400 आरपीएम पर घूमने वाली तेज और उच्च क्षमता वाली 10 इंच ग्लास-आधारित ऑप्टिकल डिस्क वाले ट्रांजिस्टरयुक्त कंप्यूटर पर आधारित मार्क II सिस्टम पर कार्य प्रारंभ हुआ। अन्य अतिरिक्त तीसरे पक्ष द्वारा प्रदान की गई ऑप्टिकल कैरेक्टर पहचान थी, जिससे उन्हें उम्मीद थी कि रूसी पाठ को मशीन-पठनीय कार्डों में कॉपी करने की समय लेने वाली प्रक्रिया समाप्त हो जाएगी।<ref name=hutch172/>


1960 में वाशिंगटन टीम भी अपने शब्दकोश प्रयासों को लेकर आईबीएम में शामिल हो गई। जैसे-जैसे अतिरिक्त भंडारण उपलब्ध कराया गया, शब्दकोश का विस्तार जारी रहा, एफटीडी में स्थापित होने तक यह 170,000 शब्दों और शब्दों तक पहुंच गया। मार्क II में प्रमुख सॉफ्टवेयर अपडेट भी शामिल किया गया था, जिसे किंग ने डिक्शनरी स्टफिंग कहा था। स्टफिंग, पाठ में पहले के शब्दों से उन पर उपसर्ग भरकर अस्पष्ट शब्दों की समस्याओं से निपटने का प्रयास था।<ref name=hutch172/>ये संशोधित शब्द शब्दकोश में समान रूप से भरे शब्दों से मेल खाएंगे, जिससे झूठी सकारात्मकता की संख्या कम हो जाएगी।
1960 में वाशिंगटन टीम भी अपने शब्दकोश प्रयासों को लेकर आईबीएम में सम्मिलित हो गई। जैसे-जैसे अतिरिक्त भंडारण उपलब्ध कराया गया, शब्दकोश का विस्तार जारी रहा, एफटीडी में स्थापित होने तक यह 170,000 शब्दों और शब्दों तक पहुंच गया। मार्क II में प्रमुख सॉफ्टवेयर अपडेट भी सम्मिलित किया गया था, जिसे किंग ने डिक्शनरी स्टफिंग कहा था। स्टफिंग, पाठ में पहले के शब्दों से उन पर उपसर्ग भरकर अस्पष्ट शब्दों की समस्याओं से निपटने का प्रयास था।<ref name=hutch172/>ये संशोधित शब्द शब्दकोश में समान रूप से भरे शब्दों से मेल खाएंगे, जिससे झूठी सकारात्मकता की संख्या कम हो जाएगी।


1962 में किंग ने आईबीएम को तेजी से नई प्रौद्योगिकियों को प्राप्त करने की प्रक्रिया में सैन्य ठेकेदार आईटेक के लिए छोड़ दिया। आईबीएम में विकास जारी रहा, और सिस्टम फरवरी 1964 में एफटीडी में पूरी तरह से चालू हो गया। इस सिस्टम का प्रदर्शन 1964 के न्यूयॉर्क विश्व मेले में किया गया था। मेले के संस्करण में 150,000 शब्दों का शब्दकोश शामिल था, जिसमें लगभग 1/3 शब्द वाक्यांशों में थे। प्रदर्शन में सुधार के लिए इनमें से लगभग 3,500 को [[कोर मेमोरी]] में संग्रहीत किया गया था, और प्रति मिनट 20 शब्द की औसत गति का दावा किया गया था। सावधानीपूर्वक चयनित इनपुट टेक्स्ट के परिणाम काफी प्रभावशाली थे।<ref>Hutchins, pg. 174</ref> एफटीडी में इसकी वापसी के बाद, इसका उपयोग 1970 तक लगातार किया गया, जब इसे सिस्ट्रान चलाने वाली मशीन द्वारा प्रतिस्थापित किया गया।<ref>Hutchins, pg. 175</ref>
1962 में किंग ने आईबीएम को तेजी से नई प्रौद्योगिकियों को प्राप्त करने की प्रक्रिया में सैन्य ठेकेदार आईटेक के लिए छोड़ दिया। आईबीएम में विकास जारी रहा, और सिस्टम फरवरी 1964 में एफटीडी में पूरी तरह से चालू हो गया। इस सिस्टम का प्रदर्शन 1964 के न्यूयॉर्क विश्व मेले में किया गया था। मेले के संस्करण में 150,000 शब्दों का शब्दकोश सम्मिलित था, जिसमें लगभग 1/3 शब्द वाक्यांशों में थे। प्रदर्शन में सुधार के लिए इनमें से लगभग 3,500 को [[कोर मेमोरी]] में संग्रहीत किया गया था, और प्रति मिनट 20 शब्द की औसत गति का दावा किया गया था। सावधानीपूर्वक चयनित इनपुट टेक्स्ट के परिणाम काफी प्रभावशाली थे।<ref>Hutchins, pg. 174</ref> एफटीडी में इसकी वापसी के बाद, इसका उपयोग 1970 तक लगातार किया गया, जब इसे सिस्ट्रान चलाने वाली मशीन द्वारा प्रतिस्थापित किया गया।<ref>Hutchins, pg. 175</ref>




===[[ALPAC]] रिपोर्ट===
===[[ALPAC]] रिपोर्ट===
1964 में संयुक्त राज्य अमेरिका के रक्षा विभाग ने मशीनी अनुवाद की स्थिति पर रिपोर्ट तैयार करने के लिए यूनाइटेड स्टेट्स [[राष्ट्रीय विज्ञान अकादमी]] (NAS) को नियुक्त किया। NAS ने स्वचालित भाषा प्रसंस्करण सलाहकार समिति, या ALPAC का गठन किया, और 1966 में उनके निष्कर्ष प्रकाशित किए। रिपोर्ट, भाषा और मशीनें: अनुवाद और भाषा विज्ञान में कंप्यूटर, मौजूदा प्रयासों की अत्यधिक आलोचनात्मक थी, यह दर्शाती है कि सिस्टम मानव से अधिक तेज़ नहीं थे। अनुवाद, यह भी प्रदर्शित करते हुए कि अनुवादकों की कथित कमी वास्तव में अधिशेष थी, और [[आपूर्ति और मांग]] के मुद्दों के परिणामस्वरूप, मानव अनुवाद अपेक्षाकृत सस्ता था - प्रति 1,000 शब्दों पर लगभग 6 डॉलर। इससे भी बुरी बात यह है कि एफटीडी भी धीमी थी; इनपुट के रूप में भौतिकी के कागजात का उपयोग करने वाले परीक्षणों से पता चला कि अनुवादक 10 प्रतिशत कम सटीक, 21 प्रतिशत धीमा था, और जब उसने मानव अनुवाद का उपयोग किया था तब उसकी समझ का स्तर 29 प्रतिशत कम था।<ref>ALPAC, pg. 20</ref>
1964 में संयुक्त राज्य अमेरिका के रक्षा विभाग ने मशीनी अनुवाद की स्थिति पर रिपोर्ट तैयार करने के लिए यूनाइटेड स्टेट्स [[राष्ट्रीय विज्ञान अकादमी]] (NAS) को नियुक्त किया। NAS ने ऑटोमैटिक लैंग्वेज प्रसंस्करण सलाहकार समिति, या ALPAC का गठन किया, और 1966 में उनके निष्कर्ष प्रकाशित किए। रिपोर्ट, लैंग्वेज और मशीनें: अनुवाद और लैंग्वेज विज्ञान में कंप्यूटर, मौजूदा प्रयासों की अत्यधिक आलोचनात्मक थी, यह दर्शाती है कि सिस्टम मानव से अधिक तेज़ नहीं थे। अनुवाद, यह भी प्रदर्शित करते हुए कि ट्रांसलेटरों की कथित कमी वास्तव में अधिशेष थी, और [[आपूर्ति और मांग]] के मुद्दों के परिणामस्वरूप, मानव अनुवाद अपेक्षाकृत सस्ता था - प्रति 1,000 शब्दों पर लगभग 6 डॉलर। इससे भी बुरी बात यह है कि एफटीडी भी धीमी थी; इनपुट के रूप में भौतिकी के कागजात का उपयोग करने वाले परीक्षणों से पता चला कि ट्रांसलेटर 10 प्रतिशत कम सटीक, 21 प्रतिशत धीमा था, और जब उसने मानव अनुवाद का उपयोग किया था तब उसकी समझ का स्तर 29 प्रतिशत कम था।<ref>ALPAC, pg. 20</ref>
ALPAC रिपोर्ट उतनी ही प्रभावशाली थी जितनी दशक पहले जॉर्जटाउन प्रयोग था; इसके प्रकाशन के तुरंत बाद, अमेरिकी सरकार ने मशीनी अनुवाद अनुसंधान के लिए लगभग सभी फंडिंग निलंबित कर दी।<ref>John Hutchins, [http://www.hutchinsweb.me.uk/ALPAC-1996.pdf "ALPAC: the (in)famous report"] {{Webarchive|url=https://web.archive.org/web/20071006133016/http://www.hutchinsweb.me.uk/ALPAC-1996.pdf |date=6 October 2007 }}</ref> आईबीएम और आईटेक में चल रहा काम 1966 तक समाप्त हो गया था, जिससे यह क्षेत्र यूरोपीय लोगों के पास चला गया, जिन्होंने सिस्ट्रान और लोगो जैसी प्रणालियों का विकास जारी रखा।
ALPAC रिपोर्ट उतनी ही प्रभावशाली थी जितनी दशक पहले जॉर्जटाउन प्रयोग था; इसके प्रकाशन के तुरंत बाद, अमेरिकी सरकार ने मशीनी अनुवाद अनुसंधान के लिए लगभग सभी फंडिंग निलंबित कर दी।<ref>John Hutchins, [http://www.hutchinsweb.me.uk/ALPAC-1996.pdf "ALPAC: the (in)famous report"] {{Webarchive|url=https://web.archive.org/web/20071006133016/http://www.hutchinsweb.me.uk/ALPAC-1996.pdf |date=6 October 2007 }}</ref> आईबीएम और आईटेक में चल रहा कार्य 1966 तक समाप्त हो गया था, जिससे यह क्षेत्र यूरोपीय लोगों के पास चला गया, जिन्होंने सिस्ट्रान और लोगो जैसी प्रणालियों का विकास जारी रखा।


==टिप्पणियाँ==
==टिप्पणियाँ==

Revision as of 11:51, 5 August 2023

आईबीएम का ऑटोमैटिक लैंग्वेज ट्रांसलेटर मशीन अनुवाद सिस्टम थी जो रूसी लैंग्वेज के डाक्यूमेंट को अंग्रेजी लैंग्वेज में परिवर्तित करती थी। इसमें ऑप्टिकल डिस्क का उपयोग किया गया था जो 170,000 शब्द-दर-शब्द और कथन-दर-कथन अनुवाद संग्रहीत करता था और उन्हें उच्च गति से देखने के लिए कस्टम कंप्यूटर का उपयोग करता था। अमेरिकी वायु सेना के विदेशी प्रौद्योगिकी प्रभाग के लिए निर्मित, एएन/जीएसक्यू-16 (या एक्सडब्ल्यू-2), जैसा कि वायु सेना को ज्ञात था, जिसका उपयोग मुख्य रूप से पश्चिमी वैज्ञानिकों को वितरण के लिए सोवियत तकनीकी डाक्यूमेंट को परिवर्तित करने के लिए किया गया था। ट्रांसलेटर 1959 में स्थापित किया गया था, 1964 में नाटकीय रूप से उन्नत किया गया था, और अंततः 1970 में सिस्ट्रान चलाने वाले मेनफ़्रेम कंप्यूटर द्वारा प्रतिस्थापित किया गया था।

इतिहास

फ़ोटोस्कोपिक स्टोर

ट्रांसलेटर का कार्य जून 1953 में अमेरिकी नौसेना से लॉस एंजिल्स के अंतर्राष्ट्रीय टेलीमीटर निगम (आईटीसी) के साथ अनुबंध के अनुसार प्रारंभ हुआ था। यह किसी अनुवाद सिस्टम के लिए नहीं था, किन्तु प्लास्टिक डिस्क में एम्बेडेड ब्लैक आयतों से युक्त उच्च प्रदर्शन वाले फोटोग्राफिक ऑनलाइन स्टोरेज माध्यम के लिए शुद्ध अनुसंधान और विकास अनुबंध था। जब प्रारंभिक अनुबंध समाप्त हो गया था, तब रोम वायु विकास केंद्र (आरएडीसी) ने 1954 और उसके बाद आगे की फंडिंग प्रारंभ की था।[1]

इस सिस्टम को आईटीसी में इंजीनियरिंग के प्रमुख गिल्बर्ट किंग ने टीम के साथ विकसित किया था जिसमें लुई रिडेनॉर भी सम्मिलित थे। यह 16 इंच की प्लास्टिक डिस्क में विकसित हुआ था, जिसमें सूक्ष्म काले आयतों या स्पष्ट धब्बों की श्रृंखला के रूप में डेटा अंकित किया गया था। भंडारण के लिए डिस्क के केवल सबसे बाहरी 4 इंच का उपयोग किया गया, जिससे पहुंच वाले हिस्से की रैखिक गति बढ़ गई। जब डिस्क 2,400 आरपीएम पर घूमती है तो इसकी पहुंच गति लगभग 1 एमबीटी/सेकंड होती है। कुल मिलाकर, सिस्टम ने 30 Mbits संग्रहीत किया, जिससे यह अपने युग का उच्चतम घनत्व वाला ऑनलाइन सिस्टम बन गया।[1][lower-alpha 1]

मार्क I

1954 में आईबीएम ने मशीनी अनुवाद का प्रभावशाली प्रदर्शन किया, जिसे आज जॉर्जटाउन-आईबीएम प्रयोग के रूप में जाना जाता है। आईबीएम 704 मेनफ्रेम कंप्यूटर पर चलने पर, अनुवाद सिस्टम कार्बनिक रसायन विज्ञान के क्षेत्र तक सीमित रूसी के केवल 250 शब्द और उनके संयोजन के लिए केवल 6 व्याकरण नियमों को जानती थी। फिर भी, परिणाम बेहद आशाजनक थे, और प्रेस में व्यापक रूप से रिपोर्ट किया गया।[2] उस समय, उभरते मशीनी अनुवाद क्षेत्र के अधिकांश शोधकर्ताओं ने महसूस किया कि उचित अनुवाद प्रदान करने में बड़ी चुनौती बड़ी लाइब्रेरी का निर्माण करना था, क्योंकि उस युग के भंडारण उपकरण इस भूमिका में उपयोगी होने के लिए बहुत छोटे और बहुत धीमे थे।[3] किंग को लगा कि फोटोस्कोपिक स्टोर समस्या का स्वाभाविक समाधान है, और उन्होंने फोटोस्टोर पर आधारित ऑटोमैटिक अनुवाद सिस्टम का विचार वायु सेना को दिया। आरएडीसी ने दिलचस्पी दिखाई और मई 1956 में शोध अनुदान प्रदान किया। उस समय, वायु सेना ने वाशिंगटन विश्वविद्यालय के शोधकर्ताओं को भी अनुदान प्रदान किया जो परियोजना के लिए इष्टतम अनुवाद शब्दकोश बनाने की समस्या पर कार्य कर रहे थे।

किंग ने अनुवाद के लिए शब्द-दर-शब्द सरल दृष्टिकोण की वकालत की। उन्होंने सोचा कि लैंग्वेज में प्राकृतिक अतिरेक के कारण खराब अनुवाद को भी समझा जा सकता है, और अस्पष्ट शब्दों का सामना करने पर स्थानीय संदर्भ ही उचित अनुमान प्रदान करने के लिए पर्याप्त है। उन्होंने कहा कि वाक्य में शब्दों का अनुमान लगाने में .50 की संभावना प्राप्त करने में मानव की सफलता काफी हद तक उसके अनुभव और पहले से खोजे गए शब्दों के वास्तविक अर्थों के कारण है।[4] दूसरे शब्दों में, केवल शब्दों का अनुवाद करने से मनुष्य किसी डाक्यूमेंट़ को प्रभावी ढंग से पढ़ सकेगा, क्योंकि वे पहले के शब्दों द्वारा प्रदान किए गए संदर्भ से उचित अर्थ निकालने में सक्षम होंगे।

1958 में किंग आईबीएम के थॉमस जे. वॉटसन रिसर्च सेंटर में चले गए और फोटोस्टोर-आधारित ट्रांसलेटर का विकास जारी रखा। समय के साथ, किंग ने शुद्ध शब्द-दर-शब्द ट्रांसलेटर के दृष्टिकोण को बदल कर उस ट्रांसलेटर में बदल दिया जो तने और अंत को संग्रहीत करता था, जो शब्दों को भागों में तोड़ देता था जिन्हें फिर से साथ जोड़कर पूर्ण शब्द बनाया जा सकता था।[4]

पहली मशीन, मार्क I, का प्रदर्शन जुलाई 1959 में किया गया था और इसमें 65,000 शब्दों का शब्दकोश और लुकअप करने के लिए कस्टम ट्यूब-आधारित कंप्यूटर सम्मिलित था।[3]कस्टम सिरिलिक टर्मिनलों का उपयोग करके टेक्स्ट को छिद्रित कार्ड पर हाथ से कॉपी किया जाता था, और फिर अनुवाद के लिए मशीन में इनपुट किया जाता था। परिणाम प्रभावशाली से कम थे, लेकिन यह सुझाव देने के लिए पर्याप्त थे कि बड़ी और तेज़ मशीन उचित विकास होगा। इस बीच, मार्क I को सोवियत समाचार पत्र, सच्चाई के अनुवादों पर लागू किया गया था। परिणाम संदिग्ध बने रहे, लेकिन किंग ने अमेरिकी वैज्ञानिक में यह कहते हुए इसे सफल घोषित किया कि सिस्टम को, परिचालन मूल्यांकन में, सरकार द्वारा काफी उपयोगी पाया गया।[3]


मार्क II

4 अक्टूबर 1957 को सोवियत संघ ने पहला कृत्रिम उपग्रह स्पुतनिक 1 लॉन्च किया। इससे अमेरिका में चिंता की लहर फैल गई, जिसका अपना प्रोजेक्ट वैनगार्ड असफल रहा और फिर शानदार अंदाज में बार-बार विफल साबित हुआ। घटनाओं के इस शर्मनाक मोड़ के कारण अमेरिकी विज्ञान और प्रौद्योगिकी में भारी निवेश हुआ, जिसमें DARPA, NASA का गठन और कई तरह के खुफिया प्रयास सम्मिलित थे, जो इस तरह से फिर से आश्चर्यचकित होने से बचने का प्रयास करेंगे।

थोड़े समय के बाद, खुफिया प्रयासों को राइट पैटरसन वायु सेना बेस पर विदेशी प्रौद्योगिकी प्रभाग (एफटीडी, जिसे अब राष्ट्रीय वायु और अंतरिक्ष खुफिया केंद्र के रूप में जाना जाता है) के रूप में केंद्रीकृत किया गया, जो वायु सेना द्वारा रक्षा खुफिया एजेंसी और अन्य से इनपुट के साथ चलाया जाता है। संगठन. एफटीडी को सोवियत और अन्य वारसॉ ब्लॉक तकनीकी और वैज्ञानिक पत्रिकाओं के अनुवाद का कार्य सौंपा गया था ताकि पश्चिम में शोधकर्ता लौह पर्दा के पीछे के विकास पर अपडेट रह सकें। इनमें से अधिकांश डाक्यूमेंट़ सार्वजनिक रूप से उपलब्ध थे, लेकिन एफटीडी ने अनुरोध पर अन्य सामग्रियों के कई एकमुश्त अनुवाद भी किए।

यह मानते हुए कि योग्य ट्रांसलेटरों की कमी थी, एफटीडी को आईबीएम में किंग के प्रयासों में अत्यधिक रुचि हो गई। उन्नत मशीन के लिए फंडिंग जल्द ही आने वाली थी, और 2,400 आरपीएम पर घूमने वाली तेज और उच्च क्षमता वाली 10 इंच ग्लास-आधारित ऑप्टिकल डिस्क वाले ट्रांजिस्टरयुक्त कंप्यूटर पर आधारित मार्क II सिस्टम पर कार्य प्रारंभ हुआ। अन्य अतिरिक्त तीसरे पक्ष द्वारा प्रदान की गई ऑप्टिकल कैरेक्टर पहचान थी, जिससे उन्हें उम्मीद थी कि रूसी पाठ को मशीन-पठनीय कार्डों में कॉपी करने की समय लेने वाली प्रक्रिया समाप्त हो जाएगी।[3]

1960 में वाशिंगटन टीम भी अपने शब्दकोश प्रयासों को लेकर आईबीएम में सम्मिलित हो गई। जैसे-जैसे अतिरिक्त भंडारण उपलब्ध कराया गया, शब्दकोश का विस्तार जारी रहा, एफटीडी में स्थापित होने तक यह 170,000 शब्दों और शब्दों तक पहुंच गया। मार्क II में प्रमुख सॉफ्टवेयर अपडेट भी सम्मिलित किया गया था, जिसे किंग ने डिक्शनरी स्टफिंग कहा था। स्टफिंग, पाठ में पहले के शब्दों से उन पर उपसर्ग भरकर अस्पष्ट शब्दों की समस्याओं से निपटने का प्रयास था।[3]ये संशोधित शब्द शब्दकोश में समान रूप से भरे शब्दों से मेल खाएंगे, जिससे झूठी सकारात्मकता की संख्या कम हो जाएगी।

1962 में किंग ने आईबीएम को तेजी से नई प्रौद्योगिकियों को प्राप्त करने की प्रक्रिया में सैन्य ठेकेदार आईटेक के लिए छोड़ दिया। आईबीएम में विकास जारी रहा, और सिस्टम फरवरी 1964 में एफटीडी में पूरी तरह से चालू हो गया। इस सिस्टम का प्रदर्शन 1964 के न्यूयॉर्क विश्व मेले में किया गया था। मेले के संस्करण में 150,000 शब्दों का शब्दकोश सम्मिलित था, जिसमें लगभग 1/3 शब्द वाक्यांशों में थे। प्रदर्शन में सुधार के लिए इनमें से लगभग 3,500 को कोर मेमोरी में संग्रहीत किया गया था, और प्रति मिनट 20 शब्द की औसत गति का दावा किया गया था। सावधानीपूर्वक चयनित इनपुट टेक्स्ट के परिणाम काफी प्रभावशाली थे।[5] एफटीडी में इसकी वापसी के बाद, इसका उपयोग 1970 तक लगातार किया गया, जब इसे सिस्ट्रान चलाने वाली मशीन द्वारा प्रतिस्थापित किया गया।[6]


ALPAC रिपोर्ट

1964 में संयुक्त राज्य अमेरिका के रक्षा विभाग ने मशीनी अनुवाद की स्थिति पर रिपोर्ट तैयार करने के लिए यूनाइटेड स्टेट्स राष्ट्रीय विज्ञान अकादमी (NAS) को नियुक्त किया। NAS ने ऑटोमैटिक लैंग्वेज प्रसंस्करण सलाहकार समिति, या ALPAC का गठन किया, और 1966 में उनके निष्कर्ष प्रकाशित किए। रिपोर्ट, लैंग्वेज और मशीनें: अनुवाद और लैंग्वेज विज्ञान में कंप्यूटर, मौजूदा प्रयासों की अत्यधिक आलोचनात्मक थी, यह दर्शाती है कि सिस्टम मानव से अधिक तेज़ नहीं थे। अनुवाद, यह भी प्रदर्शित करते हुए कि ट्रांसलेटरों की कथित कमी वास्तव में अधिशेष थी, और आपूर्ति और मांग के मुद्दों के परिणामस्वरूप, मानव अनुवाद अपेक्षाकृत सस्ता था - प्रति 1,000 शब्दों पर लगभग 6 डॉलर। इससे भी बुरी बात यह है कि एफटीडी भी धीमी थी; इनपुट के रूप में भौतिकी के कागजात का उपयोग करने वाले परीक्षणों से पता चला कि ट्रांसलेटर 10 प्रतिशत कम सटीक, 21 प्रतिशत धीमा था, और जब उसने मानव अनुवाद का उपयोग किया था तब उसकी समझ का स्तर 29 प्रतिशत कम था।[7] ALPAC रिपोर्ट उतनी ही प्रभावशाली थी जितनी दशक पहले जॉर्जटाउन प्रयोग था; इसके प्रकाशन के तुरंत बाद, अमेरिकी सरकार ने मशीनी अनुवाद अनुसंधान के लिए लगभग सभी फंडिंग निलंबित कर दी।[8] आईबीएम और आईटेक में चल रहा कार्य 1966 तक समाप्त हो गया था, जिससे यह क्षेत्र यूरोपीय लोगों के पास चला गया, जिन्होंने सिस्ट्रान और लोगो जैसी प्रणालियों का विकास जारी रखा।

टिप्पणियाँ

  1. These numbers for the early disk systems appear to be inaccurate – another document from the same author suggests that these figures are actually for the later version used on the Mark II translator.


संदर्भ

उद्धरण

  1. 1.0 1.1 Hutchins, pg. 171
  2. John Hutchins, "The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954" Archived 3 March 2016 at the Wayback Machine
  3. 3.0 3.1 3.2 3.3 3.4 Hutchins, pg. 172
  4. 4.0 4.1 King, 1956
  5. Hutchins, pg. 174
  6. Hutchins, pg. 175
  7. ALPAC, pg. 20
  8. John Hutchins, "ALPAC: the (in)famous report" Archived 6 October 2007 at the Wayback Machine


ग्रन्थसूची

  • G.W. King, G.W. Brown and L.N. Ridenour, "Photographic Techniques for Information Storage", Proceedings of the IRE, Volume 41 Issue 10 (October 1953), pp. 1421–1428
  • G.W. King, "Stochastic Methods of Mechanical Translation", Mechanical Translation, Volume 3 Issue 2 (1956) pp. 38–39
  • J.L. Craft, E.H. Goldman, W.B. Strohm, "A Table Look-up Machine for Processing of Natural Languages", IBM Journal, July 1961, pp. 192–203
  • Language Processing Advisory Committee, "Language and Machines: Computers in Translation and Linguistics", National Research Council, 1966 (widely known as the "ALPAC Report")
  • John Hutchins (ed), "Gilbert W. King and the IBM-USAF Translator", Early Years in Machine Translation, Joh Benjamins, 2000, ISBN 90-272-4586-X (RADC-TDR-62-105)
  • Charles Bourne and Trudi Bellardo Hahn, "A History of Online Information Services, 1963–1976", MIT Press, 2003, ISBN 0-262-02538-8