स्वचालित भाषा अनुवादक (ऑटोमैटिक लैंग्वेज ट्रांसलेटर)

From Vigyanwiki

आईबीएम का ऑटोमैटिक लैंग्वेज ट्रांसलेटर मशीन अनुवाद सिस्टम थी जो रूसी लैंग्वेज के डाक्यूमेंट को अंग्रेजी लैंग्वेज में परिवर्तित करती थी। इसमें ऑप्टिकल डिस्क का उपयोग किया गया था जो 170,000 स्टेटमेंट-फॉर-स्टेटमेंट और वर्ड-फॉर-वर्ड अनुवाद संग्रहीत करता था और उन्हें उच्च गति से देखने के लिए कस्टम कंप्यूटर का उपयोग करता था। अमेरिकी वायु सेना के विदेशी प्रौद्योगिकी प्रभाग के लिए निर्मित, एएन/जीएसक्यू-16 (या एक्सडब्ल्यू-2), जैसा कि वायु सेना को ज्ञात था, जिसका उपयोग मुख्य रूप से पश्चिमी वैज्ञानिकों को वितरण के लिए सोवियत तकनीकी डाक्यूमेंट को परिवर्तित करने के लिए किया गया था। ट्रांसलेटर 1959 में स्थापित किया गया था, 1964 में नाटकीय रूप से उन्नत किया गया था, और अंततः 1970 में सिस्ट्रान चलाने वाले मेनफ़्रेम कंप्यूटर द्वारा प्रतिस्थापित किया गया था।

इतिहास

फ़ोटोस्कोपिक स्टोर

ट्रांसलेटर का कार्य जून 1953 में अमेरिकी नौसेना से लॉस एंजिल्स के अंतर्राष्ट्रीय टेलीमीटर निगम (आईटीसी) के साथ अनुबंध के अनुसार प्रारंभ हुआ था। यह किसी अनुवाद सिस्टम के लिए नहीं था, किन्तु प्लास्टिक डिस्क में एम्बेडेड ब्लैक आयतों से युक्त उच्च प्रदर्शन वाले फोटोग्राफिक ऑनलाइन स्टोरेज माध्यम के लिए शुद्ध अनुसंधान और विकास अनुबंध था। जब प्रारंभिक अनुबंध समाप्त हो गया था, तब रोम वायु विकास केंद्र (आरएडीसी) ने 1954 और उसके पश्चात् आगे की फंडिंग प्रारंभ की थी।[1]

इस सिस्टम को आईटीसी में इंजीनियरिंग के प्रमुख गिल्बर्ट किंग ने टीम के साथ विकसित किया था जिसमें लुई रिडेनॉर भी सम्मिलित थे। यह 16 इंच की प्लास्टिक डिस्क में विकसित हुआ था, जिसमें सूक्ष्म ब्लैक आयतों या स्पष्ट स्पॉट की श्रृंखला के रूप में डेटा अंकित किया गया था। स्टोरेज के लिए डिस्क के केवल सबसे बाहरी 4 इंच का उपयोग किया गया था, जिससे पहुंच वाले भाग की रैखिक गति बढ़ गई थी। जब डिस्क 2,400 आरपीएम पर घूमती है तो इसकी पहुंच गति लगभग 1 एमबीटी/सेकंड होती है। कुल मिलाकर, सिस्टम ने 30 Mbits संग्रहीत किया था, जिससे यह अपने युग का उच्चतम घनत्व वाला ऑनलाइन सिस्टम बन गया था।[1][lower-alpha 1]

मार्क I

1954 में आईबीएम ने मशीनी अनुवाद का प्रभावशाली प्रदर्शन किया था, जिसे आज जॉर्जटाउन-आईबीएम प्रयोग के रूप में जाना जाता है। आईबीएम 704 मेनफ्रेम कंप्यूटर पर चलने पर, अनुवाद सिस्टम कार्बनिक रसायन विज्ञान के क्षेत्र तक सीमित रूसी के केवल 250 शब्द और उनके संयोजन के लिए केवल 6 व्याकरण नियमों को जानती थी। फिर भी, परिणाम अत्यधिक आशाजनक थे, और प्रेस में व्यापक रूप से सूची किया गया था।[2]

उस समय, नसेंट मशीनी अनुवाद क्षेत्र के अधिकांश शोधकर्ताओं ने अनुभव किया कि उचित अनुवाद प्रदान करने में बड़ी चुनौती बड़ी लाइब्रेरी का निर्माण करना था, क्योंकि उस युग के स्टोरेज उपकरण इस भूमिका में उपयोगी होने के लिए बहुत छोटे और बहुत धीमे थे।[3] किंग को लगा कि फोटोस्कोपिक स्टोर समस्या का स्वाभाविक समाधान है, और उन्होंने फोटोस्टोर पर आधारित ऑटोमैटिक अनुवाद सिस्टम का विचार वायु सेना को दिया था। आरएडीसी ने रूचि दिखाई और मई 1956 में शोध सहमती प्रदान किया था। उस समय, वायु सेना ने वाशिंगटन विश्वविद्यालय के शोधकर्ताओं को भी सहमती प्रदान किया जो परियोजना के लिए इष्टतम अनुवाद शब्दकोश बनाने की समस्या पर कार्य कर रहे थे।

किंग ने अनुवाद के लिए स्टेटमेंट-फॉर-स्टेटमेंट सरल दृष्टिकोण की वकालत की थी। उन्होंने सोचा कि लैंग्वेज में प्राकृतिक अतिरेक के कारण व्यर्थ अनुवाद को भी समझा जा सकता है, और अस्पष्ट शब्दों का सामना करने पर स्थानीय संदर्भ ही उचित अनुमान प्रदान करने के लिए पर्याप्त है। उन्होंने कहा कि वाक्य में शब्दों का अनुमान लगाने में 50 की संभावना प्राप्त करने में मानव की सफलता अधिक सीमा तक उसके अनुभव और पहले से खोजे गए शब्दों के वास्तविक अर्थों के कारण है।[4] दूसरे शब्दों में, केवल शब्दों का अनुवाद करने से मनुष्य किसी डाक्यूमेंट़ को प्रभावी विधि से पढ़ सकेगा, क्योंकि वे पहले के शब्दों द्वारा प्रदान किए गए संदर्भ से उचित अर्थ निकालने में सक्षम होते है।

1958 में किंग आईबीएम के थॉमस जे. वॉटसन रिसर्च सेंटर में चले गए और फोटोस्टोर-आधारित ट्रांसलेटर का विकास जारी रखा था। समय के साथ, किंग ने शुद्ध स्टेटमेंट-फॉर-स्टेटमेंट ट्रांसलेटर के दृष्टिकोण को परिवर्तित कर उस ट्रांसलेटर में परिवर्तित दिया था जो स्टेम को संग्रहीत करता था, जो शब्दों को भागों में तोड़ देता था जिन्हें फिर से साथ जोड़कर पूर्ण शब्द बनाया जा सकता था।[4]

पहली मशीन, मार्क I, का प्रदर्शन जुलाई 1959 में किया गया था और इसमें 65,000 शब्दों का शब्दकोश और लुकअप करने के लिए कस्टम ट्यूब-आधारित कंप्यूटर सम्मिलित था।[3] कस्टम सिरिलिक टर्मिनलों का उपयोग करके टेक्स्ट को पंच कार्ड पर हाथ से कॉपी किया जाता था, और फिर अनुवाद के लिए मशीन में इनपुट किया जाता था। परिणाम प्रभावशाली से कम थे, किन्तु यह सुझाव देने के लिए पर्याप्त थे कि बड़ी और तेज़ मशीन उचित विकास होता है। इस मध्य, मार्क I को सोवियत समाचार पत्र, प्रावदा के अनुवादों पर प्रयुक्त किया गया था। इस प्रकार परिणाम संदिग्ध किन्तु किंग ने अमेरिकी वैज्ञानिक में यह कहते हुए इसे सफल घोषित किया कि सिस्टम को परिचालन मूल्यांकन में, सरकार द्वारा अधिक उपयोगी पाया गया था।[3]

मार्क II

4 अक्टूबर 1957 को सोवियत संघ ने पहला कृत्रिम उपग्रह स्पुतनिक 1 लॉन्च किया था। इससे अमेरिका में चिंता की लहर विस्तृत हो गई थी, जिसका अपना प्रोजेक्ट वैनगार्ड असफल रहा और फिर शानदार अंदाज में अधिकांशतः विफल सिद्ध हुआ था। घटनाओं के इस ऐम्बर्रसिंग मोड़ के कारण अमेरिकी विज्ञान और प्रौद्योगिकी में भारी निवेश हुआ था, जिसमें डीएआरपीए, एनएएसए का गठन और कई तरह के इंटेलिजेंस प्रयास सम्मिलित थे, जो इस तरह से फिर से आश्चर्यचकित होने से बचने का प्रयास करते है।

अल्प समय के पश्चात्, इंटेलिजेंस प्रयासों को राइट पैटरसन वायु सेना बेस पर विदेशी प्रौद्योगिकी प्रभाग (एफटीडी, जिसे अब राष्ट्रीय वायु और अंतरिक्ष इंटेलिजेंस केंद्र के रूप में जाना जाता है) के रूप में केंद्रीकृत किया गया, जो वायु सेना द्वारा रक्षा इंटेलिजेंस एजेंसी और अन्य से इनपुट के साथ चलाया जाता है। संगठन. एफटीडी को सोवियत और अन्य वारसॉ ब्लॉक तकनीकी और वैज्ञानिक पत्रिकाओं के अनुवाद का कार्य सौंपा गया था जिससे पश्चिम में शोधकर्ता आयरन कर्टेन के पीछे के विकास पर अपडेट रह सकते है। इनमें से अधिकांश डाक्यूमेंट़ सार्वजनिक रूप से उपलब्ध थे, किन्तु एफटीडी ने अनुरोध पर अन्य पदार्थो के कई प्रत्यक्ष अनुवाद भी किए थे।

यह मानते हुए कि योग्य ट्रांसलेटरों की कमी थी, एफटीडी को आईबीएम में किंग के प्रयासों में अत्यधिक रुचि हो गई। अपग्रेड के लिए फंडिंग जल्द ही आने वाली थी, और 2,400 आरपीएम पर घूमने वाली तेज और उच्च क्षमता वाली 10 इंच ग्लास-आधारित ऑप्टिकल डिस्क वाले ट्रांजिस्टरयुक्त कंप्यूटर पर आधारित मार्क II सिस्टम पर कार्य प्रारंभ हुआ। अन्य अतिरिक्त तीसरे पक्ष द्वारा प्रदान की गई ऑप्टिकल कैरेक्टर पहचान थी, जिससे उन्हें उम्मीद थी कि रूसी टेक्स्ट को मशीन-टेक्स्ट कार्डों में कॉपी करने की समय लेने वाली प्रक्रिया समाप्त हो जाती है।[3]

1960 में वाशिंगटन टीम भी अपने शब्दकोश प्रयासों को लेकर आईबीएम में सम्मिलित हो गई। जैसे-जैसे अतिरिक्त स्टोरेज उपलब्ध कराया गया था, शब्दकोश का विस्तार जारी रहा था, एफटीडी में स्थापित होने तक यह 170,000 शब्दों और शब्दों तक पहुंच गया था। मार्क II में प्रमुख सॉफ्टवेयर अपडेट भी सम्मिलित किया गया था, जिसे किंग ने डिक्शनरी स्टफिंग कहा था। स्टफिंग, टेक्स्ट में पहले के शब्दों से उन पर उपसर्ग अस्पष्ट शब्दों की समस्याओं से निपटने का प्रयास था।[3] यह संशोधित शब्द शब्दकोश में सामान्यतः पूर्ण शब्दों से मेल खाते है, जिससे असत्य सकारात्मकता की संख्या कम हो जाती है।

1962 में किंग ने आईबीएम को तेजी से नई प्रौद्योगिकियों को प्राप्त करने की प्रक्रिया में सैन्य कांट्रेक्टर आईटेक के लिए छोड़ दिया था। आईबीएम में विकास जारी रहा, और सिस्टम फरवरी 1964 में एफटीडी में पूरी तरह से प्रारंभ हो गया था। इस सिस्टम का प्रदर्शन 1964 के न्यूयॉर्क विश्व फेयर में किया गया था। फेयर वर्जन में 150,000 शब्दों का शब्दकोश सम्मिलित था, जिसमें लगभग 1/3 शब्द वाक्यांशों में थे। प्रदर्शन में सुधार के लिए इनमें से लगभग 3,500 को कोर मेमोरी में संग्रहीत किया गया था, और प्रति मिनट 20 शब्द की औसत गति का प्रमाणित किया गया था। सावधानीपूर्वक चयनित इनपुट टेक्स्ट के परिणाम अधिक प्रभावशाली थे।[5] एफटीडी में इसकी वापसी के पश्चात्, इसका उपयोग 1970 तक निरंतर किया गया था, जब इसे सिस्ट्रान चलाने वाली मशीन द्वारा प्रतिस्थापित किया गया था।[6]

एएलपीएसी सूची

1964 में संयुक्त राज्य अमेरिका के रक्षा विभाग ने मशीनी अनुवाद की स्थिति पर सूची तैयार करने के लिए यूनाइटेड स्टेट्स राष्ट्रीय विज्ञान अकादमी (एनएएस) को नियुक्त किया था। एनएएस ने ऑटोमैटिक लैंग्वेज प्रवर्जन सलाहकार समिति, या एएलपीएसी का गठन किया था, और 1966 में उनके निष्कर्ष प्रकाशित किए थे। सूची, लैंग्वेज और मशीन अनुवाद और लैंग्वेज विज्ञान में कंप्यूटर, वर्तमान प्रयासों की अत्यधिक आलोचनात्मक थी, यह दर्शाती है कि सिस्टम मानव से अधिक तेज़ नहीं थे। अनुवाद, यह भी प्रदर्शित करते हुए कि ट्रांसलेटरों की कथित कमी वास्तव में अधिशेष थी, और सप्लाई और डिमांड के उद्देश्यों के परिणामस्वरूप, मानव अनुवाद अपेक्षाकृत सस्ता था प्रति 1,000 शब्दों पर लगभग 6 डॉलर इससे भी गलत बात यह है कि एफटीडी भी धीमी थी; इनपुट के रूप में भौतिकी के डाक्यूमेंट का उपयोग करने वाले परीक्षणों से पता चला कि ट्रांसलेटर 10 प्रतिशत कम स्पस्ट, 21 प्रतिशत धीमा था, और जब उसने मानव अनुवाद का उपयोग किया था तब उसकी समझ का स्तर 29 प्रतिशत कम था।[7]

एएलपीएसी सूची उतनी ही प्रभावशाली थी जितनी दशक पहले जॉर्जटाउन प्रयोग था; इसके प्रकाशन के तुरंत पश्चात् अमेरिकी सरकार ने मशीनी अनुवाद अनुसंधान के लिए लगभग सभी फंडिंग निलंबित कर दिया था।[8] आईबीएम और आईटेक में चल रहा कार्य 1966 तक समाप्त हो गया था, जिससे यह क्षेत्र यूरोपीय लोगों के पास चला गया था, जिन्होंने सिस्ट्रान और लोगो जैसी सिस्टम का विकास जारी रखा था।

टिप्पणियाँ

  1. These numbers for the early disk systems appear to be inaccurate – another document from the same author suggests that these figures are actually for the later version used on the Mark II translator.

संदर्भ

उद्धरण

  1. 1.0 1.1 Hutchins, pg. 171
  2. John Hutchins, "The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954" Archived 3 March 2016 at the Wayback Machine
  3. 3.0 3.1 3.2 3.3 3.4 Hutchins, pg. 172
  4. 4.0 4.1 King, 1956
  5. Hutchins, pg. 174
  6. Hutchins, pg. 175
  7. ALPAC, pg. 20
  8. John Hutchins, "ALPAC: the (in)famous report" Archived 6 October 2007 at the Wayback Machine

ग्रन्थसूची

  • G.W. King, G.W. Brown and L.N. Ridenour, "Photographic Techniques for Information Storage", Proceedings of the IRE, Volume 41 Issue 10 (October 1953), pp. 1421–1428
  • G.W. King, "Stochastic Methods of Mechanical Translation", Mechanical Translation, Volume 3 Issue 2 (1956) pp. 38–39
  • J.L. Craft, E.H. Goldman, W.B. Strohm, "A Table Look-up Machine for Processing of Natural Languages", IBM Journal, July 1961, pp. 192–203
  • Language Processing Advisory Committee, "Language and Machines: Computers in Translation and Linguistics", National Research Council, 1966 (widely known as the "ALPAC Report")
  • John Hutchins (ed), "Gilbert W. King and the IBM-USAF Translator", Early Years in Machine Translation, Joh Benjamins, 2000, ISBN 90-272-4586-X (RADC-TDR-62-105)
  • Charles Bourne and Trudi Bellardo Hahn, "A History of Online Information Services, 1963–1976", MIT Press, 2003, ISBN 0-262-02538-8