1. कंटेंट पर जाएं
  2. मेन्यू पर जाएं
  3. डीडब्ल्यू की अन्य साइट देखें

बेहतर अनुवाद के लिए रिसर्चर कर रहे हैं गणित का इस्तेमाल

१४ अक्टूबर २०१९

अनुवाद के मशीनी साधन बनाने वाले किसी विदेशी भाषा को समझाने के लिए आज भी अधिकतर डिक्शनरियों पर निर्भर रहते हैं. लेकिन अब अंक के रूप में एक नया तरीका सामने आ रहा है.

Symbolbild Computer Hardware GlasfaserSymbolbild Computer Hardware GlasfaserSymbolbild Computer Hardware Glasfaser
तस्वीर: Imago/Science Photo Library

फेसबुक के शोधकर्ताओं का कहना है कि शब्दों को अंकों में बदलना और भाषाओं के बीच की गणितीय समानताओं का इस्तेमाल करना एक आशाजनक तरीका है, भले ही स्टार ट्रेक के जैसा एक यूनिवर्सल कम्यूनिकेटर अभी एक सपना ही क्यों न हो. अच्छा ऑटोमेटिक अनुवाद इंटरनेट की बड़ी कंपनियों के लिए एक बड़ी प्राथमिकता है. दुनिया भर के लोगों को एक दूसरे से संवाद स्थापित करने में मदद करना सिर्फ एक परोपकारी लक्ष्य नहीं है, बल्कि ये व्यापार के लिए भी लाभकारी है. 

फेसबुक, गूगल, माइक्रोसॉफ्ट, रूस की यांडेक्स, चीन की बाइदू और उनके जैसी अन्य कंपनियां अपने अनुवाद के साधनों को और बेहतर बनाने की कोशिशें निरंतर कर रही हैं. पेरिस में फेसबुक की कई प्रयोगशालाओं में से एक में आर्टिफिशियल इंटेलिजेंस के विशेषज्ञ इस पर काम कर रहे हैं. फेसबुक में फंडामेंटल एआई रिसर्च की यूरोपीय सह-निदेशक आंत्वान बोर्डेस ने बताया कि इस वक्त फेसबुक पर 200 भाषाओं का इस्तेमाल हो रहा है. मौजूदा समय मेंऑटोमेटिक अनुवाद का आधार है किन्ही दो भाषाओं में एक जैसे दिखनेवाले टेक्स्ट के बड़े बड़े कोष. लेकिन कई भाषाओं के जोड़ों के साथ समस्या ये है कि उनके बीच उतने समानांतर टेक्स्ट हैं नहीं जितनों की आवश्यकता है. इसीलिए शोधकर्ता लम्बे समय से अन्य तरीकों की तलाश में हैं और इन्हीं में एक तरीका है फेसबुक द्वारा बनाई गई एक प्रणाली जो शब्दों का एक गणितीय प्रतिरूप बनाती है.

हर शब्द सैंकड़ों आयामों के बीच एक "वेक्टर"यानी एक निश्चित मात्रा वाली राशि, बन जाता है. बोली हुई भाषा में जो शब्द एक दूसरे के करीब हैं, इस वेक्टरों की दुनिया में भी खुद को एक दूसरे के निकट पाते हैं. इस प्रणाली को बनाने वालों में से एक गिलोम लाम्प्ल, कहते हैं, "मिसाल के तौर पर, अगर आप "कुत्ता" और "बिल्ली" जैसे शब्दों को लें, तो आप पाएंगे कि वेक्टर के रूप में ये दोनों शब्द एक दूसरे के बहुत करीब होंगे क्योंकि ये दोनों मिलती जुलती चीजों का विवरण देते हैं. अगर आप मेड्रिड, लंदन, पेरिस जैसे नामों को ले लें जो सभी यूरोपीय राजधानियों के नाम हैं, यहां भी वही बात होगी".

Fast nur Lehrerinnen an GrundschulenFast nur Lehrerinnen an Grundschulen
तस्वीर: picture-alliance/dpa/J. Stratenschulte

फिर इन भाषाई नक्शों को अल्गोरिदम की मदद से एक दूसरे से जोड़ा जा सकता है. ये प्रक्रिया शुरू में तो प्राथमिक ही रह पाएगी पर इसे धीरे धीरे तब तक बारीक किया जा सकता है जब तक पूरे के पूरे वाक्य को बिना ज्यादा गलतियों के मिलाया जा सके. लाम्प्ल ने बताया कि अभी से जो नतीजे आ रहे हैं वो आशाजनक हैं. उन्होने जानकारी दी कि अंग्रेजी और रोमानियाई भाषाओं के जोड़े के लिए, फेसबुक की अभी की मशीनी अनुवाद प्रणाली या तो शब्द वेक्टर प्रणाली के जितनी ही कारगर है या उस से बस थोड़ा सी खराब. लेकिन अंग्रेजी-उर्दू जैसे ज्यादा दुर्लभ भाषाई जोड़े के लिए शब्द वेक्टर प्रणाली अभी से श्रेष्ठतर है, क्यूंकि फेसबुक की पारंपरिक प्रणाली में इन भाषाओं के ज्यादा समानांतर टेक्स्ट नहीं हैं.

पर क्या इस नए तरीके से और भी भाषाओं के बीच काम करना संभव है, जैसे, मान लीजिये बास्क को अमेजॉन के किसी कबीले की भाषा में अनुवाद करना? लाम्प्ल कहते हैं कि सैद्धांतिक तौर पर ये संभव है, लेकिन व्यावहारिक तौर पर इसके लिए बड़ी मात्रा में लिखित टेक्स्ट की आवश्यकता होगी, जो कि अमेजॉन की कबीलाई भाषाओं में नहीं मिलेंगे. "सिर्फ सैंकड़ों वाक्यों से काम नहीं चलेगा, लाखों, करोड़ों वाक्यों की जरूरत पड़ेगी".

फ्रांस के सीएनआरएस राष्ट्रीय वैज्ञानिक केंद्र के विशेषज्ञ कहते हैं कि लाम्प्ल ने फेसबुक के लिए जो तरीका अपनाया है उससे उपयोगी नतीजे निकल सकते हैं, चाहे उससे परिपूर्ण अनुवाद हो या न हो. सीएनआरएस की लैटिस प्रयोगशाला के थियेरी पोबो ने शब्द वेक्टर प्रणाली को एक "वैचारिक क्रांति" बताया. उन्होंने कहा की बिना समानांतर डाटा के अनुवाद करना एक तरह से मशीनी अनुवाद के होली ग्रेल जैसा है. "लेकिन सवाल ये है कि इस तरीके से किस स्तर के प्रदर्शन की उम्मीद की जा सकती है", पोबो ने कहा. ये तरीका मूल टेक्स्ट का एक अंदाजा तो दे सकता है, लेकिन ये हर बार एक अच्छा अनुवाद देगा ये अभी साबित नहीं हो पाया है.

सीएनआरएस की ही कंप्यूटर विज्ञान प्रयोगशाला में कार्यरत शोधकर्त्ता फ्रांसोवा य्वों का कहना है, "जब दो भाषाएँ एक दूसरे से बहुत भिन्न होती हैं तो उन्हें जोड़ना कहीं ज्यादा मुश्किल होता है".उन्होंने कहा, "चीनी भाषा में सिद्धांतों को बतलाने का तरीका फ्रेंच से बिलकुल अलग है." लेकिन य्वों ने ये जरूर कहा कि अधूरा अनुवाद भी उपयोगी सिद्ध हो सकता है और नफरत फैलाने वाले भाषणों जैसी चीजों का पता लगाने में पर्याप्त साबित हो सकता है, जो फेसबुक के लिए एक बड़ी प्राथमिकता है.

केसी/एमजे (एएफपी)

__________________________

हमसे जुड़ें: WhatsApp | Facebook | Twitter | YouTube | GooglePlay | AppStore

ये हैं टॉप 10 'डेंग्लिश' शब्द

डीडब्ल्यू की टॉप स्टोरी को स्किप करें

डीडब्ल्यू की टॉप स्टोरी

डीडब्ल्यू की और रिपोर्टें को स्किप करें

डीडब्ल्यू की और रिपोर्टें