वाक्-से-वाक् मशीन अनुवाद का उपयोग करके भारतीय भाषाओं में शिक्षा के लिए पुनर्सर्जन

Mumbai

11 अप्रैल 2022

वाक्-से-वाक् मशीन अनुवाद का उपयोग करके भारतीय भाषाओं में शिक्षा के लिए पुनर्सर्जन

भारत विविधताओं का देश है। देश में बोली जाने वाली भाषाओं की व्यापक संख्या इस तथ्य का प्रमाण है। मुख्यतया चार भाषाओं के वर्ग हैं जिनके साथ बाईस अनुसूचीबद्ध भाषाएँ हैं, जिनमें तीस से अधिक भाषाएँ दस लाख से अधिक लोगों द्वारा बोली जाती हैं।

भाषाओं की यह विविधता अपने साथ चुनौतीपूर्ण कार्यों का एक समूह लेकर आती हैं। उन्हीं में से एक है शिक्षा, जहां प्राथमिक उद्देश्य भारतीय भाषाओं में विद्या अर्जन को सक्षम करना है। शिक्षण-अधिगम अपनी मातृभाषा में बहुत प्रभावी माना जाता है। इसके अतिरिक्त, प्रायः उच्च शिक्षा अंग्रेज़ी भाषा के कारण अधिकांश लोगों की पहुँच से बाहर होती है। इस आवश्यकता और अंतराल को पहचानते हुए, भारत सरकार ने प्रधान मंत्री विज्ञान, तकनीकी और नवाचार सलाहकार परिषद (पीएम-एसटीआईएसी) के तहत राष्ट्रीय भाषा अनुवाद मिशन (एनएलटीएम) को अपने प्रमुख मिशन में से एक माना है।

एनएलटीएम का उद्देश्य विज्ञान और प्रौद्योगिकी के क्षेत्र में अवसरों और विकास को सभी के लिए सुलभ बनाना है, जिससे अंग्रेज़ी में उच्च-स्तर की दक्षता की आवश्यकता रुपी बाधा को दूर किया जा सके। मशीन और मानव अनुवाद के संयोजन का उपयोग करते हुए अंतत: यह मिशन द्विभाषी (अंग्रेज़ी के साथ किसी एक मूल भारतीय भाषा में) शैक्षिक सामग्री तक पहुँच को सक्षम बनाएगा। इस मिशन में इलेक्ट्रॉनिक्स और आईटी मंत्रालय (MEITy,) सरकार की कार्यान्वयन खण्ड है।

मूल रूप से अंग्रेज़ी में NPTEL और SWAYAM पर 40,000 से अधिक शैक्षिक वीडियो वाक्-से-वाक् मशीन अनुवाद के अवसरों से प्राप्त हुए हैं, जिनका कई भारतीय भाषाओं में अनुवाद किया गया है। यह नवीन सूत्रित राष्ट्रीय शिक्षा नीति (एनईपी) के भी अनुकूल है। जो भारतीय भाषाओं में प्रशिक्षण प्रदान करने पर महत्व देती है। वर्तमान में, इन वीडियो का भारतीय भाषाओं में हाथ से (मैन्युअल रूप से) पुनर्सर्जन करने का प्रयास जारी है। इसमें प्रचुर मात्रा में समय और संसाधनों का उपयोग होता है।

इस चुनौती का उत्तर देते हुए, भारतीय प्रौद्योगिकी संस्थान बॉम्बे में प्रोफेसर पुष्पक भट्टाचार्य, भारतीय प्रौद्योगिकी संस्थान मद्रास में एस उमेश और हेमा मूर्ति और अंतर्राष्ट्रीय सूचना प्रौद्योगिकी संस्थान हैदराबाद में दीप्ति मिश्रा शर्मा के नेतृत्व में ,इन्हीं तीनों संस्थानों का एक संघ बनाया गया है। यह संघ वाक्-से-वाक् मशीन अनुवाद (SSMT) प्रणाली का सृजन करने के लिए एक साथ आया है जिसमें अंग्रेज़ी से कई भारतीय भाषाओं में अनुवाद हो पायेगा।

वाक्-से-वाक् मशीन अनुवाद (SSMT) व्यवस्था में चरणों का एक निश्चित क्रम होता है: (1) पहला, बोले गए उच्चारण को लिखित विषय वस्तु (ASR) में परिवर्तित किया जाता है, (2) फिर उसी लिखित पाठ को लक्षित भाषा (MT) में अनुवादित किया जाता है, और (3) अंत में अनुवादित पाठ को कथन (बोली) (TTS) के रूप में प्रस्तुत किया जाता है ।

SSMT के सामने कई चुनौतियां हैं, हालांकि (1) ASR-MT-TTS त्रुटियां प्रस्तुत कर सकती हैं, यद्यपि छोटी; (2) ASR से पाठ कई बार धाराप्रवाह नहीं होते हैं क्यूंकि उनमें गैर-भाषा शब्द जैसे “उह”, “उम” आदि का प्रयोग हो जाता हैं; (3) अंग्रेज़ी का स्वर और उच्चारण भारत के एक क्षेत्र से दूसरे क्षेत्र में भिन्न होता है; (4) शब्दों का क्रम अंग्रेज़ी से भारतीय भाषाओं में बदल जाता है; (5) वक्ता बोलते समय भाषाएँ मिला देते हैं जैसे हिंग्लिश (हिन्दी+अंग्रेज़ी), बांग्लिश (बंगाली+अंग्रेज़ी), तांग्लिश (तमिल+अंग्रेज़ी) इत्यादि ; (6) अंत में पाठ और बोली के बीच तालमेल बिठाने की आवश्यकता है जिससे तथाकथित होंठ-उच्चारण संकालन की समस्या का निवारण हो जाए।

अच्छी बात यह है कि एक मशीन, अनुवाद का वृहद हिस्सा कुशलतापूर्वक कर लेती है। इस पूरे कार्य के विभिन्न चरणों के परिणामों की मानवीय समीक्षा और संपादन के लिए एक छोटे प्रयास की आवश्यकता होती है। उक्त सहायक संघ द्वारा SSMT कार्यक्रम को कार्यान्वित कर के इसका परीक्षण किया गया है, और यह उल्लेखित किया गया है कि यह संकर दृष्टिकोण सम्पूर्ण मानवीय अनुवाद प्रयास को लगभग 75 प्रतिशत तक कम कर सकता है।

SSMT की प्राप्ति कई भारतीय भाषाओं में डिजिटल शिक्षण सामग्री उपलब्ध कराने की ओर अग्रसर है, जिससे ऐसी सामग्री तक पहुँच में वृद्धि होगी। इसके अतिरिक्त, इसी राह पर आगे बढ़ते हुए, यदि उन पर उपयुक्त मशीन अधिगम और एआई मॉडल बनाए जाते हैं तो ऐसी प्रणाली शिक्षार्थियों से उनकी भाषा में प्रश्नों का अंत:क्रियात्मक रूप से जवाब भी दे सकती है। निश्चित तौर पर, इन अनुप्रयोगों के विकास के साथ भविष्य आशाजनक दिखता है और विशेष रूप से इसका उद्देश्य भारतीय भाषाओं में अधिगम अंतराल को कम करना है।