இந்தியா ஒரு பன்முகத்தன்மை கொண்ட நாடு. இந்த நாட்டில் பேசப்படும் ஏராளமான மொழிகள், இதற்குச் சான்றாகும். நான்கு மொழிக் குடும்பங்கள் உள்ளடக்கி, இருபத்திரண்டு பட்டியலிடப்பட்ட மொழிகளுடன் முப்பதுக்கும் மேற்பட்ட மொழிகள், சுமார் 10 லட்சத்துக்கும் மேற்பட்ட மக்களால் பேசப்பட்டு வருகின்றன.
இம்மொழிகளின் இப்பன்முகத்தன்மை கண்டிப்பாக பல சவாலான விடயங்களை அதனுடன் கொண்டுவருகின்றது. அவற்றில் ஒன்று கல்வி, அதில் முதன்மையாகக் கவனத்தில் கொண்டிருக்க வேண்டியது இந்திய மொழிகளில் கற்பதை செயல்படுத்துவதாகும். கற்பித்தல்-கற்றல் ஒருவருடைய தாய்மொழியில் இருந்தால் அது நிச்சயம் ஆற்றல் வாய்ந்ததாக இருக்கும். மேலும், ஆங்கில மொழியின் தடையால் பெரும்பான்மையான மக்களுக்கு உயர்கல்வி சென்றடையவில்லை. இந்தத் தேவையையும் இடைவெளியையும் உணர்ந்து இந்திய அரசானது, பிரதமரின் அறிவியல், தொழில்நுட்பம் மற்றும் புதுப்புனைவு ஆலோசனைக் குழுவின் (PM-STIAC) கீழ் தேசிய மொழி மொழிபெயர்ப்பு இயக்கத்தை (NLTM) அதன் முக்கிய இலக்குகளில் ஒன்றாகக் கொண்டு வந்துள்ளது.
அறிவியல் மற்றும் தொழில்நுட்பத்தில், வாய்ப்புகள் மற்றும் மேம்பாடுகளை அனைவரும் அணுகக்கூடிய வகையில் உருவாக்குவதையே NLTM நோக்கமாகக் கொண்டுள்ளது. மேலும், ஆங்கிலமொழி முன்வைக்கும் உயர்மட்டத் தேர்ச்சியின் தேவை என்ற தடையையும் களைகிறது. எந்திரம் மற்றும் மனித மொழிபெயர்ப்பின் கூட்டுமுறையைப் பயன்படுத்தி, இந்தத் திட்டம் இறுதியில் கல்வி உரைகளை இருமொழிகளில் (ஆங்கிலம் மற்றும் ஒருவரின் சொந்த இந்திய மொழியில்) அணுக உதவும். இந்தத் திட்டத்தின் அரசாங்க செயல்படுத்துதல் பிரிவாக மின்னணுவியல் மற்றும் தகவல் தொழில்நுட்ப அமைச்சகம் (MeitY) செயல்படுகின்றது.
உரையாடலில் இருந்து உரையாடலாக (speech-to-speech) மாற்றும் எந்திரவழி மொழிபெயர்ப்புக்கான வாய்ப்புகளில் ஒன்று, NPTEL மற்றும் SWAYAMஇல் ஆங்கிலத்தில் இருக்கும் 40,000க்கும் மேற்பட்ட கல்விக்கான காணொளிகளைப் பெற்று, பல இந்திய மொழிகளில் மொழிபெயர்க்க முனைவதாகும். இந்தச் செயல்பாடு, இந்திய மொழிகளில் பயிற்சி அளிப்பதை வலியுறுத்தும் புதிதாக உருவாக்கப்பட்ட தேசிய கல்விக் கொள்கையுடனும் (NEP) பொருந்துகின்றது. தற்போது, இந்தக் காணொளிகளைக் கைமுறை வழியாகப் பல இந்திய மொழிகளில் மொழியாக்கம் செய்யும் முயற்சி நடந்துவருகின்றது. இது மாபெரும் நேரத்தையும் வளங்களையும் உள்ளடக்கி உள்ளது.
இந்த சவாலுக்குப் பதிலளிக்கும் வகையில், IITB, IITM மற்றும் IIITH முதலிய கல்வி நிறுவனங்களின் கூட்டமைப்பானது, உரையாடலில் இருந்து உரையாடலாக (speech-to-speech) மாற்றும் எந்திரவழி மொழிபெயர்ப்பு (MT) அமைப்பை (SSMT) ஆங்கிலத்திலிருந்து பல இந்திய மொழிகளில் உருவாக்க ஒன்றுசேர்ந்துள்ளது. இந்தக் கூட்டமைப்பை, இந்தியத் தொழில்நுட்பக் கழகம், பம்பாயைச் சேர்ந்த புஷ்பக் பட்டாச்சார்யா, மெட்ராஸ் இந்தியத் தொழில்நுட்பக் கழகத்தைச் சேர்ந்த எஸ். உமேஷ், ஹேமா மூர்த்தி, ஐதராபாதின் சர்வதேசத் தகவல் தொழில்நுட்பக் கழகத்தின் தீப்தி சர்மா முதலிய பேராசிரியர்கள் வழிநடத்துகின்றனர்.
SSMTயானது பின்வரும் தொடர்நிலைகளைக் கொண்டுள்ளது: (i) முதலில் உரையாடல், உரையாக (ASR) மாற்றப்படுகின்றது, (ii) பின்னர், உருவாக்கப்பட்ட உரை குறிப்பிட்ட மொழி உரையாக (MT) மொழிபெயர்க்கப்படுகின்றது, (iii) இறுதியாக, மொழிபெயர்க்கப்பட்ட உரை உரையாடலாக (TTS) வழங்கப்படுகின்றது.
SSMT பல சவால்களை முன்வைக்கின்றது, இருப்பினும்: (1) ஒவ்வொரு ASR-MT-TTSயும் பிழைகளை அறிமுகப்படுத்தலாம், அவை சுருக்கமாகவும் இருக்கலாம்; (2) ASRலிருந்து வரும் உரையானது சரளமாக இல்லாமல் இருக்கலாம், அதாவது, "அ", "உம்" போன்ற மொழி அல்லாத கூறுகளைக் கொண்டிருக்கலாம்; (3) ஆங்கிலத்தில் பேசும் பாணியும் உச்சரிப்பும் இந்தியாவில் வட்டாரத்திற்கு வட்டாரம் மாறுபடும்; (4) வாக்கியத்தில் வார்த்தைகள் பயன்படுத்தும் வரிசை ஆங்கிலத்திற்கும் இந்திய மொழிகளுக்கு மாறுபடுகின்றன; (5) ஹிங்கிலிஷ் (Hinglish) (ஹிந்தி+ஆங்கிலம்), பங்கிலிஷ் (Banglish) (வங்கம்+ஆங்கிலம்), தங்கிலிஷ் (Tanglish) (தமிழ்+ஆங்கிலம்) போன்ற கலப்பு மொழிநடையைப் பேசுபவர்கள் பயன்படுத்துகின்றனர்; (6) இறுதியாக, உரை மற்றும் உரையாடலின் வெளிப்பாடு ஒத்திசைக்கப்பட வேண்டும். இதனை, எளிமையாக உதட்டு ஒத்திசைவு பிரச்சினை என்று அழைக்கலாம்.
இதில் சிறந்த விடயம் என்னவென்றால் ஓர் எந்திரம், மொழிபெயர்ப்பின் பெரும்பகுதியைத் திறமையாகச் செய்கின்றது. இந்த எந்திர மொழிபெயர்ப்பின் தொடர்நிலையின் வெவ்வேறு நிலைகளில், மொழிபெயர்ப்பின் முடிவுகளை மதிப்பாய்வு செய்வதற்கும் திருத்துவதற்கும் ஒரு சிறிய மனித முயற்சி தேவைப்படுகின்றது. இந்த செயல்முறை, SSMTயின் தொடர்நிலையை மேற்கூறப்பட்ட கூட்டமைப்பால் செயல்படுத்துவதன் மூலம் சோதிக்கப்பட்டது. மேலும், இந்தக் கலப்பு அணுகுமுறை, மனித மொழிபெயர்ப்பு முயற்சியைக் கிட்டத்தட்ட 75 சதவீதம் குறைக்கும் என்று எதிர்பார்க்கப்படுகின்றது.
இந்த SSMTயை உணர்வது, எண்வய முறை கற்றல் (digital learning) உள்ளுறையைப் பல இந்திய மொழிகளில் வழங்குவதற்குத் தயாராக உருவாக்குவதிலும் அதன் மூலம் அத்தகைய உள்ளுறையை மேம்பட்ட முறையில் அணுகுவதிலும் மாற்றம் செய்ய முடியும். மேலும், முன்னேற்றும் வகையில், பொருத்தமான கணிப்பொறி கற்றல் மற்றும் செயற்கை நுண்ணறிவு (AI) மாதிரிகள், SSMTயின் மீது கட்டமைக்கப்பட்டால், அத்தகைய அமைப்பு கற்பவர்களின் கேள்விகளுக்கு அவர்களின் சொந்த மொழியில் உரையாடும் வகையில் பதிலளிக்க முடியும். நம் எதிர்காலம், நிச்சயமாக இந்தப் பயன்பாடுகளின் வளர்ச்சியுடன் நம்பிக்கைக்கு உரியதாகத் தெரிகின்றது மற்றும் கற்பதில் இருக்கும் இடைவெளியைக் குறிப்பாக, இந்திய மொழிகளில் குறைப்பதை நோக்கமாகக் கொண்டிருப்பதை அறிய முடிகின்றது.