ఐఐటీ బాంబే, ఐఐటీ మద్రాస్ మరియు ఐఐఐటి హైదరాబాద్ పరిశోధకులు కలిసి ఆంగ్లం నుండి అనేక భారతీయ భాషలకు స్పీచ్-టు-స్పీచ్  యాంత్రిక అనువాదం (SSMT) వ్యవస్థను రూపొందించారు.

స్పీచ్ టు స్పీచ్ యాంత్రిక అనువాదం ఉపయోగించి భారతీయ భాషలలో విద్య కోసం భాషాంతరీకరణం

Read time: 1 min
ముంబై
22 ఏప్రి 2022
స్పీచ్ టు స్పీచ్ యాంత్రిక అనువాదం ఉపయోగించి భారతీయ భాషలలో విద్య కోసం భాషాంతరీకరణం

భారతదేశం వైవిధ్యభరితమైన భూమి. మన దేశంలో విస్తృతంగా మాట్లాడే భాషలే దీనికి నిదర్శనం.  మన దేశంలో నాలుగు భాషా కుటుంబాలు, వాటిలో ఇరవై రెండు అధికారిక భాషలు; పది లక్షల కన్నా అధిక ప్రజలు ముప్పై కంటే ఎక్కువ భాషల లో మాట్లాడుతారు.

ఈ భాష వైవిధ్యం వల్ల కొన్ని సవాళ్లు ఎదురవుతాయి. ఈ భారతీయ భాషలలో విద్యాభ్యాసం ఒక ప్రాథమిక ఆందోళన. మాతృభాషలో బోధన మరియు అభ్యాసం ప్రభావవంతంగా ఉంటుందని గ్రహించబడింది. అంతేగాక, ఆంగ్ల భాష అవరోధం కారణంగా ఉన్నత విద్య తరచుగా చాలా మంది ప్రజలకు అందుబాటులో లేకుండా పోయింది. ఈ ఆవశ్యకత మరియు అంతరాన్ని గుర్తిస్తూ, ప్రధానమంత్రి సైన్స్, టెక్నాలజీ మరియు ఇన్నోవేషన్ అడ్వైజరీ కౌన్సిల్ (PM-STIAC) కింద భారత ప్రభుత్వం జాతీయ భాషా అనువాద లక్ష్యం (NLTM)  ప్రధాన ఉద్దేశం లో ఒకటిగా గుర్తించింది.

NLTM సైన్స్ మరియు టెక్నాలజీ లో అవకాశాలు మరియు అభివృద్ధి అందరికీ అందుబాటులోకి తీసుకురావాలని లక్ష్యంగా పెట్టుకుంది. దీని ద్వారా ఆంగ్ల భాష  ఉన్నత-స్థాయి నైపుణ్యత అవసరాన్ని తొలగించే ప్రయత్నం కూడా జరిగింది. ఈ లక్ష్యం యాంత్రిక మరియు మానవ అనువాద కలయికను ఉపయోగించి, విద్యా విశేషాలను ద్విభాషల లో ప్రవేశ సాధనం చేయగలదు – ఆంగ్లంలో మరియు ఒకరి స్థానిక భారతీయ భాషలో. ఎలక్ట్రానిక్స్ మరియు IT మంత్రిత్వ శాఖ (MEITy) ఈ మిషన్ ను ప్రభుత్వం తరపున అమలు చేస్తుంది.

స్పీచ్-టు-స్పీచ్ మెషిన్ అనువాదానికి గల అవకాశాలు ఒకటి NPTEL మరియు SWAYAM లో 40,000 పైగా ఉన్న విద్యాసంబంధమైన వీడియోలను ఆంగ్లంలో పొందడం, మరియు వాటిని అనేక భారతీయ భాషల్లోకి అనువదించబడటం. ఇది భారతీయ భాషల్లో శిక్షణ ఇవ్వడానికి ప్రాధాన్యతనిస్తూ కొత్తగా రూపొందించబడిన జాతీయ విద్యా విధానం (NEP)కి కూడా అనుకూలిస్తుంది. ప్రస్తుతం, ఈ వీడియోలను భారతీయ భాషల్లోకి మానవ నైపుణ్యంతో తర్జుమా చేసే ప్రయత్నం కొనసాగుతోంది. ఈ పద్ధతి చాలా సమయం తీసుకుంటుంది మరియు వనరుల ఆవశ్యకత  కలిగి ఉంటుంది.

ఈ సవాలుకు ప్రతిస్పందిస్తూ, ఇండియన్ ఇన్‌స్టిట్యూట్ ఆఫ్ టెక్నాలజీ బొంబాయిలో ప్రొఫెసర్లు, పుష్పక్ భట్టాచార్య, ఇండియన్ ఇన్‌స్టిట్యూట్ ఆఫ్ టెక్నాలజీ మద్రాస్‌లో ఎస్ ఉమేష్ మరియు హేమా మూర్తి, మరియు ఇంటర్నేషనల్ ఇన్‌స్టిట్యూట్ ఆఫ్ ఇన్ఫర్మేషన్ టెక్నాలజీ హైదరాబాద్ లో దీప్తి మిశ్రా శర్మ నేతృత్వం లో  ఒక సహాయక సంఘం (consortium) ఏర్పరిచారు. ఈ సంఘం, ఇంగ్లీష్ నుండి అనేక భారతీయ భాషలకు స్పీచ్-టు-స్పీచ్ మెషిన్ ట్రాన్స్లేషన్ (SSMT) వ్యవస్థను రూపొందించడానికి నిర్వహించబడింది.

SSMT లోని దశలు: (i) మొదట మాట్లాడే ఉచ్చారణను మూల వాక్యాల్లోకి మార్చుతుంది  (ASR), (ii) తర్వాత ఉత్పత్తి చేయబడిన వచనం లక్ష్య భాషలోకి అనువదించబడుతుంది (MT), చివరిగా,  (iii) అనువదించబడిన వచనం ప్రసంగం (TTS)గా మార్చుతుంది.

అయితే, SSMT లో అనేక సవాళ్లు ఎదురవుతాయి,: (a) ASR-MT-TTS మార్గాల్లో ఏదైనా చిన్న లోపాలు  రావచ్చు, (బి) ASR నుండి వచనం అస్పష్టంగా ఉండవచ్చు, అనగా, "అహ్", "అమ్" మొదలైన భాషేతర అంశాలు కలిగి ఉండవచ్చు; (సి) భారతదేశంలో ప్రాంతాన్ని బట్టి ఆంగ్లం యొక్క స్వరం మరియు యాస మారుతూ ఉంటుంది; (డి) ఆంగ్లం నుండి భారతీయ భాషలలో పద క్రమం మారవచ్చు; (ఇ) మాట్లాడేవారు హింగ్లీష్ (హిందీ+ఇంగ్లీష్), బంగ్లీష్ (బెంగాలీ+ఇంగ్లీష్), తంగ్లీష్ (తమిళం+ఇంగ్లీష్) మొదలైన భాషలు మిళితం చేస్తారు; (f) చివరగా, వచనం  మరియు వాక్కు రూపాన్ని సమకాలీకరించు కోవాలి – అంటే, లిప్ సింక్  (lip sync) చేయబడాలి.

ముఖ్య  విషయం ఏమిటంటే, చాలావరకూ యంత్రం ద్వారా అనువాదం సమర్ధవంతంగా జరుగుతుంది. వివిధ దశలలో అవుట్‌పుట్‌ లో మానవ సమీక్ష మరియు సవరింపు ప్రయత్నాలు అవసరం. పేర్కొన్న సహ వ్యవస్థ ద్వారా SSMT లోని వివిధ దశలు పరీక్షించబడ్డాయి మరియు ఈ హైబ్రిడ్ విధానం మనుషుల అనువాద ప్రయత్నాన్ని దాదాపు 75% తగ్గించగలదని ఉపోహ.

SSMT యొక్క సాక్షాత్కారం అనేక భారతీయ భాషలలో డిజిటల్ లెర్నింగ్ కంటెంట్‌ను అందుబాటులోకి తేవడానికి సిద్ధంగా ఉంది, తద్వారా అటువంటి కంటెంట్ యొక్క ప్రాప్యతను మెరుగుపరుస్తుంది. అదనంగా, తగిన మెషిన్ లెర్నింగ్ మరియు AI నమూనాలు వాటిపై నిర్మించబడితే, అటువంటి వ్యవస్థ   అభ్యాసకుల సొంత భాషలో ప్రశ్నోత్తర  చర్యగా కూడా ఉపయోగపడుతుంది. ఖచ్చితంగా, ఈ అప్లికేషన్‌ల అభివృద్ధితో భవిష్యత్తు ఆశాజనకంగా కనిపిస్తోంది మరియు ముఖ్యంగా భారతీయ భాషలలో నేర్చుకునే అంతర్యాన్ని తగ్గించగలిగే లక్ష్యంగా కూడా కనిపిస్తోంది.


సంపాదకుని గమనిక: ఇది మేము మీకు అందిస్తున్న ప్రత్యేక ల్యాబ్ కథనాల ఫీచర్‌లో భాగం.