रिफाइनरी से प्राप्त उपचारित अपशिष्ट जल जब बालू से होकर बहता है तो इस पर प्रदूषक-भक्षी जीवाणुओं की एक परत निर्मित कर देता है, जो पानी से हानिकारक यौगिकों को दूर करती है।

आम आदमी को सांख्यिकी में निहित अनिश्चितता के बारे में जानकारी देने की आवश्यकता

Read time: 1 min
बेंगलुरू
29 जून 2020
आम आदमी को सांख्यिकी में निहित अनिश्चितता के बारे में जानकारी देने की आवश्यकता

द जॉय ऑफ साइंस के एक पिछले प्रकरण में शाम्भवी चिदंबरम ने प्राध्यापक श्रवण वशिष्ठ से, जो पॉट्सडैम विश्वविद्यालय, जर्मनी के भाषा विज्ञान विभाग में प्राध्यापक हैं,  साइकोलिंग्विस्टिक्स के आनंद के बारे में और अन्य मुद्दों पर बात की। इस साक्षात्कार में, प्राध्यापक वशिष्ठ ने सांख्यिकी के शिक्षण और छात्रों और आम जनता दोनों के लिए अनिश्चितता को समझने की आवश्यकता के बारे में विस्तार से चर्चा की। वे "श्रवण वशिष्ठ के स्लॉग" के लेखक हैं, जो सांख्यिकी के बारे में एक ब्लॉग है। यह साक्षात्कार स्पष्टता और संक्षिप्तता के लिए संपादित किया गया है और प्रकाशन से पहले सटीकता के लिए पहले प्राध्यापक वशिष्ठ को दिखाया  जा चुका  है।

शाम्भवी चिदंबरम: आज की दुनिया में, तकनीकी विकास की तेजी से बदलती गति के कारण, विज्ञान कैसे किया जाए, इस संदर्भ में तेजी से परिवर्तन हुआ हैं। स्नातक, स्नातकोत्तर और पीएचडी स्तर पर शिक्षा के नज़रिए से, छात्रों को एक अच्छे सांख्यिकीय सिद्धांतों की पूर्ण शिक्षा के लिए क्या उपलब्ध कराना चाहिए?

श्रवण वशिष्ठ: सही संसाधनों तक पहुँच, विशेष रूप से भारतीय संदर्भ में, एक बहुत बड़ी समस्या है। मैंने भारत में पढ़ाई की है, और हमारे पास संसाधनों की बहुत कमी थी। इसलिए अभी जो भी मैं कर रहा हूँ वह व्यवस्थित रूप से स्वतंत्र रूप से उपलब्ध संसाधनों में जुड़ रहा है। मैं शिक्षा सम्बन्धी ऐसी सामग्री तैयार कर रहा हूँ जो मुक्त रूप से में ऑनलाइन उपलब्ध होगी। मेरी किताबें भी मुफ्त में उपलब्ध होंगी। प्रकाशक के साथ मेरा अनुबंध है, कि मेरी पुस्तकें हमेशा ऑनलाइन रहेंगी। मैं वीडियो व्याख्यान भी तैयार कर रहा हूँ जो यू ट्यूब पर मुफ्त में उपलब्ध होगा, इसलिए लोग सब कुछ देख सकते हैं। कोर्सेरा में मुफ्त पाठ्यक्रम भी हैं। लेकिन मुझे लगता है कि यह भारत की युवा पीढ़ी पर निर्भर करता हैं कि वे इन मुफ्त सुविधाओं का उपयोग कैसे करती है, मुझे नहीं लगता कि उनको संस्थागत परिवर्तनों के भरोसे बैठे रहना चाहिए। होगा ये कि ये युवा नई चीजों को सीखेंगे, और आगे चलकर प्राध्यापक बनने पर इसका  उपयोग करेंगे। और यह पहले ही से हो रहा हैं; मिसाल के तौर पर देखा जाए तो, मेरे एक पूर्व पोस्टडॉक में से एक, प्राध्यापक समर हुसैन, दिल्ली में एक प्राध्यापक हैं, और वह वास्तव में भारत में अभी मनोभाषाविज्ञान के अध्ययन के क्षेत्र में क्रांति ला रहे हैं।

शाम्भवी चिदंबरम: आपके पाठ्यक्रमों में जो आपने मुफ्त में उपलब्ध कराए हैं, आपने फ्रीक्वेन्टिस्ट (Frequentist) के साथ-साथ बायेसियन (Bayesian) सांख्यिकी को भी समझाया  हैं। बहुत से लोग केवल फ्रीक्वेन्टिस्ट तंत्र से परिचित हैं, जिसमे आँकड़ों की आवृत्ति या अनुपात पर जोर देकर नमूने (सैम्पल) आँकड़ों से निष्कर्ष निकालते हैं। बायेसियन सांख्यिकी क्या है? आप फ्रीक्वेन्टिस्ट सांख्यिकी की तुलना में बायेसियन आँकड़ों के साथ काम करना क्यों पसंद करते हैं?

श्रवण वशिष्ठ: यह बहुत महत्वपूर्ण प्रश्न है। मेरे लिए, बायेसियन दृष्टिकोण, आँकड़ों के विश्लेषण के लिए एकमात्र व्यवहार्य दृष्टिकोण है क्योंकि इसका ध्यान अनिश्चितता के परिमाणीकरण पर है - यह एक महत्वपूर्ण चीज हैं, जिसे हमें समझने की आवश्यकता है। यह एक बहुत ही गहन वाक्यांश है और इसके बहुत गहरे प्रारूप हैं। प्रतिदिन का उदाहरण लें तो आप मौसम के बारे में सोचें। अगर कोई कहता है कि बारिश की 60% संभावना है, तो यह एक बिंदु मान है। एक बायेसियन के रूप में, मैं जो जानना चाहता हूँ वह है, बारिश की संभावना का फैलाव क्या है? आप उस 60% मान के बारे में कैसे सुनिश्चित हैं? शायद आपको 95% यकीन है कि बारिश की संभावना 20 से 80% के बीच है। यह वाकई में बहुत अधिक अनिश्चितता है। यदि आपने इसके बजाय मुझे बताया होता कि मुझे 95% यकीन है कि बारिश की संभावना 55 और 60% के बीच है, यह बहुत कम अंतराल है और यह मुझे बताता है कि आपके पास बहुत अधिक जानकारी है। मेरे लिए, पूरा अनुयोजन इस बात पर निर्भर करता है कि मैं कितना अनिश्चित हूँ। दूसरी ओर फ्रीक्वेंटिस्ट दृष्टिकोण, एक पूरी तरह से अप्रासंगिक परिकल्पना को खारिज करता है। शून्य परिकल्पना (null hypothesis) ऐसी चीज नहीं है जिसकी मैं वास्तव में परवाह करता हूं, मुझे तो विकल्प की परवाह है। भले ही मैं शून्य परिकल्पना की परवाह करता हूँ , मुझे परवाह है कि मैं कितना अनिश्चित हूँ कि प्रभाव वास्तविक है।

संपादक टिप्पणी: शून्य परिकल्पना आँकड़ों में डिफ़ॉल्ट धारणा है कि दो समूहों के बीच कोई वास्तविक अंतर नहीं है। परिकल्पना का परीक्षण करने में आमतौर पर एक शून्य परिकल्पना का परीक्षण करना शामिल होता है और यदि समूहों के बीच अंतर ’सांख्यिकीय रूप से महत्वपूर्ण पाया जाता है’ तो इसे स्वीकार करना या अस्वीकार करना शामिल है।

1990 के दशक तक, बड़े या अहम कम्प्यूटेशनल बायेसियन विश्लेषण कर पाना संभव नहीं था। यह 2013 के बाद से आसानी से नियंत्रण करने योग्य हो पाया हैं। इसके साथ अब, मुझे लगता है कि चीजें बदल जाएंगी क्योंकि लोगों को एहसास होगा कि वे वास्तव में सही सवाल का जवाब दे सकते हैं! चूंकि फ़्रीक्वेंटिस्ट प्रतिमान एक शून्य परिकल्पना को अस्वीकार करता है, इसलिए यह आपको उस विशिष्ट विकल्प के बारे में नहीं बताता है जिसमें आप रुचि रखते हैं। एक बायेसियन के रूप में, मैं उस विशिष्ट प्रश्न का उत्तर दे सकता हूं जिसकी मुझे परवाह है।

शाम्भवी चिदंबरम: अन्य विकास जो हम हाल के दिनों में देख रहे हैं उसमे विज्ञान को एक मुक्त रूप से करने की तकनीक भी शामिल हैं। अब आपके कच्चे आँकड़े और अध्ययन के डिज़ाइन को ऑनलाइन करना संभव है, और यह स्कूपिंग (कोई अध्ययन या समाचार मूल व्यक्ति से पहले ही सार्वजनिक कर देना) को रोकने का एक प्रभावी तरीका है, क्योंकि आप इसे समय रहते पहले ही ऑनलाइन अंकित कर देते हैं, कि “मैं अभी इस पर काम कर रहा हूँ ”।
श्रवण वशिष्ठ: आज, कई वैज्ञानिक, अध्ययन के आँकड़े जारी करने से मना कर देते हैं। वास्तव में, मैंने जिन लोगों से आँकड़ों के बारे में जानकारी माँगी, उनमें से 75% ने मुझे इसे देने से इनकार कर दिया है। इसका मतलब यह है कि वे डरते हैं कि उन्हें स्कूप कर लिया जाएगा, या फिर मुझे उनके आँकड़ों में कुछ नया मिलेगा या कोई गलती मिलेगी। यह तभी बदलेगा, जब नई पीढ़ी नए नज़रिए के साथ आएगी। जब अधिक उम्र के हो जाते हैं, तो आप अपने विचारों में इतने आरोपित हो जाते हैं कि आप अपने विचारों को छोड़ना नहीं चाहते। आप प्रभारी लोगों की वर्तमान पीढ़ी को इस दिशा में काम करने के लिए मना नहीं सकते हैं। लेकिन आप युवा पीढ़ी को आश्वस्त करना शुरू कर सकते हैं और जब वे प्राध्यापक बन जाएंगे, तो चीजें बदल जाएंगी। मुझे लगता है कि भविष्य में हालात बेहतर होंगे ।

शाम्भवी चिदंबरम: आप लोगों को कैसे दिखाते हैं कि वे अपने काम को सार्वजनिक क्षेत्र में रखने से लाभान्वित होंगे और एक खुले विज्ञान के अभ्यासी बन सकते हैं?
श्रवण वशिष्ठ:  मैं जो कर रहा हूँ, मैं उसे उदाहरण से दिखाने की कोशिश करता रहा हूँ। मेरा सारे आँकड़े  और कोड ऑनलाइन है। लोग अपने काम को विकसित करने के लिए इनका उपयोग कर रहे हैं। इसलिए मैं उम्मीद कर रहा हूँ कि लोग देखेंगे कि इससे कुछ हासिल हुआ है। एक और चीज जो मैं करता हूँ वह है प्रकाशित आँकड़ों का पुन: विश्लेषण प्रकाशित करना, जो अन्य लोगों का डेटा है। मैं इसे कुछ सांख्यिकीय बिंदु प्रदर्शित करने के लिए रचनात्मक तरीके से करता हूँ, न कि मूल काम पर हस्तक्षेप करने के लिए। उदाहरण के लिए, मैं दिखाता हूँ  कि यदि आप इस छोटे से नमूने का अध्ययन करते हैं, और आप वही अध्ययन फिर एक बड़े नमूने के साथ करते हैं, तो  जानकारी में वृद्धि होती हैं। यह पहले से ही प्रभाव डाल रहा है; लोग वास्तव में उन्हें पढ़ रहे हैं और तब उन्हें पता चलता है कि उन्हें एक छोटे नमूने के साथ अध्ययन नहीं करना चाहिए, क्योंकि इससे वे जानकारी खो रहे हैं, और उनके अपने आँकड़े भटका रहे हैं। नई पीढ़ी, वास्तव में इस पर प्रतिक्रिया दे रही है। मैं अधिक से अधिक शोध पत्र देख रहा हूँ जिनमें इस तरह के शोध कार्य प्रकाशित हो रहे हैं, और लोग वास्तव में बड़े नमूनों के साथ अध्ययन कर रहे हैं। यह पिछले कुछ वर्षों में हुआ है जो आश्चर्यजनक है।

शाम्भवी चिदंबरम: हाँ, क्योंकि आखिरकार, यह एक जरूरी या गैर-जरूरी परिणाम प्राप्त करने के बारे में नहीं है, यह एक ऐसे परिणाम के बारे में है जिस पर आप भरोसा कर सकते हैं।
श्रवण वशिष्ठ:  बिलकुल। और अन्य लोग आपके आँकड़ों पर कार्य कर सकते हैं। आप समय के साथ जानकारी में बढ़ोत्तरी कर सकते हैं, भले ही आपके पास उच्च स्तरीय अध्ययन न हों। मेरा यहाँ बहुत संकीर्ण स्वार्थ भी है। यदि पहले सभी  आँकड़े उपलब्ध होते, तो मैं अपने मॉडल का अधिक सटीक मूल्यांकन कर सकता था। तो मेरे साथ जो हुआ, वह यह था कि हमने अपने मॉडल के प्रमुख आँकड़ों का मूल्यांकन किया और उस आँकड़ों के विश्लेषण से हमें पता चला कि सारा आँकड़े बेकार थे। आँकड़ों में इतनी ज्यादा अनिश्चितता थी कि हम मॉडल की भविष्यवाणियों का मूल्यांकन नहीं कर सकते थे। इसलिए मैंने उच्च क्षमता के साथ इन अध्ययनों को आजमाने और फिर से बनाने के लिए सैकड़ों और हजारों यूरो खर्च करने शुरू कर दिए। इसलिए जब मुझे एहसास हुआ कि अन्य लोग ऐसा क्यों नहीं करते हैं? यह दिखाने के लिए कि यदि आप एक उच्च-संचालित अध्ययन करते हैं, तो आपको क्या मिलता है, मैंने इन विधियों के बारे  में  शोध पत्र लिखना शुरू किया।

शाम्भवी चिदंबरम: यह एक तरह का 'बेहतर-साथ साथ ' दृष्टिकोण है जिससे सभी को लाभ होता है।
श्रवण वशिष्ठ:  बिल्कुल सही। साथ ही, विज्ञान वृद्धिशील है। मैं सागर में सिर्फ एक छोटी सी बूँद हूं, मैं एक छोटा सा योगदान दे रहा हूँ, और अन्य लोग अपनी ओर से छोटा सा योगदान दे रहे हैं। लेकिन सब मिलाकर यह किसी बड़ी चीज का निर्माण करने जैसा है।

शाम्भवी चिदंबरम: एक तरफ हम विज्ञान के बारे में बात करते हैं और फिर विज्ञान की एक सार्वजनिक धारणा भी है। जबकि करदाताओं  द्वारा अनुसंधान का अधिकांश भुगतान, कर के रूप में किया जाता है, लेकिन बहुत कम शोध ही वास्तव में उनके द्वारा समझा जाता है। क्या आपको लगता है कि वैज्ञानिकों का नैतिक दायित्व है कि वे बताएँ कि  वो क्या कर रहे हैं? क्या आम जनता को अकादमिक शोध में सांख्यिकीय समस्याओं के बारे में पता होना चाहिए?
श्रवण वशिष्ठ:  मुझे लगता है कि निश्चित रूप से इसका संचार किया जाना चाहिए, लेकिन इसका एक परिष्कृत तरीके से संचार करना होगा। आमतौर पर पत्रकार क्या करते हैं कि वे परिणाम या निष्कर्षों को सनसनीखेज बना देंगे, जैसे "कॉफी कैंसर का कारण है", और यह समस्या के बारे में अपने कम ज्ञान के कारण आंशिक रूप से समझा गया है, आधे-समझे गए शोध पत्रों से निष्कर्ष ले लिए जाते हैं, और कुछ कहानी बनाने की कोशिश भी की जाती हैं, इसके बाद वह संदेश बहुत विकृत हो जाता हैं। विश्वविद्यालयों से जो प्रेस विज्ञप्तियाँ निकलती हैं, वे भी इसमें योगदान करती हैं। यदि कोई पत्रकार वास्तव में क्या हो रहा है इसके बारे में अधिक रूप से परिष्कृत सारांश प्रदान कर सकता है, तो निश्चित रूप से उसका  संचार किया जाना चाहिए। शुक्र है, कि बहुत से लोग अब ये काम सही तरह से कर रहे हैं। उदाहरण के लिए, कैम्ब्रिज विश्वविद्यालय से डेविड स्पीगेल्टर द्वारा लिखित पुस्तक, ‘द आर्ट ऑफ स्टैटिस्टिक्स’ है। उनकी किताबें हमें दिखाती हैं कि आपको लोगों को जोखिम के बारे में कैसे सिखाना चाहिए। लेकिन यह उन पत्रकारों का काम है जिनके पास यह ज़िम्मेदारी है, मैं ऐसा नहीं कर सकता, क्योंकि मैं अपनी अस्पष्ट दुनिया में अपनी अस्पष्ट समस्या का अध्ययन करने में पूरी तरह से केंद्रित हूं। लेकिन, यह सब एक पत्रकार को अच्छी तरह से समझना होगा, इससे पहले कि वे इसके बारे में लिख सकें। इसलिए मुझे लगता है कि पत्रकारों के लिए एक समस्या यह है कि शोध पत्र आमतौर पर बहुत भ्रामक तरीके से लिखे जाते है। अपने शोधपत्र में निरर्थक विषय वस्तु लिखने के लिए शोधकर्ता खुद ज़िम्मेदार  हैं। उनके निष्कर्ष अक्सर गलत होते हैं जो आप उनके अपने विश्लेषणों से जान सकते हैं। और इसलिए जब पत्रकार किसी प्रसिद्ध शोधकर्ता के काम को पढ़ता है तब उसे इस बारे में अपने निष्कर्ष निकालने होंगे। उसके पास ऐसा करने के लिए कौशल होना चाहिए और ज्यादातर लोगों के पास यह  नहीं है। आपको यह समझने के लिए एक सांख्यिकीविद् होने की आवश्यकता है कि यह काम बेकार है! मुझे लगता है कि सही ढंग से समझाने में सक्षम होने के लिए यह एक बड़ी बाधा हैं। यही कारण है कि आपको अख़बार में ये सभी निरर्थक चीजें देखने को मिलती हैं। आज जो  हो रहा है, वह यह है कि किसी भी विवादास्पद या अनिश्चित परिणाम को सोशल मीडिया में प्रस्तुत किया जा रहा  है। और आज इसे नियंत्रित करना बहुत कठिन है। मुझे लगता है कि इसे नियंत्रित करने का एकमात्र तरीका यह है कि पत्रकार एक सूक्ष्म कहानी पेश करने में बहुत सावधानी बरते, और लोगों को यह बताने में बहुत सावधानी बरते कि निष्कर्ष के रूप में अनिश्चितता को कैसे संसाधित किया जाए। इसका क्या मतलब है? उदाहरण के लिए, धूम्रपान के विषय में यह एक स्पष्ट मामला है। धूम्रपान से कैंसर होता है। लेकिन क्या कॉफी से कैंसर होता है? या कॉफी कैंसर का इलाज करती है? या क्या कॉफी से कैंसर का खतरा कम होता है? एक पत्रकार के लिए, वास्तव में यह समझाना महत्वपूर्ण है कि हम वास्तव में उस करणीय सम्बन्ध को नहीं बता सकते क्योंकि करणीय सम्बन्ध को बताने के लिए कुछ मानकों को पूरा करना आवश्यक है। और उन मानकों को कभी पूरा नहीं किया जाता है, क्योंकि ये इनमें कई  भ्रमित चर हैं। जैसे कोई शोर, हम कुछ पैटर्न देखते हैं और हमें यह महसूस नहीं होता है कि हम जो व्यवस्थित पैटर्न देख रहे हैं वह केवल शुद्ध शोर हो सकता है। हमारे दिमाग पैटर्न को ढ़ूँढ़ने के लिए  डिज़ाइन किए गए हैं, और इस पर काबू पाना बहुत कठिन है। आपको उस सोच को दूर करने के लिए  के लिए प्रशिक्षण की आवश्यकता है, जो  लोगों के पास  नहीं है। पत्रकार यह कमी पूरी  कर सकते हैं।

शाम्भवी चिदंबरम: यह सिर्फ इसलिए नहीं है कि मनुष्य अनियमितता को पहचानने में सहज रूप से असमर्थ  है। मुझे लगता है कि यह मनोवैज्ञानिक रूप से, भावनात्मक रूप से संतोषजनक है कि हमारे पास इसके लिए एक स्पष्ट उत्तर है या उसके लिए एक स्पष्ट उत्तर है, और आप उस सुख को दूर ले जा रहे हैं, जब आप कहते हैं "वास्तव में हम इस बारे में निश्चित नहीं हैं, लेकिन मैं बता सकता हूं मैं इस बारे में कितना अनिश्चित हूँ ।"
श्रवण वशिष्ठ:  व्यक्तिगत रूप से मुझे यह समझने में मुझे लम्बा समय लगा कि अनिश्चितता का मतलब क्या है। यह ऐसा कुछ नहीं था जिसके बारे में मैंने अपने जीवन के पहले पैंतालीस वर्षों में सोचा था!  केवल हाल ही में मैंने इन चीजों पर सोचना शुरू किया है और यह सोच में एक क्रांतिकारी बदलाव है।  स्कूल में ऐसा कुछ नहीं पढ़ाया जाता! मुझे लगता है कि अनिश्चितता के संदर्भ में लोगों को सोचने के लिए सिखाने की कोशिश करना बहुत कठिन काम है। उनके दिमाग को उस और केंद्रित करने की जरूरत है जिसमे बिंदु मान नहीं, बल्कि बिंदु मान के आसपास अनिश्चितता के बारे में बात हो। इसे ऐसा देखा जाए जैसे अगर मैं अपने डॉक्टर के पास जाता हूं और मेरा डॉक्टर मुझसे कहता है की आपको यह भयानक संक्रमण है, और आपकी मृत्यु का जोखिम ऐसा और वैसा है, वह मुझे एक बिंदु मान बता रहा है। और मुझे उस बिंदु मान में कोई दिलचस्पी नहीं है. यह मुझे कुछ नहीं बताता है. मैं अक्सर अपने डॉक्टर से पूछता हूं ... "आप कितने अनिश्चित हैं?" वे यह भी नहीं समझ नहीं पाते  कि मेरा प्रश्न क्या है!

शाम्भवी चिदंबरम: मुझे लगता है कि कम से कम हम इसका उद्देश्य लोगों को ये बता सकते हैं कि आप जो कुछ भी करते हैं या कहते हैं या निष्कर्ष निकालते हैं, उसके बारे में अनिश्चितता की एक सीमा होती है। यह एक बड़े पैमाने पर क्रांति ला सकता हैं।
श्रवण वशिष्ठ:  मुझे लगता है कि यह एक बहुत बड़ी पहुँच होगी। इसमें समय लगेगा और उदाहरणों की आवश्यकता होगी  और मुझे खुशी है कि हम इससे निपटने की कोशिश कर रहे हैं।