मंगळवार, २८ नोव्हेंबर, २०२३

पांचामुखी परमेश्वर ?

“इतक्या लोकांनी धर्म स्वीकारला तर तो खरा, नाहीतर खोटा, हे कसले तर्कशास्त्र आहे? ... एखाद्या धर्माचे अनुयायी असणे ही डोळसपणे स्वीकारलेली कृती नसून ती एक अंगवळणी पडलेली केवळ सवय झालेली असते. आणि अशांच्या संख्येच्या आधारे तुम्ही तुमच्या ज्ञानाची पारख करता, हे सगळे विचित्रच नाही का?”
(जी.ए. कुलकर्णी यांच्या ‘यात्रिक’ या कथेमधून)

एखाद्या दाव्याच्या पाठीमागे उपस्थितांचे बहुमत उभे करून तो दावा वास्तव असल्याशी मखलाशी करण्याला बराच प्राचीन इतिहास आहे. एखाद्याने धार्मिकांनी आपले संख्याबळ वाढवत नेत आपल्या धारणा इतरांवर लादण्याचा मार्ग अनुसरला आहे. धर्म नि त्यावर आधारित समाजव्यवस्था ही ‘वरून खाली’ स्वरूपाची आहे. व्यवस्थेचे नीतिनियम नि अवलोकन हे मूठभर श्रेष्ठींकडून निर्माण नि नियंत्रित केले जात असते. उलट प्रातिनिधिक लोकशाही ही ‘खालून वर’ म्हणजे समाजगटाकडून व्यवस्था नियंत्रकांकडे जाणारी आहे. विशेष म्हणजे इथेही या नियंत्रकांची निवड पुन्हा बहुमताच्या तत्त्वानेच होत असते. आपल्या भारतीय परंपरेमध्ये ‘पांचामुखी परमेश्वर’ ही म्हण रुजली ती याच अर्थाने.

निवाडा नि वास्तव या दोन वेगळ्या गोष्टी असतात, निवाडा हा एका गटासंदर्भात असेल तर तो त्यातील बहुसंख्येने– अथवा त्यातील अधिक सुज्ञ बहुसंख्येने– केला तर तो समजण्याजोगे आहे. परंतु वास्तव हे व्यक्तिंच्या मताच्या निरपेक्ष उभे असू शकते. निवाड्याचा विषय असणारे वास्तव हे बहुसंख्येच्या आकलनकक्षेच्या बाहेर असले तर तो निवाडा वास्तवाच्या विपरीत असू शकतो. उदा. ‘भारताने संरक्षण सिद्धता वाढवण्यासाठी मिग विमाने विकत घ्यावीत की F-16 विमाने?’– याची कल-चाचणी केवळ संरक्षण तज्ज्ञांमध्येच व्हायला हवी. लॉलिपॉप अथवा आईसफ्रूट चोखत बसलेला शाळकरी खंडूही मतदान करु शकतो अशा एखाद्या इन्टरनेट पोर्टलवर करुन उपयोगाची नाही. परंतु रोजच्या जगण्यात ‘बहुसंख्येचे मत’ हा निकष अनेकदा असा अस्थानी वापरला जात असतो आणि त्यातून वास्तवाचे विपरीत आकलन अनेकांच्या माथी मारले जात असते.

काही वर्षांपूर्वी एका प्रथितयश आयटी कंपनीमध्ये मी काही काळ काम करत होतो. तिथे आलेला हा एक अनुभव. मी तिथे नुकताच रुजू झालो होतो. माझी निवड होण्यासाठी दिलेल्या मुलाखतीमध्ये मी विषय-तज्ज्ञ आहे नि त्या भूमिकेला अनुसरूनच काम करू इच्छितो असे स्पष्ट केले होते. त्यामुळे तिथे असलेल्या प्रशासकीय उतरंडीचा मी भाग नव्हतो. तरीही एकुण उतरंडीमध्ये मी वरच्या स्तरात काम करत असल्याने तिथल्या प्रोजेक्ट मॅनेजर्सच्या मीटिंग्सला मी शक्य तेव्हा उपस्थित राहावे असे मला सांगण्यात आले होते. अशाच एका मीटिंगमध्ये एका कटकट्या ग्राहकाचा नि त्याच्याकडे अडकलेल्या पैशाचा विषय निघाला. एरवी मी फार लक्ष दिले नसते पण ‘स्वीकार्यता चाचणी’ (acceptance test) अशी संज्ञा ऐकली आणि कान टवकारले.

हा ग्राहक बहुधा एखादी ऑनलाईन विक्रेती साखळी होती. विविध प्रकारची उत्पादने त्यांच्यामार्फत विकली जात होती. अशा मोठ्या विक्रेत्यांना आपली उलाढालीची दिशा ठरवण्यासाठी ग्राहकांचे कल ध्यानात घेण्याची गरज असते. इंटरनेट-पूर्व काळात अशा कंपन्या वा विक्रेते आपले प्रतिनिधी नेमून त्यांच्यामार्फत ग्राहकांपर्यंत पोहोचत असत. हे प्रतिनिधी अक्षरश: दारोदार जाऊन– प्रसंगी ग्राहकांकडून होणारे अपमान गिळून– ही माहिती जमा करत असत. मग त्याआधारे हे मोठे विक्रेते वा उत्पादक कंपन्या आपल्या उत्पादन वा विक्रीधोरणांमध्ये आवश्यक ते बदल करत असत.

परंतु इंटरनेट अवतरले आणि कुणीही न मागता आपली मते भसाभस त्यावर ओतणारे ग्राहक तयार झाले. त्या त्या ग्राहकाला रुचेल त्या व्यासपीठावर आपल्या वापरात येणार्‍या विविध उत्पादनांबद्दल ते आपली मते व्यक्त करू लागले. फेसबुक, ट्विटर, रीडिफ वा रिडिटसारखे फोरम्स तसंच इतर विक्रेत्यांची संकेतस्थळे, वृत्तपत्रांची पोर्टल्स आदिंवर या प्रतिक्रियांचा मारा सुरू झाला. आयतीच मिळणारी ही माहिती उचलून त्याआधारे घरबसल्या विविध उत्पादनांबद्दलची बाजारातील कल-चाचणी करणे शक्य आहे असे अमेजनसारख्या(Amazon) बहुतेक मोठ्या विक्रेत्यांच्या ध्यानात आले.

इंटरनेटवरील सर्वात चाणाक्ष विक्रेता असलेल्या गुगलने आपल्या सर्व सेवा फुकट(?) देण्याच्या बदल्यात आपल्या ग्राहकांच्या इमेल्ससकट सर्व प्रकारची माहिती गोळा करण्याचे हक्क पदरात पाडून घेतलेले असतात. या माहितीच्या आधारे त्या त्या ग्राहकाच्या आवडीनिवडी ओळखून त्या ग्राहकाला त्यासंबंधी जाहिराती दाखवण्याचे तंत्र आधीच विकसित केले होते. इथे एकाच ग्राहकाची माहिती नि तिचा वापर केवळ त्याच्या वा तिच्यापुरताच होत असे. त्याच तंत्राचा विस्तार करून अनेक ग्राहकांकडून उपलब्ध होत जाणार्‍या माहितीचे एकत्र संकलन करून ग्राहकाऐवजी त्याला अपेक्षित उत्पादन वा सेवेचे मूल्यमापन करण्याचे तंत्र विकसित केले जाऊ लागले. आमचा हा ग्राहक असेच काही साध्य करू पाहात होता.

Sentiment

या पुढच्या टप्प्यात एखाद्या उत्पादनाबद्दल, घटनेबद्दल जनतेमध्ये सरासरी प्रतिक्रिया काय आहे, याचा अदमास घेण्याचा- अर्थात लोकांचा ‘कल’ (sentiment) काय आहे हे ठरवण्याचा प्रयत्न सुरू झाला होता. फेसबुक, ट्विटरसह बहुतेक फोरम्सनी व्यावसायिकांकडून पैसे घेऊन आपल्या डेटाचा अ‍ॅक्सेस देणे सुरू केले होते. तो घेऊन आपल्या उत्पादनाशी, विशिष्ट घटनेशी संबंधित पोस्ट्स, ट्विट्स, वगैरेचा डेटा खेचून घेण्याची सोय त्यांना मिळत असे. या डेटाचे विश्लेषण करुन त्यातून आपल्या उत्पादनाबद्दल सर्वसाधारण मत काय आहे याचा अदमास घेण्याचा या व्यावसायिकांचा प्रयत्न असे. ‘Sentiment Analysis’ (कल-मूल्यमापन) नावाने ही एक शाखाच उदयाला आलेली होती.

तेव्हा स्मार्टफोन हा आजच्या इतका सार्वत्रिक झालेला नव्हता. त्यामुळे माहितीचा ओघ बराच कमी होता. हे तंत्रही अजून बाल्यावस्थेतच होते. आमच्या कंपनीकडे त्यावर आधारित एक प्रोजेक्ट होता, तो पुराही झाला होता. परंतु त्यातून मिळणार्‍या परतावा अथवा मूल्यमापनाबाबत ग्राहक समाधानी नव्हता आणि झाल्या कामाचे पैसे देण्यास नकार देत होता. गाडं अडलं होतं ते गुणवत्ता मूल्यमापनावर, आणि या संदर्भातच त्या मीटिंगमध्ये ’स्वीकार्यता-चाचणी’चा उल्लेख झाला होता.

आमच्या कंपनीने प्रोजेक्ट घेताना बहुतेक भारतीय कंपन्या करतात तशी घाई केली होती. माझा अनुभव असा की आपल्या कंपन्या स्वत:ला पळवाटा ठेवण्यासाठी काटेकोरपणा टाळतात. पण कधी कधी तोच उलट अंगाशी येतो तसे इथे झाले होते. प्रोजेक्ट पुरा झाला हे उभयपक्षी मान्य करण्यासाठी ’स्वीकार्यता-चाचणी’ काय असावी हे निश्वित न करताच कंपनीने प्रोजेक्ट हाती घेतला होता. आता ग्राहकाने आपली अशी चाचणी एकतर्फीच लादली होती.

Sentiment म्हणजे मत, कल वा भावना हा सापेक्ष मामला आहे. एकाच व्यक्तीने, एकाच वस्तू वा उत्पादनाबद्दल वेगवेगळ्या वेळी वा संदर्भामध्ये व्यक्त केलेले मत वेग-वेगळे असू शकते. एक सोपे उदाहरण म्हणजे गुंतवणूक पर्यायांकडे पाहू.

‘संभाव्य नुकसान’ हा निकष मानला तर एखाद्या गुंतवणूक पर्यायाची स्वीकार्यता माझ्या दृष्टीने नकारात्मक असेल; पण त्याच वेळी मला त्यातून ‘अपेक्षित परताव्या’च्या दृष्टीने मूल्यमापन करण्यास सांगितले तर ते सकारात्मक असू शकते. म्हणजे निकष काय यावरून त्या पर्यायाचे मूल्यमापन होते आहे.

हे झाले एकाच व्यक्तीबाबत. विविध व्यक्तींची एकाच उत्पादन, सेवा, घटना यांबाबतची अनुभव नि मते ही भिन्न भिन्न असणार हे ओघाने आलेच. या खेरीज चार व्यक्ती एकाच भाषेत नेमके एकच मत देत असतील तरी प्रत्येकाची वाक्यरचनेची पद्धत वेगवेगळी असू शकते. त्यातून ते वाचणार्‍या हाडा-मांसाच्या माणसांच्या आकलनातही फरक पडतो. याखेरीज वाचणार्‍याचा दृष्टिकोन वा पूर्वग्रह यांच्या प्रभावही त्याच्या आकलनावर पडत असतो. त्यामुळे एकच मत देणारे चार वेगळे प्रतिसाद वेगवेगळ्या प्रकारे ध्वनित होत असतात.

आता माणसा-माणसांतच अशी मतभिन्नता असते, तिथे जे माणसाला दिसते ते संगणकाच्या प्रोग्रामला दिसेलच असे याची शाश्वती देताच येत नाही. उदाहरणार्थ ‘अमुक उत्पादन उत्कृष्ट बिनडोक व्यक्तीने तयार केले आहे’ असे वाक्य असेल, तर त्याला उत्कृष्ट शब्दामुळे सकारात्मक म्हणावे की बिनडोक शब्द आल्याने नकारात्मक हे प्रोग्रामला नीट समजत नाही. निव्वळ सकारात्मक नि नकारात्मक विशेषणांकडे पाहून मूल्यमापन करत राहिले तर अशी पंचाईत होते. शिवाय कुठले विशेषण उत्पादनाचे नि कुठले त्याचे उत्पादन करणार्‍या व्यक्तीचे, त्यासंबंधी इतर गोष्टींचे हा पेचही सोडवायचा होताच. एक चांगल्यापैकी अल्गोरिदम लिहून आमच्या मंडळींनी तो सोडवलाही होता. 

पण पंचाईत अशी होती की या प्रोग्रामने दिलेले उत्तर बरोबर आहे की चूक (खरेतर स्वीकार्य म्हणजे acceptable!) हे ठरवणार कसे? हे काही गणित नाही की ज्याचे एक निश्चित उत्तर आहे, जे एखादा हुशार माणूस कागदावर गणित सोडवून शोधून काढेल नि प्रोग्रामच्या उत्तराशी ताडून बघेल. त्यामुळे इथे बरोबर वा चूक असा निवाडा असूच शकत नव्हता.

ManVsRobot
https://www.vecteezy.com/ येथून साभार.

यावर आमच्या ग्राहकाने तोड काढली होती. त्यांनी त्यांच्याकडून पाच जणांची तज्ज्ञ (Expert Tester) म्हणून नेमणूक केली होती. यांना कल-चाचणी करण्यासाठी डॉक्युमेंट्स/ पोस्ट्स/ ट्विट्स/ रिव्यूज्‌ यांचा एक संच देण्यात आला होता. कल-चाचणी कशी करावी याबाबत त्यांना काही ठोकताळे देण्यात आले होते. हे समान तंत्र वापरून या पाचांनी आणि अर्थातच आमच्या संगणकीय प्रोग्रामने आपापले अभिप्राय द्यायचे होते. आमच्या संगणकीय प्रोग्रामचे उत्तर ९०% हून अधिक वेळा या पाचांच्या सरासरीच्या जवळपास आले तर हा प्रोग्राम पुरेसा सक्षम आहे असे ग्राहक मान्य करणार होता.

त्यानुसार चाचणी पार पाडली, नि असे दिसले की संगणकीय प्रोग्रामने दिलेले उत्तर नि या पाच तथाकथित तज्ज्ञांचे सरासरी उत्तर जेमतेम ६५-७०% वेळाच जुळत होते. त्यामुळे ग्राहकाने तो संगणकीय प्रोग्राम पुरेसा सक्षम असल्याचे मान्य करण्यास नकार दिला होता. आणि त्यामुळे कंपनीचे सहा आकडी (डॉलरमध्ये) पैसे अडकून पडले होते. पुन्हा नव्याने संगणकीय प्रणाली नि प्रोग्राम तयार करणे हे जवळजवळ एक नवा प्रोजेक्टच केल्यासारखे ठरणार होते.

हे सारे ऐकून मी माझ्या लक्षात आले की ही स्वीकार्यता चाचणी मुळी प्रोग्रामची accuracy– बिनचूक उत्तर देण्याची क्षमता तपासतच नाही. ती फक्त निवडलेल्या पाच माणसांचे कौशल्य नि संगणकीय प्रोग्रामचे कौशल्य यांची तुलना करते इतकेच. जर आपण ही चाचणी प्रोग्रामची वास्तवाच्या जवळ जाणारी गुणवत्ता तपासते असे मान्य करत असू तर त्या पाच मंडळींना ‘बरोबर’ काय ते बिनचूक ठाऊक आहे आणि त्यामुळे त्यांची मूल्यमापनाची सरासरी ही ‘वास्तवा’च्या जवळ आहे असे आपण मानतो आहोत.

प्रत्येकाचा निवाडा त्या त्या माणसाच्या आकलनशक्तीवर बराच अवलंबून राहतो. हे पाच नसता अन्य पाच असते नि प्रोग्रामने त्यांच्याशी ९९% वेळा सहमती दर्शवली असती तर ग्राहक ते मान्य करणार होता का? असा प्रश्न मला पडला होता. या पाचांचे सरासरी उत्तर ‘कुठल्याही पाच व्यक्तींच्या सरासरी उत्तराच्या जवळपास राहील– म्हणजे हे पाच सर्वांच्या कलाचे प्रातिनिधित्व करतात’ याची खात्री करून देणारी संख्याशास्त्रीय चाचणी स्वतंत्रपणे केल्याखेरीज या पांचामुखी परमेश्वर असेलच असे म्हणता येणार नाही.

यातून दुसरा मुद्दा असा निर्माण होतो की हे पाच जण जवळजवळ सारख्याच बुद्धिमत्तेने अथवा आकलनातून काम करत आहेत का? असतील, तर त्यांच्या मूल्यमापनाची सरासरी हे मूळ पोस्ट/डॉक्युमेंट/ट्विट/रिव्ह्यूचे प्रातिनिधिक अथवा ‘वास्तव’ मूल्यमापन मान्य करताही येईल कदाचित. पण ते खरेच तसे आहेत का? म्हणजे असं पाहा, की पहिले पाच तज्ज्ञ मानले तर प्रोग्राम हा सहावा कल्पित (virtual) तज्ज्ञ आणला आहे– किंवा आहे का याचे उत्तर आपण शोधतो आहोत. पण मुळात हे पाच तज्ज्ञ आहेत हे कुणी आणि कसे ठरवले?

मुळात sentiment या शब्दातच सापेक्षता आहे हा पहिला मुद्दा. त्यामुळे निश्चित वास्तव असे काही नाहीच. समोरच्या पोस्ट/डॉक्युमेंट/ट्विट/रिव्ह्यू यात बरेच काही लिहिलेले असते, त्यातून निव्वळ नकारात्मक वा सकारात्मक असे द्विपर्यायी निकाल आपण देत आहोत. मी विचारले, ‘तुम्हाला तुमचा प्रोग्राम हा वास्तवाच्या(?) जवळ जाणारे उत्तर देणारा हवा आहे की ‘पांचामुखी परमेश्वर’ या न्यायाने त्या पाच न्यायाधीशांच्या ‘निकाला’च्या जवळ जाणारा? कारण इथे वास्तव नावाचे काही नाहीच असे माझे मत आहे.’ त्यामुळे ही चाचणीच योग्य आहे का हेच आधी तपासायला हवे असा सल्ला मी त्या प्रोजेक्टच्या मॅनेजरला आणि त्याच्या व्यवसाय-विभाग प्रमुखाला (BU-head) दिला.

HumanLost

“त्या पाचांची आपसांत– एक विरुद्ध इतर चार अशी– चाचणी करुन ते पाच जण परस्परांशी बहुतेक वेळा सहमत होतात का हे आधी पाहायला हवे. जर त्यांच्या मूल्यमापनात आधीच भरपूर तफावत असेल, तर त्यांच्या उत्तराची सरासरी हे ‘वास्तवाच्या जवळचे’ उत्तर हे गृहितकच चुकेल.

“तेव्हा तुम्ही या पाच जणांच्या गटात एका वेळी एक बाहेर ठेवून त्याची उरलेल्या चौघांबरोबर चाचणी घ्या. त्यातून त्यांची कामगिरी परस्परांच्या जवळपास आहे असे सिद्ध झाले तर असे म्हणता येईल की या पाचांची मत-तपासणीचे कौशल्य जवळजवळ सारखेच आहे. प्रोग्रामचेही त्यांच्याशी जुळते का हा प्रश्न पुढचा राहिला. मुळात त्यांच्यातच भरपूर मतभिन्नता असेल तर त्यांतून प्रातिनिधिक उत्तर काढण्यास पाचांची सरासरी पुरेशी नसेल, कारण त्यातील विचरण (variance) बरेच असेल.

या पद्धतीने चाचणी घेतली असता त्या पाचांच्या श्रेणीदानात आपसांतच भरपूर तफावत असल्याचे दिसून आले. जी चाचणी संगणकीय प्रोग्रामची तीच त्यांची घेतल्यावर प्रत्येकाचे इतरांशी मतैक्य हे सत्तर टक्क्याहूनही कमी दिसू लागले. म्हणजे त्यांच्या निकषांवर त्यांच्याच तज्ज्ञांची(?) कामगिरी ‘अस्वीकार्य’ ठरू लागली. परिणामी त्यांची सरासरी हे ’मत-मोजमाप’ म्हणून रद्द करावे लागले. ग्राहकाने हे मान्य करुन नवी स्वीकार्यता चाचणी तयार करण्यास अनुमती दिली आणि अखेरीस त्या सहा आकडी डॉलर्सची नौका ऐलतीरी पोचली...

...आणि तरीही सहा आकड्यातला एकही आकडा कंपनीने माझ्याकडे सरकवला नाही हे मात्र अंमळ खटकलेच मला. 😉

-oOo -


हे वाचले का?