बंदी की दुविधा
बंदी की दुविधा किसे कहते हैं
बंदी की दुविधा - गेम थ्योरी के क्षेत्र में सबसे जानी-मानी अवधारणाओं में से एक है, जिसे "पीस-वॉर गेम" के रूप में भी जाना जाता है। इस अवधारणा के अनुसार, झगड़े या बहस के ज्यादातर मामलों में दोनों पक्ष एक-दूसरे के साथ सहयोग करने से इंकार कर देते हैं, भले ही इस सहयोग से दोनों का फ़ायदा हों। इस तरह से, प्रत्येक प्रतिभागी केवल अपने खुद के फायदे को देखता है, आज राजनीति, व्यवसाय, अर्थशास्त्र, सामाजिक वातावरण और मानव जीवन के सभी क्षेत्रों में यही मुख्य समस्या है।
इस प्रकार, बंदी की दुविधा एक ऐसी समस्या है, जिसके समाधान के लिए कोई यूनिवर्सल रणनीति मौजूद नहीं है। बंदी की दुविधा में प्रमुख रणनीति वह होती है, जो उसके यूजर्स को दूसरे प्रतिभागियों की रणनीतियों की परवाह किए बिना अधिकतम फायदा कराती है, जो अपने आप में इस दुविधा का मूल है। यह पुलिस द्वारा पकड़े गए दो साथी चोरों के जाने-माने रूपक का सबसे अच्छा उदाहरण है। दोनों चोरों को अलग-अलग कमरों में बंद किया गया, जो आपस में बातचीत नहीं कर सकते थे। पुलिस अधिकारी प्रत्येक कैदी को बारी-बारी से तीन विकल्प प्रदान करते हैं:
- दोनों साथी आखिरी समय तक चुप रहते हैं, और यदि दी गयी समय अवधि के दौरान दोनों में से कोई भी जुर्म कबूल नहीं करता है, तो दोनों को कम से कम सजा मिलती है।
- एक साथी दूसरे पर सारा इलज़ाम डाल देता है, पहला छूट जाता है, और दूसरे को ज्यादा सजा मिलती है।
- दोनों साथी एक-दूसरे पर सारा इलज़ाम डालते हैं और एक जैसी सजा प्राप्त करते हैं - सजा की औसत अवधि।
चूंकि साथी आपस में बातचीत नहीं कर सकते, इसलिए दोनों में से कोई भी नहीं जानता कि दूसरा क्या करेगा। इसलिए, इस बात का ख़तरा दोनों में कोई एक ही सजा काटेगा (घटना के दूसरे विकल्प के मामले में), दोनों सहयोगियों को एक-दूसरे पर इलज़ाम डालने के लिए मजबूर करता है। नतीजतन, केवल अपने हितों के बारे में सोचते हुए, उन दोनों को औसत सजा मिलती है, हालांकि चुप रहने पर उन दोनों को न्यूनतम सजा मिल सकती थी।
बंदी की दुविधा की परिभाषा
सबसे पहले, बंदी की दुविधा को समझने के लिए यह साफ़ करना ज़रूरी है, कि गेम थ्योरी क्या होती है। तो, गेम थ्योरी - यह किसी भी ऐसी प्रक्रिया के लिए रणनीति व्यवहार के निर्माण की एक गणितीय विधि होती है, जिसमें दो या दो से अधिक पक्ष अपने हितों का पीछा कर रहे होते हैं। क्योंकि प्रत्येक पक्ष अपनी खुद की रणनीति और साधनों का उपयोग करता है और उसका अपना एक विशिष्ट लक्ष्य होता है, ऐसे में प्रत्येक प्रतिभागी समान रूप से जीत और हार सकता है। दूसरी ओर, गेम थ्योरी, आपको अन्य पक्षों के मनोविज्ञान, सोच और संसाधनों की समझ के आधार पर, सबसे फायदेमंद मिली-जुली रणनीति चुनने का मौका देती है।
अमेरिकी गणितज्ञ अल्बर्ट टकर ने बंदी की दुविधा की एक थ्योरी के रूप में तैयार किया। उन्होंने इसका इस्तेमाल उन खेलों में पैदा होने वाली कठिनाइयों को स्पष्ट करने के लिए किया, जहां केवल एक प्राइज उपलबध होता है, और ज़्यादातर खिलाड़ी साथ मिलकर काम नहीं करना चाहते हैं। लेकिन इस चीज़ को "बंदी की दुविधा" क्यों कहा जाता है? यह ज्यादातर देशों के कानूनों से आया है, जो अपराधियों को तब सजा देते हैं, यदि वे एक-दूसरे पर इलज़ाम डालते हैं या कबूल कर लेते हैं और अक्सर दोनों के चुप रहने पर किसी को भी सजा नहीं मिलती है। यह आईडिया, सहयोग की समस्या को साथ लेते हुए, टकर की थ्योरी "बंदी की दुविधा" का आधार बनती है।
इसके निम्नलिखित सैद्धांतिक बिंदुओं को हाईलाइट किया जा सकता है:
- बंदी की दुविधा उन स्थितियों में विकसित होती है, जहां प्रतिभागियों के पास किसी दूसरे प्रतिभागी की स्थिति को खराब करने का मकसद होता है, पर साथ ही सभी की स्थिति को सुधारने का भी कोई सचेत मकसद नहीं होता है।
- बंदी की दुविधा के अनुसार, एक व्यक्ति को सबसे अधिक फायदा तब होता है, जब वह अन्य सभी को दुश्मन बना लेता है और विश्वासघात करता है।
- इस खेल को हर बार दोहराने के साथ, सभी पक्ष सहयोग को प्रोत्साहित करना शुरू कर देते हैं और धीरे-धीरे पारस्परिक फायदे की ओर बढ़ते हैं।
- उन विनाशकारी उद्देश्यों और प्रोत्साहनों के बावजूद, जो प्रतिभागियों को दूसरों की कीमत पर अपने हितों को आगे बढ़ाने के लिए प्रेरित करते हैं, बंदी की दुविधा को दूर किया जा सकता है और इसे दूर किया जाना चाहिए।
बंदी की दुविधा का महत्व
इस तथ्य के बावजूद कि बंदी की दुविधा गेम की थ्योरी को संदर्भित करती है, जिसे व्यापक रूप से जाना या समझा नहीं जाता है, यह रोजमर्रा की जिंदगी में भी नज़र आती है। उदाहरण के लिए, बंदी की दुविधा कैसे काम करती है, इसकी जानकारी आपको इस तरह मदद कर सकती है:
- जब यह तुरंत साफ़ न हो कि, बातचीत कठोर तरीके से करनी है या नरम तरीके से, तब बातचीत की सबसे प्रभावी रणनीति चुनना;
- एक टीम को लीड करना और अंदरूनी झगड़ों का समाधान करना;
- जब आपको अपने खुद के फ़ायदे और ग्राहकों के अनुरोधों की प्रभावी संतुष्टि के बीच चुनना हो, तब बिज़नेस करना;
- जब आपको विभिन्न स्तरों के फायदों के साथ कई विकल्पों में से किसी एक को चुनना हो, तब अपने व्यक्तिगत जीवन को ध्यान में रखकर महत्वपूर्ण निर्णय लेना हो।
संक्षेप में, बंदी की दुविधा एक कठिन परिस्थिति से बाहर निकलने का रास्ता प्रदान करती है, या कम से कम किसी प्रतिद्वंद्वी के उद्देश्यों और व्यवहार के पैटर्न को समझने में मदद करती है, ताकि आपको झटका न लगे या आप कोई जोखिम भरा निर्णय न लें।
बंदी की दुविधा में नैश संतुलन
नैश संतुलन (Nash equilibrium) - गेम थ्योरी में यह एक और अवधारणा है, जो कभी-कभी "बंदी की दुविधा" के संदर्भ में उत्पन्न होती है। नैश संतुलन एक ऐसी स्थिति है, जहां जीत को बढ़ाना एकतरफा तौर पर संभव नहीं होता है। यानि कि, जब एक खेल (प्रक्रिया) का प्रतिभागी अपनी रणनीति बदलकर अपनी जीत नहीं बढ़ा सकता है, यदि खेल के अन्य प्रतिभागी भी अपनी रणनीति नहीं बदलते हैं। गणितज्ञ जॉन नैश, जिन्होंने इस चीज़ की खोज की, वो जंगल के भेड़ियों का एक उदाहरण देते हैं: भेड़िये कभी भी सभी खरगोशों को नहीं खाते, वरना उनके पास कुछ भी खाने को नहीं बचेगा। नतीजतन, इस बात से सहमत होना कि प्रत्येक भेड़िया दूसरों के साथ मिलकर संयम से खरगोशों को खाएंगे, इस तरह "खेल" का सबसे फायदेमंद नतीजे मिलते है।
नैश संतुलन की कई संभावित भिन्नता भी हैं, जब एक तरफ या किसी दूसरी तरफ फायदा अधिक होता है:
- मजबूत संतुलन - खिलाड़ी अपनी रणनीति बदल सकता है, लेकिन केवल अपने और दूसरों के लिए इसे और खराब कर देगा;
- कमजोर संतुलन - यदि, वे अपनी रणनीति बदलते हैं, तो वे एक अच्छी स्थिति भी बना सकते हैं, लेकिन पहले से बेहतर नहीं होते हैं।
यदि खिलाड़ी रणनीति बदलकर अपनी स्थिति में सुधार कर लेता है, तो इसे नैश संतुलन नहीं कहा जायेगा।
आइए, एक उदाहरण के रूप में रोजमर्रा की जिंदगी से एक स्थिति को लेते हैं। मान लीजिए कि दो कारें दो अगल-बगल की लेन में चल रही हैं, लेकिन विपरीत दिशाओं में। यहाँ संतुलन की कितनी स्थितियाँ हैं? पहली - दोनों ड्राइवर एक-दूसरे के दाहिनी ओर ड्राइव कर रहे हैं, और दोनों पास से गुजरते हुए सुरक्षित रहते हैं। दूसरी - दोनों में से एक ड्राइवर दिशा बदलता है, और एक गंभीर दुर्घटना हो जाती है, जिसके नतीजतन, इस स्थिति को मजबूत संतुलन कहा जा सकता है। तीसरी - जिसमें "कमज़ोर संतुलन" दिखता है, जब दोनों ड्राइवर दिशा बदलना चाहते हैं और उसी तरीके से बदलना चाहते हैं, जिसके नतीजतन स्थिति खराब नहीं होती है (कोई दुर्घटना नहीं होती है) और बेहतर भी नहीं होती है।
बंदी की दुविधा से कैसे बाहर निकलें
अमेरिकी राजनीतिक वैज्ञानिक रॉबर्ट एक्सेलरोड ने, बंदी की दुविधा पर किये कई सालों के रीसर्च के दौरान पाया गया, कि लोग जितना ज़्यादा इस दुविधा का सामना करते हैं, उतनी ही आसानी से और तेजी से वे इससे बाहर निकलने का रास्ता खोज लेते हैं। पिछले अनुभव (आमतौर पर नकारात्मक अनुभव, जो इस दुविधा में हर किसी के पास होते हैं), नए स्किल्स (एक्सेलरोड के लिए झगड़ो से निपटान और बातचीत की क्षमता विशेष रूप से महत्वपूर्ण होती हैं) और उनसे सीखे गए कीमती सबक के साथ उपलब्धियां इसमें योगदान करती हैं। रिसर्चर्स ने यह भी पाया कि जिन रणनीतियों का पहला मकसद लालच होता है, वे प्रतिभागियों के बीच समझौता कराने और मैत्रीपूर्ण संबंध बनाने की इच्छा रखने वाली रणनीतियों की तुलना में, लंबे समय में खराब नतीजे देते हैं।
इस डेटा के आधार पर, एक्सेलरोड ने कई थ्योरी की पहचान की जो बातचीत या बिज़नेस डील में बंदी की दुविधा को दूर करने में मदद करते हैं या इसे पूरी तरह से टालते हैं:
- बातचीत की रणनीतियां जोड़-तोड़ वाली नहीं होनी चाहिए, और प्रतिभागियों को अपने प्रतिद्वंद्वी को धोखा देने की कोशिश करने से बचना चाहिए, जब तक कि उनमें से कोई इस थ्योरी का उल्लंघन करते हुए पकड़ा न जाए।
- यदि एक प्रतिभागी दूसरे के हितों के साथ विश्वासघात करता है, तो दूसरे को समग्र स्थिति को स्थिर करने के लिए "बदला" लेना चाहिए यानि जरुरी रूप से प्रतिक्रिया देनी चाहिए।
- "बदला" पूरा हो जाने के बाद, प्रतिभागियों को सहयोग पर वापस आ जाना चाहिए और पहले थ्योरी का पालन करना चाहिए।
- बातचीत की रणनीति में सभी के हितों को समान रूप से संतुष्ट करने की कोशिश की जानी चाहिए, बिना किसी को पछाड़ने और अधिक फायदा हासिल करने की कोशिश किये बग़ैर।
इन थ्योरी का पालन करने से उन बातचीत की प्रभावशीलता और नतीजों में काफी वृद्धि की है, जिसमें बंदी की दुविधा विकसित हुई थी। इसलिए, एक्सलरोड की रणनीति से सभी प्रतिभागियों को फायदा प्राप्त होने की सबसे बड़ी संभावना होती है। इसकी मुख्य कुंजी है - सामान्य भलाई के पक्ष में व्यक्तिगत स्वार्थी प्रोत्साहनों को दूर करना और खेल को एक से अधिक बार दोहराना यदि यह तुरंत करना संभव नहीं होता है। फिर, समय के साथ, प्रतिभागी ऐसी रणनीतियाँ विकसित कर सकते हैं जो सहयोग को प्रोत्साहित करती हैं और विश्वासघात के लिए सजा देती हैं, इससे विश्वासघात को प्रोत्साहन मिलना कम हो जाता है।
बंदी की दुविधा को दूर करने का एक वैकल्पिक तरीका भी है। इसमें विनाशकारी प्रोत्साहनों से बचने और तर्कसंगत, सूचित और पारस्परिक रूप से फायदेमंद समाधानों के पक्ष में सोच की रूढ़ियों को दूर करने के लिए उपकरणों और रणनीतियों का सामूहिक निर्माण शामिल है। इसमें सामूहिक रूप से विघटनकारी उत्तेजनाओं से बचने और तर्कसंगत, सूचित और पारस्परिक रूप से लाभकारी समाधानों के पक्ष में रूढ़िवादी सोच को दूर करने के लिए उपकरण और रणनीति बनाना शामिल है। हालांकि, यह ध्यान देने योग्य है कि इस तरह से दुविधा से बाहर निकलने के लिए अतिरिक्त संसाधन लागतों की जरुरत होती है, साथ ही विकास प्रक्रिया में सभी खेल प्रतिभागियों की भागीदारी की जरुरत होती है।
ऐसा ही एक टूल है, बंदी की दुविधा की पे-ऑफ मैट्रिक्स, जिसमें निम्नलिखित जानकारी वाले चार कॉलम उपलब्ध होते हैं;
- क्या होगा यदि, पहला प्रतिभागी दूसरे को धोखा दे दे?
- क्या होगा यदि, दूसरा प्रतिभागी पहले को धोखा दे?
- क्या होगा यदि, दोनों प्रतिभागी एक दूसरे को धोखा दें?
- क्या होगा यदि, कोई किसी को धोखा न दे?
विषय के अनुसार सीखना
बंदी की दुविधा के उदाहरण
आइए डकैती की स्थिति के उदाहरण के साथ क्लासिक बंदी की दुविधा को स्पष्ट करें:
बोनी और क्लाइड ने एक बैंक लूटा पर उन्हें गिरफ्तार करके पूछताछ के लिए अलग-अलग कमरों में रखा गया। दुर्भाग्य से, पुलिस के पास कोई और दूसरा गवाह नहीं होता है, जिससे बोनी और क्लाइड के अपराध को साबित करना अविश्वसनीय रूप से कठिन हो जाता है, जब तक कि उनमे से एक या वे दोनों खुद इसे स्वीकार नहीं कर लेते। आखिरी में, दोनों लुटेरों को एक विकल्प दिया जाता है: या तो वे चुप रहें, जिसके लिए उन्हें केवल एक साल की जेल होगी, या सह-अपराधी का नाम बता कर छूट जाना, लेकिन तब उस साथी को पूरे पांच साल की जेल होगी। यदि ऐसा होता है, कि वे दोनों अपराध कबूल कर लेते हैं, तो बोनी और क्लाइड दोनों को दो-दो साल की जेल होगी।
चूंकि बोनी और क्लाइड एक-दूसरे के निर्णयों से अनजान हैं और स्वतंत्र रूप से निर्णय लेते हैं, इसलिए यहाँ चार संभावित नतीजे पैदा हो सकते हैं:
- केवल बोनी क्लाइड पर इलज़ाम डाल देता है और खुद छूट जाता है, और क्लाइड को पांच साल के लिए जेल हो जाती है।
- केवल क्लाइड बोनी पर इलज़ाम डाल देता है और खुद छूट जाता है, जबकि बोनी को पांच साल के लिए जेल हो जाती है।
- क्लाइड बोनी पर इलज़ाम डाल देता है, और बोनी क्लाइड पर इलज़ाम डाल देता है और फिर दोनों को दो-दो साल की जेल हो जाती है।
- क्लाइड और बोनी चुप रहते हैं, जिसके नतीजतन दोनों को केवल एक साल की जेल होती है।
बचने वाले की दुविधा के हिसाब से, तीसरे नतीजे की संभावना 50% से ज़्यादा होती है, जबकि चौथे नतीजे की संभावना केवल 5% होती है।
आइए असली जिंदगी में भी बंदी की दुविधा के उदाहरणों पर विचार करें, जैसे कि, बिज़नेस में, जहां यह दुविधा सबसे अधिक बार होती है, पूरी मार्किट को जोखिम में डाल दते है। मान लीजिए कि दो ब्यूटी प्रोडक्ट कंपनियां हैं और वे एक दूसरे की प्रतिस्पर्धी हैं। उनके बीच कीमत को लेकर युद्ध छिड़ जाता है, क्योंकि दोनों अच्छे से जानती हैं, कि खरीदार सबसे सस्ता सामान पसंद करते हैं। नतीजतन, बड़ी संख्या में खरीदारों को आकर्षित करने और प्रतिस्पर्धी से आगे निकलने की कोशिश में, दोनों कंपनियां अपनी कीमतें तब तक कम करती रहती हैं, जब तक कि वे नुकसान में और घाटे में नहीं चली जातीं। आखिरी में, उनमें से किसी को भी नए क्लाइंट नहीं मिलते हैं, जबकि बजट समाप्त हो जाता है, प्रॉफिट जीरो पर रहता है।
विभिन्न देशों के बीच हथियारों की होड़ में स्थिति भी लगभग ऐसी ही दिखती है, जिसमें, सैन्य शक्ति का निरंतर निर्माण केवल एक-दूसरे के समाजों में डर और झगड़ों को बढ़ाने, संसाधनों को कम करने के लिए होता है और दुश्मन को नियंत्रित करने के बजाय और भी अधिक जटिल अंतर्राष्ट्रीय संबंध बनाने का काम करता है। कृषि में भी, बंदी की दुविधा तब उत्पन्न हो सकती है, जब किसान लगातार उत्पादन में वृद्धि करते हैं, जिसके परिणामस्वरूप मार्किट की भीड़, मांग और कीमतों में गिरावट आती है, जिसके बाद दिवालियापन का खतरा पैदा हो जाता है।