पीछे की ओर प्रेरण

पिछड़े हुए प्रेरण क्या है?

गेम थ्योरी में बैकवर्ड इंडक्शन एक समस्या या स्थिति के अंत से समय में पिछड़े तर्क का एक पुनरावृत्त प्रक्रिया है, जो परिमित व्यापक रूप और अनुक्रमिक गेम को हल करने के लिए, और इष्टतम कार्यों के अनुक्रम का अनुमान लगाता है।

बैकवर्ड इंडक्शन समझाया

जॉन वॉन न्यूमैन और ऑस्कर मोर्गनस्टर्न स्थापित गेम थ्योरी के बाद से शैक्षिक विषय के रूप में बैकवर्ड इंडक्शन का इस्तेमाल तब किया गया, जब उन्होंने 1944 में अपनी पुस्तक, थ्योरी ऑफ गेम्स और इकोनॉमिक बिहेवियर को प्रकाशित किया।

खेल के प्रत्येक चरण में पिछड़े प्रेरण खिलाड़ी की इष्टतम रणनीति को निर्धारित करता है जो खेल में अंतिम चाल बनाता है। फिर, अगले-से-अंतिम मूविंग प्लेयर की इष्टतम कार्रवाई निर्धारित की जाती है, अंतिम खिलाड़ी की कार्रवाई को दिए गए अनुसार। यह प्रक्रिया तब तक पिछड़ी रहती है जब तक कि हर बिंदु के लिए सबसे अच्छी कार्रवाई निर्धारित नहीं की गई है। प्रभावी रूप से, कोई भी मूल गेम के प्रत्येक सबगेम के नैश संतुलन का निर्धारण कर रहा है।

हालांकि, पिछड़े प्रेरण से निकले परिणाम अक्सर वास्तविक मानव खेल की भविष्यवाणी करने में विफल होते हैं। प्रायोगिक अध्ययनों से पता चला है कि "तर्कसंगत" व्यवहार (जैसा कि खेल सिद्धांत द्वारा भविष्यवाणी की गई है) शायद ही कभी वास्तविक जीवन में प्रदर्शित होता है। तर्कहीन खिलाड़ी वास्तव में पिछड़े प्रेरण द्वारा भविष्यवाणी की तुलना में उच्च भुगतान प्राप्त कर सकते हैं, जैसा कि सेंटीपीड गेम में चित्रित किया गया है।

सेंटीपीड गेम में, दो खिलाड़ियों को बारी-बारी से पैसे के बढ़ते बर्तन का बड़ा हिस्सा लेने का मौका मिलता है, या दूसरे खिलाड़ी को पॉट पास करने का मौका मिलता है। अदायगी की व्यवस्था इसलिए की जाती है कि यदि किसी के विरोधी को पॉट पास किया जाता है और प्रतिद्वंद्वी पॉट को अगले राउंड पर ले जाता है, तो यदि वह इस राउंड पर पॉट ले गया होता है, तो वह थोड़ा कम प्राप्त करता है। जैसे ही कोई खिलाड़ी स्लैश लेता है, उस खिलाड़ी का बड़ा हिस्सा हो जाता है और दूसरे खिलाड़ी का छोटा हिस्सा हो जाता है।

बैकवर्ड इंडक्शन का उदाहरण

एक उदाहरण के रूप में, मान लीजिए कि प्लेयर A पहले चला जाता है और यह तय करना होता है कि उसे "ले" या "पास" करना चाहिए, जो वर्तमान में $ 2 है। यदि वह लेता है, तो ए और बी को $ 1 प्रत्येक मिलता है, लेकिन यदि ए पास होता है, तो अब लेने या पास करने का निर्णय प्लेयर बी द्वारा किया जाना है। यदि बी लेता है, तो उसे $ 3 मिलता है (यानी, $ 2 + $ 1 का पिछला स्लैश) और A को $ 0 मिलता है। लेकिन अगर बी पास हो जाता है, तो ए को अब तय करना है कि क्या लेना है या पास करना है, और इसी तरह। यदि दोनों खिलाड़ी हमेशा पास करना चुनते हैं, तो वे खेल के अंत में $ 100 का भुगतान प्राप्त करते हैं।

खेल की बात यह है कि यदि A और B दोनों सहयोग करते हैं और खेल के अंत तक पास करना जारी रखते हैं, तो उन्हें प्रत्येक $ 100 का अधिकतम भुगतान प्राप्त होता है। लेकिन अगर वे दूसरे खिलाड़ी का अविश्वास करते हैं और उनसे उम्मीद करते हैं कि पहले मौके पर "ले" करेंगे, तो नैश संतुलन की भविष्यवाणी करता है कि खिलाड़ी सबसे कम संभव दावा करेंगे (इस मामले में $ 1)।

इस खेल का नैश संतुलन, जहां किसी भी खिलाड़ी को प्रतिद्वंद्वी की पसंद पर विचार करने के बाद अपनी चुनी हुई रणनीति से विचलित करने का कोई प्रोत्साहन नहीं होता है, पहले खिलाड़ी को खेल के पहले दौर में पॉट लेने का सुझाव देता है। हालांकि, वास्तव में, अपेक्षाकृत कम खिलाड़ी ऐसा करते हैं। नतीजतन, उन्हें संतुलन विश्लेषण द्वारा भविष्यवाणी की गई अदायगी की तुलना में अधिक भुगतान मिलता है।

पिछड़े प्रेरण का उपयोग कर अनुक्रमिक खेलों को हल करना

नीचे दो खिलाड़ियों के बीच एक सरल अनुक्रमिक खेल है। उनके भीतर प्लेयर 1 और प्लेयर 2 के लेबल क्रमशः एक या दो खिलाड़ियों के लिए सूचना सेट हैं। पेड़ के नीचे कोष्ठक में संख्या प्रत्येक संबंधित बिंदु पर अदायगी है। खेल भी अनुक्रमिक है, इसलिए प्लेयर 1 पहला निर्णय (बाएं या दाएं) करता है और प्लेयर 2 प्लेयर 1 (ऊपर या नीचे) के बाद अपना निर्णय लेता है।

आकृति 1

बैकवर्ड इंडक्शन, सभी खेल सिद्धांत की तरह, तर्कसंगतता और अधिकतमकरण की मान्यताओं का उपयोग करता है, जिसका अर्थ है कि खिलाड़ी 2 किसी भी स्थिति में अपने भुगतान को अधिकतम करेगा। या तो सूचना सेट पर हमारे पास दो विकल्प हैं, सभी में चार। प्लेयर 2 को चुनने वाले विकल्पों को समाप्त करके, हम अपने पेड़ को संकीर्ण कर सकते हैं। इस तरह, हम उन लाइनों को बोल्ड करेंगे जो दिए गए सूचना सेट पर खिलाड़ी के भुगतान को अधिकतम करते हैं।

चित्र 2

इस कमी के बाद, खिलाड़ी 1 अब अपने भुगतान को अधिकतम कर सकता है जो कि खिलाड़ी 2 के विकल्प से ज्ञात होता है। परिणाम खिलाड़ी 1 के पिछड़े प्रेरण द्वारा पाया गया एक संतुलन है "सही" और खिलाड़ी 2 को चुनना "।" नीचे दिए गए खेल के साथ संतुलन का रास्ता साहसिक है।

चित्र तीन

उदाहरण के लिए, कोई भी आसानी से खिलाड़ियों के रूप में कंपनियों के उपयोग से ऊपर एक गेम सेट कर सकता है। इस गेम में उत्पाद रिलीज़ परिदृश्य शामिल हो सकते हैं। यदि कंपनी 1 एक उत्पाद जारी करना चाहती थी, तो कंपनी 2 प्रतिक्रिया में क्या कर सकती है "> विभिन्न परिदृश्यों में इस नए उत्पाद की बिक्री का पूर्वानुमान लगाते हुए, हम यह अनुमान लगाने के लिए एक गेम सेट कर सकते हैं कि घटनाएँ कैसे सामने आ सकती हैं। नीचे एक उदाहरण है कि कोई कैसे मॉडल बना सकता है। ऐसा खेल।

चित्र 4

इनवेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।

पीछे की ओर प्रेरण

बैकवर्ड इंडक्शन समझाया

बैकवर्ड इंडक्शन का उदाहरण

पिछड़े प्रेरण का उपयोग कर अनुक्रमिक खेलों को हल करना

संबंधित शर्तें