Ce este inducerea înapoi?
Inducerea înapoi în teoria jocurilor este un proces iterativ de raționare înapoi în timp, de la sfârșitul unei probleme sau situații, pentru a rezolva o formă extinsă finită și jocuri secvențiale și a deduce o secvență de acțiuni optime.
Inducerea înapoi explicată
Inducția înapoi a fost folosită pentru a rezolva jocurile de când John von Neumann și Oskar Morgenstern au stabilit teoria jocurilor ca subiect academic atunci când au publicat cartea lor, Theory of Games and Economic Behavior in 1944.
În fiecare etapă a jocului, inducția înapoi determină strategia optimă a jucătorului care face ultima mișcare din joc. Apoi, acțiunea optimă a jucătorului care se deplasează în următoarea este determinată, luând acțiunea ultimului jucător așa cum a fost dată. Acest proces continuă înapoi până când a fost determinată cea mai bună acțiune pentru fiecare punct în timp. În mod efectiv, se determină echilibrul Nash al fiecărui sub-joc al jocului inițial.
Cu toate acestea, rezultatele deduse din inducția înapoi nu reușesc adesea să prezică jocul uman real. Studiile experimentale au arătat că comportamentul „rațional” (așa cum prevede teoria teoriei jocurilor) este foarte rar prezentat în viața reală. Jucătorii iraționali pot ajunge în realitate să obțină rambursări mai mari decât se prevedea prin inducerea înapoi, așa cum este ilustrat în jocul centipede.
În jocul de centipede, doi jucători au alternativă șansa de a lua o parte mai mare dintr-un vas de bani în creștere sau de a trece potul către celălalt jucător. Remunerațiile sunt aranjate astfel încât, dacă potul este trecut adversarului și oponentul ia potul în runda următoare, unul primește ceva mai puțin decât dacă unul ar fi luat potul în această rundă. Jocul se încheie de îndată ce un jucător ia pasul, jucătorul obținând porțiunea mai mare, iar celălalt jucător obține porțiunea mai mică.
Exemplu de inducție înapoi
Ca exemplu, presupunem că jucătorul A merge pe primul loc și trebuie să decidă dacă ar trebui să „ia” sau „să treacă” stash-ul, care se ridică în prezent la 2 $. Dacă ia, atunci A și B obțin 1 dolar fiecare, dar dacă A trece, decizia de a lua sau de a trece acum trebuie să fie luată de jucătorul B. Dacă B ia, ea primește 3 $ (adică, stashul precedent de 2 $ + 1 $) iar A primește 0 $. Dar dacă trece B, A ajunge acum să decidă dacă să ia sau să treacă și așa mai departe. Dacă ambii jucători aleg întotdeauna să treacă, fiecare primește o rambursare de 100 USD la sfârșitul jocului.
Ideea jocului este dacă A și B cooperează și continuă să treacă până la sfârșitul jocului, primesc suma maximă de 100 USD fiecare. Dar dacă aceștia au încredere în celălalt jucător și se așteaptă ca aceștia să „ia” la prima oportunitate, echilibrul Nash prevede că jucătorii vor primi cea mai mică cerere posibilă (1 dolar în acest caz).
Echilibrul Nash al acestui joc, în care niciun jucător nu are un stimulent să se abată de la strategia aleasă după ce a luat în considerare alegerea unui adversar, sugerează că primul jucător ar lua potul chiar din prima rundă a jocului. Cu toate acestea, în realitate, relativ puțini jucători fac acest lucru. Ca urmare, obțin un profit mai mare decât profitul prevăzut de analiza echilibrului.
Rezolvarea jocurilor secvențiale cu ajutorul inducției înapoi
Mai jos este un simplu joc secvențial între doi jucători. Etichetele cu Player 1 și Player 2 în ele sunt seturile de informații pentru jucătorii unu sau două, respectiv. Numerele din paranteze din partea de jos a arborelui sunt rambursările la fiecare punct respectiv. Jocul este de asemenea secvențial, astfel încât jucătorul 1 ia prima decizie (stânga sau dreapta), iar jucătorul 2 ia decizia după jucătorul 1 (în sus sau în jos).
figura 1
Inducția înapoi, ca toată teoria jocurilor, utilizează ipotezele raționalității și maximizării, ceea ce înseamnă că jucătorul 2 își va maximiza profitul în orice situație dată. La oricare dintre seturile de informații avem două opțiuni, patru în total. Eliminând opțiunile pe care jucătorul 2 nu le va alege, ne putem restrânge arborele. În acest fel, vom îndrăzni liniile care maximizează rambursarea jucătorului la setul de informații date.
Figura 2
După această reducere, jucătorul 1 își poate maximiza profiturile acum când sunt făcute cunoscute alegerile jucătorului 2. Rezultatul este un echilibru găsit prin inducerea înapoi a jucătorului 1 alegând „corect” și jucătorul 2 alegând „sus”. Mai jos este soluția jocului cu calea de echilibru îndrăzneață.
Figura 3
De exemplu, s-ar putea configura cu ușurință un joc similar cu cel de mai sus, folosind companii ca jucători. Acest joc ar putea include scenarii de lansare a produsului. Dacă Compania 1 dorea să lanseze un produs, ce ar putea face Compania 2 ca răspuns? Compania 2 va lansa un produs concurențial similar? Prin prognozarea vânzărilor acestui nou produs în diferite scenarii, putem configura un joc care să prezică modul în care se pot derula evenimentele. Mai jos este un exemplu despre modul în care se poate modela un astfel de joc.
Figura 4
