Nash echilibru. Teoria jocurilor pentru economiști (John Nash)

În anii 1930, John von Neumann și Oscar Morgenstern au devenit fondatorii unei noi zone interesante de matematică, care a fost numită „teoria jocurilor”. În anii 1950, tânărul matematician John Nash s-a interesat de acest domeniu. Teoria echilibrului a devenit subiectul disertației sale, pe care a scris-o la 21 de ani. Astfel s-a născut o nouă strategie pentru jocuri numită Nash Equilibrium, care a obținut Premiul Nobel mulți ani mai târziu, în 1994.

Distanța lungă dintre scrierea unei teze și acceptarea universală a fost un test pentru matematician. Geniul fără recunoaștere a dus la încălcări mintale grave, dar John Nash a fost capabil să rezolve această problemă datorită minții sale logice excelente. Teoria sa despre „echilibrul Nash” a primit premiul Nobel, iar adaptarea sa în filmul „Mintea frumoasă” („Jocurile minții”).

Teoria jocurilor pe scurt

Deoarece teoria echilibrului Nash explică comportamentul oamenilor în termeni de interacțiune, merită așadar să luăm în considerare conceptele de bază ale teoriei jocurilor.

Teoria jocului studiază comportamentul participanților (agenților) în condiții de interacțiune între ei în funcție de tipul jocului, când rezultatul depinde de decizia și comportamentul mai multor persoane. Participantul ia decizii, ghidat de prognozele sale cu privire la comportamentul celorlalți, care se numește strategia de joc.

Există, de asemenea, o strategie dominantă în care participantul obține rezultatul optim pentru orice comportament al altor participanți. Aceasta este cea mai bună strategie a câștigului-câștig a jucătorului.

Dilema prizonierului și descoperirea științifică

Dilema prizonierului este un caz cu un joc atunci când participanții sunt obligați să ia decizii raționale, atingând un obiectiv comun în contextul unui conflict de alternative. Întrebarea este care dintre aceste opțiuni va alege, recunoscându-și interesul personal și comun, precum și incapacitatea de a obține ambele. Jucătorii par să fie închiși în condiții dure de joc, ceea ce uneori îi face să gândească foarte productiv.

Această dilemă a fost explorată de matematicianul american John Nash. Echilibrul pe care l-a scos la iveală a devenit revoluționar de acest fel. În mod deosebit de viu, această nouă gândire a influențat opinia economiștilor cu privire la modul în care jucătorii de pe piață aleg alegerile, ținând cont de interesele altora, cu o interacțiune strânsă și intersecția de interese.

Cel mai bine este să studiați teoria jocului cu exemple specifice, deoarece această disciplină matematică în sine nu este una teoretică uscată.

Exemplu de dilemă prizonier

De exemplu, două persoane au jefuit, au căzut în mâinile poliției și sunt interogați în celule separate. În același timp, polițiștii oferă fiecărui participant condiții favorabile în care va fi eliberat dacă va depune mărturie împotriva partenerului său. Fiecare dintre infractori are următorul set de strategii pe care îl va lua în considerare:

Ambele mărturisesc simultan și primesc 2, 5 ani de închisoare.
Amândouă au tăcere în același timp și primesc câte un an, deoarece în acest caz baza de dovezi a vinovăției lor va fi mică.
Unul dă dovezi și primește libertate, în timp ce celălalt tăce și primește 5 ani de închisoare.

Evident, rezultatul cazului depinde de decizia ambilor participanți, dar nu pot ajunge la un acord pentru că stau în diferite celule. Conflictul intereselor lor personale în lupta pentru un interes comun este, de asemenea, clar vizibil. Fiecare deținut are două opțiuni pentru acțiune și 4 opțiuni pentru rezultate.

Lanț de infern

Deci, criminalul A are în vedere următoarele opțiuni:

Eu tac si partenerul meu tace - amandoi vom primi 1 an de inchisoare.
Îi dau partenerul și el îmi dă - amândoi primim 2, 5 ani de închisoare.
Am tăcere, iar partenerul meu mă predă - voi primi 5 ani de închisoare, iar el va fi liber.
Îmi închiriez partenerul, iar el tace - primesc libertate, iar el are 5 ani de închisoare.

Oferim o matrice de soluții și rezultate posibile pentru claritate.

Tabelul rezultatelor probabile ale dilemei prizonierului.

Întrebarea este ce va alege fiecare participant?

„Tăcere, nu poți vorbi” sau „Tăcere nu poți vorbi”

Pentru a înțelege alegerea participantului, trebuie să parcurgeți lanțul gândurilor sale. În urma motivării criminalului A: dacă tac și păstrez tăcerea partenerului meu, vom primi un termen minim (1 an), dar nu pot afla cum se comportă. Dacă mărturisește împotriva mea, atunci este mai bine să mărturisesc, altfel pot sta 5 ani. Aș prefera să stau 2, 5 ani decât 5 ani. Dacă nu spune nimic, atunci cu atât mai mult trebuie să mărturisesc, pentru că în acest fel voi primi libertatea. De asemenea, membrul B susține în același mod.

Este ușor de înțeles că strategia dominantă pentru fiecare dintre infractori este să depună mărturie. Punctul optim al acestui joc apare atunci când ambii infractori dau dovezi și primesc „premiul” lor - 2, 5 ani de închisoare. Teoria jocului lui Nash o numește echilibru.

Soluție optimă Nash Optimal

Revoluția opiniei Nashev este că un astfel de echilibru nu este optim dacă luăm în considerare participantul individual și interesul personal al acestuia. La urma urmei, cea mai bună opțiune este să taci și să mergi liber.

Echilibrul Nash este un punct de contact, în care fiecare participant alege o opțiune care este optimă pentru el numai dacă ceilalți participanți aleg o strategie specifică.

Ținând cont de opțiunea când ambii infractori au tăcere și primesc doar 1 an fiecare, îl putem numi opțiunea Pareto-optimă. Cu toate acestea, este posibil numai dacă infractorii ar fi putut fi de acord în prealabil. Dar chiar și acest lucru nu ar garanta acest rezultat, întrucât tentația de a trage înapoi persuasiunea și de a evita pedeapsa este mare. Lipsa de încredere deplină în celălalt și pericolul de a fi în vârstă de 5 ani îl obligă pe unul să aleagă opțiunea cu recunoaștere. A reflecta asupra faptului că participanții vor respecta opțiunea cu tăcere, acționând în concert, este pur și simplu irațional. O astfel de concluzie poate fi făcută dacă studiem echilibrul Nash. Exemplele dovedesc doar asta.

Egoist sau rațional

Teoria echilibrului Nash a dat concluzii uimitoare, respingând principiile care existau înainte. De exemplu, Adam Smith a considerat comportamentul fiecăruia dintre participanți drept absolut egoist, ceea ce a adus sistemul în echilibru. Această teorie a fost numită „mâna invizibilă a pieței”.

John Nash a văzut că dacă toți participanții acționează în urma propriilor lor interese, atunci acest lucru nu va duce niciodată la un rezultat optim al grupului. Având în vedere că gândirea rațională este inerentă fiecărui participant, este mai probabil alegerea pe care o oferă strategia de echilibru Nash.

Experiment pur masculin

Un exemplu viu este jocul „paradoxului blond”, care, deși pare nepotrivit, este o ilustrare vie care arată cum funcționează teoria jocului Nash.

În acest joc trebuie să vă imaginați că compania de tipuri gratuite a venit la bar. Următoarea este o companie de fete, dintre care una este de preferat celorlalți, spun o blondă. Cum se comportă băieții pentru a obține cea mai bună iubită pentru ei înșiși?

Deci, raționamentul băieților: dacă toată lumea începe să ia cunoștință de blondă, cel mai probabil nu va ajunge la nimeni, atunci prietenii ei nu vor dori să se întâlnească. Nimeni nu vrea să fie al doilea fallback. Dar dacă băieții aleg să evite blonda, atunci probabilitatea ca fiecare dintre băieți să găsească o fată bună printre fete este mare.

Situația echilibrului Nash nu este optimă pentru băieți, deoarece, urmărind doar interesele lor egoiste, toată lumea ar alege o blondă. Este evident că urmărirea numai a intereselor egoiste va echivala cu prăbușirea intereselor de grup. Echilibrul Nash va însemna că fiecare tip acționează în propriile sale interese personale, care sunt în contact cu interesele întregului grup. Aceasta nu este o opțiune optimă pentru toată lumea, ci optimă pentru toată lumea, bazată pe strategia de succes generală.

Întreaga noastră viață este un joc

Luarea deciziilor în condiții reale este foarte similară cu un joc atunci când vă așteptați un anumit comportament rațional de la alți participanți. În afaceri, în muncă, în echipă, într-o companie și chiar în relațiile cu sexul opus. De la tranzacții mari la situații obișnuite de viață, totul se supune unei legi sau alteia.

Desigur, situațiile de joc considerate cu infractorii și bara sunt doar ilustrații excelente care demonstrează echilibrul lui Nash. Exemple de astfel de dileme apar foarte des pe piața reală și acest lucru funcționează mai ales în cazurile cu doi monopolisti care controlează piața.

Strategii mixte

De multe ori suntem implicați nu într-unul, ci în mai multe jocuri simultan. Alegerea uneia dintre opțiunile pentru un joc, ghidată de o strategie rațională, dar ajungi într-un alt joc. După mai multe decizii raționale, puteți constata că rezultatul dvs. nu vi se potrivește. Ce să faci?

Luați în considerare două tipuri de strategie:

O strategie pură este comportamentul unui participant care vine din gândirea despre comportamentul posibil al altor participanți.
O strategie mixtă sau o strategie aleatorie este alternarea strategiilor pure la întâmplare sau alegerea unei strategii pure cu o anumită probabilitate. Această strategie se mai numește randomizat.

Având în vedere acest comportament, obținem o nouă privire asupra echilibrului Nash. Dacă mai devreme se spunea că jucătorul alege o strategie o dată, atunci se poate imagina un alt comportament. Putem admite opțiunea ca jucătorii să aleagă o strategie la întâmplare cu o anumită probabilitate. Jocurile în care echilibrul Nash nu poate fi găsit în strategii pure le au întotdeauna în amestec.

Echilibrul nash în strategiile mixte se numește echilibru mixt. Acesta este un astfel de echilibru, în care fiecare participant alege frecvența optimă pentru alegerea strategiilor sale, cu condiția ca alți participanți să-și aleagă strategiile cu o frecvență dată.