Nash balanse. Teorya ng Laro para sa mga ekonomista (John Nash)

Noong 1930s, si John von Neumann at Oscar Morgenstern ay naging tagapagtatag ng isang bagong kawili-wiling lugar ng matematika, na tinawag na "teorya ng laro." Noong 1950s, ang batang matematiko na si John Nash ay naging interesado sa lugar na ito. Ang teorya ng balanse ay naging paksa ng kanyang disertasyon, na isinulat niya noong siya ay 21 taong gulang. Sa gayon ay ipinanganak ang isang bagong diskarte para sa mga laro na tinawag na Nash Equilibrium, na nakakuha ng Nobel Prize maraming taon mamaya, noong 1994.

Ang mahabang agwat sa pagitan ng pagsusulat ng isang tesis at pagtanggap sa unibersal ay isang pagsubok para sa matematiko. Ang henyo nang walang pagkilala ay nagresulta sa malubhang paglabag sa kaisipan, ngunit si John Nash ay nagawang malutas ang problemang ito salamat sa kanyang mahusay na lohikal na kaisipan. Ang kanyang teorya ng "Nash equilibrium" ay iginawad sa Nobel Prize, at ang kanyang adaptation sa pelikula sa pelikulang "Magagandang isip" ("Mind Games").

Teorya ng Laro Maikling

Dahil ang teorya ng Nash equilibrium ay nagpapaliwanag sa pag-uugali ng mga tao sa mga tuntunin ng pakikipag-ugnay, samakatuwid ay nagkakahalaga ng pagsasaalang-alang sa mga pangunahing konsepto ng teorya ng laro.

Pinag-aaralan ng teorya ng Game ang pag-uugali ng mga kalahok (ahente) sa ilalim ng mga kondisyon ng pakikipag-ugnay sa bawat isa ayon sa uri ng laro, kapag ang kinalabasan ay nakasalalay sa pagpapasya at pag-uugali ng ilang mga tao. Ang kalahok ay gumagawa ng mga pagpapasya, ginagabayan ng kanyang mga pagtataya tungkol sa pag-uugali ng iba, na tinatawag na diskarte sa laro.

Mayroon ding isang nangingibabaw na diskarte kung saan nakukuha ng kalahok ang pinakamainam na resulta para sa anumang pag-uugali ng iba pang mga kalahok. Ito ang pinakamahusay na diskarte sa panalo ng manlalaro.

Dilemma ng Prisoner's and Scientific Breakthrough

Ang dilemma ng bilangguan ay isang kaso sa isang laro kapag ang mga kalahok ay pinipilit na gumawa ng mga nakapangangatwiran na desisyon, na umaabot sa isang karaniwang layunin sa konteksto ng isang salungatan ng mga kahalili. Ang tanong ay alin sa mga pagpipiliang ito ang pipiliin niya, pagkilala sa kanyang personal at karaniwang interes, pati na rin ang kawalan ng kakayahang makuha pareho. Ang mga manlalaro ay tila nakapaloob sa malupit na mga kondisyon ng paglalaro, na kung minsan ay pinapaisip nila nang napaka produktibo.

Ang dilema na ito ay ginalugad ng Amerikanong matematiko na si John Nash. Ang balanse na inilabas niya ay naging rebolusyonaryo ng uri nito. Lalo na malinaw, ang bagong kaisipang ito ay naiimpluwensyahan ang opinyon ng mga ekonomista kung paano gumawa ng mga pagpipilian ang mga manlalaro sa merkado, na isinasaalang-alang ang mga interes ng iba, na may malapit na pakikipag-ugnayan at interseksyon ng mga interes.

Pinakamainam na pag-aralan ang teorya ng laro na may mga tiyak na halimbawa, dahil ang disiplinang matematika mismo ay hindi isang dry teoretikal.

Halimbawa ng Prisoner Dilemma

Halimbawa, dalawang tao ang ninakawan, nahulog sa mga kamay ng pulisya at pinag-iimbestiga sa magkahiwalay na mga selula. Kasabay nito, nag-aalok ang mga opisyal ng pulisya sa bawat kalahok ng kanais-nais na mga kondisyon sa ilalim kung saan ilalabas siya kung nagpapatotoo siya laban sa kanyang kapareha. Ang bawat isa sa mga kriminal ay may mga sumusunod na hanay ng mga diskarte na isasaalang-alang niya:

Ang parehong sabay na nagpapatotoo at tumatanggap ng 2.5 taon sa bilangguan.
Parehong tahimik ang parehong oras at tumatanggap ng 1 taon bawat taon, dahil sa kasong ito ang maliit na batayan ng katibayan ng kanilang pagkakasala ay maliit.
Ang isa ay nagbibigay ng katibayan at nakakakuha ng kalayaan, habang ang isa ay tahimik at nakakakuha ng 5 taon sa bilangguan.

Malinaw, ang kinalabasan ng kaso ay nakasalalay sa pagpapasya ng parehong mga kalahok, ngunit hindi sila maaaring magkasundo dahil sila ay nakaupo sa iba't ibang mga cell. Ang salungatan ng kanilang mga personal na interes sa pakikibaka para sa isang karaniwang interes ay malinaw na nakikita. Ang bawat bilanggo ay may dalawang pagpipilian para sa pagkilos at 4 na pagpipilian para sa mga kinalabasan.

Inference Chain

Kaya, isinasaalang-alang ng kriminal A ang mga sumusunod na pagpipilian:

Natahimik ako at ang aking kasosyo ay tahimik - pareho kaming makakatanggap ng 1 taon sa bilangguan.
Ibinibigay ko ang aking kasosyo at binibigyan niya ako - pareho kaming nakakakuha ng 2, 5 taon sa bilangguan.
Natahimik ako, at ang aking kasosyo ay ibibigay sa akin - tatanggap ako ng 5 taon sa bilangguan, at siya ay magiging malaya.
Pinauupahan ko ang aking kasosyo, at siya ay tahimik - nakakakuha ako ng kalayaan, at siya ay 5 taong nakakulong.

Nagbibigay kami ng isang matris ng mga posibleng solusyon at mga resulta para sa kalinawan.

Ang talahanayan ng posibleng mga kinalabasan ng problema sa bilangguan.

Ang tanong ay ano ang pipiliin ng bawat kalahok?

"Tahimik, hindi ka makapagsalita" o "Tahimik na hindi ka makapagsalita"

Upang maunawaan ang pagpili ng kalahok, kailangan mong dumaan sa kadena ng kanyang mga saloobin. Kasunod ng pangangatuwiran ng kriminal na A: kung mananahimik ako at tumahimik sa aking kapareha, makakakuha kami ng isang minimum na term (1 taon), ngunit hindi ko malaman kung paano siya kumilos. Kung siya ay nagpapatotoo laban sa akin, mas mahusay din para sa akin na magpatotoo, kung hindi, maaari akong umupo sa loob ng 5 taon. Mas gugustuhin kong maupo ng 2.5 taon kaysa sa 5 taon. Kung wala siyang sasabihin, anupat higit na kailangan kong magpatotoo, dahil sa ganitong paraan makakakuha ako ng kalayaan. Nagtatalo rin ang miyembro B sa parehong paraan.

Madaling maunawaan na ang nangingibabaw na diskarte para sa bawat isa sa mga kriminal ay magpatotoo. Ang pinakamainam na punto ng larong ito ay nangyayari kapag ang parehong mga kriminal ay nagbibigay ng katibayan at natatanggap ang kanilang "premyo" - 2.5 taon sa bilangguan. Ang teorya ng laro ni Nash ay tinatawag itong balanse.

Nash Optimal Optimal Solution

Ang rebolusyon ng pananaw ng Nashev ay ang naturang balanse ay hindi optimal kung isasaalang-alang namin ang indibidwal na kalahok at ang kanyang personal na interes. Pagkatapos ng lahat, ang pinakamahusay na pagpipilian ay upang manahimik at libre.

Ang balanse ng Nash ay isang punto ng pakikipag-ugnay, kung saan ang bawat kalahok ay pumipili ng isang pagpipilian na pinakamainam para sa kanya lamang kung ang iba pang mga kalahok ay pumili ng isang tiyak na diskarte.

Isinasaalang-alang ang pagpipilian kapag ang parehong mga kriminal ay tahimik at tumanggap lamang ng 1 taon bawat isa, maaari naming tawaging ito ang opsyon na pinakamabuting kalagayan ng Pareto. Gayunpaman, posible lamang kung ang mga kriminal ay maaaring sumang-ayon nang maaga. Ngunit kahit na hindi nito magagarantiyahan ang kalalabasan na ito, dahil ang tukso na mag-backtrack mula sa panghihikayat at maiwasan ang kaparusahan ay mahusay. Ang kawalan ng buong pagtitiwala sa bawat isa at ang panganib ng pagiging 5 taong gulang na puwersa ng isa upang piliin ang pagpipilian na may pagkilala. Upang maipakita ang katotohanan na ang mga kalahok ay sumunod sa opsyon na may katahimikan, kumikilos nang konsiyerto, ay hindi makatwiran. Ang ganitong konklusyon ay maaaring gawin kung pag-aralan natin ang balanse ng Nash. Pinapatunayan lamang ng mga halimbawa iyon.

Makasarili o makatuwiran

Ang teorya ng Nash equilibrium ay nagbunga ng mga nakamamanghang konklusyon, na pinabulaanan ang mga prinsipyo na nauna. Halimbawa, itinuring ni Adam Smith ang pag-uugali ng bawat isa sa mga kalahok bilang ganap na makasarili, na nagdala ng sistema sa balanse. Ang teoryang ito ay tinawag na "invisible kamay ng merkado."

Nakita ni John Nash na kung ang lahat ng mga kalahok ay kumikilos sa hangarin ng kanilang sariling mga interes, kung gayon hindi ito hahantong sa isang pinakamainam na resulta ng pangkat. Isinasaalang-alang na ang nakapangangatwiran na pag-iisip ay likas sa bawat kalahok, ang pagpili na inaalok ng diskarte sa balanse ng Nash ay mas malamang.

Puro eksperimento sa lalaki

Ang isang matingkad na halimbawa ay ang "blonde paradox" na laro, na, bagaman tila hindi nararapat, ay isang matingkad na paglalarawan na nagpapakita kung paano gumagana ang teorya ng laro ng Nash.

Sa larong ito kailangan mong isipin na ang kumpanya ng mga libreng guys ay dumating sa bar. Susunod ay isang kumpanya ng mga batang babae, ang isa sa kung saan ay mas kanais-nais sa iba, sabihin ng isang blonde. Paano kumilos ang mga lalaki upang makakuha ng pinakamahusay na kasintahan para sa kanilang sarili?

Kaya, ang pangangatuwiran ng mga lalaki: kung ang lahat ay nagsisimula na makilala ang blonde, malamang na hindi siya makakakuha ng sinuman, kung gayon ang kanyang mga kaibigan ay hindi nais na matugunan. Walang sinuman ang nais na maging pangalawang fallback. Ngunit kung pipiliin ng mga lalaki na maiwasan ang blonde, ang posibilidad para sa bawat isa sa mga lalaki na makahanap ng isang mabuting kasintahan sa mga batang babae ay mataas.

Ang sitwasyon ng balanse ng Nash ay hindi pinakamainam para sa mga lalaki, dahil, sa paghabol lamang sa kanilang makasariling mga interes, ang bawat isa ay pipiliin ng isang blonde. Kitang-kita na ang pagtugis ng mga makasariling interes lamang ay magiging sanhi ng pagbagsak ng mga interes ng grupo. Ang Nash equilibrium ay nangangahulugang ang bawat tao ay kumikilos sa kanyang sariling mga pansariling interes, na nakikipag-ugnay sa mga interes ng buong pangkat. Hindi ito isang pinakamainam na pagpipilian para sa lahat ng tao, ngunit pinakamainam para sa lahat, batay sa pangkalahatang diskarte sa tagumpay.

Ang aming buong buhay ay isang laro

Ang paggawa ng mga pagpapasya sa totoong mga kondisyon ay halos kapareho sa isang laro kapag inaasahan mo ang isang tiyak na makatuwiran na pag-uugali mula sa ibang mga kalahok. Sa negosyo, sa trabaho, sa isang koponan, sa isang kumpanya, at maging sa mga relasyon sa kabaligtaran na kasarian. Mula sa malalaking transaksyon hanggang sa mga ordinaryong sitwasyon sa buhay, ang lahat ay sumunod sa isang batas o sa iba pa.

Siyempre, ang itinuturing na mga sitwasyon sa laro sa mga kriminal at bar ay mahusay na mga guhit na nagpapakita lamang ng balanse ni Nash. Ang mga halimbawa ng gayong mga dilema ay madalas na lumitaw sa totoong merkado, at lalo na ito ay gumagana sa mga kaso na may dalawang monopolist na kumokontrol sa merkado.

Hinahalong mga diskarte

Kadalasan kami ay kasangkot hindi sa isa ngunit maraming mga laro nang sabay-sabay. Ang pagpili ng isa sa mga pagpipilian para sa isang laro, ginagabayan ng isang nakapangangatwiran na diskarte, ngunit nakakuha ka sa isa pang laro. Matapos ang maraming mga nakapangangatwiran na pagpapasya, maaari mong makita na ang iyong resulta ay hindi angkop sa iyo. Ano ang gagawin?

Isaalang-alang ang dalawang uri ng diskarte:

Ang isang purong diskarte ay pag-uugali ng kalahok na nagmula sa pag-iisip tungkol sa posibleng pag-uugali ng iba pang mga kalahok.
Ang isang halo-halong diskarte o isang random na diskarte ay ang pagpapalit ng mga dalisay na diskarte nang sapalaran o ang pagpili ng isang dalisay na diskarte na may isang tiyak na posibilidad. Ang diskarte na ito ay tinatawag ding randomized.

Isinasaalang-alang ang pag-uugali na ito, nakakakuha kami ng isang bagong hitsura sa Nash equilibrium. Kung mas maaga sinabi na ang player ay pumili ng isang diskarte minsan, kung gayon ang isa pang pag-uugali ay maaaring isipin. Maaari naming aminin ang pagpipilian na ang mga manlalaro ay pumili ng isang diskarte nang random na may isang tiyak na posibilidad. Mga laro kung saan ang Nash equilibria ay hindi matatagpuan sa dalisay na mga diskarte palaging ang mga ito sa halo-halong mga.

Ang balanse ng nash sa halo-halong mga diskarte ay tinatawag na halo-halong balanse. Ito ay tulad ng isang balanse, kung saan pinipili ng bawat kalahok ang pinakamainam na dalas para sa pagpili ng kanilang mga diskarte, sa kondisyon na piliin ng ibang mga kalahok ang kanilang mga diskarte sa isang naibigay na dalas.