Diferencia entre revisiones de «Equilibrio de Nash»

← Ir a diferencia anterior Ir a siguiente diferencia →

Contenido eliminado Contenido añadido

En renglón

Revisión del 19:57 28 may 2010

En teoría de juegos, se define el equilibrio de Nash (formulado por John Forbes Nash) como un modo de obtener una estrategia óptima para juegos que involucren a dos o más jugadores. Intuitivamente, si hay un conjunto de estrategias tal que ningún jugador se beneficia cambiando su estrategia mientras los otros no cambien la suya, entonces ese conjunto de estrategias constituye un equilibrio de Nash.

El concepto de equilibrio de Nash apareció por primera vez en su disertación Non-cooperative games (1950). John Forbes Nash demostró que las distintas soluciones que habían sido propuestas anteriormente para juegos tienen la propiedad de producir un equilibrio de Nash.

En las llamadas estrategias puras, un juego puede no tener equilibrios de Nash o tener uno o varios. Nash fue capaz de demostrar que si permitimos estrategias mixtas (en las que los jugadores pueden escoger estrategias al azar con una probabilidad predefinida), entonces todos los juegos de n jugadores en los que cada jugador puede escoger entre un número finito de estrategias tienen al menos un equilibrio de Nash con estrategias mixtas.

Si un juego tiene un único equilibrio de Nash y los jugadores son completamente racionales, los jugadores escogerán las estrategias que forman el equilibrio.

Historia

El concepto de equilibrio de Nash comienza su desarrollo con Antoine Augustin Cournot, y su trabajo sobre oligopolios (1838). En éste se plantea el modelo de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia. Cournot encuentra comportamientos de equilibrio para el juego, que coinciden con los equilibrios de Nash en estrategias puras.

Los equilibrios de Nash en estrategias puras son limitados en muchos aspectos y fue con el desarrollo de la teoría moderna de juegos que surgen los equilibrios en estrategias mixtas (aquellas donde los jugadores pueden elegir aleatoriamente entre varias estrategias). El concepto de equilibrio para este tipo de estrategias fue introducido por John von Neumann y Oskar Morgenstern en su libro The Theory of Games and Economic Behavior (1944), aunque sólo trataron los equilibrios para el caso especial de juegos de suma cero.

Fue John Forbes Nash quien en su tesis de doctorado (1951) define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas. Nash ganaría posteriormente un premio Nobel por la amplia gama de aplicaciones que tuvo éste concepto en diversas ramas de las ciencias.

Posteriormente se encontraron algunos casos en los que los equilibrios de Nash no llevaba a predicciones totalmente adecuadas para los comportamientos de los jugadores, o que existían comportamientos estables que no se podían encontrar como equilibrios de Nash, lo que dio paso a la búsqueda y desarrollo de nuevos equilibrios (muchas veces como refinamientos de los equilibrios de Nash) y conceptos de solución de un juego.

Definiciones formales

Un juego rectangular se define como una terna $(N,D_{j},{\phi }_{j})$ , donde N es el conjunto de jugadores, ${D_{j}}$ es el conjunto de estrategias para cada jugador j y

${\varphi }_{j}:\prod _{i\in N}D_{i}\rightarrow \mathbb {R} \,$

son las llamadas funciones de pago, que a cada conjunto de estrategias (una para cada jugador) le asocia un respectivo pago al jugador j.

Denotaremos $\prod _{i\in N}D_{i}=D$

Por otro lado dado un juego rectangular $(N,D_{j},{\phi }_{j})$ , decimos que $X^{j}\in R^{l_{j}}$ es una estrategia mixta del jugador j, si para toda $\sigma ^{j}\in D_{j}$ , $x_{\sigma ^{j}}^{j}\geq 0$ y $\sum _{\sigma ^{j}\in D_{j}}x_{\sigma j}^{j}=1$ . El entero $l_{j}$ denota el número de estrategias puras del jugador j.

Intuitivamente, una estrategia mixta es un vector que asocia cierta probabilidad a cada estrategia pura del jugador j, de ahí que cada entrada tenga que ser no negativa y la suma de todas ellas sea 1.

En una estrategia mixta $X^{j}$ del jugador j, $x_{\sigma ^{j}}^{j}$ se interpreta como el peso o probabilidad que el jugador j le asocia a su estrategia pura $\sigma ^{j}$ .

La letra $M_{j}$ denotará al conjunto de estrategias mixtas del jugador j y M al producto cartesiano de los conjuntos $M_{j}$ . A cada elemento de M lo llamaremos un perfil de estrategias mixtas.

Equilibrios en estrategias puras

Dado un juego rectangular $(N,D_{j},{\phi }_{j})$ , se dice que $\sigma \in D$ es un equilibrio de Nash en estrategias puras (ep) si para cada jugador en N se cumple:

$\varphi _{j}(\sigma )\geq \varphi _{j}(\sigma \vert \sigma ^{j})\ \ \ \forall \ \sigma ^{j}\in D_{j}$

y donde $\varphi _{j}(\sigma \vert \sigma ^{j})$ representa el pago para el jugador j cuando éste decide cambiar su estrategia por cualquier otra $\sigma ^{j}\in D_{j}$ , mientras que los demás jugadores mantienen la estrategia dada por el perfil σ.

Equilibrios en estrategias mixtas

Decimos que un perfil de estrategias mixtas X es un equilibrio de Nash en estrategias mixtas (em) si para cada jugador j∈N se cumple:

$E_{j}(X)\geq E_{j}(X\vert X^{j})\ \ \ \forall \ \ X^{j}\in M_{j}$

Donde $E_{j}(X)$ es el pago esperado (o pago promedio) que obtendrá el jugador j al jugarse siempre el perfil de estrategias mixtas X.

Intuitivamente, un perfil de estrategias mixtas es equilibrio de Nash si, en promedio, ningún jugador puede mejorar su pago cambiando sus estrategias mixtas cuando el resto de los jugadores se mantenga con la estrategia actual.

Equilibrios de Nash para juegos extensivos

A menudo no es posible modelar un problema de la teoría de juegos a través de un juego rectangular y se hace necesario modelarlo como un juego extensivo. En estos casos pueden buscarse los equilibrios de Nash a través de la forma normal del juego o usando diversos algoritmos en el juego extensivo, como la inducción hacia atrás.

Ocurrencia

En la definición informal de equilibrios de Nash como estrategias estables que los jugadores terminan eligiendo hay fuertes supuestos de racionalidad. A menudo se pasa por alto el hecho de que en un juego los equilibrios de Nash se adoptarán solo bajo ciertas condiciones:

Todos los jugadores buscan maximizar su pago esperado de acuerdo a los pagos que describen el juego.
Los jugadores ejecutan sus estrategias sin errores.
Los jugadores tienen inteligencia suficiente para deducir sus propios equilibrios y los de los demás.
Los jugadores suponen que el hecho de cambiar su propia estrategia no provocará desviaciones en las estrategias de otros.
Existe un conocimiento común tanto de las reglas como de los supuestos de racionalidad.

De este modo, el incumplimiento de alguna de las condiciones puede llevar a desviaciones que resulten en estrategias distintas a los equilibrios de Nash:

La primera condición no se cumple si el juego no representa correctamente los pagos. Así, el dilema del prisionero no es tal si uno de los jugadores, contrario a toda racionalidad, busca quedarse el mayor tiempo posible en prisión.
Puede acontecer que a la hora de elegir una estrategia los jugadores se vean imposibilitados a llevarla acabo en su realización. Así, la segunda condición pide que un jugador sea capaz de implementar su estrategia una vez que ha elegido su plan de acción.
Incluso en personas racionales e inteligentes existen juegos que, debido al poder de cómputo necesario para calcular sus equilibrios, se ven imposibilitadas a saber qué estrategia deberían seguir. Así, el juego del ajedrez no puede ser abordado para encontrar soluciones al juego y debido a esto los jugadores tienen que recurrir al ingenio para intentar vencer al oponente.
En muchas ocasiones los jugadores no saben exactamente cuales son las reglas del juego y tienen que deducirlas de la experiencia, en cuyo caso incluso siendo racionales pueden deducir equilibrios que no corresponden completamente a los equilibrios reales.

Pruebas de existencia

Muchos juegos no tienen equilibrios en estrategias puras, ni siquiera los más sencillos, como por ejemplo el juego de piedra, papel o tijeras.

En estrategias mixtas sin embargo se puede asegurar que siempre existen equilibrios. Fue Nash quien demostró que cualquier juego rectangular finito tiene al menos un equilibrio de Nash en estrategias mixtas (em). Inicialmente Nash se basa en la correspondencia de mejor respuesta y el teorema del punto fijo de Kakutani; posteriormente, en su tesis de doctorado dio una nueva demostración basada en la función de reajuste de Nash y el teorema del punto fijo de Brouwer; sin embargo ambas pruebas son de existencia y no constructivas, es decir, aseguran la existencia de equilibrios de Nash, pero no muestran como calcularlos.

Fue a finales de los 60's que surgieron algoritmos (gracias al trabajo de matematicos/economistas como Herbert Scarf, Carlton Lemke y Emanuel Sperner) que permitían calcular eficientemente puntos fijos: el algoritmo de Scarf y el lema de Sperner son los dos resultados más importantes que permitieron la prueba constructiva de existencia de equilibrios de Nash (cabe destacar que ambos resultados son generales y han encontrado una amplia gama de aplicaciones además de la teoría de juegos).

Ejemplos

Juego competitivo

Consideramos el siguiente juego de dos jugadores:

"Los jugadores escogen simultáneamente un número entero entre cero (0) y diez (10). Los dos jugadores ganan el valor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 al otro."

Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). Cualquier otra estrategia puede desfavorecer a un jugador si otro escoge un número menor.

Si se modifica el juego de modo que los dos jugadores ganen el número escogido si ambos son iguales, y de otro modo no ganen nada, hay 11 equilibrios de Nash distintos.

Juego de coordinación

Este juego es un juego de coordinación al conducir. Las opciones son: o conducir por la derecha o conducir por la izquierda: 100 significa que no se produce un choque y 0 significa que sí. El primer número en cada celda indica la ganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundo jugador (cuyas opciones se muestran encima).

	Conducir por la izquierda:	Conducir por la derecha:
Conducir por la izquierda:	100,100	0,0
Conducir por la derecha:	0,0	100,100

En este caso hay dos equilibrios de Nash con estrategias puras, cuando ambos conducen por la derecha o ambos conducen por la izquierda. Esto ayuda a explicar por qué en casi todo el mundo se conduce por el mismo lado (a la derecha) y como en Inglaterra, al ser una isla y no empeorar su pago por no coordinarse con los demás países, se mantuvo la estrategia de conducir por la izquierda.

Dilema del prisionero

El dilema del prisionero tiene un equilibrio de Nash en estrategias puras: se produce cuando ambos jugadores confiesan. A pesar de ello, "ambos confiesan" es peor que "ambos cooperan", en el sentido de que el tiempo total de cárcel que deben cumplir es mayor. Sin embargo, la estrategia "ambos cooperan" es inestable, ya que un jugador puede mejorar su resultado desertando si su oponente mantiene la estrategia de cooperación. Así, "ambos cooperan" no es un equilibrio de Nash pero sí un óptimo paretiano. Una manera de llegar a ese resultado es logrando una colusión y mediante la promesa de cada jugador de "castigar" al otro si rompe el acuerdo. También podría llegarse a una solución fuera del equilibrio de Nash si el juego se repitiese infinitas veces, cuando se logra la estrategia "ojo por ojo".

La tragedia de los comunes

La tragedia de los comunes es una generalización del dilema del prisionero ideada por Garrett James Hardin y publicada por primera vez en su artículo "the tragedy of the commons" (1968). En este juego existen n jugadores que hacen uso de un bien común (como por ejemplo, un terreno comunal). Aunque cada jugador puede participar en el cuidado de éste bien (lo que conlleva un costo para el que lo hace), todos los jugadores tienen derecho a usarlo, lo cuiden o no. De este modo tenemos un juego n-personal donde cada jugador tiene dos estrategias: egoísta o solidario, y donde la estrategia egoísta es dominante estricta, es decir, para cualquier perfil de estrategias puras el jugador j puede mejorar su pago si elige la estrategia egoísta en lugar de la solidaria. De este modo, el juego sólo tiene un equilibrio de Nash en estrategias puras y es (egoísta, egoísta, ... , egoísta) a pesar de que, como en el dilema del prisionero, el beneficio para cada jugador termina siendo mucho menor que si todos hubieran elegido ser solidarios.

Éste juego ha encontrado diversas aplicaciones en la vida diaria. Consideremos por ejemplo una ciudad, con caminos libres de transito y contaminación baja como un bien común que todos debemos cuidar. Siempre existe la tentación de ser egoísta (usar automóvil particular para mejorar nuestro propio transporte por la ciudad, ignorar semáforos en rojo, etc) a pesar de que si todos siguen la misma estrategia las vialidades sufren congestionamientos extremos y surge el serio problema de la contaminación ambiental. Debido a que la ruina común es el único equilibrio de Nash, los gobiernos recurren a medidas externas para intentar cambiar los pagos por ser egoísta y llevar a nuevos equilibrios. Así el poner multas a los que no obedecen los reglamentos y encarecer el uso del transporte privado a la vez que se mejora el transporte público es una forma de conseguir que la estrategia egoísta deje de ser dominante estricta y que todas las personas puedan seguir una estrategia solidaria.

Piedra, papel o tijera

Consideremos el juego piedra, papel o tijera con la matriz de pagos dada por:

	Piedra	Papel	Tijera
Piedra	0	-1	+1
Papel	+1	0	-1
Tijera	-1	+1	0

Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.

Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne más probabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos dados por la matriz).

Véase también

Referencias

H.S. Bierman, L. Fernández, "Game Theory with Economic Applications", Addison-Wesley, 1993.
K. Binmore, "Teoría de Juegos", McGraw-Hill, 1994.
R. Gibbons, "Un Primer Curso de Teoría de Juegos", Antoni Bosh, 1996.
Oskar Morgenstern y John von Neumann, "The Theory of Games and Economic Behavior" Princeton University Press, 1947.
Zapata L. Paloma, "Economía, Política y Otros Juegos: Una Introducción a los Juegos No Cooperativos", las prensas de ciencias, 2007.

Enlaces externos

@@ Línea 69: / Línea 69: @@
 # Los jugadores tienen inteligencia suficiente para deducir sus propios equilibrios y los de los demás.
 # Los jugadores suponen que el hecho de cambiar su propia estrategia no provocará desviaciones en las estrategias de otros.
-# Existe un conocimiento común tanto de las reglas como de los supuestos de racionalidad. Es decir, se trata de juegos con [[información completa]].
+# Existe un conocimiento común tanto de las reglas como de los supuestos de racionalidad.
 De este modo, el incumplimiento de alguna de las condiciones puede llevar a desviaciones que resulten en estrategias distintas a los equilibrios de Nash:
@@ Línea 76: / Línea 76: @@
 # Puede acontecer que a la hora de elegir una estrategia los jugadores se vean imposibilitados a llevarla acabo en su realización. Así, la segunda condición pide que un jugador sea capaz de implementar su estrategia una vez que ha elegido su plan de acción.
 # Incluso en personas racionales e inteligentes existen juegos que, debido al poder de cómputo necesario para calcular sus equilibrios, se ven imposibilitadas a saber qué estrategia deberían seguir. Así, el juego del ajedrez no puede ser abordado para encontrar soluciones al juego y debido a esto los jugadores tienen que recurrir al ingenio para intentar vencer al oponente.
 # En muchas ocasiones los jugadores no saben exactamente cuales son las reglas del juego y tienen que deducirlas de la experiencia, en cuyo caso incluso siendo racionales pueden deducir equilibrios que no corresponden completamente a los equilibrios reales.
 == Pruebas de existencia ==