Introduccion a la teoria de juegos

20

Click here to load reader

description

Una introducción a la teoría de juegos, el dilema del prisionero , los juegos de dos personas con suma cero, y una aplicación de la programación lineal para hallar la estrategia óptima.

Transcript of Introduccion a la teoria de juegos

Page 1: Introduccion a la teoria de juegos

TEORÍA DE JUEGOS

Page 2: Introduccion a la teoria de juegos

INTRODUCCIÓN

La teoría de juegos es una herramienta matemática orientada a predecir cual será el resultado más probable o el resultado más cierto de una disputa entre dos individuos, grupos, firmas o cualquier combinación de ellas. Fue diseñada y elaborada en un trabajo realizado por John Von Neumann y Oskar Morgenstern a comienzos de la década de 1940, llamado “Theory of Games and Economic Behaviour”.

Page 3: Introduccion a la teoria de juegos

DEFINICIONES

Juego: Un juego es un proceso en el que dos o más personas toman decisiones y acciones, la estructura de las cuales está inscrita en un conjunto de reglas.

Matriz de pagos o Payoff : Es la importancia que le asignamos al resultado del juego. La matriz de pagos no es más que una forma de resumir los pagos esperados de los jugadores en forma matricial, donde los elementos de la matriz pueden tener cualquier tipo de unidades siempre que representen con exactitud la utilidad de un jugador para el resultado correspondiente.

Racionalidad: Un jugador es racional si busca maximizar su utilidad.

Reglas: Las reglas definen el conjunto de instrucciones de como hacer algo. En un juego los jugadores parten del conocimientos de una serie de reglas que les permita desarrollar el juego. Las reglas definen la terminación del juego, la cantidad que cada jugador paga o recibe y el objetivo de cada jugador.

Page 4: Introduccion a la teoria de juegos

DEFINICIONES

Estrategia: Se trata de una posible acción de un jugador.-Estrategia pura: Es aquella decisión que se toma con certeza, es decir, con probabilidad del 100%.-Estrategia mixta: Es una combinación de decisiones tomada de acuerdo a una serie de probabilidades.

Juego de dos personas con suma cero: cuando la suma de la matriz Payoff de los jugadores igual a cero, un jugador gana lo que el otro pierde. En este juego participan dos o más jugadores. Los jugadores pueden ser representados por una o más personas.

Juego de dos personas con suma constante: Es aquel que, para cualquier selección de estrategias de ambos jugadores, la recompensa de ambos jugadores se suma para dar un valor, k, constante.

Page 5: Introduccion a la teoria de juegos

OBJETIVO DE LA TEORÍA DE JUEGOS

El objetivo de la teoría de juegos es determinar la mejor estrategia para un jugador dado, bajo la consideración de que el oponente es racional, inteligente y está bien informado.

Page 6: Introduccion a la teoria de juegos

ESTRATEGIA MAXIMIN

Adoptar una estrategia maximin es adoptar aquella estrategia en la que se maximiza la ganancia mínima que puede obtenerse. Por ejemplo, el siguiente juego es de suma cero. Cada jugador dispone de tres estrategias posibles a las que designaremos como A,B y C. Los pagos consisten en la distribución de 10 monedas que se repartirán según las estrategias elegidas por ambos jugadores y se muestran en la matriz de pagos.

La segunda matriz muestra todos los posibles resultados. De todos esos posibles resultados mínimos, el que prefiero es el máximo de los mínimos.

Page 7: Introduccion a la teoria de juegos

ESTRATEGIA MINIMAX

Es un método de decisión para minimizar la pérdida máxima esperada en juegos con adversarios y con información perfecta. El funcionamiento de minimax puede resumirse como elegir el mejor movimiento para ti mismo suponiendo que tu contrincante escogerá el peor para ti.

Máximo

9

6

8

Page 8: Introduccion a la teoria de juegos

EL DILEMA DEL PRISIONERO

Es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la teoría de juegos.

Dos delincuentes son detenidos y encerrados en celdas de aislamiento diferentes de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo de un banco, cuya pena es de 10 años de cárcel, pero no tienen pruebas. Solo tienen pruebas para culparlos de un delito menor, es decir, tendencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona información para culpar al otro del robo del banco.

Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos (Payoff). La estrategia “lealtad” consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos “traición” a la estrategia alternativa.

Page 9: Introduccion a la teoria de juegos

EL DILEMA DEL PRISIONERO

Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel al que es condenado el preso X o el preso Y, respectivamente según las estrategias que hayan elegido cada uno de ellos.

Page 10: Introduccion a la teoria de juegos

EL DILEMA DEL PRISIONERO

La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad.  Este resultado es un PUNTO DE EQUILIBRIO DE NASH.

El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la tentación de cambiar de estrategia ya que cualquier cambio implicaría una disminución en sus pagos.

Page 11: Introduccion a la teoria de juegos

El duopolio en la Teoría de Juegos

Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio local en el sector de los grandes almacenes. Cuando llega la época de las tradicionales rebajas de enero, ambas empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la pérdida de todo el beneficio. Este año se han puesto de acuerdo y han decidido no hacer publicidad por lo que cada una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones. Sin embargo una de ellas puede preparar en secreto su campaña publicitaria y lanzarla en el último momento con lo que conseguiría atraer a todos los consumidores. Sus beneficios en ese caso serían de 75 millones mientras que la empresa competidora perdería 25 millones.

Page 12: Introduccion a la teoria de juegos

El duopolio en la Teoría de Juegos

Cada almacén tiene que elegir entre dos estrategias: respetar el acuerdo ¿Cooperar¿ o hacer publicidad ¿Traicionar¿. Los beneficios o pérdidas mostrados a la izquierda de cada casilla son los que obtiene Xauen cuando elige la estrategia mostrada a la izquierda y Yuste la mostrada arriba.

Page 13: Introduccion a la teoria de juegos

El duopolio en la Teoría de Juegos

Veamos cuál debe ser la decisión a adoptar por esos almacenes. El director de la división de estrategia de Xauen pensará: "Si Yuste no hace publicidad, a nosotros lo que más nos conviene es traicionar el acuerdo, pero si ellos son los primeros en traicionar, a nosotros también nos convendrá hacerlo. Sea cual sea la estrategia adoptada por nuestros competidores, lo que más nos conviene es traicionarles".

Page 14: Introduccion a la teoria de juegos

EJEMPLO DE UN JUEGO DE DOS PERSONAS Y SUMA CERO

Considere la matriz de pagos para el siguiente juego. Se trata de un juego donde compiten dos políticos en la campaña por un lugar en el senado. Están en los dos últimos días de campaña. Quieren pasar estos dos días en dos ciudades: Cali y Bogotá.

Los dos jugadores son los dos políticos:

Estrategia 1 = pasar un día en cada ciudad.Estrategia 2 = pasar los dos días en Cali.Estrategia 3 = pasar los dos días en Bogotá.

Page 15: Introduccion a la teoria de juegos

VARIACIÓN 1 DEL JUEGO:

Para la siguiente matriz de pagos, se usa el concepto de estrategia dominada, para eliminar una serie de estrategias inferiores hasta que quede solo una para elegir. Las unidades de los pagos están dadas en miles de votos.

1 2 31 1 2 4

Político 1 2 1 0 53 0 1 -1

Político 2Estrategia

Para el jugador 1, la estrategia 3 está dominada por la estrategia 1, ya que tiene pagos más altos (1>0, 2>1, 4>1) independientemente de lo que haga el jugador 2.

Page 16: Introduccion a la teoria de juegos

VARIACIÓN 1 DEL JUEGO:

El jugador 2 es también racional, por tanto, él también puede eliminar estrategias dominadas. Al final obtenemos la siguiente matriz de pagos:

1 2Político 1 1 1 2

Político 2Estrategia

Ahora la estrategia 2 del jugador 2 está dominada por la estrategia 1 por lo que debe eliminarse. En consecuencia ambos jugadores deberán elegir su estrategia 1. Con esta solución el jugador 1 recibirá mil votos por parte del jugador 2.

Page 17: Introduccion a la teoria de juegos

VARIACIÓN 2 DEL JUEGO:

Supongamos que se tiene la matriz de pagos siguiente para el mismo juego:

Mínimo1 2 3

1 0 -2 2 -2Político 1 2 5 4 -3 -3

3 2 3 -4 -45 4 2

Político 2Estrategia

MáximoValor minimax

Valor maximin

El resultado es que no hay punto de silla. Esto es una solución inestable. Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador asignar una distribución de probabilidades sobre su conjunto de estrategias.

Page 18: Introduccion a la teoria de juegos

VARIACIÓN 2 DEL JUEGO:

Considere que después de que el jugador 1 elimina la estrategia 3, sus estrategias mixtas son (X1, X2) y X2 = 1–X1. La estrategia 3 es dominada. Ahora tenemos la tabla:

Y1 Y2 Y3X1 0 -2 2

Político 1 1 -X1 5 4 -3

Político 2Probabilidad

Ahora lo resolveremos usando programación lineal. Las variables son X1 y X2. El modelo que obtenemos, (tomando como el valor del juego v) , es el siguiente:

Page 19: Introduccion a la teoria de juegos

VARIACIÓN 2 DEL JUEGO:

Maximizar ,Sujeto a:

La aplicación del algoritmo de Dantzig o método simplex a este problema da como resultado = , = y Como solución óptima. La estrategia mixta óptima del jugador 1 es = , = .

Y1 Y2 Y3X1 0 -2 2

Político 1 1 -X1 5 4 -3

Político 2Probabilidad

Page 20: Introduccion a la teoria de juegos

GRACIAS…!!!