TEORIA DE JUEGOS

20
Análisis de Análisis de Decisión y Juegos Decisión y Juegos Investigación Operativa I Investigación Operativa I

Transcript of TEORIA DE JUEGOS

Page 1: TEORIA DE JUEGOS

Análisis de Decisión y Análisis de Decisión y JuegosJuegos

Investigación Operativa IInvestigación Operativa I

Page 2: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos La Teoría de los Juegos es una rama de la matemática que

se dedica al estudio de situaciones llamadas de conflicto.

En ella dos o más partes o decididores deben tomar cada una decisiones cuya efectividad depende de las decisiones tomadas por las demás.

El objetivo del estudio es encontrar la forma en que un decididor pueda tomar las decisiones lo más efectivamente que sea posible.

Se dirá entonces que cada decididor buscará maximizar el beneficio de sus decisiones

Page 3: TEORIA DE JUEGOS

Teoría de JuegosTeoría de JuegosDefiniciones elementales Juego: situación de conflicto en la que dos o más jugadores

intentan alcanzar un objetivo seleccionando cursos de acción de entre todos los que sean permitidos por las reglas.

Reglas: posibles cursos de acción que pueden ser elegidos. Conocidas por todos los jugadores.

Resultados: asociados a cada posible combinación de elecciones son definidos por adelantado y conocidos por todos los jugadores.

Movida: elección de un curso de acción en particular de entre un conjunto de alternativas posibles.

Partida: conjunto de secuencias de una o más movidas, una secuencia por cada jugador y todas ellas con el mismo número de movidas.

Page 4: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Estrategia:

Método predeterminado que permita a un jugador elegir cada una de las movidas que conforman a una partida, ante el análisis de todas las movidas que pudieran haber hecho todos los demás jugadores. También se llamará estrategia a la secuencia de movidas resultante.

Estrategia pura a aquella en la cual cada una de las movidas hechas por un jugador a lo largo de una partida corresponde a una única opción o curso de acción.

Estrategia mixta a aquella en la cual no siempre se opta por el mismo curso de acción a lo largo de una partida.

Page 5: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Valor del juego: resultado de jugar una partida, cada

jugador con su estrategia. Indica cual es el beneficio o perjuicio que recibe cada jugador.

Solución del juego: conjunto de estrategias óptimas para cada jugador y valor del juego resultante de la aplicación de esas estrategias.

Técnica: conjunto de reglas mediante las cuales se intenta hallar la estrategia óptima para cada jugador.

Criterio: conjunto de reglas mediante las cuales se intenta hallar la estrategia óptima para un jugador que juega contra la Naturaleza (de la cual no se puede decir que esté intentando maximizar su beneficio)

Page 6: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

En Resumen:En Resumen: La teoría de juegos trata con situaciones La teoría de juegos trata con situaciones

de decisión en las que dos oponentes de decisión en las que dos oponentes inteligentesinteligentes tienen objetivos en conflicto. tienen objetivos en conflicto.

Dos oponentes, conocidos como Dos oponentes, conocidos como jugadoresjugadores, tendrá cada uno un número de , tendrá cada uno un número de alternativas o alternativas o estrategiasestrategias..

Asociada con cada par de estrategias hay Asociada con cada par de estrategias hay una una recompensarecompensa que un jugador paga al que un jugador paga al otro. Tales juegos se llaman de otro. Tales juegos se llaman de suma cerosuma cero entre 2 personas, porque la ganancia de entre 2 personas, porque la ganancia de un jugador es igual a la pérdida de otra.un jugador es igual a la pérdida de otra.

Page 7: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Representación mediante matrices de pago: si A usa la Representación mediante matrices de pago: si A usa la

estrategia i y B la estrategia j, el pago a A es aij, lo que estrategia i y B la estrategia j, el pago a A es aij, lo que significa que el pago a B es –aij (es decir B paga a A)significa que el pago a B es –aij (es decir B paga a A)

A BA B B1B1 B2B2 …… BnBn

A1A1 a11a11 a12a12 …… a1na1n

A2A2 a21a21 a22a22 …… a2na2n

…… …… …… …… ……

AmAm am1am1 am2am2 …… amnamn

Page 8: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Distintos Métodos para resolución de Juegos

Submatrices Laplace Minimáx Hurwicks (optimismo) Savage Gráfico Iteración (Braun Robinson)

Page 9: TEORIA DE JUEGOS

Teoría de JuegosTeoría de JuegosSubmatrices

Si la matriz de pagos es una matriz de tres por tres, puede utilizarse el método de resolución por submatrices.

i. Se agrega una cuarta columna, C4 = C1 - C2. ii. Se agrega una quinta columna, C5 = C2 - C3.iii. Se agrega una cuarta fila, F4 = F1 - F2. iv. Se agrega una quinta fila, F5 = F2 - F3.v. Se evalúa para cada fila el valor absoluto del

determinante de la submatriz de dos por dos correspondiente a las otras dos filas, escribiendo los resultados en una nueva columna.

vi. Se evalúa para cada columna el valor absoluto del determinante de la submatriz de dos por dos correspondiente a las otras dos columnas, escribiendo los resultados en una nueva fila.

Page 10: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Si la suma de los resultados en la última fila es igual a la suma de los resultados en la última columna, entonces el juego tiene solución por este método. Si no debe buscarse un método alternativo para resolverlo.

vii. Si el juego tiene solución, Se divide cada elemento de la columna de resultados por el valor de la suma de todos los elementos de esa columna, y luego se repite el procedimiento para la fila de resultados. Estos valores son las probabilidades de elegir cada opción en la estrategia mixta correspondiente a cada jugador. El valor del juego se calcula eligiendo una opción cualquiera de uno de los dos jugadores y sumando para cada opción del otro jugador el producto del pago de esa opción por la probabilidad de que el otro jugador la elija.

Page 11: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

 

A A BB

B1B1 B2B2 B3B3 B1-B1-B2B2

B2-B3B2-B3

A1A1 -1-1 22 11 -3-3 11

A2A2 11 -2-2 22 33 -4-4

A3A3 33 44 -3-3 -1-1 77

A1-A1-A2A2

-2-2 44 -1-1

A2-A2-A3A3

-2-2 -6-6 55

33 -4-4

-1-1 77

-3-3 11

-1-1 77

-3-3 11

33 -4-4

44 -1-1

-6-6 55

-2-2 -1-1

-2-2 55

-2-2 44

-2-2 -6-6

14 12 20

17

20

9

14+ 12 + 20 =46

17+ 20 + 9 = 46

Page 12: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Como las sumas son iguales, entonces tiene solución, las

estrategias son las siguientes:

Sa = ( 17/46, 20/46, 9/46 ) Sb = ( 14/46, 12/46, 20/46 )

El valor del juego:

Se elige una alternativa cualquiera de cualquier jugador, (Ej: 1) del jugador B, y se suman los productos de cada pago según la alternativa de A por su probabilidad. Entonces:

 Vj = (-1).17/46 + 1. 20/46 + 3.9/46 = 30/46

Page 13: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Laplace: todos los estados son igualmente probablesLaplace: todos los estados son igualmente probables

A BA B B1B1 B2B2 B3B3 PromPromii

A1A1 77 99 1111 99

A2A2 88 66 22 5.335.33

A3A3 44 1010 66 6.666.66

PromPromjj 6.336.33 8.338.33 6.336.33

njjjj aaaan

...1

min 321

iniii aaaan

máx ...1

321

Page 14: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Maximin: max {Maximin: max {CCii} para A (matriz de ganancia) donde C} para A (matriz de ganancia) donde Cii=min =min aaij ij

Asegura que para un comportamiento del contrincante que Asegura que para un comportamiento del contrincante que menos convenga se obtenga la ganancia máximamenos convenga se obtenga la ganancia máxima

Minimax: minMinimax: min {D{Djj} para B donde D} para B donde Djj=max a=max aijijA A

BBB1B1 B2B2 B3B3 CC

A1A1 77 99 1111 77

A2A2 88 66 22 22

A3A3 44 1010 66 44

DD 88 1010 1111

Page 15: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Hurwicz (optimismo): representa un rango de actitudes de

la más optimista a la más pesimista.

= 0, 1 (índice de optimismo)Hi = . (máxj aij) + (1 - ) . (minj aij)

H1 = 0,1 . 11 + 0,9 . 7 = 7,4

H2 = 0,1 . 8 + 0,9 . 2 = 2,6

H3 = 0,1 . 10 + 0,9 . 4 = 4,6

Nos quedamos con el máximo valor obtenido

A A BB

B1B1 B2B2 B3B3

A1A1 77 99 1111

A2A2 88 66 22

A3A3 44 1010 66

Page 16: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Savage o criterio de arrepentimiento, reemplaza la matriz de Savage o criterio de arrepentimiento, reemplaza la matriz de

resultados con una matriz de pérdidasresultados con una matriz de pérdidas

A BA B B1B1 B2B2 B3B3

A1A1 77 99 1111

A2A2 88 66 22

A3A3 44 1010 66

R’ij = Máx. de Columna – Rij

A BA B B1B1 B2B2 B3B3

A1A1 11 11 00 11

A2A2 00 44 99 99

A3A3 44 00 55 55

Aplicar Min i (máx j R’ij)

Para B:R’ij = Rij - Min. de Columna

Para A:

Page 17: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos Cuando el valor del juego inferior es igual al valor del juego Cuando el valor del juego inferior es igual al valor del juego

superior, las estrategias de los jugadores A y B son estables, superior, las estrategias de los jugadores A y B son estables, y a dicho punto se lo denomina y a dicho punto se lo denomina valor del juegovalor del juego..

Las estrategias con las cuales se alcanza esta ganancia se Las estrategias con las cuales se alcanza esta ganancia se denominan denominan estrategias puras óptimasestrategias puras óptimas, y su conjunto, , y su conjunto, solución de juego. El juego se resuelve por solución de juego. El juego se resuelve por estrategias purasestrategias puras..

Existen Existen estrategias mixtasestrategias mixtas: el jugador no aplica una sola : el jugador no aplica una sola estrategia sino varias, combinándolas aleatoriamente con estrategia sino varias, combinándolas aleatoriamente con ciertas probabilidades.ciertas probabilidades.

En este caso SEn este caso SAA=(p1,p2,…,pm) y S=(p1,p2,…,pm) y SBB=(q1,q2,…,qn), donde p1 =(q1,q2,…,qn), donde p1 es la probabilidad de que el jugador A aplique la estrategia es la probabilidad de que el jugador A aplique la estrategia A1 y q1 es la probabilidad de que el jugador B aplique la A1 y q1 es la probabilidad de que el jugador B aplique la estrategia B1.estrategia B1.

Cualquier juego finito de suma cero entre dos personas , Cualquier juego finito de suma cero entre dos personas , tiene por lo menos una solución, o sea un par de estrategias tiene por lo menos una solución, o sea un par de estrategias óptimas, que son en general mixtas óptimas, que son en general mixtas (S(SAA*, S*, SBB*)*) y un valor y un valor correspondiente al correspondiente al valor del juegovalor del juego..

Page 18: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

Método Gráfico y deducción analítica de Método Gráfico y deducción analítica de probabilidades asociadas.probabilidades asociadas.

Método de Braun RobinsonMétodo de Braun Robinson

Ejemplo:Ejemplo:

A BA B B1B1 B2B2 B3B3

A1A1 77 22 99

A2A2 22 99 00

A3A3 99 00 1111

Page 19: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

kk ii B1B1 B2B2 B3B3 jj A1A1 A2A2 A3A3 vvminmin VVmaxmax v*v*

11 33 99 00 1111 22 22 99 00 00 99 4.54.5

22 22 1111 99 1111 22 44 1818 00 4.54.5 99 6.76.755

33 22 1313 1818 1111 33 1313 1818 1111 3.63.677

66 4.84.844

44 22 1515 2727 1111 33 2222 1818 2222 2.72.755

5.55.5 4.14.133

55 11 2222 2929 2020 33 3131 1818 3333 44 6.66.6 5.35.3

66 33 3131 2929 3131 22 3333 2727 3333 4.84.844

5.55.5 5.15.177

77 11 3838 3131 4040 22 3535 3636 3333 4.44.433

5.15.144

4.74.799

K=nro. Iteración - i=estrategia de A - j=estrategia de BK=nro. Iteración - i=estrategia de A - j=estrategia de B VVminmin=ganancia mínima acumulada dividido k=ganancia mínima acumulada dividido k VVmaxmax=ganancia máxima acumulada dividido k=ganancia máxima acumulada dividido k V*=(vmax+vmin)/2V*=(vmax+vmin)/2

Page 20: TEORIA DE JUEGOS

Teoría de JuegosTeoría de Juegos

SA=(p1,p2,p3)SA=(p1,p2,p3) SB=(q1,q2,q3)SB=(q1,q2,q3)

p1 es aproximadamente la cantidad de veces que A eligió la p1 es aproximadamente la cantidad de veces que A eligió la estrategia 1 en k, entonces: p1= 2/7 = 0.28 estrategia 1 en k, entonces: p1= 2/7 = 0.28 (aproximadamente) (aproximadamente)

p2 = 3/7 = 0.42 (aproximadamente) p2 = 3/7 = 0.42 (aproximadamente) p3= 2/7= 0.28 (aproximadamente) p3= 2/7= 0.28 (aproximadamente) De la misma forma calcular q1, q2 y q3 aproximados.De la misma forma calcular q1, q2 y q3 aproximados. Los valores exactos son obtenidos mediante la resolución de Los valores exactos son obtenidos mediante la resolución de

problemas dobles de programación lineal y equivalen a problemas dobles de programación lineal y equivalen a p1=0.25, p2=0.5 y p3=0.25. Si aumentan la cantidad de p1=0.25, p2=0.5 y p3=0.25. Si aumentan la cantidad de iteraciones de Braun Robinson nos vamos acercando a los iteraciones de Braun Robinson nos vamos acercando a los valores reales.valores reales.