Post on 21-Dec-2015
description
Introducción
Hemos estudiado juegos estáticos, es decir, juegos en que
los jugadores deciden simultáneamente qué hacer.
Como es obvio, en muchas situaciones esto no es así,
como por ejemplo: el juego de ajedrez, cuando una
empresa decide si entrar o no al mercado, lanzar un
producto, etc. En estos juegos, es indispensable
considerar que, a veces, un jugador mueve antes que
otro, y que los otros jugadores observan su decisión
antes de jugar. A estos juegos se les conoce como juegos
dinámicos. 3
Ejemplo 16: El juego de Entrar o no entrar
4
Suponga que Almacenes Paris
(Jugador 2) está considerando entrar
(e) en el negocio de vender seguros o
no (n). Falabella (Jugador 1) observa a
Paris, y actuará solo en caso que éste
decida entrar. En ese caso puede: a)
Declara una guerra de precios (G) con
lo que ganaría 0 (es decir, perdería los
20 que actualmente gana) o aceptar la
nueva competencia (A) con lo que
ambos se repartirían las ganancia. ¡Pensemos por un par de
minutos cuál es la solución!
Dinámicos significa…
Ahora analizaremos juegos en los que cada jugador
sabe qué han hecho los jugadores que han movido
antes que él.
Se dice que estos juegos son de información perfecta, lo
cual es más estricto que información completa.
5
Elementos a Considerar en este nuevo contexto
1. ¿Qué es una estrategia?
2. ¿Qué equilibrios son razonables?
3. ¿Qué información tiene cada jugador cada vez que le
toca decidir?
6
Inducción hacia atrás
Sería prematuro tratar de responder las preguntas
anteriores sin algunos preliminares. A continuación,
definiremos el concepto de Inducción hacia Atrás
(Backwards Induction) a través de un ejemplo sencillo:
7
Ejemplo: el Juego de la Confianza
Suponga un juego que comienza
con el jugador 1 eligiendo entre
confiar o no confiar en el
jugador 2.
Si 1 elige no confiar el juego
termina
Si 1 elige confiar, 2 juega y puede
mantener su promesa, o
traicionar.
8
Inducción hacia atrás en el juego de la Confianza
Analicemos ahora de atrás para
adelante: si el jugador 2 mueve
(es decir, si el jugador 1 decidió
CONFIAR) elegirá entre los
pagos 1 (honrar su palabra) ó 2
(traicionar). Como 2 es mayor
que 1, el Jugador 2 eligirá
TRAICIONAR (Marcado en
negrito)
9
Inducción hacia atrás en el juego de la Confianza
Ante esta perspectiva, el jugador 1
debe elegir entre NO
CONFIAR con un pago de 0, ó
CONFIAR con un pago de -1
(ya que el jugador 2 no elegirá
CUMPLIR SU PALABRA).
Entre 0 y -1 eligirá 0, NO
CONFIAR (Marcada en
negrito)
10
Algoritmo de Inducción hacia atrás
Comienza en el final del juego, y “regresa” hacia atrás, eligiendo en
cada movimiento la mejor respuesta del individuo.
El método funciona siempre y cuando no exista:
a) Movimientos simultáneos
b) Secuencias infinitas
En estos casos, usaremos el concepto de EQUILIBRIO DE
NASH PERFECTO EN SUBJUEGOS que veremos más
adelante.
11
El algoritmo en acción: el juego del ciempies…
Ilustra una situación en la que es benéfico para ambos continuar
una relación, aun cuando uno de los jugadores querría terminarla
hoy, si supiese que el otro está dispuesto a terminarla mañana.
El juego ocurre en tres etapas, en cada una de las cuales el jugador
elige seguir ir hacia abajo (D, d, δ) ó seguir derecho (A, a, α)
12
Juego del ciempies: Paso 1 (Etapa 3)
Primero, situémonos en el final del juego (en la etapa 3) donde el
jugador 1 debe elegir entre α con pago 2, ó δ con pago 3.
Evidentemente, elegirá δ.
13
Juego del ciempies: Paso 2 (Etapa 2)
En la Segunda Etapa, el jugador 2 (Qué sabe que el jugador 1 jugó
δ en la tercera etapa) tiene que decidir entonces entre d con un
pago de 4, ó a con un pago de 3. Evidentemente, elegirá el
mayor pago, es decir, jugará d.
14
Juego del ciempies: Paso 3 (Etapa 1)
El “final” del juego es en realidad en donde comenzamos, el
jugador 1 debe elegir D con un pago de 1, o A con un pago de 0.
Evidentemente, elegirá D.
15
Equilibrio de Nash para el Juego del ciempies
Moraleja: ¡Miedo al Compromiso!
Los resultados del tercer día ó etapa, (3,3) ó (2,5), son ambos
estrictamente mejores que la solución de equilibrio (1,1). Pero
esos resultados no se pueden alcanzar, dado que el jugador 2 no
se comprometerá a jugar a por lo que el jugador 1, anticipándolo,
resuelve terminar el juego en el primer día tirando D.
16
Equilibrio de Nash para el Juego del ciempies
Finalmente, el equilibrio de Nash que hemos encontrado es
(D, d, δ) con pagos (1,1). Gráficamente:
17
Intuición de Subjuego
Antes de dar una definición formal de subjuego
daremos una definición intuitiva. En cada juego,
pueden existir pequeños mini juegos.
Recordemos de nuevo nuestro ejemplo del juego
del ciempiés. En el existen 3 subjuegos:
18
Intuición de Subjuego
En dónde a los últimos 2 los llamamos subjuegos
propios.
Observe cómo en cada subjuego, el equilibrio
hallado mediante inducción hacia atrás es un
equilibrio del subjuego (incorporamos el último
n-ésimo equilibrio como un hecho en el
equilibrio n-1).
20
Definición: Forma extensiva de un juego dinámico con información … (termina)
22
Después de cada historia no terminal h, el jugador P(h) elige una acción
del set:
Observación sobre la Historia:
Suponga el siguiente juego dinámico
llamado “matching pennies”: Dos
jugadores tiran monedas, uno
después del otro. Si el segundo
jugador iguala el resultado del
jugador uno, gana 1 peso (y por lo
tanto el jugador 1 pierde un peso);
en caso contrario, el jugador 1 es
quien gana un peso (siendo el
jugador 2 quien paga el peso). El
juego en forma extendida es:
23
Singletons
En este juego, todos los nodos se
encuentran en su propio conjunto
informativo. Cuando esto ocurre, se
dice el nodo es singleton (tiene un
solo elemento). Esto implica que no
hay incertidumbre en relación a la
historia pasada del juego. Además,
como cada nodo tiene solo una
rama entrante, cada jugador es
capaz de reconstruir toda la
historia del juego.
24
Usando Inducción hacia Atrás en Matching Pennies
En caso de que el jugador 1 elija
HEAD, el jugador 2 eligirá HEAD
también.
En caso de que el jugador 1 elija
TAIL, el jugador 2 eligirá TAIL
también.
25
Usando Inducción hacia Atrás en Matching Pennies
En tal caso, el jugador 1 estará
indiferente entre HEAD y
TAIL, y escogerá cualquiera de
ellos al azar (estrategia pura) o
una combinación aleatoria de
ellos (estrategia mixta)
Obviamente, este no es el fin de
la historia.
26
Información Perfecta
Juegos cómo el anterior, en
donde todos los conjuntos
informativos son singletons, son
llamados juegos de
“información perfecta”
27
“Historias” de Matching
Pennies ¿Recuerda la definición de
historia? Existen h=ak=22=4,
a=acciones propias,
k=acciones del otro, para el
jugador 2. Para J1 sus
acciones son iguales a sus
historias (k=1) dado que
juega primero.
28
HH HEAD si 1 juega HEAD; Y, HEAD si 1 juega TAIL
HT HEAD si 1 juega HEAD; Y, TAIL si 1 juega TAIL
TH TAIL si 1 juega HEAD; Y, HEAD si 1 juega TAIL
TT TAIL si 1 juega HEAD; Y, TAIL si 1 juega TAIL
1
“Historias” de Matching
Pennies ¿Recuerda la definición de
historia? Existen h=ak=22=4,
a=acciones propias,
k=acciones del otro, para el
jugador 2. Para J1 sus
acciones son iguales a sus
historias (k=1) dado que
juega primero.
29
HH HEAD si 1 juega HEAD; Y, HEAD si 1 juega TAIL
HT HEAD si 1 juega HEAD; Y, TAIL si 1 juega TAIL
TH TAIL si 1 juega HEAD; Y, HEAD si 1 juega TAIL
TT TAIL si 1 juega HEAD; Y, TAIL si 1 juega TAIL
2
“Historias” de Matching
Pennies ¿Recuerda la definición de
historia? Existen h=ak=22=4,
a=acciones propias,
k=acciones del otro, para el
jugador 2. Para J1 sus
acciones son iguales a sus
historias (k=1) dado que
juega primero.
30
HH HEAD si 1 juega HEAD; Y, HEAD si 1 juega TAIL
HT HEAD si 1 juega HEAD; Y, TAIL si 1 juega TAIL
TH TAIL si 1 juega HEAD; Y, HEAD si 1 juega TAIL
TT TAIL si 1 juega HEAD; Y, TAIL si 1 juega TAIL
3
“Historias” de Matching
Pennies ¿Recuerda la definición de
historia? Existen h=ak=22=4,
a=acciones propias,
k=acciones del otro, para el
jugador 2. Para J1 sus
acciones son iguales a sus
historias (k=1) dado que
juega primero.
31
HH HEAD si 1 juega HEAD; Y, HEAD si 1 juega TAIL
HT HEAD si 1 juega HEAD; Y, TAIL si 1 juega TAIL
TH TAIL si 1 juega HEAD; Y, HEAD si 1 juega TAIL
TT TAIL si 1 juega HEAD; Y, TAIL si 1 juega TAIL 4
“Reconstruyendo” un juego de Información
Perfecta
Entonces, averiguando los pagos:
32
J2: (1), H si H* y H si T
Si J1=H, J2 gana*
Si J1=T, J2 pierde
1
“Reconstruyendo” un juego de Información
Perfecta
Entonces, averiguando los pagos:
33
J2: (2), H si H* y T si T*
Si J1=H, J2 gana*
Si J1=T, J2 gana*
2
“Reconstruyendo” un juego de Información
Perfecta
Entonces, averiguando los pagos:
34
J2: (3), T si H y H si T
Si J1=H, J2 pierde
Si J1=T, J2 pierde
3
“Reconstruyendo” un juego de Información
Perfecta
Entonces, averiguando los pagos:
35
J2: (4), T si H y T si T*
Si J1=H, J2 pierde
Si J1=T, J2 gana*
4
Información Completa
Por el contrario, si un set informativo
se encuentra poblado por más de
un nodo (Es decir, no todos los
nodos son singletons), aunque
ambos jugadores conocen todos los
pagos (propios y ajenos), no son
capaces de reconstruir de manera
perfecta la historia del juego. Tales
juegos se llaman de “información
imperfecta” o “información
completa” 36
Backward Induction en Juegos de
Información Completa
Dado que en los juegos de
información completa los jugadores
no pueden reconstruir la historia del
juego, es incorrecto utilizar para
ellos el método de backward
induction.
37
Observe qué:
De la definición de juego en forma extensiva,
se tiene que dos historias distintas no
pueden terminar en la misma acción.
38
Ejemplo 17: Un juego
dinámico
Lista completa de
estrategias para 2:
42
ce c si 1 juega A, y e si 1 juega B
cf c si 1 juega A, y f si 1 juega B
de d si 1 juega A, y e si 1 juega B
df d si 1 juega A, y f si 1 juega B
Ejemplo 17: Un juego dinámico…
Para entender mejor lo que es una
estrategia, consideremos la representación
en forma normal del juego:
43
ce c si 1 juega A, y e si 1 juega B
cf c si 1 juega A, y f si 1 juega B
de d si 1 juega A, y e si 1 juega B
df d si 1 juega A, y f si 1 juega B
Resultado de un Juego
44
¿Cómo procedemos si no podemos usar inducción hacia
atrás? Supongamos el siguiente juego:
El juego tiene 2 subjuegos:
1) El que comienza después de
que 1 tira E (subjuego propio)
2) El juego en sí mismo
¿Cómo procedemos?
45
1. Computamos el equilibrio de Nash en el subjuego
2. Fijamos la acción encontrada en (1) para el subjuego
tomando los pagos de equilibrio
3. Computamos el equilibrio del juego entero
Resultado de un Juego
46
1. En el subjuego R domina a L para el jugador 2
2. El subjuego queda con pagos (3,2) si 1 tira T; (1,5) si 1
tira B
3. Como es turno del J1, escogerá T con pagos: (3,2)> (1,5)
para J1
¿Porqué pudimos hacerlo a pesar
de NO estar poblado de singletons?
¡Estrategias Dominadas!
Resultado de un Juego
48
3. Con lo que el equilibrio de Nash final para el juego total
queda entonces como:
Historia de equilibrio: (ET, R)
Pagos de Equilibrio: (3,2)
Otros Equilibrios de Nash
49
NOTE que existen otros equilibrios de Nash (PISTA: para
hallar los otros equilibrios de Nash, encuentre la forma
normal del juego y siga el método de mejor respuesta)
Sin embargo, dichos equilibrios no
son creíbles pues involucran
que el jugador 2 adopte
estrategias dominadas (L es
dominada por R)
Intuición de Equilibrio Perfecto en Subjuegos
50
Esto significa que hay un grupo de Equilibrios qué, aun
cuando son equilibrios de Nash en TODOS y cada uno
de los subjuegos, no se basan en estrategias dominadas.
Llamamos a este tipo de equilibrios “Equilibrios
Perfectos en Subjuegos”.
Algunos de estos pueden estar basados
en estrategias dominadas
NO se encuentran basados en
estrategias dominadas
Equilibrio Perfecto en Subjuegos
53
El equilibrio perfecto en subjuegos es un equilibrio de Nash
al que se le exige además que cada jugador optimice
después de cada historia, llegue a ella o no el juego, dada la
combinación de estrategias que están utilizando el resto de
los jugadores. La condición de optimalidad luego de cada
historia es equivalente a exigir que en cada subjuego la
combinación de estrategias elegida induzca un equilibrio de
Nash.
Ejemplo: Perfección en Subjuegos
55
Encuentre el Equilibrio Perfecto en Subjuegos del siguiente
juego en forma extendida
Ejemplo 19: Negociación
60
Dos jugadores deben repartirse $ 1.000.000. Las reglas son
las siguientes: el jugador 1 (J1) parte ofreciendo una
división, luego el jugador 2 (J2) decide si la acepta o no. Si
la acepta, el juego termina ahí. Si no acepta, en el siguiente
periodo el J2 ofrece una nueva partición y entonces es J1
quien decide si acepta o no. Esto continúa hasta que se
logre el acuerdo. El factor de descuento de J1 y de J2 es el
mismo e igual a δ ϵ(0, 1). Sea x la cantidad con la que se
queda 1.