Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes.
El juego de etapa que se juega en cada interacción es estático e inmutable
Juego dinámico El problema subyacente y las estrategias de los jugadores son dinámicos.
Hay un entorno de juego (game environment) que cambia de un período a otro y afecta a las ganancias en el juego de etapa de cualquier período.
El entorno puede cambiar por razones ajenas a la voluntad de los jugadores o puede cambiar a causa de lo que hacen los jugadores.
Uso de un recurso de propiedad común: tragedia de los comunes
Fuentes de externalidad en el uso de un recurso de propiedad común: • el uso de cada persona puede disminuir los beneficios para el uso de las otras personas
(externalidad actual) • la utilización conjunta puede afectar a la condición futura del recurso (externalidad futura).
Entorno del juego=tamaño del recurso
Características del entorno• Evoluciona a través del tiempo de acuerdo con el patrón de uso en el pasado
Cuantas más personas utilizan el recurso o cuanto más intensamente es utilizado menos hay en el futuro.
• Afecta a los pagos en cada juego de etapa.El resultado del uso hoy en día marca el uso futuro.
La pregunta clave es cuánto aprovechamiento supone este "mejor" uso del recurso.
MODELO SIMPLE (dos períodos de tiempo)
• Recurso de propiedad común de tamaño y> 0. • Cada uno de los dos jugadores puede retirar una cantidad c1 o c2 no negativa • La función de utilidad es logarítmica y a un consumo c le corresponde una utilidad log(c)• La cantidad total consumida no puede sobrepasar el recurso, c1 + c2 ≤ y.• El intento de consumir en exceso se traduce en que la cantidad total se reparte entre ellos,
es decir, cada jugador termina por consumir y/2. • Cuando el consumo total es menor que y, la cantidad sobrante, y-(c1 + c2), es la futura
base del recurso y, por tanto, del consumo futuro.
Sólo hay un periodo más de consumo
INDUCCIÓN HACIA ATRÁS
Período 2• Cada jugador decide la cantidad a consumir de la cantidad a su disposición y- (c1 + c2). • Puesto que no hay más períodos, cada jugador consumirá tanto como sea posible. • En el período 2, la cantidad total se divide entre ellos y cada uno tiene (y - (c1 + c2)) / 2
Periodo 1• El primer jugador determina la cantidad a consumir a partir del stock disponible • Su utilidad depende de la cantidad que el jugador 2 decida consumir (su consumo
determina el tamaño de los recursos que quedarán para el segundo periodo). • El jugador 1 determina su nivel de consumo mediante un problema de mejor respuesta
en función de la cantidad que el jugador 2 va a consumir en el primer período, c2
SOLUCIÓNLa mejor respuesta de consumo del jugador 1 es
R1 (c2) = (y - c2) / 2 La mejor respuesta de consumo del jugador 2 es
R2 (c1) = (y - c1) / 2El equilibrio de Nash viene dado por los niveles de consumo de c1* y c2* tales que
R1 (c2*) = R2 (c1*). Sustituyendo en las funciones de reacción, el equilibrio de Nash es c1* = c2* = y /3.
En el primer período, cada jugador consume y/3, dejando un total de y/3 para el segundo período,En el segundo períodoesta cantidad se divide por la mitad con un consumo de y/6 cada uno. La utilidad para cada jugador
log (y /3) + log (y/ 6)=2log (y )- log 18
Uso socialmente óptimo.
• Los dos jugadores constituyen una sociedad y se reúnen para decidir cuánto debe consumir cada uno por el "bien común“.
• Bien común supone asegurarse de que la utilidad total se maximiza. • Un patrón de consumo, (c1*, c2*), es socialmente óptimo si se maximiza la suma de la
utilidad de los dos jugadores, es decir, si se soluciona el problema siguiente:
Este procedimiento conduce a una solución socialmente óptimaC1*= C2 *=y/4
Cada jugador consume un cuarto del recurso en cada período La utilidad para cada jugador es
2log (y /4)=2log (y) –log 16
Comparación del equilibrio con el uso socialmente óptimo
Equilibrio de Nash dos terceras partes de los recursos se utilizan en el primer período.
Uso socialmente óptimo la mitad del recurso se utiliza en el primer período
Tragedia de los comunes.Exceso de extracción del recurso en el equilibrio de Nash
Criterio individual (utilidad propia)Si el jugador 1 recorta su consumo en el primer periodo en una unidad, hace que haya una unidad disponible para el consumo de ambos jugadores en el segundo períodoEs capaz de recuperar sólo la mitad de esta unidad adicional en el segundo período, debido a que la otra mitad queda para el jugador 2.
Criterio social (utilidades de ambos jugadores)Una unidad de consumo dejada para mañana por cualquiera de los jugadores sigue siendo en el segundo periodo una unidad de consumo para la sociedad en su conjunto.
Problema en grandes poblacionesSea N el número de jugadores y c1,…,cN sus consumos
En el equilibrio de Nash • Cada jugador consume la misma cantidad con un nivel de consumo en equilibrio de
c1* = c2* =... = cN* =y/ (N +1). • El consumo total es
Ny/(N +1).• La cantidad que queda después del primer período es
y/(N +1). Si N es grande una pequeña cantidad del recurso alcanza el segundo periodo
En el uso social • El consumo que maximiza la utilidad conjunta de todos los jugadores es
c1= c2=... = cn = y/2N • El consumo total es
y/2• La cantidad que queda después del primer período es
y/2Independientemente de N la mitad del recurso alcanza el segundo periodo
A medida que el número de jugadores aumenta la tragedia es aún más grave.
Ejercicio Considere la siguiente variante del modelo en la que en el primer período el jugador 1 extrae una cantidad c1 y el jugador 2 una cantidad c2. Lo que no se extrae, es decir, la cantidad y-c1 - c2, se regenera y se convierte en una cantidad igual a en el periodo 2.
Con el fin de que la cantidad de recurso crezca y sea mayor que y-c1-c2, suponemos y ≤ 1 (esto es una convención, si la cantidad máxima real es 100 multiplicamos la función de regeneración por √ 100). El resto del modelo es idéntico, en particular, la función de utilidad es log c y la regla de asignación si el total deseado es más de lo disponible sigue siendo dar la mitad a cada uno.
• Plantear el problema de mejor respuesta del jugador 1.• Demostrar que la función de mejor respuesta viene dada por R1 (c2) = 2 (y-c2)/ 3.• Calcular el equilibrio de Nash.• Demostrar que la extracción socialmente óptima es y/3 para cada jugador.
¿En qué se diferencia del modelo de recurso agotable en el que la extracción socialmente óptima es y/4 para cada jugador?
• Analizar el problema de los recursos renovables para N jugadores. ¿Es cierto que todos los recursos se extrae en el primer período si N tiende a infinito?
Problema de los comunes con interacción continua y recursos renovables
• El consumo del jugador i en el período t es ci (t) , con ci(t) ≥ 0 . • El consumo da a los jugadores una utilidad log(ci(t))
• El entorno del juego en el período t es el tamaño de los recursos, y(t), con y (t) ≥ 0 . • El valor de y(t) limita el consumo total c1(t) +c2(t) ≤ y (t) .
• La base de inversión que genera el recurso futuro, x(t), es la cantidad no extraídax(t) =y(t )-(c1(t)+c2(t))≥ 0.
• La inversión produce el recurso del próximo período (función de producción)y(t +1)=
El juego continúa siempre y cuando exista un nivel de recursos positivos y, por tanto, potencialmente, puede continuar para siempre.
Las preguntas de interés son ¿La interacción estratégica conduce a la sobreexplotación del recurso?¿Cómo evoluciona el stock del recurso y (t)?¿Hay una cantidad de recursos que es sostenible en el tiempo?
Solución socialmente óptima
Maximizamos la suma de las utilidades de los dos jugadores (inducción hacia atrás)
Supongamos que sólo queda un periodo
En el último periodo si el stock es y tenemos que resolver
En este último periodo nunca queda ningún stock sin uso, es decir, c1 + c2 = y.
Por lo tanto el problema de maximización puede reescribirse como
Con solución c1 = c2 = y/2.
En consecuencia, la utilidad social óptima de cada jugador cuando sólo queda una etapa corresponde al stock disponible y está dada por
donde A (1) es una abreviatura para la constante.
Supongamos que quedan dos períodos la extracción social óptima se encuentra al resolver el siguiente problema:
donde la utilidad del segundo periodo se descuenta un periodo mediante el factor de descuento δ.
Después de algunos cálculos, podemos reescribir el problema un poco más simple como
donde hemos suprimido las constantes aditivas.
Las condiciones de primer orden hacen que el consumo sea c1 = c2 = y / (2 + δ).
La utilidad social óptima por jugador cuando quedan dos etapas depende del stock disponible y viene dada por
Que puede escribirse como
Supongamos que quedan tres períodos de uso de recursos. En el primer período tenemos que resolver el siguiente problema:
Después de sustituir V2 y suprimir todas las constantes irrelevantes, podemos reescribirlo
El consumo social óptimo es c1=c2=y/2
La utilidad social óptima per cápita es de la forma
En esta etapa podemos ver un patrón y hacer una conjetura Cuando el número de períodos restantes es T, el consumo social óptimo es
En el modelo de infinitos períodos en cada etapa hay exactamente el mismo número de períodos restantes y la fracción de consumo de cada etapa es idéntica.
• El consumo viene dada por el límite del consumo óptimo cuando T tiende a infinito.
• La función de inversión es .
Por lo tanto, la fracción de la inversión óptima asociada es δ / 2
• La utilidad socialmente óptima, por extrapolación, viene dada por
• Obsérvese que
• El stock de recurso sostenible socialmente óptimo es 100δ / 2 (punto fijo de la ecuación)
Extracción unilateral del recurso.
En este caso, cada jugador sólo considera su propia utilidad y trata de maximizarla
Supongamos que estamos en el último períodoComo no hay más períodos después, cada jugador intentará consumir cuanto más mejor y el stock se divide a partes iguales entre los dos.
En este periodo el consumo de cada jugador es c1 = c2 = y/2.
la utilidad de equilibrio de cada jugador viene dada por
Supongamos que quedan dos períodos. En este periodo los jugadores van a consumir una fracción del recurso c1= θ1y, c2 = θ2y
El jugador 1 se enfrenta al siguiente problema de mejor respuesta
Este problema puede ser escrito de forma equivalente como
Se puede demostrar que la mejor respuesta de consumo es
En equilibrio, y
Cada jugador consume con la misma tasa de extracción (equilibrio simétrico)
La utilidad de equilibrio cuando quedan dos períodos se puede escribir como
Cuando quedan T períodos
la tasa de extracción de equilibrio es
En el modelo con infinitos períodos,
La función de consumo de equilibrio, c* (y) = θy, vendrá dada por el límite del consumo de equilibrio cuando T tiende a infinito
La función de inversión es
Obsérvese
el stock del recurso sostenible en equilibrio es (punto fijo de la ecuación)
Comparación del óptimo social y los resultados del equilibrioConsideremos dos sociedades distintas, una en la que se gestiona el consumo socialmente y otra en la que se determina de manera unilateral.
• La función de consumo socialmente óptima c (y) es siempre menor que la función de consumo en equilibrio (dando cada individuo su mejor respuesta) c*(y)
• Imaginemos que ambas sociedades comienzan con el mismo stock En el período 2, la primera sociedad tendría un stock más grande, ya que invirtió más en el primer período. Este aumento implica a su vez que esta sociedad vuelve a invertir más en el periodo 2.
• La primera sociedad invierte una fracción más grande de cualquier stock. • La primera sociedad cuenta con un stock de recursos más grande disponible.
• El stock sostenible, y (t +1) = y (t), es más alto en el primer caso que en el segundo. • En el primer caso el stock sostenible es y = 100δ/2 • En el segundo caso el stock sostenible es y* = 100δ / (4-δ)
Conclusiones
En el juego con horizonte infinito cada jugador decide cuánto consumir sólo mirando el tamaño del recurso actual (estrategia markoviana)
no requiere que el jugador tenga información de lo que ha hecho su rival en el pasado o de cómo el recurso ha evolucionado en períodos anteriores.
Un equilibrio perfecto en subjuegos mediante estrategias markovianas recibe el nombre de equilibrio perfecto de Markov (MPE). • Si el número de entornos es finito siempre existe un MPE. • Si el número de entornos es infinito no podemos garantizar que exista un MPE
La conclusión final sobre este equilibrio es que está siempre por debajo de la solución socialmente óptima. Se extrae demasiado recurso y las utilidades de equilibrio son más bajas que las utilidades socialmente óptimas.
Usando estrategias del disparador a veces se puede remediar este problema. Si los jugadores creen que en el futuro el buen comportamiento será recompensado y el mal comportamiento castigado son propensos a cooperar.
Top Related