J E M L I E 7 2 1 8 3 4 7 · El dilema del prisionero Es uno de los ejemplos más conocidos dentro...
Transcript of J E M L I E 7 2 1 8 3 4 7 · El dilema del prisionero Es uno de los ejemplos más conocidos dentro...
7/3/2018 Carátula de Trabajo
http://www.feriadelasciencias.unam.mx/inscripciones 1/1
C������� �� T������
J������ �� ��� ��������Título del trabajo
E����������Pseudónimo de integrantes
M����������Á���
L����C��������
I������������ E�����������M��������
7218347Folio de Inscripción
Dudas o sugerencias sobre este sistema: [email protected] © 2018 Escuela Nacional Colegio de Ciencias y Humanidades, Hecho en México, Comité Organizador
2
Índice
Página
1. Carátula…………………………………………………………………………….1
2. Título………………………………………………………………………………..3
3. Resumen…………………………………………………………………………...3
4. Introducción………………………………………………………………………..3
4.1. Marco Teórico………………………………………………………………3
- Juego…………………………………………………………………….…3
- Teoría de juegos…………………………………………………………...3
- Teoría de juegos aplicada a las empresas………………………………4
- Dilema del prisionero………………………………………………………5
- Equilibrio de Nash………………………………………………………….6
- La Tragedia de los Comunes……………………………………………..7
- Recompensa……………………………………………………………….8
- Castigo……………………………………………………………………...8
- Bien común…………………………………………………………………8
4.2. Objetivo(s)………………………………………………………………….8
4.3. Problema……………………………………………………………………9
4.4. Hipótesis……………………………………………………………………9
5. Desarrollo…………………………………………………………………………..9
6. Resultados y Análisis e interpretación de resultados
……………………………………………………………………………………..13
7. Conclusiones……………………………………………………………………..19
8. Fuentes de información…………………………………………………………19
3
“JUGANDO EN LAS EMPRESAS”
3. Resumen
En el siguiente trabajo se abordará sobre un punto importante en el mundo
empresarial actual: la dinámica con la que las empresas obtienen mejores
resultados. Se desarrollará con ayuda de la Teoría de Juegos, realizando un modelo
que permitirá comparar diferentes estrategias, y conocer la estrategia más óptima
para un buen desempeño en una empresa.
4. Introducción
4.1 Marco Teórico
Juego
Es una situación en la que dos o más individuos, sometiéndose a unas reglas
preestablecidas deben tomar decisiones que, consideradas conjuntamente,
conducen a un resultado.
Teoría de juegos
La teoría de juegos es un área de las matemáticas aplicada que utiliza modelos para
estudiar y analizar comportamientos e interacciones en estructuras formalizadas de
incentivos, de individuos durante diversos juegos estratégicos, además toma en
cuenta las predicciones que éstos realizan acerca de otros jugadores en este mismo
escenario; donde los implicados usan la razón y la lógica.
El objetivo de la teoría de juegos es el análisis de los comportamientos estratégicos
de los jugadores, es decir, proporcionar la estrategia óptima adelantándose y
previendo a la estrategia del resto. En el mundo real, tanto en las relaciones
económicas como en las políticas o sociales, son muy frecuentes en las situaciones
en las que, al igual que en los juegos, su resultado depende del conjunto de
4
decisiones de diferentes agentes (o jugadores). Se dice que un comportamiento es
estratégico cuando se adopta teniendo en cuenta la influencia conjunta sobre el
resultado propio y ajeno de decisiones propias y ajenas.
La Teoría de Juegos clasifica a los diferentes tipos de juegos en categorías en
función del método que hay que aplicar para resolverlos. De esta forma existen:
o Juegos simétricos y asimétricos.
o Juegos de suma cero y de suma no cero.
o Criterios "maximin" y "minimax".
o "Equilibrio de Nash"
o Juegos cooperativos.
o Juegos simultáneos y secuenciales.
o Juegos de información perfecta.
o Juegos de información infinita
Teoría de juegos aplicada a las empresas
La Teoría de juegos se aplica a diario en el campo empresarial al tomarse
decisiones no solamente basadas en los posibles beneficios inmediatos que
podamos obtener, sino en las reacciones y estrategias que nuestra competencia
puede adoptar ante la decisión que hemos tomado.
Las aplicaciones de la Teoría de juegos en las empresas, son infinitas y abarcan
todo tipo de empresas: desde un pequeño puesto de helados que está pensando
en bajar los precios de sus productos y debe pensar cómo actuará el del puesto de
enfrente, a una gran multinacional automovilística que está pensando invertir
cientos de millones de pesos para crear un vehículo eléctrico y necesita saber cuál
será el retorno de su inversión y el riesgo asociado al proyecto según lo que puede
hacer su competencia.
Estas decisiones, sobre todo cuando estamos en el ámbito de una pequeña
empresa, se hacen basándose en la intuición y la experiencia, confiando en que la
decisión será la mejor. Pero las decisiones siempre serán más acertadas y fiables
5
si se hacen basándose en la estadística y otros conceptos matemáticos. En las
grandes empresas, que disponen de departamentos enteros de análisis de riesgo,
este tipo de decisiones nunca son aleatorias y se basan en análisis de la
competencia, estudios de mercado y análisis de riesgo.
El dilema del prisionero
Es uno de los ejemplos más conocidos dentro de la categoría de juegos del tipo
"Equilibrio de Nash". En él se analizan los incentivos que tienen dos presos
encarcelados por un delito menor para delatar al otro a la policía, y acceder así a
beneficios penitenciarios. Considera el supuesto de que cada prisionero está
encarcelado por separado, de tal forma que no pueden comunicarse entre ellos,
ponerse de acuerdo, pactar sus decisiones o saber qué hace el otro.
La policía solo tiene pruebas para culparlos de un delito menor, tenencia ilícita de
armas, sin embargo sospechan que han participado en el robo de un banco, de la
cual no tienen pruebas. Se le promete a cada uno de ellos reducir su condena a la
mitad si proporciona las pruebas para culpar al otro del robo del banco.
Las posibilidades de condena en función de la decisión tomada por ambos son las
siguientes, las cuales pueden representarse en forma de matriz de pagos:
a) Nadie delata.- si ninguno de los dos
delatase al otro a la policía, entonces cada uno
recibiría una condena de 2 años: (-2, -2).
b) Uno delata al otro.- si uno de los prisioneros
delatase al otro, pero este otro no delatase al
uno, entonces el prisionero que delata reduciría
su condena hasta solo 1 año, mientras que el
prisionero delatado vería incrementada su
condena hasta 10 años: posibilidades (-10, -1)
y (-1, -10).
Fuente: http://1.bp.blogspot.com/-
Z2SzpTTtMWk/UN7ky3IEHqI/AAAAAAAAFXk/wTug
eVTSiRw/s1600/dilema_del_prisionero_teoria_juego
s.jpg
6
c) Ambos se delatan mutuamente.- si ambos deciden delatar al otro, entonces
recibirán una condena de 6 años de condena para cada uno (-6, -6).
En vez de expresar los pagos en años de
cárcel, se podría indicar el orden de
preferencia de cada preso de los
correspondientes resultados.
La aplicación de la estrategia maximin
conduce en este juego a un resultado
óptimo. Al no conocer la decisión del otro
preso, la estrategia más segura es
traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos
hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está
señalado en la matriz mediante un asterisco.
El pensamiento lógico por separado de cada prisionero hace que al final cada uno
tome por separado la decisión que es mejor para él individualmente y no la que sería
la mejor decisión para el bien común. En este caso concreto, ambas partes no
pueden cambiar su decisión individual sin empeorar; de esta forma, cada jugador
ejecuta el mejor movimiento que pueda dados los movimientos de los demás
jugadores. Siendo por excelencia el juego de la cooperación.
Equilibrio de Nash
Es cuando los jugadores optan por la decisión que mejor los beneficia dadas las
estrategias del resto; busca la ganancia de todos los participantes, por medio de un
punto de estabilidad en la que ninguna de las partes obtiene un beneficio si mueve
sus posiciones.
Es decir, un "equilibrio de Nash" es una situación en la que todos los jugadores
ponen en práctica una estrategia que maximiza sus ganancias individuales, dadas
las estrategias de los otros. Como consecuencia ningún jugador tiene incentivos
para modificar individualmente su estrategia. En el "equilibrio de Nash" se logra el
Fuente: http://www.eumed.net/cursecon/juegos/presos.htm
7
mejor resultado individualmente para cada jugador, pero no el mejor resultado para
todos en su conjunto. Es posible que el resultado fuera mejor para todos los
jugadores si éstos coordinaran su actuación.
Aplicado a la economía, el "equilibrio de Nash" es un tipo de equilibrio de
competencia imperfecta que describe la situación de varias empresas compitiendo
por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar
maximizas sus ganancias.
Los equilibrios Nash se pueden utilizar para predecir el resultado de juegos finitos,
siempre que exista tal equilibrio. Sin embargo, nos encontramos con el problema
que surge cuando se trata de un equilibrio de Nash que no es ni social ni ético, y
donde la eficiencia puede ser subjetiva.
La Tragedia de los Comunes
La Tragedia de los comunes es un dilema escrito por Garret Hardín en 1968 para
la revista Science. Hardín se centra en dar respuesta al dilema del uso óptimo de
los bienes públicos bajo condiciones como la indefinición de derechos de propiedad,
la gratuidad y libre explotación de los bienes.
La Tragedia de los comunes parte de la premisa de que si los individuos buscan
maximizar su beneficio de forma individual usarán constantemente ciertos bienes o
recursos naturales (pastizales, ríos, bosques, etc.) hasta que estos se agoten. Este
comportamiento no considera el bienestar colectivo y menos la conservación del
ambiente en el largo plazo.
Cuenta la historia de un grupo de pastores que utilizaban una misma zona de
pastos. Un pastor pensó que podía añadir una oveja más a las que pacían en los
pastos comunes, ya que el impacto de un solo animal apenas afectaría a la
capacidad de recuperación del suelo. Los demás pastores pensaron también,
individualmente, que podían ganar una oveja más sin que los pastos se
deteriorasen. Pero la suma del deterioro imperceptible causado por cada animal
arruinó los pastos, y tanto los animales como los pastores murieron de hambre.
8
Recompensa
Es un premio, una compensación o la remuneración que se da a alguien por algún
servicio, por haber realizado una tarea o como reconocimiento de un mérito. Es un
incentivo que se ofrece a alguien o a un público en general para que colabore en
una acción o hecho. Es decir, es un reforzador positivo a una acción que se ha
hecho.
Castigo
Es una sanción, una pena o una reprimenda que se impone a una persona o
personas que han incurrido en algún tipo de falta, que ha quebrado alguna norma.
Por lo general, buscan funcionar como correctivo. Tiene como objetivo disminuir la
frecuencia de conductas negativas o des adaptativas.
Bien común
Se refiere en general al bien de todos los miembros de una comunidad y también al
interés público. Se puede definir como el fin general o como los objetivos y valores
en común, para cuya realización las personas se unen en una comunidad. Puede
tratarse de un objeto material o inmaterial cuya posesión o disfrute es necesario
para todos, como puede ser el aire o el calor del Sol, o puede referirse a un fin que
trascienda a la mejora de uno o de pocos, para beneficiar a todos, o a parte
importante de los seres humanos.
4.2 Objetivo(s)
Objetivo general:
Analizar cómo se puede mejorar el índice de cumplimiento de metas de una
empresa a través de la Teoría de Juegos, enfocada en la cooperación.
9
Objetivos específicos:
Desarrollar un modelo, teniendo como base la Teoría de juegos, de casos de
cooperación que ayuden a encontrar acciones para la eficiencia del trabajo
en equipo.
Identificar si la recompensa o el castigo es el mejor recurso para motivar a
un grupo de personas.
Justificar la importancia de considerar los bienes comunes dentro de la
misión y visión de una empresa, para el crecimiento de la misma.
4.3 Problema
Los problemas que se abordarán serán: ¿cuál es la mejor manera de motivar a los
participantes de un proyecto en una empresa? ¿Cómo influye la consideración del
bien común en una empresa? ¿De qué forma influye la cooperación en una empresa
para llegar a metas establecidas?
4.4 Hipótesis
La recompensa es el mejor recurso para motivar el progreso de un proyecto
cualquiera dentro de una empresa.
La consideración del bien común influye en la visión y misión de una empresa ya
que su compromiso con la sociedad debe tomarse en cuenta.
Es más útil buscar una estrategia que mejora las ganancias individuales, tomando
en consideración las estrategias del resto; que solo tomar en consideración una
mejora individual, lo cual no sería la mejor decisión para el bien común.
5 Desarrollo
Tomando como base el dilema del prisionero y juego de bienes comunes, se
moldeará el siguiente juego, el cual presenta cuatro modalidades:
10
Juego estándar.
Juego con castigo.
Juego con recompensa.
Juego con recompensa y castigo.
Juego estándar
- Hay cuatro jugadores y un coordinador (el experimentador).
- A cada jugador se le dan 50 monedas.
- Se realizan 10 rondas.
- En cada ronda los jugadores deben decidir aportar 0, 2 o 4 monedas al “fondo
común”.
- El equipo gana si después de las 10 rondas el fondo común tiene por lo
menos 80 monedas (suponiendo que en promedio cada persona da dos
monedas cada ronda).
- Si el equipo gana el jugador recibiría lo que ha quedado en su “cuenta
privada” (que inicialmente es de 50 monedas).
- Si el equipo pierde implica que todos pierden todo el dinero.
Para entender las siguientes tres modalidades primero explicaremos lo que en el
juego significan los términos de castigo y recompensa.
- Castigo: paga una moneda para que el castigado pierda cuatro.
- Recompensa: pagar una moneda para que la persona recompensada reciba
tres.
Las siguientes modalidades tienen las mismas reglas que la modalidad estándar,
solo se aplican las siguientes variantes:
Juego con castigo
11
Después de cada ronda los jugadores pueden decidir castigar a otro jugador (los
jugadores lo deciden simultáneamente y después se dice abiertamente). Un jugador
puede castigar a varios jugadores (no hay límite) en la misma ronda (por cada
castigo pagará una moneda), pero no puede pagar un “doble castigo” (pagar dos
monedas para quitarle ocho monedas a otro jugador). Tampoco se puede
autocastigar.
Juego con recompensa:
Luego de cada ronda los jugadores pueden decidir recompensar a otro jugador (los
jugadores lo deciden simultáneamente y después se dice abiertamente). Un jugador
puede recompensar a varios jugadores (no hay límite) en la misma ronda (por cada
recompensa para una moneda), pero no puede pagar una “doble recompensa”
(pagar dos monedas para que le den seis monedas a otro jugador). Tampoco se
puede auto recompensar.
Juego con recompensa y castigo
Después de cada ronda los jugadores pueden decidir recompensar o castigar a otro
jugador (los jugadores lo deciden simultáneamente y después se dice
abiertamente). Se puede castigar y recompensar a cuantos jugadores se quiera,
pero no se puede dar doble castigo, ni doble recompensa, y tampoco se puede ni
autocastigar ni auto recompensar.
Justificación de los juegos.
La modalidad estándar es un modelo que está planificado para observar el
comportamiento “normal” de las personas al momento de cooperar. El “fondo
común” representa los objetivos que las personas comparten.
12
Pensemos por un momento que nos encontramos en una situación parecida, en la
que el resultado depende de un grupo de personas. Es del conocimiento de todos
que si no se logra la meta nadie tendrá una recompensa al final, por lo que el
comportamiento inicial debe ser cooperando. Sin embargo, las diez rondas no son
simples repeticiones; son para que los jugadores experimenten con sus monedas,
es decir, si un jugador decide no aportar monedas al fondo los otros jugadores
pensarán que deben poner más monedas de su parte para suplir esa falta y así
lograr el objetivo. Siguiendo esa cadena de acciones, el desertor pensaría “no
importa si yo no aporto monedas, los demás lo compensarán”. Un comportamiento
egoísta que lo llevará a que al final tenga más monedas en su fondo personal.
Siguiendo aún más esta serie de eventos los demás jugadores pensarán lo mismo
y empezarán a desertar. Lo que posiblemente termine en la tragedia de los
comunes.
Aplicado a empresas representaría, por ejemplo, cumplir con ciertas metas o tareas
específicas logrando mejorar su reputación y aporte dentro de la empresa para un
proyecto en común. Por lo cual pueden surgir desacuerdos e inconformidades sobre
lo que los demás aportan o no, llegando incluso a perder el objetivo en común con
tal de actuar con un sentido de justicia.
La elección del monto a cooperar en cada ronda representa, cualitativa y
cuantitativamente, lo que aportas para que el proyecto salga adelante, siendo el
proyecto un nuevo producto, mejoramiento del sistema de producción, branding,
marketing, entre otros.
La cantidad que se fija para ganar (80 monedas) es para que, en promedio, los
jugadores aporten dos monedas cada uno, en cada una de las diez rondas. Dar cero
monedas es el equivalente a no trabajar en equipo, es decir, no dar ningún esfuerzo
para el logro del objetivo. Aportar dos monedas representa un comportamiento
cooperativo, en el que la persona realiza lo necesario para ganar. Y dar cuatro
monedas es un comportamiento altruista.
13
26.5
Con las modalidades 2 (con castigo) y la 3 (con recompensa) se busca analizar las
diferencias en los resultados. Agregando una variable, por lo que se podrá medir
directamente el impacto de ésta.
Estas variantes surgen para observar la necesidad de reacción de los participantes
a las de los otros jugadores. Es decir, el “uso ideal” del castigo sería aplicárselo a
las personas que no están cooperando para el fondo común. Y la recompensa
debería darse a los jugadores que realicen una buena aportación al monto.
Finalmente, la modalidad 4 (recompensa y castigo), es un modelo más cercano a la
realidad. En la que se permite que los participantes interactúen dinámicamente.
Reaccionando a castigos y recompensas.
6 Resultados y Análisis e interpretación de resultados.
Se realizó una muestra de 64 personas, divididos en grupos de cuatro personas.
Por lo que cada modalidad del juego se llevó a cabo cuatro veces.
Al final de cada juego (modalidad con los grupos de 4 integrantes) se anotó las
monedas con las que terminaron en su fondo personal.
Se hicieron cuatro veces la modalidad estándar, con un total de 16 jugadores.
Se calculó la media aritmética de las monedas finales (de fondos personales) de
las 6 personas.
El resultado es
Se graficaron las monedas finales de los jugadores de la modalidad estándar.
14
Además se calcularon la desviación estándar de la variable independiente
(monedas).
Se obtuvo:
.
En el diagrama de dispersión se puede observar la agrupación de los datos.
Análogamente, se realizó la metodología para las otras modalidades.
MODALIDAD CON CASTIGO
Se obtiene:
0
5
10
15
20
25
30
35
0 2 4 6 8 10 12 14 16 18
Monedas
Jugador
Diagrama de dispersión-Juego estándar
𝑥− = 26.5
3.041381265
11.54864034
19.5625
15
Realizando el diagrama de dispersión podemos observar la agrupación de los datos.
Cabe mencionar que los valores de x=0 es debido a que las personas no lograron
el objetivo del fondo común (tener 80 monedas mínimo).
MODALIDAD RECOMPENSA
0
5
10
15
20
25
30
35
0 2 4 6 8 10 12 14 16 18
Monedas
Jugador
Diagrama de dispersión-Juego con castigo
𝑥− = 19.5625
32.125
4.498263554
16
En esta modalidad es donde se encontró que el promedio de monedas finales es el
mayor. Cumpliendo el objetivo. Y además la desviación estándar es pequeña, lo
que indica que no se alejan demasiado los datos de la media.
MODALIDAD DE RECOMPENSA Y CASTIGO
Como se puede observar, la desviación estándar es grande. Lo que indica que las
monedas finales no fueron muy regulares, se puede encontrar valores bajos y altos.
Esto se puede observar mejor en el siguiente diagrama de dispersión:
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18
Monedas
Jugador
Juego con recompensa
𝑥− = 32.125
20
13.43037602
17
La mayor desviación estándar se localiza en la modalidad de Recompensa y
Castigo. Cumpliendo las expectativas, puesto que es la dinámica más cercana a la
vida real, teniendo valores altos y bajos, y reaccionando a recompensas y castigos.
La modalidad estándar presenta el menor valor para esta medida estadística; de
nuevo, cumpliendo las expectativas, puesto que la dinámica es relativamente
simple, únicamente escogiendo cuánto cooperar pero no teniendo un impacto muy
directo sobre los otros participantes.
Cabe mencionar, que la mayor media aritmética se encuentra en la modalidad de
Recompensa, y la menor la encontramos en la modalidad Castigo.
Tomando como base estos resultados se puede encontrar la relación existente entre
la modalidad y los resultados (monedas finales).
Para esto se realiza un nuevo diagrama de dispersión.
En el eje x, se definen los siguientes valores:
1.- modalidad de castigo
2.- modalidad de recompensa y castigo.
3.- modalidad estándar.
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18
Monedas
Jugador
Diagrama de dispersiónJuego de Recompensa y Castigo
𝑥− = 20
18
4.- modalidad con recompensa.
En el eje y se asignaron los valores respectivos de la media aritmética de las
modalidades.
Se realizó el cálculo del coeficiente de correlación. Se obtiene:
r=9.57
Lo que indica que hay una relación lineal positiva casi perfecta entre la modalidad
y las monedas finales.
Con esto, se puede afirmar que la modalidad de Recompensa es la más eficiente
en nuestro sistema de juego, y la modalidad de Castigo es la que peores resultados
presentó, tanto individuales como colectivos.
0
5
10
15
20
25
30
35
0 1 2 3 4 5
Pro
medio
(m
onedas fin
ale
s)
Modalidad de juego
Correlación Modalidad-Monedas
19
7 Conclusiones
Gracias a la teoría de juego se pudo comprobar que la recompensa tiene mejores
efectos en trabajos colectivos que el castigo.
Con los resultados que pueden ser llevados a mayores escalas, se puede aplicar
en sistemas cooperativos que permitan tener mejor rendimiento, y lograr objetivos
más altos.
Con base en el análisis de la tragedia de los comunes se puede concluir que el bien
común es de importancia, debido a que repercute en el progreso y futuro de una
empresa, además de su sustentabilidad a futuro.
Por último es importante recalcar que en la sociedad la cooperación es el mejor
camino para obtener mejores resultados, por lo que al momento de tomar decisiones
no se debe sólo considerar la mejor opción personal sino la que sea mejor para
todos.
8 Fuentes de información
- Nowak, M. (2012). Súper cooperadores. Barcelona, España: Ediciones B
- Tinsa. (2012). Teoría de los juegos y su importante aplicación empresarial.
Febreo 20, 2018, de Tinsa Sitio web:
https://www.tinsa.es/blog/economia/aplicacion-empresarial-de-la-teoria-de-
los-juegos/
- Eumed. (Sin especificar). Introducción a la Teoría de Juegos. Dilema del
prisionero. Febrero 20, 2018, de Eumed.net. Sitio web:
http://www.eumed.net/cursecon/juegos/presos.htm
- Stokel, C. (2015). ¿Qué es exactamente la Teoría de juegos? Febrero 20,
2018, de BBC Mundo. Sitio web:
http://www.bbc.com/mundo/noticias/2015/02/150220_teoria_de_juegos_que
_es_finde_dv
20
- Martínez, S. (2014). Dilemas económicos: La Tragedia de los Comunes.
Febrero 20, 2018, de Letras Libres. Sitio web:
http://www.letraslibres.com/mexico-espana/dilemas-economicos-la-tragedia-
los-comunes