J E M L I E 7 2 1 8 3 4 7 · El dilema del prisionero Es uno de los ejemplos más conocidos dentro...

20
7/3/2018 Carátula de Trabajo http://www.feriadelasciencias.unam.mx/inscripciones 1/1 C T J Título del trabajo E Pseudónimo de integrantes M Á L C I E M 7218347 Folio de Inscripción Dudas o sugerencias sobre este sistema: [email protected] © 2018 Escuela Nacional Colegio de Ciencias y Humanidades, Hecho en México, Comité Organizador

Transcript of J E M L I E 7 2 1 8 3 4 7 · El dilema del prisionero Es uno de los ejemplos más conocidos dentro...

7/3/2018 Carátula de Trabajo

http://www.feriadelasciencias.unam.mx/inscripciones 1/1

C������� �� T������

J������ �� ��� ��������Título del trabajo

E����������Pseudónimo de integrantes

M����������Á���

L����C��������

I������������ E�����������M��������

7218347Folio de Inscripción

Dudas o sugerencias sobre este sistema: [email protected] © 2018 Escuela Nacional Colegio de Ciencias y Humanidades, Hecho en México, Comité Organizador

2

Índice

Página

1. Carátula…………………………………………………………………………….1

2. Título………………………………………………………………………………..3

3. Resumen…………………………………………………………………………...3

4. Introducción………………………………………………………………………..3

4.1. Marco Teórico………………………………………………………………3

- Juego…………………………………………………………………….…3

- Teoría de juegos…………………………………………………………...3

- Teoría de juegos aplicada a las empresas………………………………4

- Dilema del prisionero………………………………………………………5

- Equilibrio de Nash………………………………………………………….6

- La Tragedia de los Comunes……………………………………………..7

- Recompensa……………………………………………………………….8

- Castigo……………………………………………………………………...8

- Bien común…………………………………………………………………8

4.2. Objetivo(s)………………………………………………………………….8

4.3. Problema……………………………………………………………………9

4.4. Hipótesis……………………………………………………………………9

5. Desarrollo…………………………………………………………………………..9

6. Resultados y Análisis e interpretación de resultados

……………………………………………………………………………………..13

7. Conclusiones……………………………………………………………………..19

8. Fuentes de información…………………………………………………………19

3

“JUGANDO EN LAS EMPRESAS”

3. Resumen

En el siguiente trabajo se abordará sobre un punto importante en el mundo

empresarial actual: la dinámica con la que las empresas obtienen mejores

resultados. Se desarrollará con ayuda de la Teoría de Juegos, realizando un modelo

que permitirá comparar diferentes estrategias, y conocer la estrategia más óptima

para un buen desempeño en una empresa.

4. Introducción

4.1 Marco Teórico

Juego

Es una situación en la que dos o más individuos, sometiéndose a unas reglas

preestablecidas deben tomar decisiones que, consideradas conjuntamente,

conducen a un resultado.

Teoría de juegos

La teoría de juegos es un área de las matemáticas aplicada que utiliza modelos para

estudiar y analizar comportamientos e interacciones en estructuras formalizadas de

incentivos, de individuos durante diversos juegos estratégicos, además toma en

cuenta las predicciones que éstos realizan acerca de otros jugadores en este mismo

escenario; donde los implicados usan la razón y la lógica.

El objetivo de la teoría de juegos es el análisis de los comportamientos estratégicos

de los jugadores, es decir, proporcionar la estrategia óptima adelantándose y

previendo a la estrategia del resto. En el mundo real, tanto en las relaciones

económicas como en las políticas o sociales, son muy frecuentes en las situaciones

en las que, al igual que en los juegos, su resultado depende del conjunto de

4

decisiones de diferentes agentes (o jugadores). Se dice que un comportamiento es

estratégico cuando se adopta teniendo en cuenta la influencia conjunta sobre el

resultado propio y ajeno de decisiones propias y ajenas.

La Teoría de Juegos clasifica a los diferentes tipos de juegos en categorías en

función del método que hay que aplicar para resolverlos. De esta forma existen:

o Juegos simétricos y asimétricos.

o Juegos de suma cero y de suma no cero.

o Criterios "maximin" y "minimax".

o "Equilibrio de Nash"

o Juegos cooperativos.

o Juegos simultáneos y secuenciales.

o Juegos de información perfecta.

o Juegos de información infinita

Teoría de juegos aplicada a las empresas

La Teoría de juegos se aplica a diario en el campo empresarial al tomarse

decisiones no solamente basadas en los posibles beneficios inmediatos que

podamos obtener, sino en las reacciones y estrategias que nuestra competencia

puede adoptar ante la decisión que hemos tomado.

Las aplicaciones de la Teoría de juegos en las empresas, son infinitas y abarcan

todo tipo de empresas: desde un pequeño puesto de helados que está pensando

en bajar los precios de sus productos y debe pensar cómo actuará el del puesto de

enfrente, a una gran multinacional automovilística que está pensando invertir

cientos de millones de pesos para crear un vehículo eléctrico y necesita saber cuál

será el retorno de su inversión y el riesgo asociado al proyecto según lo que puede

hacer su competencia.

Estas decisiones, sobre todo cuando estamos en el ámbito de una pequeña

empresa, se hacen basándose en la intuición y la experiencia, confiando en que la

decisión será la mejor. Pero las decisiones siempre serán más acertadas y fiables

5

si se hacen basándose en la estadística y otros conceptos matemáticos. En las

grandes empresas, que disponen de departamentos enteros de análisis de riesgo,

este tipo de decisiones nunca son aleatorias y se basan en análisis de la

competencia, estudios de mercado y análisis de riesgo.

El dilema del prisionero

Es uno de los ejemplos más conocidos dentro de la categoría de juegos del tipo

"Equilibrio de Nash". En él se analizan los incentivos que tienen dos presos

encarcelados por un delito menor para delatar al otro a la policía, y acceder así a

beneficios penitenciarios. Considera el supuesto de que cada prisionero está

encarcelado por separado, de tal forma que no pueden comunicarse entre ellos,

ponerse de acuerdo, pactar sus decisiones o saber qué hace el otro.

La policía solo tiene pruebas para culparlos de un delito menor, tenencia ilícita de

armas, sin embargo sospechan que han participado en el robo de un banco, de la

cual no tienen pruebas. Se le promete a cada uno de ellos reducir su condena a la

mitad si proporciona las pruebas para culpar al otro del robo del banco.

Las posibilidades de condena en función de la decisión tomada por ambos son las

siguientes, las cuales pueden representarse en forma de matriz de pagos:

a) Nadie delata.- si ninguno de los dos

delatase al otro a la policía, entonces cada uno

recibiría una condena de 2 años: (-2, -2).

b) Uno delata al otro.- si uno de los prisioneros

delatase al otro, pero este otro no delatase al

uno, entonces el prisionero que delata reduciría

su condena hasta solo 1 año, mientras que el

prisionero delatado vería incrementada su

condena hasta 10 años: posibilidades (-10, -1)

y (-1, -10).

Fuente: http://1.bp.blogspot.com/-

Z2SzpTTtMWk/UN7ky3IEHqI/AAAAAAAAFXk/wTug

eVTSiRw/s1600/dilema_del_prisionero_teoria_juego

s.jpg

6

c) Ambos se delatan mutuamente.- si ambos deciden delatar al otro, entonces

recibirán una condena de 6 años de condena para cada uno (-6, -6).

En vez de expresar los pagos en años de

cárcel, se podría indicar el orden de

preferencia de cada preso de los

correspondientes resultados.

La aplicación de la estrategia maximin

conduce en este juego a un resultado

óptimo. Al no conocer la decisión del otro

preso, la estrategia más segura es

traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos

hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está

señalado en la matriz mediante un asterisco.

El pensamiento lógico por separado de cada prisionero hace que al final cada uno

tome por separado la decisión que es mejor para él individualmente y no la que sería

la mejor decisión para el bien común. En este caso concreto, ambas partes no

pueden cambiar su decisión individual sin empeorar; de esta forma, cada jugador

ejecuta el mejor movimiento que pueda dados los movimientos de los demás

jugadores. Siendo por excelencia el juego de la cooperación.

Equilibrio de Nash

Es cuando los jugadores optan por la decisión que mejor los beneficia dadas las

estrategias del resto; busca la ganancia de todos los participantes, por medio de un

punto de estabilidad en la que ninguna de las partes obtiene un beneficio si mueve

sus posiciones.

Es decir, un "equilibrio de Nash" es una situación en la que todos los jugadores

ponen en práctica una estrategia que maximiza sus ganancias individuales, dadas

las estrategias de los otros. Como consecuencia ningún jugador tiene incentivos

para modificar individualmente su estrategia. En el "equilibrio de Nash" se logra el

Fuente: http://www.eumed.net/cursecon/juegos/presos.htm

7

mejor resultado individualmente para cada jugador, pero no el mejor resultado para

todos en su conjunto. Es posible que el resultado fuera mejor para todos los

jugadores si éstos coordinaran su actuación.

Aplicado a la economía, el "equilibrio de Nash" es un tipo de equilibrio de

competencia imperfecta que describe la situación de varias empresas compitiendo

por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar

maximizas sus ganancias.

Los equilibrios Nash se pueden utilizar para predecir el resultado de juegos finitos,

siempre que exista tal equilibrio. Sin embargo, nos encontramos con el problema

que surge cuando se trata de un equilibrio de Nash que no es ni social ni ético, y

donde la eficiencia puede ser subjetiva.

La Tragedia de los Comunes

La Tragedia de los comunes es un dilema escrito por Garret Hardín en 1968 para

la revista Science. Hardín se centra en dar respuesta al dilema del uso óptimo de

los bienes públicos bajo condiciones como la indefinición de derechos de propiedad,

la gratuidad y libre explotación de los bienes.

La Tragedia de los comunes parte de la premisa de que si los individuos buscan

maximizar su beneficio de forma individual usarán constantemente ciertos bienes o

recursos naturales (pastizales, ríos, bosques, etc.) hasta que estos se agoten. Este

comportamiento no considera el bienestar colectivo y menos la conservación del

ambiente en el largo plazo.

Cuenta la historia de un grupo de pastores que utilizaban una misma zona de

pastos. Un pastor pensó que podía añadir una oveja más a las que pacían en los

pastos comunes, ya que el impacto de un solo animal apenas afectaría a la

capacidad de recuperación del suelo. Los demás pastores pensaron también,

individualmente, que podían ganar una oveja más sin que los pastos se

deteriorasen. Pero la suma del deterioro imperceptible causado por cada animal

arruinó los pastos, y tanto los animales como los pastores murieron de hambre.

8

Recompensa

Es un premio, una compensación o la remuneración que se da a alguien por algún

servicio, por haber realizado una tarea o como reconocimiento de un mérito. Es un

incentivo que se ofrece a alguien o a un público en general para que colabore en

una acción o hecho. Es decir, es un reforzador positivo a una acción que se ha

hecho.

Castigo

Es una sanción, una pena o una reprimenda que se impone a una persona o

personas que han incurrido en algún tipo de falta, que ha quebrado alguna norma.

Por lo general, buscan funcionar como correctivo. Tiene como objetivo disminuir la

frecuencia de conductas negativas o des adaptativas.

Bien común

Se refiere en general al bien de todos los miembros de una comunidad y también al

interés público. Se puede definir como el fin general o como los objetivos y valores

en común, para cuya realización las personas se unen en una comunidad. Puede

tratarse de un objeto material o inmaterial cuya posesión o disfrute es necesario

para todos, como puede ser el aire o el calor del Sol, o puede referirse a un fin que

trascienda a la mejora de uno o de pocos, para beneficiar a todos, o a parte

importante de los seres humanos.

4.2 Objetivo(s)

Objetivo general:

Analizar cómo se puede mejorar el índice de cumplimiento de metas de una

empresa a través de la Teoría de Juegos, enfocada en la cooperación.

9

Objetivos específicos:

Desarrollar un modelo, teniendo como base la Teoría de juegos, de casos de

cooperación que ayuden a encontrar acciones para la eficiencia del trabajo

en equipo.

Identificar si la recompensa o el castigo es el mejor recurso para motivar a

un grupo de personas.

Justificar la importancia de considerar los bienes comunes dentro de la

misión y visión de una empresa, para el crecimiento de la misma.

4.3 Problema

Los problemas que se abordarán serán: ¿cuál es la mejor manera de motivar a los

participantes de un proyecto en una empresa? ¿Cómo influye la consideración del

bien común en una empresa? ¿De qué forma influye la cooperación en una empresa

para llegar a metas establecidas?

4.4 Hipótesis

La recompensa es el mejor recurso para motivar el progreso de un proyecto

cualquiera dentro de una empresa.

La consideración del bien común influye en la visión y misión de una empresa ya

que su compromiso con la sociedad debe tomarse en cuenta.

Es más útil buscar una estrategia que mejora las ganancias individuales, tomando

en consideración las estrategias del resto; que solo tomar en consideración una

mejora individual, lo cual no sería la mejor decisión para el bien común.

5 Desarrollo

Tomando como base el dilema del prisionero y juego de bienes comunes, se

moldeará el siguiente juego, el cual presenta cuatro modalidades:

10

Juego estándar.

Juego con castigo.

Juego con recompensa.

Juego con recompensa y castigo.

Juego estándar

- Hay cuatro jugadores y un coordinador (el experimentador).

- A cada jugador se le dan 50 monedas.

- Se realizan 10 rondas.

- En cada ronda los jugadores deben decidir aportar 0, 2 o 4 monedas al “fondo

común”.

- El equipo gana si después de las 10 rondas el fondo común tiene por lo

menos 80 monedas (suponiendo que en promedio cada persona da dos

monedas cada ronda).

- Si el equipo gana el jugador recibiría lo que ha quedado en su “cuenta

privada” (que inicialmente es de 50 monedas).

- Si el equipo pierde implica que todos pierden todo el dinero.

Para entender las siguientes tres modalidades primero explicaremos lo que en el

juego significan los términos de castigo y recompensa.

- Castigo: paga una moneda para que el castigado pierda cuatro.

- Recompensa: pagar una moneda para que la persona recompensada reciba

tres.

Las siguientes modalidades tienen las mismas reglas que la modalidad estándar,

solo se aplican las siguientes variantes:

Juego con castigo

11

Después de cada ronda los jugadores pueden decidir castigar a otro jugador (los

jugadores lo deciden simultáneamente y después se dice abiertamente). Un jugador

puede castigar a varios jugadores (no hay límite) en la misma ronda (por cada

castigo pagará una moneda), pero no puede pagar un “doble castigo” (pagar dos

monedas para quitarle ocho monedas a otro jugador). Tampoco se puede

autocastigar.

Juego con recompensa:

Luego de cada ronda los jugadores pueden decidir recompensar a otro jugador (los

jugadores lo deciden simultáneamente y después se dice abiertamente). Un jugador

puede recompensar a varios jugadores (no hay límite) en la misma ronda (por cada

recompensa para una moneda), pero no puede pagar una “doble recompensa”

(pagar dos monedas para que le den seis monedas a otro jugador). Tampoco se

puede auto recompensar.

Juego con recompensa y castigo

Después de cada ronda los jugadores pueden decidir recompensar o castigar a otro

jugador (los jugadores lo deciden simultáneamente y después se dice

abiertamente). Se puede castigar y recompensar a cuantos jugadores se quiera,

pero no se puede dar doble castigo, ni doble recompensa, y tampoco se puede ni

autocastigar ni auto recompensar.

Justificación de los juegos.

La modalidad estándar es un modelo que está planificado para observar el

comportamiento “normal” de las personas al momento de cooperar. El “fondo

común” representa los objetivos que las personas comparten.

12

Pensemos por un momento que nos encontramos en una situación parecida, en la

que el resultado depende de un grupo de personas. Es del conocimiento de todos

que si no se logra la meta nadie tendrá una recompensa al final, por lo que el

comportamiento inicial debe ser cooperando. Sin embargo, las diez rondas no son

simples repeticiones; son para que los jugadores experimenten con sus monedas,

es decir, si un jugador decide no aportar monedas al fondo los otros jugadores

pensarán que deben poner más monedas de su parte para suplir esa falta y así

lograr el objetivo. Siguiendo esa cadena de acciones, el desertor pensaría “no

importa si yo no aporto monedas, los demás lo compensarán”. Un comportamiento

egoísta que lo llevará a que al final tenga más monedas en su fondo personal.

Siguiendo aún más esta serie de eventos los demás jugadores pensarán lo mismo

y empezarán a desertar. Lo que posiblemente termine en la tragedia de los

comunes.

Aplicado a empresas representaría, por ejemplo, cumplir con ciertas metas o tareas

específicas logrando mejorar su reputación y aporte dentro de la empresa para un

proyecto en común. Por lo cual pueden surgir desacuerdos e inconformidades sobre

lo que los demás aportan o no, llegando incluso a perder el objetivo en común con

tal de actuar con un sentido de justicia.

La elección del monto a cooperar en cada ronda representa, cualitativa y

cuantitativamente, lo que aportas para que el proyecto salga adelante, siendo el

proyecto un nuevo producto, mejoramiento del sistema de producción, branding,

marketing, entre otros.

La cantidad que se fija para ganar (80 monedas) es para que, en promedio, los

jugadores aporten dos monedas cada uno, en cada una de las diez rondas. Dar cero

monedas es el equivalente a no trabajar en equipo, es decir, no dar ningún esfuerzo

para el logro del objetivo. Aportar dos monedas representa un comportamiento

cooperativo, en el que la persona realiza lo necesario para ganar. Y dar cuatro

monedas es un comportamiento altruista.

13

26.5

Con las modalidades 2 (con castigo) y la 3 (con recompensa) se busca analizar las

diferencias en los resultados. Agregando una variable, por lo que se podrá medir

directamente el impacto de ésta.

Estas variantes surgen para observar la necesidad de reacción de los participantes

a las de los otros jugadores. Es decir, el “uso ideal” del castigo sería aplicárselo a

las personas que no están cooperando para el fondo común. Y la recompensa

debería darse a los jugadores que realicen una buena aportación al monto.

Finalmente, la modalidad 4 (recompensa y castigo), es un modelo más cercano a la

realidad. En la que se permite que los participantes interactúen dinámicamente.

Reaccionando a castigos y recompensas.

6 Resultados y Análisis e interpretación de resultados.

Se realizó una muestra de 64 personas, divididos en grupos de cuatro personas.

Por lo que cada modalidad del juego se llevó a cabo cuatro veces.

Al final de cada juego (modalidad con los grupos de 4 integrantes) se anotó las

monedas con las que terminaron en su fondo personal.

Se hicieron cuatro veces la modalidad estándar, con un total de 16 jugadores.

Se calculó la media aritmética de las monedas finales (de fondos personales) de

las 6 personas.

El resultado es

Se graficaron las monedas finales de los jugadores de la modalidad estándar.

14

Además se calcularon la desviación estándar de la variable independiente

(monedas).

Se obtuvo:

.

En el diagrama de dispersión se puede observar la agrupación de los datos.

Análogamente, se realizó la metodología para las otras modalidades.

MODALIDAD CON CASTIGO

Se obtiene:

0

5

10

15

20

25

30

35

0 2 4 6 8 10 12 14 16 18

Monedas

Jugador

Diagrama de dispersión-Juego estándar

𝑥− = 26.5

3.041381265

11.54864034

19.5625

15

Realizando el diagrama de dispersión podemos observar la agrupación de los datos.

Cabe mencionar que los valores de x=0 es debido a que las personas no lograron

el objetivo del fondo común (tener 80 monedas mínimo).

MODALIDAD RECOMPENSA

0

5

10

15

20

25

30

35

0 2 4 6 8 10 12 14 16 18

Monedas

Jugador

Diagrama de dispersión-Juego con castigo

𝑥− = 19.5625

32.125

4.498263554

16

En esta modalidad es donde se encontró que el promedio de monedas finales es el

mayor. Cumpliendo el objetivo. Y además la desviación estándar es pequeña, lo

que indica que no se alejan demasiado los datos de la media.

MODALIDAD DE RECOMPENSA Y CASTIGO

Como se puede observar, la desviación estándar es grande. Lo que indica que las

monedas finales no fueron muy regulares, se puede encontrar valores bajos y altos.

Esto se puede observar mejor en el siguiente diagrama de dispersión:

0

5

10

15

20

25

30

35

40

45

0 2 4 6 8 10 12 14 16 18

Monedas

Jugador

Juego con recompensa

𝑥− = 32.125

20

13.43037602

17

La mayor desviación estándar se localiza en la modalidad de Recompensa y

Castigo. Cumpliendo las expectativas, puesto que es la dinámica más cercana a la

vida real, teniendo valores altos y bajos, y reaccionando a recompensas y castigos.

La modalidad estándar presenta el menor valor para esta medida estadística; de

nuevo, cumpliendo las expectativas, puesto que la dinámica es relativamente

simple, únicamente escogiendo cuánto cooperar pero no teniendo un impacto muy

directo sobre los otros participantes.

Cabe mencionar, que la mayor media aritmética se encuentra en la modalidad de

Recompensa, y la menor la encontramos en la modalidad Castigo.

Tomando como base estos resultados se puede encontrar la relación existente entre

la modalidad y los resultados (monedas finales).

Para esto se realiza un nuevo diagrama de dispersión.

En el eje x, se definen los siguientes valores:

1.- modalidad de castigo

2.- modalidad de recompensa y castigo.

3.- modalidad estándar.

0

5

10

15

20

25

30

35

40

45

0 2 4 6 8 10 12 14 16 18

Monedas

Jugador

Diagrama de dispersiónJuego de Recompensa y Castigo

𝑥− = 20

18

4.- modalidad con recompensa.

En el eje y se asignaron los valores respectivos de la media aritmética de las

modalidades.

Se realizó el cálculo del coeficiente de correlación. Se obtiene:

r=9.57

Lo que indica que hay una relación lineal positiva casi perfecta entre la modalidad

y las monedas finales.

Con esto, se puede afirmar que la modalidad de Recompensa es la más eficiente

en nuestro sistema de juego, y la modalidad de Castigo es la que peores resultados

presentó, tanto individuales como colectivos.

0

5

10

15

20

25

30

35

0 1 2 3 4 5

Pro

medio

(m

onedas fin

ale

s)

Modalidad de juego

Correlación Modalidad-Monedas

19

7 Conclusiones

Gracias a la teoría de juego se pudo comprobar que la recompensa tiene mejores

efectos en trabajos colectivos que el castigo.

Con los resultados que pueden ser llevados a mayores escalas, se puede aplicar

en sistemas cooperativos que permitan tener mejor rendimiento, y lograr objetivos

más altos.

Con base en el análisis de la tragedia de los comunes se puede concluir que el bien

común es de importancia, debido a que repercute en el progreso y futuro de una

empresa, además de su sustentabilidad a futuro.

Por último es importante recalcar que en la sociedad la cooperación es el mejor

camino para obtener mejores resultados, por lo que al momento de tomar decisiones

no se debe sólo considerar la mejor opción personal sino la que sea mejor para

todos.

8 Fuentes de información

- Nowak, M. (2012). Súper cooperadores. Barcelona, España: Ediciones B

- Tinsa. (2012). Teoría de los juegos y su importante aplicación empresarial.

Febreo 20, 2018, de Tinsa Sitio web:

https://www.tinsa.es/blog/economia/aplicacion-empresarial-de-la-teoria-de-

los-juegos/

- Eumed. (Sin especificar). Introducción a la Teoría de Juegos. Dilema del

prisionero. Febrero 20, 2018, de Eumed.net. Sitio web:

http://www.eumed.net/cursecon/juegos/presos.htm

- Stokel, C. (2015). ¿Qué es exactamente la Teoría de juegos? Febrero 20,

2018, de BBC Mundo. Sitio web:

http://www.bbc.com/mundo/noticias/2015/02/150220_teoria_de_juegos_que

_es_finde_dv

20

- Martínez, S. (2014). Dilemas económicos: La Tragedia de los Comunes.

Febrero 20, 2018, de Letras Libres. Sitio web:

http://www.letraslibres.com/mexico-espana/dilemas-economicos-la-tragedia-

los-comunes