Esta Di Stica

50
Fuente: http://descargas.pntic.mec.es/cedec/mat3/contenidos/u11/M3_U11_contenidos/1_conceptos_ bsicos.html ESTADISTICA 1. Conceptos básicos Una gran parte de las estadísticas se basan en el estudio de datos referentes a nosotros; como la edad, estatura, peso, sexo, color del pelo, población de residencia, número de hermanos, etc. Recogemos este tipo de información y obtenemos distintos datos numéricos o gráficos, que nos hacen comprender mejor las características del conjunto de las personas que estudiamos. ESTADISTICA Podemos definir la Estadística como la ciencia que tiene como objetivo reunir información que; tras ser organizada, analizada e interpretada; facilita la toma de decisiones futuras. La Estadística se divide en dos partes: Estadística descriptiva: es la parte que se encarga de recoger, organizar, expresar gráficamente y resumir los datos que se han recogido. En ella construiremos tablas de frecuencias, agrupando los datos. También representaremos gráficamente estos datos y calcularemos parámetros que nos indicarán claramente cómo se han distribuido los datos recogidos. Estadística inferencial o inferencia estadística: es la parte que estudia regularidades en los datos recogidos para elaborar conclusiones futuras, permitiendo una toma de decisiones más efectiva. La bondad de esas deducciones se mide de forma probabilística. Es decir, estudiaremos cuál es la probabilidad de acertar eligiendo una opción u otra. También se pretende estudiar si se puede generalizar el estudio hecho de unos datos a toda la población. Es lo que se hace cuando se realiza una estadística de predicción de votos antes de unas elecciones.

description

educación

Transcript of Esta Di Stica

Page 1: Esta Di Stica

Fuente:

http://descargas.pntic.mec.es/cedec/mat3/contenidos/u11/M3_U11_contenidos/1_conceptos_

bsicos.html

ESTADISTICA

1. Conceptos básicos

Una gran parte de las estadísticas se basan en el estudio de datos referentes a nosotros; como la edad, estatura, peso, sexo, color del pelo, población de residencia, número de hermanos, etc. Recogemos este tipo de información y obtenemos distintos datos numéricos o gráficos, que nos hacen comprender mejor las características del conjunto de las personas que estudiamos.

ESTADISTICA

Podemos definir la Estadística como la ciencia que tiene como objetivo reunir información que; tras ser organizada, analizada e interpretada; facilita la toma de decisiones futuras.

La Estadística se divide en dos partes:

Estadística descriptiva: es la parte que se encarga de recoger, organizar, expresar gráficamente y resumir los datos que se han recogido. En ella construiremos tablas de frecuencias, agrupando los datos. También representaremos gráficamente estos datos y calcularemos parámetros que nos indicarán claramente cómo se han distribuido los datos recogidos.

Estadística inferencial o inferencia estadística: es la parte que estudia regularidades en los datos recogidos para elaborar conclusiones futuras, permitiendo una toma de decisiones más efectiva. La bondad de esas deducciones se mide de forma probabilística. Es decir, estudiaremos cuál es la probabilidad de acertar eligiendo una opción u otra. También se pretende estudiar si se puede generalizar el estudio hecho de unos datos a toda la población. Es lo que se hace cuando se realiza una estadística de predicción de votos antes de unas elecciones.

Page 2: Esta Di Stica

1. Población y muestra

Veamos ahora los conceptos básicos de estadística.

Población: es el conjunto de elementos que son objeto

de estudio estadístico.

Individuo: cada uno de los elementos de la población. El

número total de individuos de la población se suele

representar por la letra N.

Aunque tengan estos nombres, esos elementos pueden referirse a cualquier cosa y no solo a personas. Por ejemplo, podemos estudiar los televisores que se montan en una determinada fábrica, la cantidad de vehículos que se desplazan por carretera un fin de semana de agosto, o los programas de televisión más vistos en una determinada franja horaria. Cada televisor, vehículo o programa televisivo sería un individuo de ese estudio.

A veces, es necesario estudiar a todos los individuos de la población. En este caso se trata de un estudio exhaustivo. Por ejemplo, cuando se realiza el censo de población de una determinada ciudad. En general, es muy costoso, en tiempo y dinero; entrevistar a todos los elementos objeto del estudio. Por ello, se selecciona solo una parte y en este caso se dice que se trata de un estudio muestral.

Page 3: Esta Di Stica

Muestra: es una parte de la población con la que realmente se realiza el estudio.

Tamaño: es el número de elementos del que se compone la muestra y se suele representar por la letra n.

La elección de la muestra es muy importante para que los resultados que se extraigan de ella se puedan generalizar a toda la población. Debe haber pocos individuos, para que no sea muy costosa su realización, pero elegidos de forma que aparezcan todos los estratos diferentes que forman la población. Por ejemplo, si quisiéramos saber los gustos culinarios de la juventud actual; no bastaría preguntar a las puertas de una pizzería, pues hay una parte de jóvenes que prefieren otro tipo de comidas y no visitan este tipo de establecimientos. Si lo hiciéramos, la muestra seleccionada no sería representativa de toda la población a estudiar.

Page 4: Esta Di Stica

1.2 Tipos de datos

Conceptos estadísticos básicos relacionados con el tipo de datos que se estudian.

Se llama variable estadística o carácter a

cada una de las características que pueden estudiarse de la población.

Las variables estadísticas pueden ser de dos tipos:

Cualitativas: son aquellas en la que los resultados

posibles no son valores numéricos. Por ejemplo:

color del pelo, tipo de ropa preferida, lugar de

veraneo, etc.

Cuantitativas: aquellas cuyo resultado es un

número. A su vez, las hay de dos tipos:

o Cuantitativas discretas: cuando se toman

valores aislados. Por ejemplo: número de

amigos, número de veces que vas al cine al

mes, número de coches que tiene tu familia.

o Cuantitativas continuas: cuando, entre dos

valores cualesquiera, puede haber valores

intermedios. Es decir, se toman todos los valores de un determinado intervalo. Por ejemplo: peso de las personas, nivel sobre

el mar en que se encuentra tu ciudad, medida del perímetro torácico.

Page 5: Esta Di Stica

2. Organizando los datos

Una vez que conoces los conceptos básicos de estadística, vamos a empezar a trabajar con ellos. Imagínate que has realizado una encuesta a pie de calle y has recogido multitud de datos de las personas que has entrevistado. ¿Qué puedes hacer ahora con ellos?

Si has preguntado sobre el estado civil; hay pocos resultados posibles: la persona puede ser soltera, casada, divorciada, viuda o formar una pareja de hecho. Si has recogido por ejemplo 120 datos, está claro que se repetirán muchas veces cada uno de ellos; por lo que lo mejor es agruparlos para poder estudiarlos mejor.

2.1 Agrupando los datos

¿Te gusta la música?, ¿posees muchos CD/DVDs en tu casa? Aún en el caso de que no sea sí, piensa en una musipedia. Hay multitud de CDs y DVDs y, para poder tenerlos organizados de forma que sean fácilmente accesibles; deben estar ordenados. Una de las primeras formas de ordenarlos es agruparlos por los que son del mismo género. Algo parecido a lo que se hace con los CDs y DVDs es lo que vamos a hacer nosotros con los datos recogidos en una encuesta o por cualquier otro medio.

Lo que veremos en este apartado y el siguiente valdrá para las variables cualitativas y las cuantitativas discretas. En el punto siguiente sabremos qué pasa con las variables cuantitativas continuas.

Page 6: Esta Di Stica

TABLAS DE DISTRIBUCION DE FRECUENCIAS

Se llama tabla de frecuencias a una tabla en la que se

relacionan los distintos resultados de la variable con la

cantidad de veces que han aparecido dichos resultados.

Un ejemplo es la siguiente en la que se recogen el

número de DVDs/CDs de música de una musipedia.

Tipo de música

xi

Nº de CD/DVDs

fi

Clásica 200

Pop 500

Jazz 60

Dance 50

Rock and roll 120

Los conceptos que vamos a reflejar en las tablas van a tener una representación que es necesario que conozcas. Ya hemos definido en la parte anterior qué se entiende por variable estadística: lo que estudiamos de la población. Vamos a representar la variable que se está estudiando por la letra x. Si suponemos ordenados de alguna manera los posibles valores de esa variable, llamaremos x1al primer valor, x2 al segundo y así sucesivamente. En general, la columna donde vamos a colocar esos resultados la encabezaremos por el símbolo xi para indicar que están todos los valores; cada uno con su subíndice u orden correspondiente.

Importante

Page 7: Esta Di Stica

Se llama frecuencia absoluta al número de veces que

aparece un determinado resultado de la variable

estadística entre todos los datos que se han recogido.

Vamos a representarla genéricamente por la letra fi.

Si hemos entrevistado a 600 personas, de las

cuales 250 han sido hombres y el resto mujeres, la

frecuencia absoluta del resultado Hombres sería 250 y

del resultado Mujeres sería 350.

En la siguiente tabla de frecuencias se han recogido los

datos sobre el color de pelo de 50 personas y se han

agrupado según su frecuencia absoluta. Como puedes

apreciar, lo único que hay que hacer es anotar los

resultados posibles y al lado la cantidad de veces que se

han recogido esos resultados.

Color del pelo

xi

Nº de personas

fi

Castaño 10

Moreno 20

Pelirrojo 15

Rubio 5

El número total de elementos recogidos, que debe

coincidir con la suma de todas las frecuencias absolutas,

suele representarse por la letra N.

Page 8: Esta Di Stica

Ejercicio

En un I.E.S. se está realizando un estudio sobre las faltas

de asistencia de 40 alumnos de bachillerato a la primera

hora de clase en el último mes. El objetivo es conocer el

grado de ausentismo a primera hora de clase. Se han

elegido aleatoriamente 40 alumnos de bachillerato y se

han obtenido los siguientes datos:

3, 1, 2, 0, 1, 0, 3, 0, 0, 1, 4, 2, 1, 0, 0, 0, 1, 1, 2, 0, 0,

0, 1, 0, 1, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 1, 0, 2

E

sos datos se han agrupado en la siguiente tabla de frecuencias.

Rellena los huecos correspondientes.

xi fi

0

1

2

3

4

Page 9: Esta Di Stica

Ahora imagínate que te comentan que en el grado 3º-1 de primaria hay 12 niñas y en la clase de 3º-2 de primaria hay 15 niñas.

A simple vista, parece que en la segunda clase la representación femenina es mayor. Sin embargo, si te dicen que la primera clase tiene en total 20 alumnos mientras que la segunda tiene 30, la deducción ya no parece correcta.

Esto es importante a la hora de compartir resultados obtenidos por un mismo valor en distintos estudios, pues en ese caso es mejor comparar proporciones. Para ello necesitamos unos nuevos conceptos.

Importante

Se llama frecuencia relativa de un resultado al cociente entre su frecuencia absoluta y el número total de datos que se han recogido. Vamos a representarla por fr. En ese caso la

frecuencia relativa se calcularía como: fr=

El tanto por ciento de un resultado de la variable se halla multiplicando la frecuencia absoluta por 100 y dividiendo por el total o, directamente, multiplicando la frecuencia relativa por 100.

Aprende a hacerlo

Anota en tu cuaderno la tabla de la autoevaluación de la actividad anterior y añade una columna para la frecuencia relativa (encabezamiento fr) y otra para el tanto por ciento (encabezamiento %). La frecuencia relativa exprésala redondeada con dos decimales y el tanto por ciento sin

decimales.

Importante La suma de todas las frecuencias relativas debe dar uno y la suma de los % debe dar100. Pero, por problemas de redondeo,

Page 10: Esta Di Stica

a veces se desvían un poco de esos valores. Es lo que ocurre en la tabla de la autoevaluación anterior, en la que las frecuencias relativas suman 1,02 y el porcentaje 102%. No importa, pero acostúmbrate a repasar los cálculos por si en algún lugar no te has acordado de redondear correctamente.

La frecuencia relativa nos indica una proporción. Es decir; cuando hablamos de la frecuencia relativa de los rubios en un conjunto de personas, es el cociente entre el número de rubios

respecto del total.

2.2 Acumulando las frecuencias

Como hemos visto, las frecuencias que definimos pueden usarse con cualquier tipo de variable estadística. Pero hay algunas más, que complementan a las vistas, que solo se pueden utilizar cuando la variable estudiada es cuantitativa. Ello es así porque es necesario que la variable esté ordenada.

Por ejemplo, no tiene sentido preguntar quién tiene un color de pelo menor que moreno, pero sí tiene sentido preguntar cuántos alumnos han tenido menos de tres faltas a clase a primera hora. En este segundo caso, se considerarían juntos los que no han tenido ninguna falta con los que han tenido una falta y dos.

Esa idea de agrupamiento es la que vamos a trabajar con las frecuencias acumuladas.

Importante Frecuencia absoluta acumulada de un resultado: es la suma de todas las frecuencias absolutas de ese resultado y todos lo que están antes que él. Por ejemplo: si queremos saber cuántos alumnos hay en un instituto que sean menores de edad (es decir, que tengan menos de 18 años) tenemos que sumar las frecuencias absolutas de los que tienen 12, 13, 14, 15 , 16 y 17 años. La frecuencia acumulada

Page 11: Esta Di Stica

la vamos a representar por la misma letra que la normal pero en mayúscula. En nuestro caso usaremos la letra F.

Frecuencia relativa acumulada de un resultado: es la suma de las frecuencia relativa del resultado y de todos los anteriores. También puede obtenerse dividiendo la frecuencia absoluta acumulada entre el valor total de datos recogidos. La representamos por Fr

Tanto por ciento acumulado de un resultado: es la suma de todos los valores absolutos desde el primer resultado hasta el resultado elegido.

Ejercicio

En una tienda de telefonía móvil han hecho un estudio sobre el número de teléfonos móviles que tienen en su casa, para toda la familia, los clientes que han entrado a consultar en la tienda durante los cuatro últimos días. Con esos datos han creado la siguiente tabla de valores.

Nº de

teléfonos

por

familia

Nº de familias

con

esa cantidad

xi fi

2 12

3 16

4 8

5 3

6 1

N= 40

Debes completar la tabla añadiendo las columnas correspondientes a las frecuencias absolutas acumuladas (Fi), relativas (fr), relativas acumuladas (Fr), % y % acumulado.

Comprueba lo aprendido

Page 12: Esta Di Stica

A partir de la tabla anterior, contesta a las siguientes preguntas:

a) El número de hogares con 3 teléfonos es de .

b) El porcentaje de familias con 4 teléfonos es de un %.

c) La proporción de hogares con menos de 5 teléfonos es

de .

d) El número de hogares con 4 o más teléfonos es de .

e) % es el porcentaje de familias con menos de 4 teléfonos.

Taller

En la Casa de la Cultura de una determinada ciudad se proyectan

habitualmente películas de dibujos animados para niños y

adolescentes entre 8 y 16 años. Los responsables de la actividad

están interesados en saber cuál es la distribución de las edades de

los niños y niñas que suelen asistir a ellas. Para ello, han

preguntado a cada uno de los asistentes a una sesión su edad.

Estas han sido las respuestas:

8 10 9 12 11

10 11 8 9 14

12 8 10 10 15

13 13 12 11 16

10 11 9 8 10

10 12 15 13 14

Realiza las siguientes actividades:

Page 13: Esta Di Stica

Confecciona en tu cuaderno una tabla en la que indiques, para cada edad, el número de niños y niñas que han asistido a la película.

Elabora una tabla de frecuencias y calcula todas las frecuencias vistas, incluyendo las acumuladas.

2.3 Acumulando en continuo

Ya hemos visto cómo se agrupan los datos cuando se utilizan variables cualitativas y cuantitativas discretas. ¿Qué ocurre con las continuas.

La dificultad que tienen las variables continuas, al agrupar por frecuencias, lo puedes comprobar con el siguiente ejemplo:

Para las prácticas de laboratorio de los alumnos de bachillerato se van a encargar una serie de batas. Una tienda de la zona ofrece las batas de varias medidas distintas en cuanto al largo. Para poder pedir las que se necesitan, se decide hacer un estudio de las alturas de los alumnos de laboratorio. Una vez medidos los alumnos, se obtienen las siguientes estaturas (en centímetros):

183, 164, 159, 176, 173, 168, 154, 168, 162, 161, 172, 174, 178, 184, 160, 181, 165, 167, 163, 172, 178, 161, 158, 170, 179

Si pretendiéramos realizar una agrupación de los datos, como en el caso de las variables cuantitativas discretas, nos encontraríamos con que hay muchos valores distintos. En concreto, desde el menor valor (154) hasta el mayor (184), hay 30 valores distintos. Pero, además, muchos de ellos no aparecen ninguna vez, por ejemplo el 156 o el 175. Por tanto, tendrías una tabla muy grande y con bastantes valores de frecuencia nula.

En estos casos, para evitar ese problema, lo que se hace es agrupar los datos en intervalos semicerrados.

Page 14: Esta Di Stica

La forma de completar la tabla es la siguiente: se cuentan cuántos valores distintos hay entre el valor mayor y el menor (en este caso es 30) y se dividen proporcionalmente en el número de intervalos que queramos conseguir. Lo normal es que el número de intervalos no sea menor que cinco ni mayor que diez.

En este caso; si quisiéramos tener cinco intervalos, necesitaríamos que su amplitud fuese de 6 centímetros cada uno. Entonces construiríamos la siguiente tabla.

Estaturas en cm

Intervalos

fi Fi hi Hi % %acum.

[155,161) 4 4 0,16 0,16 16 16

[161,167) 6 10 0,24 0,40 24 40

[167,173) 6 16 0,24 0,64 24 64

[173,179) 5 21 0,20 0,84 20 84

[179,185) 4 25 0,16 1,00 16 100

N = 25

Lo primero es calcular la frecuencia absoluta. Para ello, sólo hay que tener en cuenta un detalle importante: los intervalos son cerrados por la izquierda y abiertos por la derecha. Esto quiere decir que si tienes un valor que corresponde con dónde termina un intervalo y empieza el siguiente, ese valor debes contarlo en el segundo intervalo y no en el primero. Esta es una norma que se sigue usualmente.

Lo que debe quedarte claro es que no puedes contarla en ambos intervalos o estarías duplicando los valores y te saldrían más valores de los que has recogido.

Una vez que tengas la frecuencia absoluta, el resto se calcula como lo hemos hecho con el otro tipo de variables. Sólo hay un concepto nuevo, que definimos a continuación.

Page 15: Esta Di Stica

Importante

Cuando la variable estadística es cuantitativa continua los valores se agrupan en intervalos. Todos los intervalos deben tener la misma amplitud; de forma que recojan todos los valores posibles, desde el menor al mayor. Cuando un dato es el que sirve de división para pasar de un intervalo al siguiente, sólo se contabiliza en el segundo intervalo.

Se llama marca de clase de un intervalo al valor medio del intervalo (se calcula sumando los extremos y dividiendo entre dos). Se suele considerar que los valores que están dentro del intervalo se distribuyen a un lado y otro de la marca. Equivale en total como si todos los valores del intervalo valiesen lo mismo que la marca de clase. Por eso, lo vamos a representar por x; ya que va a sustituir al valor de la variable como si fuese una variable cuantitativa discreta.

De esta manera, la tabla anterior; al añadir la columna correspondiente a las marcas de clase (columna xi); quedaría de la siguiente forma:

Estaturas en cm

Intervalos

xi fi Fi Fi Fr % %acum.

[155,161) 158 4 4 0,16 0,16 16 16

[161,167) 164 6 10 0,24 0,40 24 40

[167,173) 170 6 16 0,24 0,64 24 64

[173,179) 176 5 21 0,20 0,84 20 84

[179,185) 182 4 25 0,16 1,00 16 100

N = 25

Ejercicio

Page 16: Esta Di Stica

En mi barrio acaban de abrir una pequeña carnicería. El dueño, para saber cuántos kilogramos de carne debe traer, decide hacer un estudio para saber cuántos kilogramos de carne vende en el primer mes. Las cantidades, redondeadas a kilogramos, han sido las siguientes:

13, 25, 28, 31, 24, 46, 15, 20, 32, 19, 28, 18, 21, 31, 25, 29, 35, 18, 27, 33, 26, 35, 43, 20, 35, 28, 23

Construye una tabla de frecuencias que tenga 6intervalos de la misma amplitud, comenzando en el valor más pequeño que aparece. Escribe en la segunda columna la marca de clase. Completa la tabla con todas las frecuencias y %que hemos visto.

3. Gráficas

No exageramos si decimos que la estadística es una parte de las matemáticas omnipresente en nuestra vida. Las empresas, públicas y privadas, presentan sus campañas, su evolución y su estado actual a través de tablas de datos y gráficos. En la educación, se estudian los resultados obtenidos por el alumnado para saber si la evolución es positiva o no. En los medios de comunicación, a pesar de los llamativos titulares, mucha información se complementa y fundamenta a través de tablas numéricas y todo tipo de representaciones: en las elecciones, en la evolución de los accidentes de carretera, del precio de la bombona de butano, del rendimiento de un deportista... Y muchos más, como el que te mostramos en la imagen.

Page 17: Esta Di Stica

Animales en extinción en España. Imagen de José Alberto Bermúdez en el banco de imágenes del ITE Licencia Creative Commons by-nc-sa

Como en los medios de comunicación el tiempo y el espacio son muy importantes, cada vez es más usual que informaciones numéricas se ofrezcan mediante gráficos estadísticos. Esto se hace así por varias razones: ocupan menos espacio, atraen más la atención, comparan fácilmente elementos entre sí y permiten asimilar más información de un solo vistazo. Sin embargo, hay que ser muy críticos con las gráficas que aparecen en los medios, pues no es raro que tengan errores significativos e incluso que estén manipuladas para llevarnos a confusión. Esto es especialmente habitual en el caso de la publicidad.

En este apartado vamos a ver los gráficos más usuales que se suelen utilizar en la estadística, y que encontrarás en los medios de comunicación.

En muchas ocasiones, las matemáticas han avanzado gracias al esfuerzo de personas que no eran matemáticas profesionales. Sin embargo, utilizaron las matemáticas para resolver

Page 18: Esta Di Stica

problemas cotidianos con los que se encontraban. Una de esas personas fue la inglesa Florence Nightingale (1820,1910), quien está considerada como la creadora de la enfermería moderna y una de las primeras personas en utilizar los datos estadísticos para fundamentar sus ideas.

3.1 Con barras y sectores

Si vas a una librería y hojeas un libro ilustrado, ¿qué es lo primero en lo que te fijas?

Estamos seguros de que, igual que nosotros, primero te fijas en las fotos y las ilustraciones

que aparecen y, en el caso de que alguna te atraiga especialmente, después lees el pie de

foto o el texto que acompañe a la ilustración.

Esta atracción por las ilustraciones es la que hace que nos sea más fácil y atractivo ver

cualquier tipo de información numérica mediante un gráfico. En este apartado vamos a ver

los gráficos más usuales que puedes encontrarte.

El gráfico o diagrama de sectores está

formado por un círculo dividido en

sectores circulares, de forma que los

ángulos de cada sector sean

proporcionales a la frecuencia del

resultado representado.

Esta representación gráfica puede

utilizarse con cualquier tipo de variable.

A la hora de representar los resultados,

da igual que la frecuencia sea absoluta o

relativa o incluso que se trate del %.

Como el círculo completo es

proporcional al total y cada sector a una

parte, en todos los casos el gráfico sería el mismo.

Ejercicio

Vamos a construir el diagrama de sectores correspondiente a la siguiente distribución de

colores del pelo de 100 personas.

xi fi

Castaño 15

Diagrama de sectores. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Page 19: Esta Di Stica

Negro 59

Pelirrojo 4

Rubio 22

N= 100

Tarea

Queremos que realices un estudio sobre los colores favoritos de tus compañeros y

compañeras de la clase, para lo cual debes realizar las siguientes actividades:

1º) Tú y cada uno de los compañeros de tu clase deben decir cuál de los siguientes colores

les gustan más: amarillo, azul, verde y rojo.

2º) Realiza un recuento con los resultados anteriores.

3º) Elabora una tabla parecida a la de la actividad anterior de la distribución del color del

pelo. Crea el correspondiente diagrama de sectores.

Importante

El diagrama de barras es un gráfico

formado por unos ejes coordenados en

los que se representan, en el eje

horizontal, separados regularmente, los

distintos resultados de la variable y, en el

eje vertical, adecuadamente dividido, los

valores de la frecuencia correspondiente

a cada resultado. Sobre cada uno de los

resultados se eleva una barra, del mismo

grosor, cuya altura equivale a la

frecuencia que estemos representando.

El diagrama de barras se utiliza con las

variables cualitativas y las cuantitativas discretas. Para las variables continuas,

necesitaremos una variación que veremos más adelante.

Se llama polígono de frecuencias a la línea que une los extremos superiores de las barras.

Tarea

Diagrama de barras. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Page 20: Esta Di Stica

Tenemos una bolsa donde hay bolas de cinco colores diferentes: rojo, verde, azul, amarillo

y turquesa. Sacamos bolas, anotamos su color y volvemos a dejarlas en la bolsa.

Obtenemos el siguiente conjunto de valores:

Ro, Ve, Ve, Am, Tu, Ro, Am, Az, Tu, Ro, Ve, Tu, Am, Am, Am, Ve, Az, Ro, Az, Tu,

Az, Ro, Ro, Ve, Ve.

Construye la tabla de frecuencias absoluta y relativa y dibuja los diagramas de barras y

sectores correspondientes a esos datos.

A veces se representa el polígono de frecuencias sin representar el diagrama de barras. Esto

suele ser muy corriente en los medios de comunicación, en los cuales es usual ver gráficas

lineales a trozos que en realidad son polígonos de frecuencias. Observa, por ejemplo, el

siguiente gráfico en el que se recogen los nacimientos en una población desde el año 2005

al 2010.

Nacimientos. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Pensamos que uno de los objetivos primordiales de la educación es preparar a las personas para afrontar la vida social y laboral en que van a desenvolverse. Para que ello se haga de forma

Page 21: Esta Di Stica

óptima, las personas deben aprender a ser críticas con aquello a lo que se enfrentan. Es por ello que cualquier consumidor de medios de comunicación debe enfrentarse a la información que le llega con criterio y examinando la veracidad o no de la noticia.

Por ejemplo, en el siguiente gráfico de tránsitos de motos y de personas menores de 18 años por una avenida podemos observar como la amplitud de los sectores no se corresponden con los porcentajes (%) que representan. Como puedes comprobar, el sector de las motos se corresponde con porcentaje del 25%(ya que abarca un cuadrante) y no un 10%. El sector de los menores de 18 años representa una zona inferior al 50% (abarca menos que un semicírculo) y no un 60% como se indica en el diagrama.

Este tipo de errores son realizados a veces de forma imprevista y otras veces de forma intencionada. Así, por ejemplo, en publicidad es muy común realizar este tipo errores con el fin de llamar la atención sobre un determinado producto o servicio, haciendo por ejemplo que las barras de un diagrama no estén realizadas todas en la misma escala, De esta forma dos barras que deberían tener poca diferencia se presenten una mucho más alta que la otra.

En el diagrama de barras de la siguiente imagen puedes comprobar este tipo de errores. Observa las alturas y las frecuencias que representan las distintas barras.

Errores en diagramas de sectores. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Page 22: Esta Di Stica

Errores en diagramas de barras.

Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

3.2 Para lo continuo

En el apartado anterior hemos estudiado los diagramas estadísticos de barras y de sectores, que se emplean para la representación de variables cualitativas y cuantitativas discretas. Ahora vamos a ver cómo podemos representar gráficamente los datos asociados a una variable cuantitativa continua.

Page 23: Esta Di Stica

Importante

Histograma. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

El histograma es la representación típica para las variables estadísticas cuantitativas continuas. En este caso, en el eje de abscisas se distribuyen los extremos de los intervalos de forma adecuada. Sobre cada intervalo se eleva un rectángulo cuya superficie es igual a la frecuencia que corresponde a ese intervalo.

Como es usual dar la misma amplitud a cada intervalo, lo usual es hacer coincidir la altura

del rectángulo con la frecuencia representada.

En los histogramas también se puede dibujar el polígono de frecuencias, que es la línea poligonal que une los puntos medios superiores de los rectángulos.

Aprende a hacerlo

Estaturas en cm

Intervalos

fi

[155,161) 4

[161,167) 6

[167,173) 6

[173,179) 5

[179,185) 4

N = 25

Vamos a construir el histograma correspondiente a la distribución de las estaturas de los alumnos de bachillerato recogidas en la tabla.

Page 24: Esta Di Stica

Tarea

La siguiente tabla es la correspondiente a la actividad sobre la carnicería de tu barrio que realizaste en el apartado Acumulando en continuo. Recuerda que la columna de la frecuencia absoluta representa el número de días del mes en los que se ha comprado un número de kilogramos de carne

correspondiente a cada intervalo.

pesos en kg

Intervalos

fi

[13,20) 5

[20,27) 8

[27,34) 9

[34,41) 2

[41,48) 3

N = 25

Realiza el histograma correspondiente

4. Parámetros estadísticos

Ya hemos visto cómo se organizan los datos y cómo representarlos. Ahora vamos a estudiar cómo sacar información precisa sobre su distribución.

Como has podido comprobar, la estadística tiene una gran importancia en los medios de comunicación. Si sigues la información que nos llega a través de radio, prensa o televisión, seguramente habrá muchas personas famosas de las que habrás oído hablar aunque no se dediquen a parcelas sociales por las que tú tengas especial interés. Por ejemplo, aunque no seas una persona aficionada al fútbol, seguro que habrás oído hablar del fichaje del futbolista Cristiano Ronaldo . O aunque no

Page 25: Esta Di Stica

4.1 Centralización

Hay conceptos estadísticos que seguro que utilizas muy a menudo, aún sin darte cuenta. Si tienes tantos hermanos o hermanas mayores como menores, entonces tú eres el hermano mediano (o hermana mediana, según el caso). Si utilizas algo que está de actualidad, es porque estás a la moda, es decir, te

seas aficionado al cine, habrás oído hablar, quizás hasta la saciedad, de Penélope Cruz,. Y puede que no seas un adicto a la lectura, pero seguro que conoces algo sobre el personaje de Harry Potter. Estamos seguros de que has escuchado hablar de estos personajes reales o ficticios porque, aunque el ambiente en el que se desarrollan no te atraiga, son fenómenos mediáticos que inundan en determinados momentos todos los medios. Algo igual pasa con el personaje al que va dedicado el siguiente vídeo, al que nos gustaría que le echaras un vistazo.

Este proceso el que vamos a conocer en este apartado: cómo una gran cantidad de datos puede reducirse a un sólo valor que indicará información sobre ese conjunto de valores.

Imagina que eres una persona aficionada a la cocina y que has preparado un nuevo plato que presentas a tu familia. Quizás alguno de ellos, después de probarlo, exclame "este plato se merece un 9" o incluso un 10. Esa puntuación que se le da al plato puede depender de muchos factores: la originalidad, la textura, el sabor, la presentación, la cantidad, los productos y condimentos utilizados, etc. En este tema vamos a plantear algo similar. Vamos a buscar unos pocos valores que nos den información sobre la población que estamos estudiando.

Se llaman parámetros estadísticos a unos pocos valores que resumen las características fundamentales de una serie estadística de datos y se pueden clasificar en tres tipos: de centralización, dispersión y posición.

Page 26: Esta Di Stica

relacionas con lo que más gente usa en esos momentos. Si te gusta salir los fines de semana de marcha, seguro que unos días gastarás más que otros. Pero si quieres saber cuál es el gasto medio al mes deberás calcular la media estadística de los gastos de cada fin de semana. Estos tres conceptos tan elementales son los que vamos a desarrollar.

Los Parámetros de centralización son aquellos valores en torno a los cuales están agrupados los datos. Básicamente, son los valores centrales del conjunto de valores recogidos y representan, de forma global, a toda la población o la muestra.

Importante

Se define la moda como el valor que más se repite entre los datos de que disponemos. Sería el resultado de la variable con mayor frecuencia absoluta. Vamos a representarla por Mo.

La moda es el único parámetro estadístico que puede utilizarse con cualquier tipo de variable. En concreto, es el único parámetro que tiene sentido calcular en las variables cualitativas.

Tiene además la particularidad de ser el único que puede tomar más de un valor. Por ejemplo, si disponemos de 6 monedas de 1 €, 1 €, 2 €, 0,50 €, 0,50 € y 0,20 €; la moda correspondería a los valores 1 € y 0,50 €, ya que ambas se repiten dos veces.

Ejercicio En una pequeña empresa, trabajan siete empleados que, según el tiempo que llevan en la empresa y el trabajo que desarrollan, cobran distintos salarios. Los salarios mensuales de los empleados, en euros, son los siguientes: 805, 950, 950, 950, 1200,1200, 2100.

La moda de esos valores es de euros.

Page 27: Esta Di Stica

Ejercicio

En la siguiente tabla se recoge el color del pelo de un grupo

de 50 personas.

¿Cuál de las siguientes opciones es la moda del color del pelo?

a) Rubio

b) Moreno

c) Pelirrojo

Los restantes parámetros estadísticos se utilizan cuando la variable es cuantitativa.

Importante

Si suponemos que los datos están ordenados numéricamente de menor a mayor, la mediana es el valor que está en el centro, es decir, el valor que tiene por delante la mitad de los valores y

por detrás la otra mitad. La representaremos por Me.

Para su cálculo hay que distinguir si los datos están agrupados o no por intervalos. En el caso de que los datos estén agrupados por intervalos, la mediana coincide con el segundo cuartil, concepto que estudiaremos en el apartado correspondiente a los parámetros de posicionamiento.

Cuando los datos no están agrupados por intervalos, se procede de la siguiente forma para el cálculo de la Me:

Si el número de valores que tenemos es impar, la mediana será el que ocupe el valor central. Por ejemplo, si el número de personas que viven en los distintos pisos de un bloque de

Color del pelo

xi

Nº de personas

fi

Castaño 10

Moreno 20

Pelirrojo 15

Rubio 5

Page 28: Esta Di Stica

viviendas son: 2, 2, 2, 3, 4, 4, 5, 5, 6; la cantidad mediana de personas que viven en esos pisos sería de 4 personas.

Si el número de valores de los que disponemos fuese par, entonces la mediana es la semisuma de los dos valores centrales. Y no importa que obtengamos un valor decimal, aunque parezca no tener sentido en el contexto. Si en el ejemplo anterior hubiese una vivienda más con tres personas, entonces los valores centrales serían el 3 y el 4,

por lo tanto, la mediana sería

Ejercicio

Considera de nuevo el ejercicio de los sueldos de los empleados de la empresa. Estos eran: 805,950, 950, 950, 1200, 1200, 2100.

1. El sueldo que correspondería con la mediana sería euros.

2. Si consideramos también el sueldo del gerente, que cobra 2.500 euros, entonces la mediana de esos valores sería un

sueldo de euros.

Nos queda por ver el parámetro central por excelencia: la media. Desde que comenzamos a estudiar la secundaria, dominamos muy bien qué es la media y como se calcula. Piensa que las notas que nos han puesto en nuestras evaluaciones suelen haber sido calculadas utilizando ese parámetro.

Importante

La media es el valor promedio del conjunto de valores que estamos trabajando. Suele representarse por . Suele considerarse a la media como el centro de gravedad de la

Page 29: Esta Di Stica

distribución de valores y, como veremos, no tiene por qué estar exactamente en la mitad.

Se calcula sumando todos los valores obtenidos y dividiendo entre el número total de datos. Si los datos que tenemos son x1, x2, x3, ... hasta el valor xN, entonces la media vendría dada por la expresión.

La media equivale al valor que obtendríamos si reuniésemos todo el valor completo de la variable y lo repartiésemos a partes iguales entre todas las observaciones que hubiésemos hecho.

Aquí tienes un ejemplo. Si sumamos los sueldos de todos los empleados tendríamos 805+950+950+950+1200+1200+2100 = 8155 €. Si ahora calculamos la media, obtenemos:

Si supusiésemos que el sueldo de todos los empleados era igual, sería precisamente ese valor medio, ya que la suma de todos los sueldos valdría lo mismo: 805+950+950+950+1200+1200+2100 = 8155 = 1165 · 7.

Aprende a hacerlo

En una mediana empresa quieren realizar un estudio sobre el número de empleados que faltan al trabajo por encontrarse enfermos. Durante dos semanas van anotando la cantidad de personas que faltan, obteniendo los siguientes datos:

1, 0, 2, 1, 1, 5, 1, 0, 0, 3, 2, 1

Page 30: Esta Di Stica

Calcula el número medio de empleados que han faltado al

trabajo en esas dos semanas.

En la siguiente escena puedes realizar algunos ejercicios de cálculo de moda, mediana y media. Utiliza el botón "Comprobar" para ver si tienes bien hechos los cálculos. Cuando lo pulses, te dará opción a realizar otro ejercicio.

Los valores extremos de la distribución que hayamos tomado no suelen afectar a la mediana, pero si afectan a la media. Si hay algunos valores muy grandes, hacen aumentar la media; mientras que si hay valores muy pequeños respecto de los demás, hacen que la media disminuya. Por eso, la media no está a veces exactamente en el medio, como sí le pasa a la

mediana.

4.2 Con tablas

Ya sabes calcular los parámetros centrales de un conjunto de datos. Pero, ¿te servirá lo aprendido en todos los casos? Si quieres saber cuál es el gasto mensual medio que tienes de leche en tu casa, no hay mucha dificultad. Basta hallar la media de los litros de leche que habéis consumido durante los doce meses de un año. Pero si fueses el gerente de una cadena comercial con miles de empleados y quisieras saber cuál es la edad media de tus empleados, sería más complicado

Si recuerdas el ejemplo de los sueldos de apartado anterior, había tres empleados que cobraban 950 euros. A la hora de hallar la media, podíamos sumar tres veces ese valor o calcular 950·3. En el caso de tres no parece muy interesante, pero si se repitiera el mismo sueldo 231 sería distinto: no costaría igual tener que sumar 231 veces una misma cantidad en lugar de multiplicarla por 231. Por eso, cuando tenemos muchos datos, los cálculos de los parámetros se realizan a través de la tabla de frecuencia.

Page 31: Esta Di Stica

Importante

El cálculo de los parámetros de centralización a través de las tablas de frecuencia se realiza de la siguiente forma:

Mediana: como los valores están ordenados en la tabla de frecuencias, el procedimiento consiste en calcular la frecuencia absoluta acumulada. Se divide el número total de datos recogidos (N) entre dos. El primer valor cuya frecuencia absoluta acumulada supera a esa cantidad, es el valor mediano. Esto es debido a que si escribiésemos todos los valores ordenados uno detrás de otro, la frecuencia acumulada nos indicaría hasta qué lugares llegaban cada uno de los distintos valores.

Si la mitad de N coincide exactamente con el valor de la frecuencia acumulada de un valor, estaríamos como en el mismo caso del apartado anterior cuando teníamos un número par de valores. En ese caso, la mediana es la semisuma de ese valor y el siguiente.

Media: en lugar de sumar cada valor todas las veces que aparezca, multiplicamos el valor de la variable por la cantidad de veces que aparece (frecuencia absoluta). La suma de todos esos valores la dividimos entre el número total de valores recogidos. Se aplicaría la fórmula siguiente:

Si en lugar de valores de una variable discreta, tuviésemos valores de una variable continua, el proceso es muy similar. En este caso, en lugar de moda se habla de intervalo modaly, de momento, en lugar de mediana hablaremos de intervalo mediano.

Page 32: Esta Di Stica

Para hallar la media, únicamente hay que tener en cuenta que se toma como valor xi de la variable el de la marca de clase.

Aprende a hacerlo

En el estudio del número de televisores por familia de un barrio se ha recogido la información que se muestra en la tabla.

Calcula la moda, la mediana y la media de esos valores.

Comprueba lo aprendido

Una empresa envasadora de espárragos blancos quiere estudiar la posibilidad de lanzar al mercado envases de dos tamaños. Uno para productos más grandes, lógicamente de mayor precio, y otro para los elementos más pequeños. Para ello hace un estudio aleatorio del tamaño de espárragos que va envasando,

obteniendo los siguientes resultados:

Medida en cm.Intervalos Nº de espárragosfi

[7,9) 25

[9,11) 172

[11,13) 311

[13,15) 413

[15,17) 79

Completa la tabla con la frecuencia acumulada, la marca de clase y los valores xi·fi. Después, calcula los parámetros de centralización y contesta a las siguientes preguntas:

nº de televisores nº de hogares

0 6

1 30

2 28

3 21

4 9

5 6

Page 33: Esta Di Stica

a) El intervalo modal es [ , ).

b) El intervalo mediano es [ , ).

c) La media, redondeada a dos decimales, vale .

En la siguiente escena puedes realizar algunos ejercicios de cálculo de la media. Puedes practicar varios ejemplos, tanto para variables discretas como continuas. Utiliza el botón "Discreta/Continua" para seleccionar el tipo y pulsa el botón "Genera" para realizar otro ejercicio.

Hemos comentado que la mediana y la media no tienen sentido en las variables cualitativas. No obstante, a veces, para poder sacar esa información incluso en datos no numéricos, lo que se hace es codificar las respuestas. Por ejemplo, a veces te habrás encontrado encuestas en las que, al preguntarte sobre cuál es tu grado de satisfacción con un determinado servicio, te habrán pedido que elijas un número del 1 al 5 (el 1 significa nada satisfecho y el 5 muy satisfecho).

De esa forma se evalúan los datos numéricos correspondientes y se pueden hallar todos los parámetros.

Una vez que has llegado a este punto, suponemos que ya dominas los parámetros de centralización. Debes recordar siempre que esos parámetros representan valores alrededor de los cuales se agrupan los datos recogidos en el estudio estadístico. La moda es donde hay más, la mediana es el punto medio exacto de los datos y la media equivale al centro de gravedad de la distribución de valores. Pero, como es lógico, con esos valores no es suficiente para tener toda la información sobre los datos.

Por si no te ha quedado clara la dificultad de utilizar sólo los parámetros estadísticos centrales imagina un ejemplo. Hemos preguntado a 15 personas sobre las veces que se conectan al

Page 34: Esta Di Stica

día a Internet fuera de su trabajo y, tras estudiar las respuestas, nos ha salido una media de 3 veces al día, ¿es esa suficiente información? Posiblemente esa sola no nos sirva, ya que puede haber muchos casos. Por ejemplo, puede darse el caso de que prácticamente todos dediquen el mismo tiempo o que haya unos que dediquen muy poco tiempo y otros mucho.

Precisamente por esta dificultad es por lo que necesitaremos más parámetros estadísticos que vamos a desarrollar a continuación.

4.3 Dispersión

Ya hemos comentado que uno de los parámetros estadísticos fundamentales es la media. Se utiliza en multitud de ocasiones: muchos elementos se fijan en función de los valores medios que se realizan en estudios y todo parece depender de ella. Por eso no es de extrañar que los parámetros que vamos a ver en esta sección estén todos pendientes de la media. Así por ejemplo, si tenemos una caja de nectarinas, lo normal es que no todas tengan el mismo tamaño y es lógico que nos fijemos en si hay una gran variación entre ellas o son todas parecidas.

Se llaman parámetros de dispersión a una serie de valores que indican lo concentrados o separados están los datos entre sí y respecto a la media.

Importante

Se llama recorrido o amplitud del rango a la diferencia entre el valor más pequeño y el más grande que se ha recogido. Nos da una primera idea de si los datos están agrupados o están muy separados, al menos en lo que respecta a los valores menores y mayores.

Page 35: Esta Di Stica

Aprende a hacerlo

En el estudio del número de hijos por familia de un barrio se ha recogido la información que se muestra en la tabla. Determina el valor del recorrido o amplitud del rango. En otro estudio realizado sobre la estatura de los alumnos de una clase se ha obtenido como menor estatura 150 cm y como mayor 170 cm ¿Cuál es el recorrido o amplitud del rango de las estaturas?

Comprueba lo aprendido En el estudio del peso de distintas piezas de melocotones se ha obtenido un peso mínimo de 50 g y un máximo de 85 g. ¿Cuál es el recorrido o amplitud del rango de los pesos?

a) 50 g

b) 35 g

c) 85 g

En el estudio de las ciruelas de una determinada producción se han obtenido los datos del calibre en cm que aparecen en la tabla. El estudio se ha hecho a partir de una muestra de 140 piezas. ¿Cuál es el recorrido o amplitud de rango de los calibres de las piezas de ciruelas estudiadas?

a) 5,5 cm

nº de hijos

xi

nº de familias

fi

0 6

1 30

2 20

3 10

4 5

5 1

xi fi

[5,6) 30

[6,7) 50

[7,8) 40

[8,9) 20

Page 36: Esta Di Stica

b) 6 cm

c) 4 cm

Importante Se define la desviación típica a la raíz cuadrada de la media de los cuadrados de las diferencias de las medidas obtenidas con la media de los datos. Se representa mediante la letra griega σ (sigma minúscula). Dicho valor se puede obtener mediante cualquiera de las siguientes expresiones:

La segunda expresión es la que normalmente se suele utilizar ya que, si nos basamos en la tabla de frecuencias, basta añadir una nueva columna correspondiente a xi

2·fi y totalizarla.

La desviación típica nos da información sobre cómo se desvían los datos respecto a la media, de forma que cuanto mayor sea más alejados están los datos de ella.

Al cuadrado de la desviación típica se le llama varianza, varianza = σ2, que es otro parámetro de dispersión que también se suele utilizar en estadística.

Page 37: Esta Di Stica

Aprende a hacerlo

Vamos a retomar el ejercicio del número de hijos por familia del

barrio. Teníamos la tabla siguiente:

Vamos a calcular su media y su varianza.

En el siguiente enlace a un documento OpenOffice.calc puedes ver el cálculo de la media y de la desviación típica de la actividad anterior. Observa que hemos introducido dos nuevas funciones:

REDONDEAR(Número a redondear; nº de decimales): redondea un número con el número de cifras

decimales que se indique. Por ejemplo, REDONDEAR (5,456;2) redondeará el número 5,456 a dos cifras decimales y por tanto nos devolverá el valor 5,46.

RAÍZ (número), devuelve la raíz cuadrada del número que se especifique.

Mediante la siguiente tarea queremos que realices un estudio del número de animales que tienen en su casa distintas familias de tu entorno más cercano: tus propios familiares, amigos y algunos de tus compañeros. Para ello debes realizar las siguientes actividades:

1) Selecciona 12 personas que no vivan en la misma casa y pregúntales cuántos animales tienen en casa.

2) Recoge la información en una tabla de frecuencias creándola con OpenOffice.calc.

3) Añade a la tabla las columnas necesarias para poder calcular la media y la desviación típica.

4) Calcula, utilizando dos cifras decimales, la media y la desviación típica.

5) Representa en un diagrama de barras o de sectores la distribución del número de animales.

nº de hijos

xi

nº de familias

fi

0 6

1 30

2 20

3 10

4 5

5 1

Page 38: Esta Di Stica

6) Analiza los resultados obtenidos, indicando si existe o no una gran dispersión de los datos.

Una vez que hayamos terminado el proceso, guarda el archivo en tu carpeta personal y realiza una entrada en el blog. El titulo de la entrada estará formado por dos partes, la primera será la inicial de tu nombre y tu primer apellido y la segunda será animales.

Utiliza dicho documento para realizar una exposición a tus

compañeros y explicarles los resultados obtenidos del estudio.

4.4 Posición

¿Has estado alguna vez en un importante museo, en un concierto de un artista de éxito o en unos grandes almacenes a principio de mes? Seguro que recordarás las largas colas. Donde las colas de espera están bien organizadas, nosotros hemos encontrado indicaciones como estas: primero un letrero que indicaba "a partir de aquí 30 minutos de espera", unos metros más adelante otro de "desde aquí 15 minutos" y así sucesivamente. Es una forma de compartimentar la cantidad de personas que esperan y el tiempo que se tardará en llegar a la entrada o ventanilla. Algo similar hacen los parámetros que vamos a ver a continuación.

Se llaman parámetros de posición aquellos que dividen a los datos obtenidos en partes proporcionales, de forma que cada parte tenga el mismo número de elementos. Para poder hacerlo necesitamos que los datos estén ordenados de menor a mayor. Los hay de tres tipos: cuartiles, deciles y percentiles, aunque vamos a desarrollar solo los cuartiles.

Importante Se definen los cuartiles como los valores que dividen a la distribución de valores ordenados en cuatro partes iguales. Son los siguientes:

Q1: primer cuartil. Tiene el 25% de los datos detrás de él y el 75% delante.

Page 39: Esta Di Stica

Me: segundo cuartil .Coincide con la mediana. Tiene el 50% de los datos delante y el otro 50% detrás de él.

Q3: deja detrás de él el 75% de la distribución y delante el 25%.

Se define el recorrido intercuartílico a la diferencia entre el tercer y el primer cuartil. Dentro de este intervalo se encuentra el 50% de la distribución. Un estudio conjunto del recorrido y del recorrido intercuartílico nos da información sobre la dispersión de la muestra. Si el recorrido general es grande pero el intercuartílico pequeño, eso indica que hay valores extremos. Si ambos son grandes, los datos son dispersos. Si ambos son pequeños, los datos están muy agrupados respecto a los valores centrales.

Para calcular los cuartiles basta generalizar el cálculo de la

mediana que ya habíamos visto. Se halla y el primer valor cuya frecuencia absoluta acumulada supera ese valor es Q1.

Para Q3 debemos hallar y seleccionar aquel valor cuya frecuencia acumulada supera esa cantidad. Hay que recordar (como en la mediana) que si un valor tiene como frecuencia acumulada exactamente ese valor, se halla la media aritmética con el valor siguiente. Aprende a hacerlo

Veamos en primer lugar el cálculo de los cuartiles cuando los

datos no están agrupados en intervalos.

Para realizar un estudio sobre el gasto farmacéutico en la sanidad pública, le encargan a Mercedes que haga un estudio sobre el número de medicamentos por paciente que se receta en una determinada consulta a lo largo de una semana. Tras estudiar los datos, Mercedes obtiene la siguiente tabla.

nº de medicamentos (xi) 1 2 3 4 5 6 7 8 9 10

nº de pacientes (fi) 12 24 15 13 9 6 2 1 1 1

Page 40: Esta Di Stica

Calcula los cuartiles de esa distribución.

Ejemplo o ejercicio

resuelto

Considera la distribución del ejemplo de las medidas de los espárragos que estamos trabajando en este tema.

Medida en cm,intervalos Nº de espárragos fi

[7,9) 25

[9,11) 172

[11,13) 311

[13,15) 413

[15,17] 79

Halla los tres cuartiles de esa distribución.

Tarea

Te planteamos una tarea en la que queremos que realices el cálculo de los cuartiles de la actividad del número de hijos por familias del barrio.

Recuerda que la tabla de datos es:

Espárragos. Imagen del ITE en el banco de imágenes del ITE Licencia Creative Commons by-nc-sa

Page 41: Esta Di Stica

nº de hijos

xi

nº de familias

fi

0 6

1 30

2 20

3 10

4 5

5 1

Anota en tu cuaderno la tabla y todos los cálculos que has realizado.

Una vez que has calculado los cuartiles indica entre cuáles se sitúa tu familia.

5. Experimentos aleatorios.

En este apartado vamos a tratar las nociones básicas para el tratamiento del azar y que serán necesarios para tratar el siguiente tema, en el que estudiarás el concepto de probabilidad.

Page 42: Esta Di Stica

Azar. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Los comienzos del estudio matemático del azar podemos situarlo precisamente como consecuencia del estudio de los juegos de azar. Fueron el Caballero de Meré alrededor de 1651, a la vez que los matemáticos Fermat y Pascal, los que comenzaron con un estudio exhaustivo de este tipo de problemas.

Actualmente estos conceptos son aplicados prácticamente en todas las ciencias y en una gran variedad de situaciones de la vida real.

No podemos siempre determinar lo que va a suceder, pero si podemos realizar un estudio de los casos posibles que pueden darse y qué posibilidades tenemos de que ocurran cada uno de ellos.

Por ejemplo; si lanzamos un dado, sabemos que sólo hay seis posibilidades: 1,2,3,4,5 o 6 dependiendo del azar la puntuación obtenida.

Page 43: Esta Di Stica

5.1 Sucesos

Importante

Un experimento aleatorio es aquel en el que su resultado es imposible de predecir con seguridad por muy bien que conozcamos como se produce.

Cada vez que repetimos el experimento, decimos que es una prueba del mismo. A cada uno de los resultados de una sola prueba se le llama suceso elemental.

Serían ejemplos de experimentos aleatorios:

a) Lanzar una moneda al aire.

b) Elegir al azar un alumno de una clase y observar el color de su pelo.

c) Elegir a una persona al azar de una lista y ver cuál es su sexo.

d) Lanzar un dado con sus caras numeradas del 1 al 6 y observar que número sale.

e) Extraer una bola al azar de una bolsa con bolas de distinto color.

f) El número del gordo de la lotería nacional del próximo sorteo.

Importante

El espacio muestral de un experimento aleatorio es el conjunto formado por todos los resultados posibles (sucesos elementales) y se representa por la letra S.

Los subconjuntos del espacio muestral se llaman sucesos y se representan por letras mayúsculas A, B, C, D ...

Page 44: Esta Di Stica

Si un suceso está formado por varios sucesos elementales, decimos que es un suceso compuesto. Por ejemplo, si lanzamos un dado, un suceso elemental sería que saliera un 2 y lo representaríamos por ejemplo por A = {2}. Mientras, un suceso compuesto sería salir un número par y lo representaríamos por ejemplo por B = {2,4,6}.

Aprende a hacerlo Dado el experimento aleatorio consistente en lanzar un dado con sus caras numeradas del 1 al 6.

a) Determinar el espacio muestral. b) Indica un suceso que sea compuesto formado por dos sucesos elementales.

Aquí tienes otro tipo de experimento aleatorio basado en lazar monedas.

Aprende a hacerlo Sea el experimento aleatorio basado en lanzar una moneda dos

veces y llamemos c a salir cara y x a salir cruz.

a) Determinar el espacio muestral.

b) Indicar un suceso compuesto de dicho experimento aleatorio.

Dado. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Euros. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Page 45: Esta Di Stica

Comprueba lo aprendido

Dado el experimento aleatorio consistente en sacar una bola de una bolsa que contiene bolas blancas, negras y rojas; indica si son o no verdaderas las siguientes afirmaciones.

a) El suceso B={Blanca} es un suceso compuesto.

Verdadero Falso b) El suceso T={Blanca, Roja} es un suceso compuesto.

Verdadero Falso c) El suceso S={Negra} es un suceso elemental.

Verdadero Falso

Otros tipos de sucesos son:

Decimos que un suceso es seguro si siempre ocurre. El espacio muestral es en sí mismo un suceso seguro.

Decimos que un suceso es imposible si nunca puede suceder. Por ejemplo, en el experimento lanzar un dado con sus caras numeradas del 1 al 6, sería imposible el suceso consistente en que, al lanzarlo una vez, salga un 7.

Dos sucesos son incompatibles si no pueden suceder a la vez. Así, por ejemplo, si lanzamos una moneda, los sucesos salir cara y salir cruz son incompatibles.

Llamamos suceso contrario (opuesto) de un suceso A, al suceso que sucede cuando no sucede A. Se representa por, aunque también se puede representar mediante A' o Ac. Por ejemplo, el suceso contrario de sacar oro al extraer una carta de la baraja española, es el suceso salir basto, copa o espada. El suceso contrario de sacar cara al lanzar una moneda será salir cruz y lo expresaríamos como A = {cara} y = {cruz}.

Page 46: Esta Di Stica

5.2 Operaciones con sucesos

Importante

El espacio muestral E y los sucesos pueden ser representados en diagramas de Venn, como puedes observar en la siguiente imagen.

Espacio muestral y sucesos. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

En la imagen se representa el espacio muestral S = {1,2,3,4,5,6}, correspondiente al experimento aleatorio de lanzar un dado con sus caras numeradas del 1 al 6. Las zonas amarillas se corresponden a los sucesos A = {2,3} y B = {2,5}.

Ejemplo o ejercicio resuelto

Page 47: Esta Di Stica

Supongamos que hemos grabado en cada cara de un dado las letras a,b,c,d,e y f. Representa en tu cuaderno, mediante diagramas de Venn, el espacio muestral relativo al experimento aleatorio consistente en lanzar dicho dado. El suceso A consiste en salir una vocal y el suceso B consiste en salir las consonantes comprendidas en el alfabeto entre la a y la e.

Fíjate en el ejemplo de la imagen

anterior.

Importante

La unión de dos sucesos A y B es el suceso formado por los de A y B. Se representa por A U B. Por ejemplo, dado el suceso A = {2,3} y el suceso B = {2,5}, la unión será A U B = {2, 3,5}.

Unión de A y B. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

La intersección de dos sucesos A y B es el suceso formado por los sucesos comunes de A y B. Se representa por A ∩

Dado con letras. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Page 48: Esta Di Stica

B . Por ejemplo, dado el suceso A = {2,3} y el suceso B = {2,5}, la intersección será A ∩ B = {2}.

Intersección de A y B. Imagen de Arturo Mandly en Flickr Licencia Creative Commons by-nc-sa

Aprende a hacerlo

Consideremos el experimento aleatorio consistente en lanzar un dado con sus caras numeradas con los números 2,4,5,6,10 y 12. Sean los siguientes sucesos:

A, consistente en salir un número primo. B, consistente en salir un número múltiplo de 3. C, consistente en salir un número múltiplo de 5.

Resolver las siguientes cuestiones. Determina los sucesos A, B y C. Determina los sucesos A U B, A ∩ B, A U B U C,A ∩ C.

Page 49: Esta Di Stica

Comprueba lo aprendido

Consideremos el experimento aleatorio consistente en lanzar dos veces una misma moneda. Su espacio muestral es E = {cc,cx,xc,xx}. Consideremos los sucesos A = {cc,cx,xc}, B = {cc,xx} y C = {cx,xc}. Indica la opción correcta a las siguientes cuestiones.

¿Cuál es el suceso contrario del suceso A?

a) {xx}

b) {cx,xc}

c) {cc}

¿Cuál es el suceso A U B?

a) {cc,xx}

b) E = {cc,cx,xc,xx}

c) {cc,xx,cx}

¿Cuál es el suceso A ∩ B?

a) {cx,xx}

b) {xx}

Page 50: Esta Di Stica

c) {cc}

¿Cuál es el suceso B ∩ C?

a) {cc}

b) Ø

c) {xx}