MATEMÁTICAS CIENCIAS SOCIALES -...

14
1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA ----------------------------------------------------------------------------------------------------------------------------------------------------- - 1 - 1.- TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística : Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros como la media, la moda, la mediana, la desviación típica, etc Población : Es el conjunto formado por todos los elementos que queremos estudiar. Por ejemplo, si vamos a estudiar el peso de los jóvenes de 17 años nacidos en España, la población sería precisamente el conjunto formado dichos jóvenes Muestra : Es una parte de la población que elegimos para estudiarla. Se tomará una muestra cuando la población sea muy numerosa. La muestra debe ser representativa de la población. El número de elementos de la muestra se llama tamaño de la muestra y cada elemento se llama individuo. El proceso de elección de la muestra se llama muestreo. En el ejemplo del peso de los jóvenes mencionado anteriormente, elegiríamos una muestra formada por sólo algunos jóvenes, por ejemplo, 1000 jóvenes (tamaño 1000). Para que la muestra fuese representativa de la población habría que tomar hombres y mujeres y de todas las comunidades autónomas. Si queremos estudiar el peso de los alumnos de esta clase no es necesario tomar una muestra: tomaríamos toda la población pues hay “pocos” alumnos. Variable estadística : Es la característica que queremos estudiar de la población. En el ejemplo anterior, la variable estadística es el peso Tipos de variables estadísticas : Las variables estadísticas se clasifican en: Cualitativas : Si los valores que toma son cualidades. Por ejemplo, programa de TV favorito, color del pelo, etc. Cuantitativas : Si los valores que toma son numéricos. Por ejemplo, nº de hermanos, estatura, peso, edad, etc. Las variables estadísticas cuantitativas se clasifican en: - Cuantitativas discretas : Cuando sólo puede tomar valores aislados. Por ejemplo, nº de hermanos, edad, etc. - Cuantitativas continuas : Cuando entre dos valores, aunque estén muy próximos entre sí, siempre se puede tomar otro valor. Por ejemplo, la temperatura, el peso, etc. TABLAS DE FRECUENCIAS : Sirven para organizar y analizar los datos. Ejemplo : Estas son las edades de un grupo de alumnos: 14 , 15 , 13 , 13 , 14 15 , 15 , 18 , 14 , 13 15 , 13 , 14 , 15 , 16 14 , 15 , 13 , 13 , 15 Valores de la variable (x i ) : Son los valores que aparecen en los datos. Se escriben ordenados de menor a mayor. Frecuencia absoluta (f i ) : Es el número de veces que se repite cada valor en los datos. La suma de las frecuencias absolutas es igual al nº total de datos “ n ” Frecuencia absoluta acumulada (F i ) : Se calcula sumando uno a uno los valores de la columna f i . F i representa el número de datos que hay menores o iguales al valor x i correspondiente. Frecuencia relativa (h i ) : Se calcula dividiendo cada valor f i entre el nº total de datos, n. h i = f n i La frecuencia relativa se suele expresar en forma de % y nos indica el % de datos que hay iguales al valor x i correspondiente. La suma de las frecuencias relativas es siempre igual al 100% Frecuencia relativa acumulada (H i ) : Se calcula sumando uno a uno los valores de la columna h i . La frecuencia relativa acumulada se suele expresar en forma de % y nos indica el % de datos que hay menores o iguales al valor x i correspondiente. Análisis de los datos : Por ejemplo, con 15 años hay 7 alumnos; con 14 años o menos, hay 11 alumnos; con 13 años, hay un 30% ; con 16 años o menos hay un 95%. x i f i F i h i H i 13 6 6 30% 30% 14 5 11 25% 55% 15 7 18 35% 90% 16 1 19 5% 95% 18 1 20 5% 100% Suma total 20 = n - 100%

Transcript of MATEMÁTICAS CIENCIAS SOCIALES -...

Page 1: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 1 -

1.- TABLAS Y GRÁFICOS ESTADÍSTICOSEstadística : Es la ciencia que estudia conjuntos de datos obtenidos de la realidad.Estos datos son interpretados mediante tablas, gráficas y otros parámetros como la media, la moda, la mediana, ladesviación típica, etc

Población : Es el conjunto formado por todos los elementos que queremos estudiar.Por ejemplo, si vamos a estudiar el peso de los jóvenes de 17 años nacidos en España, la población seríaprecisamente el conjunto formado dichos jóvenes

Muestra : Es una parte de la población que elegimos para estudiarla. Se tomará una muestra cuando la poblaciónsea muy numerosa. La muestra debe ser representativa de la población.El número de elementos de la muestra se llama tamaño de la muestra y cada elemento se llama individuo.El proceso de elección de la muestra se llama muestreo.En el ejemplo del peso de los jóvenes mencionado anteriormente, elegiríamos una muestra formada por sóloalgunos jóvenes, por ejemplo, 1000 jóvenes (tamaño 1000).Para que la muestra fuese representativa de la población habría que tomar hombres y mujeres y de todas lascomunidades autónomas. Si queremos estudiar el peso de los alumnos de esta clase no es necesario tomar unamuestra: tomaríamos toda la población pues hay “pocos” alumnos.

Variable estadística: Es la característica que queremos estudiar de la población.En el ejemplo anterior, la variable estadística es el peso

Tipos de variables estadísticas: Las variables estadísticas se clasifican en:Cualitativas: Si los valores que toma son cualidades. Por ejemplo, programa de TV favorito, color del pelo, etc.

Cuantitativas: Si los valores que toma son numéricos. Por ejemplo, nº de hermanos, estatura, peso, edad, etc.Las variables estadísticas cuantitativas se clasifican en:- Cuantitativas discretas: Cuando sólo puede tomar valores aislados. Por ejemplo, nº de hermanos, edad, etc.- Cuantitativas continuas: Cuando entre dos valores, aunque estén muy próximos entre sí, siempre se puede tomarotro valor. Por ejemplo, la temperatura, el peso, etc.

TABLAS DE FRECUENCIAS: Sirven para organizar y analizar los datos.

Ejemplo: Estas son las edades de un grupo de alumnos:14 , 15 , 13 , 13 , 14 15 , 15 , 18 , 14 , 13 15 , 13 , 14 , 15 , 16 14 , 15 , 13 , 13 , 15

Valores de la variable (xi): Son los valores que aparecen en losdatos. Se escriben ordenados de menor a mayor.

Frecuencia absoluta (fi) : Es el número de veces que se repite cadavalor en los datos. La suma de las frecuencias absolutas es igual alnº total de datos “ n ”

Frecuencia absoluta acumulada (Fi) : Se calcula sumando uno a uno los valores de la columna fi.Fi representa el número de datos que hay menores o iguales al valor xi correspondiente.

Frecuencia relativa (hi) : Se calcula dividiendo cada valor fi entre el nº total de datos, n. hi = fni

La frecuencia relativa se suele expresar en forma de % y nos indica el % de datos que hay iguales al valor x icorrespondiente. La suma de las frecuencias relativas es siempre igual al 100%

Frecuencia relativa acumulada (Hi) : Se calcula sumando uno a uno los valores de la columna hi.La frecuencia relativa acumulada se suele expresar en forma de % y nos indica el % de datos que haymenores o iguales al valor xi correspondiente.

Análisis de los datos: Por ejemplo, con 15 años hay 7 alumnos; con 14 años o menos, hay 11 alumnos;con 13 años, hay un 30% ; con 16 años o menos hay un 95%.

xi fi Fi hi Hi13 6 6 30% 30%14 5 11 25% 55%15 7 18 35% 90%16 1 19 5% 95%18 1 20 5% 100%

Suma total 20 = n - 100%

Page 2: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 2 -

En el caso de que haya muchos valores distintos, los agrupamos en intervalos, llamados clases

Ejemplo: Las notas en la asignatura de inglés de un grupo de alumnos han sido:3,1 ; 7 ; 2 ; 5,6 ; 6,1 7,3 ; 4,7 ; 5,2 ; 7,1 ; 3 2,8 ; 2,9 ; 4,1 ; 4,9 ; 7,8 6,4 ; 6,2 ; 5,2 ; 5,4 ; 5,3.

Nota máxima = 7,8 , Nota mínima = 2 Tomamos, por ejemplo, intervalos de amplitud 1, empezando por 2

Clases fi Fi hi Hi[2,3) 3 3 0,15 = 15% 0,15 = 15%[3,4) 2 5 0,1 = 10% 0,25 = 25%[4,5) 3 8 0,15 = 15% 0,4 = 40%[5,6) 5 13 0,25 = 25% 0,65 = 65%[6,7) 3 16 0,15 = 15% 0,8 = 80%[7,8) 4 20 0,2 = 20% 1 = 100%Total 20 = n - 1 = 100%

GRÁFICOS ESTADÍSTICOS: Los datos obtenidos en un estudio estadístico los podemos representar condiferentes gráficos. Los gráficos nos ayudan a analizar los datos a simple vista. Podemos hacer gráficos paracualquiera de las frecuencias.

Diagrama de barras: Se representan los valores xi en un eje horizontal y para cada valor xi se dibuja una barracuya altura sea la frecuencia de xi que se quiera representar.

Las barras deben ser de la misma anchura y debemos dibujarlas separadas.

Uniendo los extremos superiores de las barras por su punto medio, se obtiene una línea quebrada llamadapolígono de frecuenciasEl diagrama de barras se suele utilizar para variables discretas con “pocos” valores o para variables cualitativas

Ejemplo: Vamos a representar el diagrama de barras para las frecuencias absolutas de los datoscorrespondientes al número de hijos de 50 matrimonios

Histograma: Es similar al diagrama de barras, sólo que la base de cada barra es el intervalo de la tabla defrecuencias y por tanto no hay espacios entre las barras.

Uniendo los extremos superiores de las barras por su punto medio, se obtiene la línea quebrada llamadapolígono de frecuencias. Los histogramas se utilizan cuando los datos los agrupamos en intervalos.Ejemplo: Notas de 20 alumnos en un examen:

7,6 ; 4,3 ; 2 ; 5,1 ; 6; 3,5 ; 7,7 ; 4 ; 5,7 ; 2,5 ; 5,3 ; 6,4 ; 2,8 ; 7,2 ; 3,2 ; 6,8 ; 7 ; 5 ; 5,4 ; 4,8

xi fi0 41 92 123 104 85 46 27 1

Total 50 = n

Page 3: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 3 -

Diagrama de sectores: Para dibujar el diagrama de sectores se dibuja un círculo y se divide en tantos sectores(quesitos) como valores haya en los datos. El ángulo de cada sector debe ser proporcional a la frecuenciarelativa de cada valor. El diagrama de sectores se suele utilizar para variables discretas con “pocos” valores opara variables cualitativasEjemplo: En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 9 juegan al fútbol y elresto no practica ningún deporte

ACTIVIDADES

1 En un pueblo de 2000 habitantes hay personas de pelo negro, rubio o castaño.Averigua cuántas personas hay de pelo negro, rubio y castaño sabiendo que se ha tomado una muestraeligiendo proporcionalmente 28 de pelo negro, 32 de pelo rubio y 20 de pelo castaño.

2 La siguiente grafica da la cantidad de pares de zapatos de mujer vendidos en una tienda a lo largo del día.

05

101520253035

36 37 38 39 40

Nº de zapato

Nº d

e pa

res

vend

idos

Pasa esta información a una tabla de frecuencias y a un diagrama de sectores

Actividades del libro obligatorias (unidad 11)

Deporte fi hi (en %) Ángulo del sector

Baloncesto 12 40 40% de 360º = 144ºNatación 3 10 10% de 360º = 36º

Fútbol 9 30 30% de 360º = 108ºNinguno 6 20 20% de 360º = 72º

Total 30 100% 360º

Page 4: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 4 -

2.- MEDIDAS ESTADÍSTICASLA MEDIA ARITMÉTICA ( x ): Es la suma de todos los datos dividida entre el número total de datos, n.

Se calcula por la fórmula i ix .fxn ( significa suma)

Si los datos están agrupados en intervalos, se toma como xi el punto medio del intervalo, llamado marca declase.Ejemplos:

Notas en un examen de un grupo de amigos 59x 5,910

Gasto mensual en teléfono móvil de un grupo de jóvenes 239x 11,9520

La media ponderada: Se calcula cuando los datos tienen distinto peso o importancia.

Se puede hallar con la fórmula: i i

i

x pM.P.p

, donde pi representa el peso de cada valor xi

Ejemplo: Tres exámenes tienen distinto peso, el primero vale 1, el segundo 2, y el tercero 3.Un alumno obtiene calificaciones de 9, 4 y 8, respectivamente. ¿Qué nota le debe poner el profesor?La nota debe ser una media ponderada. Se multiplica cada nota por su peso y se divide entre la suma de los

pesos. Media ponderada: 9.1 4.2 8.3 41 6,81 2 3 6

. Luego le debe poner un 6,8

LA MODA (MO): Es el valor que más se repite en los datos. Se calcula tomando el valor que tiene mayorfrecuencia absoluta. Si los datos están agrupados en intervalos se toma el intervalo de mayor frecuencia(intervalo o clase modal). Puede haber más de una moda o puede que no haya moda porque todos los valorestengan la misma frecuencia absoluta.Ejemplos:1) Temperaturas mínimas, en ºC, en una ciudad La moda es –1 ºC

xi fi xifi4 1 45 2 106 4 247 3 21

Total n = 10 59

Clases xi fi xifi[10,11) 10,5 4 42[11,12) 11,5 6 69[12,13) 12,5 7 87,5[13,14) 13,5 3 40,5

Total n = 20 239

Temperaturas Número de días–3 6–1 100 92 5

Page 5: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 5 -

2)Pulsaciones por minuto de un grupo de atletas después de una carrera

El intervalo modal es [86,90)

3) Equipo de fútbol preferido Hay dos modas, Madrid y Barcelona.

4) Número de calzado de un grupo de personas No hay moda

LOS CUARTILES (Qi): Cuando los datos están ordenados de menor a mayor, los cuartiles son tres valoresQ

1 , Q

2 , Q

3 que dividen los datos en 4 partes iguales

- El primer cuartil, Q1, es el primer valor xi cuya Hi supera el 25%

- El segundo cuartil o MEDIANA, Me = Q2, es el primer valor xi cuya Hi supera el 50%

- El tercer cuartil, Q3, es el primer valor xi cuya Hi supera el 75%

Si los datos estuviesen agrupados en intervalos se toma como xi la marca de clase

Rango intercuartílico: Es la diferencia entre Q3 y Q

1 : RI: Q

3– Q

1

Ejemplo: Notas de 20 alumnos Q1 = 4,5 Q

2 = Me = 5,5 Q

3 = 6,5 ; RI = 6,5 – 4,5 = 2

Cuando hay “pocos” datos:- Si el nº de datos es impar , la Mediana Me es el dato central- Si el nº de datos es par , la Mediana Me es la media aritmética de los 2 datos centrales

Ejemplos:1) Edades de 9 personas: 15 , 12 , 17 , 15 , 14 , 14 , 17 , 15 , 15Ordenando los datos: 12, 14, 14, 15, 15, 15, 15, 17, 17 → Me = 15

2) Notas de 12 alumnos: 7 , 4 , 6 , 5 , 7 , 7 , 8 , 5 , 8 , 4 , 4 , 5Ordenando los datos: 4, 4, 4, 5, 5, 5, 6, 7, 7, 7, 8, 8 → Me = 5,5

Los cuartiles se suelen representar en un diagrama, llamado DIAGRAMA DE CAJAPara dibujar el diagrama de caja, se calculan los valores mínimo y máximo de x

iasí como los cuartiles.

Después se dibuja una caja, cuyos extremos son Q1 y Q

3, que indica donde se concentran el 50% de los datos

y una línea central que marca la mediana.

Pulsaciones Número de atletas[70,74) 3[74,78) 3[78,82) 7[82,86) 10[86,90) 12[90,94) 8

Equipo Número de personasMadrid 12

Granada 7Barcelona 12

Málaga 6Número Número de personas

38 639 640 642 6

clases xi Hi

[2,3) 2,5 15[3,4) 3,5 25[4,5) 4,5 40[5,6) 5,5 65[6,7) 6,5 80[7,8) 7,5 100

Page 6: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 6 -

Esta representación nos permite saber qué datos son atípicos y si la distribución de datos es simétricarespecto de la mediana. Si la caja está desplazada hacía la izquierda o hacía la derecha respecto de la medianasignifica que la distribución de datos es asimétrica.

Ejemplos:

Número de hijos de 50 matrimonios: Mínimo = 0 Máximo = 7 Q1 = 1 Q

2 = Me = 3 Q

3= 4

Notas en Inglés de 20 alumnos: Mín. = 2 Máx. = 8 Q1 = 4,5 Q

2 = Me = 5,5 Q

3 = 6,5

Los percentiles: Cuando los datos están ordenados de menor a mayor, los percentiles son 99 valoresP

1, P

2, … P

99 que dividen a los datos en 100 partes iguales.

Por ejemplo, P1 es el primer valor x

i cuya H

i supera el 1%, P

2 es el primer valor x

icuya H

i supera el 2%, etc.

Observa:P

25es el primer valor x

i cuya H

i supera el 25%. Luego P

25 = Q

1P

50es el primer valor x

icuya H

i supera el 50%. Luego P

50 = Q

2 = Me

P75

es el primer valor xi cuya H

i supera el 75%. Luego P

75 = Q

3Los deciles: Cuando los datos están ordenados de menor a mayor, los deciles son 9 valores D

1, D

2, … D

9 que

dividen a los datos en 10 partes iguales.Por ejemplo, D

1 es el primer valor x

i cuya H

i supera el 10%, D

2 es el primer valor x

i cuya H

i supera el 20%, etc.

Observa que D5

es el primer valor xi cuya H

i supera el 50%. Luego D

5 = Q

2 = Me

Si los datos estuviesen agrupados en intervalos se toma como xila marca de clase

Los deciles y percentiles sólo se pueden calcular para variables cuantitativas

RANGO O RECORRIDO : Es la diferencia entre el mayor y el menor valor de xi

VARIANZA (S2) y DESVIACIÓN TÍPICA (s): La varianza se calcula por la fórmula2

2 2i ix .fs xn o la fórmula

22 i i(x x) .fs

n y la desviación típica es la raíz cuadrada de la varianza: 2s s

Se puede demostrar que:

En el intervalo ( x – s , x + s) se encuentra, aproximadamente el 68% de todos los datos

En el intervalo ( x – 2s , x + 2s) se encuentra, aproximadamente el 95% de todos los datos

En el intervalo ( x – 3s , x + 3s) se encuentra, aproximadamente el 99% de todos los datos

Cuánto mayor es la desviación típica más dispersos están los datos respecto a la media.

COEFICIENTE DE VARIACIÓN (C.V.): Se calcula por la fórmula sC.V.x

Nos permite comparar la dispersión de dos o más grupos de datos.Si los datos estuviesen agrupados en intervalos tomaremos como xi la marca de clase

Page 7: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 7 -

Ejemplo:Se han agrupado los hoteles de una región por el número de habitaciones, obteniéndose la siguiente tabla:

Rango: 500 – 0 = 500 52 000x 260200

2 216 700 000s 260 15 900200

s 15 900 126,0952 126,0952C.V. 0,485

260

Si la variable estadística es cualitativa, sólo se puede calcular la moda, pues xi no son números.

ACTIVIDADES

1 En las pruebas de acceso a una Universidad la calificación final se obtiene haciendo la media ponderada dela nota de Bachillerato y la de la prueba de Selectividad.La nota de Bachillerato tiene un peso del 60% y la de Selectividad un 40%.

¿Estaría aprobado un alumno que tiene de nota de Bachillerato 5,66 y un 4,01 en la Selectividad?

2 En este gráfico se muestran las calificaciones de un grupo de alumnos

Calificaciones109876543210

Fre

cuen

cia

5

4

3

2

1

0

a) Indica cuál es la modaa) Dibuja el diagrama de caja e indica si la distribución de datos es simétricab) Calcula el percentil 60 y el decil 8c) Halla el coeficiente de variaciónd) Determina si en este caso se cumple que en el intervalo (x – s , x + s) se encuentra el 68% de los alumnos

3 El siguiente diagrama de caja representa las marcas obtenidas por 20 saltadores d longitud

a) Indica cuál es la mediana y el primer cuartilb) ¿Cuántos saltadores tienen marcas por encima de 7,85 m?c) Es simétrica la distribución de los datos? d) ¿Cuál es el rango de la distribución de datos?

Habitaciones número de hoteles0 – 100 20

100 – 200 50200 – 300 60300 – 400 30400 – 500 40

clases xi fi xi fi 2i ix f

[0,100) 50 20 1 000 50 000[100,200) 150 50 7 500 1 125 000[200,300) 250 60 15 000 3 750 000[300,400) 350 30 10 500 3 675 000[400,500) 450 40 18 000 8 100 000

Total n = 200 52 000 16 700 000

Page 8: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 8 -

4 El volumen de ventas anuales de las empresas de telefonía en un país se reparte de la siguiente manera:Dentro de la telefonía móvil la media fue de 6,61 millones de euros y la varianza de 86,5.En el caso de la telefonía fija la media fue 7,2 millones de euros y la varianza de 117,79.a) Usando los coeficientes de variación explica en cuál de estos dos sectores de telefonía están más dispersaslas ventasb) Una empresa tiene un volumen de ventas anuales de 7,51 millones de euros en telefonía móvil y 8,41millones de euros en telefonía fija. ¿En cual de los dos sectores está mejor situado comparándolo con la mediadel país?

Actividades del libro obligatorias (unidad 11)

Page 9: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 9 -

3.- DISTRIBUCIONES BIDIMENSIONALES

Distribución bidimensional: Cuando se quieren estudiar dos características X e Y de una misma población, losdatos que se obtienen son parejas de valores (x

i, y

i). El conjunto de datos (x

i,y

i) se llama distribución

bidimensional.

Diagrama de dispersión o nube de puntos: Es la representación grafica de los puntos (xi, y

i)

Ejemplo: Notas de 12 alumnos en Matemáticas y FísicaAlumno a b c d e f g h i j k l

Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10Física 1 3 2 4 4 4 6 4 6 7 9 10

Interpretación del diagrama de dispersión: Si la nube de puntos se concentra en torno a una línea se dice quehay correlación entre las dos variables.Se dice que hay correlación lineal si la nube de puntos se concentra en torno a una recta.La correlación será positiva o directa si la línea es creciente y negativa o inversa si es decreciente y será masfuerte cuanto mayor sea la concentración de los puntos entorno a esa línea.

Ejemplos:

Correlación lineal directa fuerte Correlación directa débil Correlación inversafuerte

Correlación lineal inversadébil

Si los puntos están esparcidos sin concentrarse en torno a ninguna línea, se dice que no hay relación entre lasvariables o que la correlación es nula.

Correlación nula

ACTIVIDAD

1 En los siguientes casos dibuja el diagrama de dispersión e indica el tipo de correlación que hay entre X e Y.a) Se ha realizado una encuesta preguntando por el número de personas que habitan en el hogar familiar y elnúmero de dormitorios que tiene la casa. La tabla siguiente recoge la información obtenida:

X = número de personas 3 5 4 6 4Y = número de dormitorios 2 3 4 4 3

Page 10: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 10 -

b) El número de gérmenes por cm3 en un enfermo que se está curando viene dado por la tablaX = horas 0 1 2 3 4Y = número de gérmenes 80 60 50 40 20

c) El numero de libros vendidos en una librería y la temperatura del díaX = temperatura (ºC) 20 21 22 23 24 25Y = número de libros 10 70 50 20 90 10

4.- MEDIDAS ESTADÍSTICAS BIDIMENSIONALESDada (X , Y) una variable bidimensional con n datos (x

i,y

i). Se definen las siguientes medidas:

Medias aritméticas de X y de Y: i ix .fxn i iy .fy

n , Centro de gravedad de la distribución: (x , y)

Varianza y desviación típica de X y de Y:

22 2i i

x

2x x

x .fvar ianza: s x

n

Desviación típica: s s

22 2i i

y

2y y

y .fvar ianza: s y

n

Desviación típica: s s

Covarianza entre X e Y : i i ixy

x y fs x y

nTambién se puede usar la fórmula

(x x)(y y)i isxy n

Coeficiente de correlación lineal de Pearson: xy

x y

sr

s s

Propiedades del coeficiente de correlación

1) El coeficiente de correlación, r, tiene el mismo signo que la covarianza y nos sirve para medir el grado derelación o dependencia entre las variables X e Y

2) -1 r 1 3) Si | r | = 1 , la nube de puntos se ajusta perfectamente a una recta

4) Si r es positivo, la correlación es positiva y si r es negativo, la correlación es negativa

5) Cuanto más próximo esté r al 0 más débil es la correlación

6) Cuánto más próximo esté | r | al 1, más fuerte es la correlación

Interpretación de la correlación según el valor del coeficiente de correlación

Tablas de doble entrada: Cuando las datos (xi,y

i) se repiten se suele utilizar una tabla de doble entrada para

evitar escribir la misma pareja varias veces.Ejemplo: A un grupo de padres se les ha preguntado por el número de hijos que tienen y el número de horasque ven diariamente la televisión. Los resultados se han recogido en la siguiente tabla de doble entrada:X = número de hijos, Y = número de horas que ven la televisión.

XY 0 1 2

0 2 1 01 3 4 12 0 5 3

Por ejemplo, la pareja de valores (1,1) aparece 4 veces lo que significa que hay 4 padres que tienen 1 hijo yven la televisión 1 hora.

Page 11: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 11 -

ACTIVIDADES1 Se ha representado el diagrama de dispersión correspondiente a la nota en un examen y las horas deestudio de un grupo de jóvenes

Indica cuál de estos valores es más apropiado para el coeficiente de correlación: 0,92; –0,44; –0,92; 0,44

2 A un grupo de padres se le ha preguntado por el número de hijos que tienen y el número de horas que vendiariamente la televisión. Los resultados se han recogido en la siguiente tabla de doble entrada:

X = número de hijos, Y = número de horas que ven la televisión.XY 0 1 2

0 2 1 01 3 4 12 0 5 3

Calcula el coeficiente de correlación e interprétalo

Actividades del libro obligatorias (unidad 12)

Page 12: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 12 -

5.- RECTAS DE REGRESIÓNSon las rectas que mejor se ajustan a la nube de puntos de forma que la nube de puntos está muyconcentrada en torno a ellas

Recta de regresión de Y sobre X

xyyx 2

x

sr : y y (x x)

s

xy2

x

s

ses la pendiente de la recta y se llama coeficiente de regresión de Y sobre X

Recta de regresión de X sobre Y

xyxy 2

y

sr : x x (y y)

sxy2

y

s

sse llama coeficiente de regresión de X sobre Y

Propiedades de las rectas de regresión

- Las dos rectas se cortan en el centro de gravedad (x , y)- Cuánto más fuerte es la correlación menor es el ángulo que forman entre sí ambas rectas.

Ejemplos:

Correlación débil Correlación fuerte

La recta de regresión de Y sobre X se puede usar para estimar lo que vale “y” para un valor dado de “x”.La estimación es más fiable cuanto más fuerte sea la correlación entre las variables y cuanto más cerca esté elvalor “x” de los valores “x

i” de la distribución.

Page 13: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 13 -

ACTIVIDADES

1 La media de las estaturas X de los habitantes de una ciudad es 170 cm y la media de sus pesos Y es 65 kg.Las desviaciones típicas son 10 cm y 5 kg, respectivamente, y la covarianza de ambas variables es 40.

a) Halla el coeficiente de correlación

b) Calcula la recta de regresión de Y respecto de X y de X respecto de Y

c) Estima el peso de un individuo de 180 cm de estatura. ¿Será buena la estimación? Razónalo

d) Estima el la estatura de un individuo de 60 kg de peso. ¿Será buena la estimación? Razónalo

e) Si quisiéramos estimar el peso de un niño de 50 cm mediante la recta de regresión ¿sería buena lapredicción?

2 Se ha preguntado en seis familias por el número de hijos y el número medio de días que suelen ir al cinecada mes y las rectas de regresión obtenidas han sido

En vista de las rectas de regresión explica si la correlación entre las variables es fuerte o débil

Actividades del libro obligatorias (unidad 12)

Page 14: MATEMÁTICAS CIENCIAS SOCIALES - luisgarrido.weebly.comluisgarrido.weebly.com/uploads/3/7/9/2/3792563/apuntes_estadistica... · 1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES

1º BACHILLERATO – MATEMÁTICAS CIENCIAS SOCIALES – TEMA 5.- ESTADÍSTICA DESCRIPTIVA-----------------------------------------------------------------------------------------------------------------------------------------------------

- 14 -