Estadistica

12
ESTADISTICA ESTADISTICA 0 10 20 30 1 2 3 4 5 6 C1 C2 Temperaturas Día Máxima Mínima Lun. 18 12 mar. 24 16 Miér. 21 11 Jue. 17 12 Vier. 24 10 Sáb. 27 15 Dom. 23 14

description

 

Transcript of Estadistica

Page 1: Estadistica

ESTADISTICAESTADISTICA

0

10

20

30

1 2 3 4 5 6

C1

C2

TemperaturasDía Máxima MínimaLun. 18 12mar. 24 16Miér. 21 11Jue. 17 12Vier. 24 10Sáb. 27 15

Dom. 23 14

Page 2: Estadistica

Pasos a seguir en un estudio estadísticoPasos a seguir en un estudio estadístico

Analizar la característica a estudiar de la población.Analizar la característica a estudiar de la población. Elegir una muestra representativa de la población.Elegir una muestra representativa de la población. Recogida de datos de la variable en la muestra.Recogida de datos de la variable en la muestra. Ordenar los datos obtenidos en la muestra.Ordenar los datos obtenidos en la muestra. Construir la tabla de frecuencias correspondiente.Construir la tabla de frecuencias correspondiente. Dibujar los gráficos estadísticos adecuados.Dibujar los gráficos estadísticos adecuados. Calcular las medidas de centralización y dispersión.Calcular las medidas de centralización y dispersión. Extraer conclusiones de esos datos para la población.Extraer conclusiones de esos datos para la población.

Page 3: Estadistica

Conceptos básicosConceptos básicos Definiciones:Definiciones:

Estadística.-Estadística.- Es la parte de las matemáticas que se ocupa de recoger, organizar y analizar Es la parte de las matemáticas que se ocupa de recoger, organizar y analizar grandes cantidades de datos para estudiar sus características y obtener conclusiones.grandes cantidades de datos para estudiar sus características y obtener conclusiones.

PoblaciónPoblación.- Conjunto de elementos al que se les aplica el estudio..- Conjunto de elementos al que se les aplica el estudio. MuestraMuestra.- Es un subconjunto de la población que utilizaremos para realizar dicho estudio..- Es un subconjunto de la población que utilizaremos para realizar dicho estudio. IIndividuondividuo.- Cada uno de los elementos de la población..- Cada uno de los elementos de la población. Variable estadísticaVariable estadística.- Propiedad o característica de la población que estamos interesados en .- Propiedad o característica de la población que estamos interesados en

estudiar. La representaremos por xestudiar. La representaremos por x i.i.

Clasificación:Clasificación: Según el tipo de valores que puede tomar la variable estadística, podemos clasificarla Según el tipo de valores que puede tomar la variable estadística, podemos clasificarla en:en:

Cuantitativa:Cuantitativa: Si toma valores numéricos. Si toma valores numéricos. Cuantitativa discreta:Cuantitativa discreta: Si los valores numéricos son enteros. Si los valores numéricos son enteros. Cuantitativa continua:Cuantitativa continua: Si los valores numéricos son decimales. Si los valores numéricos son decimales.

Cualitativa:Cualitativa: Si la variable no toma valores numéricos. Si la variable no toma valores numéricos.

Ejemplo:Ejemplo: Queremos estudiar las siguientes características de la población de Ourense. (Sexo, altura, Queremos estudiar las siguientes características de la población de Ourense. (Sexo, altura, edad y color del pelo). Elegimos 100 números de teléfono de la guía de Ourense de forma aleatoria, y edad y color del pelo). Elegimos 100 números de teléfono de la guía de Ourense de forma aleatoria, y le preguntamos a cada uno su sexo, altura, edad y color del pelo, Anotando en nuestra libreta los le preguntamos a cada uno su sexo, altura, edad y color del pelo, Anotando en nuestra libreta los resultados obtenidos.resultados obtenidos.

Contestad a las siguientes preguntas:Contestad a las siguientes preguntas: ¿Cuál es la población, la muestra y el individuo?.¿Cuál es la población, la muestra y el individuo?. ¿Cuáles son las variables estadísticas y de que tipo son?.¿Cuáles son las variables estadísticas y de que tipo son?. ¿Qué valores pueden tomar las distintas variables estadísticas?.¿Qué valores pueden tomar las distintas variables estadísticas?.

Page 4: Estadistica

FrecuenciasFrecuencias Es una tabla en la que se colocan los datos estadísticos obtenidos, una vez Es una tabla en la que se colocan los datos estadísticos obtenidos, una vez

ordenados, para su análisis posterior. En ella indicaremos los valores de la ordenados, para su análisis posterior. En ella indicaremos los valores de la variable y sus frecuencias.variable y sus frecuencias.

Definiciones:Definiciones: Frecuencia absolutaFrecuencia absoluta ( (nnii).- Es el número de veces que toma el valor x).- Es el número de veces que toma el valor x ii.. Frecuencia relativaFrecuencia relativa ( (ffii).- Es el cociente entre la frecuencia absoluta ().- Es el cociente entre la frecuencia absoluta (nnii) )

y el total de datos (N). y el total de datos (N). ffii Representa el tanto por uno. Representa el tanto por uno.

Frecuencia absoluta acumuladaFrecuencia absoluta acumulada ( (NNii).-).- Es el número de veces que Es el número de veces que toma el valor xtoma el valor xii y todos los anteriores a él (cuando los datos están y todos los anteriores a él (cuando los datos están ordenados).ordenados).

Frecuencia relativa acumuladaFrecuencia relativa acumulada ( (FFii).- Es el cociente entre la frecuencia ).- Es el cociente entre la frecuencia absoluta acumulada (Ni) y el total de datos (N). absoluta acumulada (Ni) y el total de datos (N).

%%.- Número de veces que aparece el valor de la variable en 100 ..- Número de veces que aparece el valor de la variable en 100 .

Observaciones:Observaciones: El porcentaje se obtiene multiplicando por 100 la frecuencia relativa.El porcentaje se obtiene multiplicando por 100 la frecuencia relativa. En las variables cualitativas no se calculan las frecuencias acumuladas.En las variables cualitativas no se calculan las frecuencias acumuladas.

fi=ni/N.

Fi=Ni/N

Page 5: Estadistica

Ejemplo de Tabla de frecuenciasEjemplo de Tabla de frecuencias

Ejemplo para variables discretasEjemplo para variables discretas: Lanzamos un dado 120 veces. : Lanzamos un dado 120 veces. Después de anotar los resultados obtenidos y ordenarlos en forma Después de anotar los resultados obtenidos y ordenarlos en forma creciente, construimos la tabla de frecuencias siguiente: creciente, construimos la tabla de frecuencias siguiente:

Tabla de frecuenciasTabla de frecuenciasxxii nnii ffii NNii FFii %%

11 1818 0,150,15 1818 0,150,15 1515

22 2121 0,180,18 3939 0,330,33 1818

33 2424 0,200,20 6363 0,530,53 2020

44 1616 0,130,13 7979 0,660,66 1313

55 1919 0,160,16 9898 0,820,82 1616

66 2222 0,180,18 120120 1,001,00 1818

N=N= 120120 11 100100

Nota: Observa que los valores obtenidos en la última fila son los totales de cada una de las columnas. Las frecuencias relativas suman 1 y los porcentajes suman 100.

Page 6: Estadistica

Ejemplo de tabla de frecuencias Ejemplo para variables continuas: Los pesos, en kilogramos, de 30 cajas de fruta vienen dados por los siguientes valores:

32´5, 30´6, 38´7, 35´2, 29, 23´8, 36´4, 41, 39´5, 42, 28´1, 20´7, 43, 35´7, 29,

33, 28´5, 45, 37´5, 27, 30´4, 42, 43, 38´6, 29, 38, 42´4, 25, 36´5, 34. Pasos a seguir para construir la tabla de frecuencias:

Calcular el recorrido R = Valor mayor – valor menor = 45 – 20´7 = 24´3 Decidir cuantas clases (intervalos) queremos hacer, entre 5 y 10. (en este ejemplo hacemos 5 clases). Hallar el ancho de la clase, dividiendo el recorrido entre el número de clases = 24´3 / 5 = 4,86, redondeando siempre por

exceso al entero más próximo. Ancho de clase = 5. Tomamos como extremo izquierdo de la 1ª clase el valor más pequeño de la variable, consideraremos cada clase cerrada

por un extremo izquierdo y abierta por el extremo derecho. Determinamos la marca de clase (representante de cada clase), tomando el valor intermedio de cada una. Calcularemos la frecuencia absoluta de cada clase contando cuantos datos hay en cada una de ellas.

Aplicación al ejemplo dado:

Frecuencias

Clases Marcas = xi ni fi Ni Fi %

[20, 25) 22´5 2 0,07 2 0,07 7

[25, 30) 27´5 7 0,23 9 0,30 23

[30, 35) 32,5 5 0,17 14 0,47 17

[35, 40) 37,5 9 0,30 23 0,77 30

[40, 45] 42,5 7 0,23 30 1,00 23

30 1 100

Page 7: Estadistica

Tipos de gráficos (I)Tipos de gráficos (I)Resultados al lanzar un dado

0

5

10

15

20

25

1 2 3 4 5 6

valores obtenidos

Po

rcen

taje

ob

ten

ido

Resultado al lanzar un dado

15%

18%

20%13%

16%

18%

1 2 3 4 5 6

Gráfico de barras Diagrama de sectores

Diagramas evolutivo Diagrama comparativo

Temperaturas en una semana

0

5

10

15

20

25

30

Lun. mar. Miér. Jue. Vier. Sáb. Dom.

Tem

per

atu

ra

Máximas Mínimas

Temperaturas en una semana

0

5

10

15

20

25

30

Lun. mar. Miér. Jue. Vier. Sáb. Dom.

Tem

per

atu

ra

Page 8: Estadistica

Tipos de gráficos (II)Tipos de gráficos (II)

Pictograma Histograma

Cartograma Pirámide de Población

Page 9: Estadistica

Ejercicios1.- El número de alumnos por clase el 15 aulas de un Instituto vienen dados por los siguientes datos:

20, 18, 25, 24, 25, 20, 18, 22, 24, 22, 22, 24, 18, 22, 20. a) Indica de que tipo es la variable.. b) Ordénalos y construye la tabla de frecuencias. c) Dibuja un diagrama de barras y un diagrama de sectores. d) Calcula las medidas de centralización y dispersión correspondientes.

2.- Anotados los colores de 20 coches que circulan por una calle, hemos obtenido los siguientes:

B, N, A, B, N, V, A, N, B, A, N, V, B, N, N, R, R, B, R, V.

Siendo las letras los siguientes colores (B=Blanco; R=Rojo; A=Azul; V=Verde; N= Negro)

a) Indica de que tipo es la variable.b) Construye la tabla de frecuencias (sin las acumuladas)c) Dibuja un diagrama de barras y un diagrama de sectores. d) Calcula la moda.

3.- El peso, en gramos, de 40 huevos de una caja son los siguientes: 50´5, 53´2, 51, 58´7, 55´6, 62, 60´5, 69´8, 65, 54´3, 58, 59´6, 61, 67, 68´7, 54, 57´6, 61, 66, 63, 68, 59´6, 61, 60´7, 66, 57´2, 63, 57´5, 51, 66´8, 55´7, 59´8, 62, 52, 64´3, 67, 54´5, 55, 62´6, 66 a) Indica de que tipo es la variable. b) Ordénalos y calcula el recorrido. c) Construye las clases e indica las marcas de clase. d) Construye la tabla de frecuencias con las marcas de clase. c) Dibuja un histograma o diagrama de rectángulos.. d) Calcula las medidas de centralización y dispersión correspondientes.

Page 10: Estadistica

Medidas de centralizaciónMedidas de centralización Las medidas de centralización son:Las medidas de centralización son:

MediaMedia.- Es el cociente entre la suma de todos los datos y el número de ellos. Se .- Es el cociente entre la suma de todos los datos y el número de ellos. Se representa por . representa por .

Formula: Formula:

MedianMediana.- Es el valor de la variable que ocupa el lugar central, cuando los datos están a.- Es el valor de la variable que ocupa el lugar central, cuando los datos están

ordenados. Se representa por ordenados. Se representa por MeMe..

Para calcular la mediana se divide el total de datos (N) entre 2, se mira en la frecuencia Para calcular la mediana se divide el total de datos (N) entre 2, se mira en la frecuencia absoluta acumulada (Nabsoluta acumulada (Nii) el primer valor igual o mayor que encontremos, el valor x) el primer valor igual o mayor que encontremos, el valor x i i

correspondiente es la mediana.correspondiente es la mediana. ModModa.- Es el valor de la variable que más se repite. Se representa por a.- Es el valor de la variable que más se repite. Se representa por Mo.Mo.

Ejemplo: Ejemplo: Las edades de 11 personas son: 6, 9, 5, 15, 7, 6, 9, 9, 7, 7, 9.Las edades de 11 personas son: 6, 9, 5, 15, 7, 6, 9, 9, 7, 7, 9. MediaMedia: :

MedianaMediana: Ordenamos los datos: 5, 6, 6, 7, 7, : Ordenamos los datos: 5, 6, 6, 7, 7, 77, 9, 9, 9, 9, 15. El que ocupa el lugar , 9, 9, 9, 9, 15. El que ocupa el lugar central es el 7. Me=7central es el 7. Me=7

Si hay dos que ocupan el lugar central se halla su media.Si hay dos que ocupan el lugar central se halla su media. ModaModa: El que más se repite es el 9: Mo=9: El que más se repite es el 9: Mo=9

N

nxnxnxx pp

......2211_

_

x

_

x

1́811

89

11

1*154*93*72*61*5_

x

Page 11: Estadistica

Medidas de dispersión Recorrido.- Es la diferencia entre el valor mayor de la variable y el valor más

pequeño. Se representa por R. Fórmula:

Desviación media.- Es la media aritmética de las desviaciones, en valor absoluto, respecto de la media. Se representa por: DM

Fórmula

Varianza.- Es la media aritmética de los cuadrados de las desviaciones al cuadrado respecto de la media. Se representa por: σ2

Fórmula:

Desviación típica.- Es la raíz cuadrada positiva de la varianza. Se representa por: σ

Fórmula:

R= xM - xm

N

nxxnxxnxx

Dpp

M

*......**_

2

_

21

_

1

N

nxxnxxnxx pp *)(.......*)(*)( 2_

22

_

212

_

12

2

Page 12: Estadistica

Cálculo de las medidas de centralización y dispersión

Ejemplo. Consideremos las notas de los exámenes de 40 alumnos dados por las dos primeras columnas de la siguiente tabla: xi = nota. ni = frecuencia

76 / 40

44 / 40

200 / 40

Tabla de frecuencias Cálculos

xi ni fi Ni Fi % xi*ni |xi-x| |xi-x|*ni (xi-x)2*ni

2 2 0,05 2 0,05 5 4 3 6 18

3 5 0,13 7 0,18 13 15 2 10 20

4 6 0,15 13 0,33 15 24 1 6 6

5 10 0,25 23 0,58 25 50 0 0 0

6 12 0,30 35 0,88 30 72 1 12 12

7 5 0,13 40 1,00 13 35 2 10 20

N= 40 1 100 200 44 76

Moda = 6

Mediana = 5

Media = 5

Desviación media = 1,10

Varianza = 1,90

Desviación típica = 1,38