Estadistica 2 2

52
2-2008 1 Organización de datos numéricos Estadística Capítulo 2.2

Transcript of Estadistica 2 2

2-2008 1

Organización de datos numéricos

EstadísticaCapítulo 2.2

2-2008 2

ARREGLO ORDENADO

Una vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la información y ordenarla.

• Por cada variable se hace un ordenamiento simple.

• El determinar cual es el dato que tiene menor valor y cual el de mayor valor es información vital para empezar a trabajar con variables cuantitativas.

2-2008 3

Suponga que decide llevar a cabo un estudio del costo de una comida en un restaurante de una gran ciudad. A 50 restaurantes citadinos se les consultó sobre el precio promedio de sus platos y se obtuvieron los siguientes resultados.

2-2008 4

Precio del plato en 50 restaurantes citadinos50 38 43 56 51 36 25 33 41 4434 39 49 37 40 50 50 35 22 4544 38 14 44 51 27 44 39 50 3531 34 48 48 30 42 26 35 32 6336 38 53 23 39 45 37 31 39 53

2-2008 5

Precio de plato en 50 restaurantes de la ciudad14 22 23 25 26 27 30 31 31 3233 34 34 35 35 35 36 36 37 3738 38 38 39 39 39 39 40 41 4243 44 44 44 44 45 45 48 48 4950 50 50 50 51 51 53 53 56 63

2-2008 6

Rango

Calcular el rango es determinar la longitud numérica que existe entre el primer dato y el último.

• Restar el dato menor del dato mayor de la muestra y se obtiene el rango.

• Rango = DatoMayor - DatoMenor

2-2008 7

La pregunta que estamos analizando ya tiene sus datos ordenados, ahora determinar a simple vista cuales son los datos mayor y menor respectivamente:

Dato Mayor $ 63.00Dato Menor $ 14.00

2-2008 8

RANGO

En una muestra o población el rango es la distancia entre el dato mayor y el dato menor. Se calcula restando ambos datos.

MenorDatoMayorDatoRango

2-2008 9

Cálculo del rango.

Muestra de restaurantes citadinos

491463

RangoRango

DatoMenorDatoMayorRango

2-2008 10

DISTRIBUCIÓN DE FRECUENCIAS

Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos de una variable en una muestra.

La distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos numéricamente ordenados.

2-2008 11

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y efectiva.

Seleccionar el número apropiado de agrupaciones o clases para la tala,

determinando una amplitud conveniente de las clases y estableciendo los límites

de cada una para evitar traslape.

2-2008 12

Amplitud de intervalo o clase

La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el número de intervalos elegidos.

Se ha convenido que todos los intervalos tengan la misma amplitud.

elegidosIntervalosdeNumeroRangoAmplitud

2-2008 13

Amplitud de un Intervalo o clase

La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una anchura que sea un número entero (aplican restricciones).Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera.

• Si el resulta es menor de 0.5 se elimina la parte decimal.

• En caso contrario se pasa al próximo entero.

2-2008 14

Cálculo de la amplitud

Muestra de restaurantes citadinos

77/49

749

1463

AmplitudAmplitudIntervalosRangoRango

DatoMenorDatoMayorRango

2-2008 15

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y 2 columnas:Columna 1: El nombre de la variable que se está analizando.

Columna 2: Las veces que se repiten los datos con las mismas características de la variable y se le llama frecuencia.

Variable Frecuencia

   

   

   

   

   

   

2-2008 16

DISTRIBUCIÓN DE FRECUENCIAS

Cuando la variable es numérica, se trata de valores y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administrarlos con eficiencia. A cada grupo de datos se le llama Intervalo o clase.

Intervalos Frecuencia

   

   

   

   

   

   

2-2008 17

DISTRIBUCIÓN DE FRECUENCIAS

Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras; la más generalizada es:

Intervalos Frecuencia

   

   

   

   

   

   

DatoMenor pero menos que DatoMayor o

2-2008 18

DISTRIBUCIÓN DE FRECUENCIAS

La información en cada intervalo debe ser única.

Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango.

Intervalos Frecuencia

   

   

   

   

   

   

2-2008 19

DISTRIBUCIÓN DE FRECUENCIAS

Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones.

IntervalosFrecuen

ciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

2-2008 20

DISTRIBUCIÓN DE FRECUENCIAS

Los datos por ser numéricos, pueden ir de 100 a 1000, o se pueden extender a 10,000, etc. Un intervalo es similar al rango, el cual tiene un dato mayor y un dato menor, solo que la distancia entre ellos recibe el nombre de Amplitud

Intervalos FrecuenciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

2-2008 21

DISTRIBUCIÓN DE FRECUENCIAS

Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias.

Intervalos FrecuenciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

2-2008 22

Calcular el rango. Elegir el número de intervalos Calcular la anchura de cada intervalo Generar los intervalos de clases (no

deben menos de 5 ni más de 15) Determinar la frecuencia para cada

intervalo.

Procedimiento para generar una distribución de frecuencias

2-2008 23

Calcular las frecuencias de la distribución para los 50 restaurantes citadinos

Precio de plato14 22 23 25 26 27 30 31 31 3233 34 34 35 35 35 36 36 37 3738 38 38 39 39 39 39 40 41 4243 44 44 44 44 45 45 48 48 4950 50 50 50 51 51 53 53 56 63

2-2008 24

78.6534534

337337

Amplitud

IntervalosRangoRangoDatoMenorDatoMayor

2-2008 25

En este caso, se iniciará el primer intervalo con el dato menor de la muestra = 14

A 14 se le suma la amplitud que es 7 y es = 21

El primer intervalo será el siguiente:

14 pero menos de 21

2-2008 26

Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28.

El segundo intervalo resulta ser:De 21 a menos de 28

Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35

El tercer intervalo será:De 28 a menos de 35

2-2008 27

En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 = 42.

El cuarto intervalo resulta ser:De 35 a menos de 42

En el quinto intervalo, al dato menor 42 se le suma 7 = 49

El quinto intervalo es:De 42 a menos de 49

2-2008 28

PRECIO DE PLATO Frecuencia14 pero menos de 21   

21 pero menos de 28  

28 pero menos de 35  

35 pero menos de 42  

42 pero menos de 49  

49 pero menos de 5656 pero menos de 6363 pero menos de 70

Intervalos o clases

2-2008 29

Calcular la frecuencia de cada intervalo.

El primer intervalo de “14 pero menos de 21”, se cuenta el número de datos que tienen esa

característica y solo es 14. Al contar los números resulta que es 1 dato

El segundo intervalo de de “21 pero menos de 28” se cuenta 22, 23, 25, 26 y 27 que son 5

2-2008 30

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 3535 pero menos de 42  42 pero menos de 4949 pero menos de 5656 pero menos de 6363 pero menos de 70

2-2008 31

El tercer intervalo de “28 pero menos de 35”, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7.

El cuarto intervalo de “35 pero menos de 42” se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan 16

2-2008 32

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 4949 pero menos de 5656 pero menos de 6363 pero menos de 70

2-2008 33

El quinto intervalo de “42 pero menos de 49”, está formado por se cuenta con 42, 43, 44, 44, 44, 44, 45, 45, 48, 48 ; la frecuencia es 10.

El sexto intervalo de “49 pero menos de 56” se cuentan 49, 50, 50, 50, 50, 51, 51, 53, 53 y resultan 9

2-2008 34

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 49 1049 pero menos de 56 956 pero menos de 6363 pero menos de 70

2-2008 35

El séptimo intervalo de “56 pero menos de 63”, está formado por se cuenta con 56 y la frecuencia es 1.

El sexto intervalo de “63 pero menos de 70” se cuentan 63 y resulta 1.

2-2008 36

Los intervalos quedan de la siguiente manera:PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 49 1049 pero menos de 56 956 pero menos de 63 163 pero menos de 70 1

2-2008 37

Fronteras de clase

Las fronteras de clase o límites de clase, son los extremos numéricos de una clase.

Un intervalo tiene la forma “a – b”, contiene los números que empiezan en “a” y que casi terminan de “b”

2-2008 38

Intervalo 14 pero menos de 21

• La frontera inferior es 14• La frontera superior se acerca a 21Intervalo 21 pero menos de 28

• La frontera inferior es 21• La frontera superior se acerca a 28

2-2008 39

Frontera real de clase Numéricamente, “antes de A” no es un

número. Se establece un límite de acuerdo a la

formulación de los datos. Si los datos se ministran con dos decimales,

se busca el número que está exactamente antes de la frontera superior.Intervalo normal Fronteras reales21 pero menos de 28 21 y 27.921 pero menos de 28 21 y 27.99

2-2008 40

Intervalo o claseFrontera

inferiorFrontera

Superior

14 pero menos de 21  14 2121 pero menos de 28 21 2828 pero menos de 35 28 3535 pero menos de 42 35 4242 pero menos de 49 42 4949 pero menos de 56 49 56

Calcular las fronteras reales de la siguiente distribución:

2-2008 41

Marca de Clase

Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre dos. El intervalo es dividido a la mitad

2-2008 42

Intervalo o clase Marca de clase

14 pero menos de 21  (14+21)/2 = 17.521 pero menos de 28 (21+28)/2 = 24.528 pero menos de 35 (28+35)/2 = 31.535 pero menos de 42 (35+42)/2 =38.542 pero menos de 49 (42+49)/2 = 45.549 pero menos de 56 (49+56)/2 = 52.5

Calcular las marcas de clase de la siguiente distribución:

2-2008 43

Frecuencia Relativa

La frecuencia relativa es la proporción de frecuencia que corresponde un intervalo con relación al tamaño de la muestra.

2-2008 44

Cálculo de la frecuencia relativa

Se suman todas las frecuencias Se divide la frecuencia de cada

intervalo entre el total de frecuencias. Todas las frecuencias son valores

entre 0.0 y 1.0 La suma de todas las frecuencias

relativas debe ser igual a uno (1)

2-2008 45

Frecuencia Relativa

PRECIO POR PLATO FrecuenciaFrecuencia

Relativa14 pero menos de 21  1 1/50 = 0.0221 pero menos de 28 5 5/50 = 0.1028 pero menos de 35 7  7/50 = 0.1435 pero menos de 42 16  16/50 = 0.3242 pero menos de 49 10 10/50 = 0.2049 pero menos de 56 9 9/50 = 0.1856 pero menos de 63 1 1/50 = 0.0263 pero menos de 70 1 1/50 = 0.02

2-2008 46

Frecuencia Acumulada

La frecuencia acumulada es la suma parcial para cada intervalo, permite hacer observaciones sobre los intervalos que están por debajo de él.

2-2008 47

Cálculo de la frecuencia acumulada

Se suman todas las frecuencias Se suma la frecuencia del intervalo con

todas las frecuencias anteriores. La frecuencia acumulada de cada

intervalo nunca es menor que el valor del intervalo anterior.

El último intervalo debe tener como resultado la suma de todas las frecuencias (tamaño de la muestra)

2-2008 48

PRECIO POR PLATO FrecuenciaFrecuencia Acumulada

14 pero menos de 21  1 121 pero menos de 28 5 628 pero menos de 35 7  1335 pero menos de 42 16  2942 pero menos de 49 10 3949 pero menos de 56 9 4856 pero menos de 63 1 4963 pero menos de 70 1 50

Frecuencia Acumulada

2-2008 49

Frecuencia Porcentual

La frecuencia porcentual es la misma frecuencia relativa pero en formato de % (porcentaje). El total de la muestra siempre resulta ser 100%

2-2008 50

Frecuencia Porcentual

La frecuencia porcentual se puede calcular para las frecuencias absolutas o las acumuladas

2-2008 51

PRECIO POR PLATO FrecuenciaFrecuencia

Porcentual14 pero menos de 21  1 0.02*100 = 221 pero menos de 28 5 0.10 *100 = 1028 pero menos de 35 7  0.14*100 = 1435 pero menos de 42 16  0.32*100 = 3242 pero menos de 49 10 0.20*100 = 2049 pero menos de 56 9 0.18*100 = 1856 pero menos de 63 1 0.02*100 = 263 pero menos de 70 1 0.02*100 = 2

2-2008 52

Fin del capítulo 2.2

Continúa el capítulo 2.3