Capítulo 2.2

56
1-2008 1 Organización de datos numéricos Estadístic a Capítulo 2.2

description

Estad í stica. Capítulo 2.2. Organización de datos numéricos. Introducci ó n. El aprendizaje de esta unidad se va a centrar en la organizaci ó n de variables numéricas, ya sean discretas o continuas. 2. - PowerPoint PPT Presentation

Transcript of Capítulo 2.2

Page 1: Capítulo 2.2

1-2008 1

Organización de datos numéricos

EstadísticaCapítulo 2.2

Page 2: Capítulo 2.2

1-2008 22

Introducción

El aprendizaje de esta unidad se va a centrar en la organización de variables numéricas, ya sean

discretas o continuas.

Page 3: Capítulo 2.2

1-2008 33

ARREGLO ORDENADOUna vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la información y ordenarla.

• Por cada variable se hace un ordenamiento simple.

• El determinar cual es el dato que tiene menor valor y cual el de mayor valor es información vital para empezar a trabajar con variables cuantitativas.

Page 4: Capítulo 2.2

1-2008 44

Suponga que decide llevar a cabo un estudio del costo de una comida en un restaurante de una gran ciudad. A 50 restaurantes citadinos se les consultó sobre el precio promedio de

sus platos y se obtuvieron los siguientes resultados.

Page 5: Capítulo 2.2

1-2008 55

Precio del plato en 50 restaurantes citadinos

50 38 43 56 51 36 25 33 41 44

34 39 49 37 40 50 50 35 22 45

44 38 14 44 51 27 44 39 50 35

31 34 48 48 30 42 26 35 32 63

36 38 53 23 39 45 37 31 39 53

Page 6: Capítulo 2.2

1-2008 66

Precio de plato en 50 restaurantes de la ciudad

14 22 23 25 26 27 30 31 31 32

33 34 34 35 35 35 36 36 37 37

38 38 38 39 39 39 39 40 41 42

43 44 44 44 44 45 45 48 48 49

50 50 50 50 51 51 53 53 56 63

Page 7: Capítulo 2.2

1-2008 77

Rango

Calcular el rango es determinar la longitud numérica que existe entre el

primer dato y el último.

• Restar el dato menor del dato mayor de la muestra y se obtiene el rango.

• Rango = DatoMayor - DatoMenor

Page 8: Capítulo 2.2

1-2008 88

La pregunta que estamos analizando ya tiene sus datos ordenados, ahora determinar a simple vista

cuales son los datos mayor y menor respectivamente:

Dato Mayor $ 63.00

Dato Menor $ 14.00

Page 9: Capítulo 2.2

1-2008 99

RANGO

En una muestra o población el rango es la distancia entre el dato mayor y el dato menor. Se calcula restando

ambos datos.

MenorDatoMayorDatoRango

Page 10: Capítulo 2.2

1-2008 1010

Cálculo del rango.

Muestra de restaurantes citadinos

49

1463

Rango

Rango

DatoMenorDatoMayorRango

Page 11: Capítulo 2.2

1-2008 1111

DISTRIBUCIÓN DE FRECUENCIAS

Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos

de una variable en una muestra.

La distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos

numéricamente ordenados.

Page 12: Capítulo 2.2

1-2008 1212

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y

efectiva.

Seleccionar el número apropiado de agrupaciones oclases para la tala,

determinando una amplitud conveniente de las clases y estableciendo los límites de

cada una para evitar traslape.

Page 13: Capítulo 2.2

1-2008 1313

Amplitud de intervalo o clase

La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el número de intervalos elegidos.Se ha convenido que todos los intervalos tienen la misma anchura.

elegidosIntervalosdeNumero

RangoAmplitud

Page 14: Capítulo 2.2

1-2008 1414

Amplitud de unIntervalo o clase

La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una anchura que sea un número entero (aplican restricciones).

Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera.• Si el resulta es menor de 0.5 se elimina la

parte decimal.• En caso contrario se pasa al próximo

entero.

Page 15: Capítulo 2.2

1-2008 1515

Cálculo de la amplitud

Muestra de restaurantes citadinos

7

7/49

7

49

1463

Amplitud

Amplitud

Intervalos

Rango

Rango

DatoMenorDatoMayorRango

Page 16: Capítulo 2.2

1-2008 1616

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y 2 columnas:

Columna 1: El nombre de la variable que se está analizando.

Columna 2: Las veces que se repiten los datos con las mismas características de la variable y se le llama frecuencia.

VariableFrecuenci

a

   

   

   

   

   

   

Page 17: Capítulo 2.2

1-2008 1717

DISTRIBUCIÓN DE FRECUENCIAS

Como la variable es numérica, se trata de valores y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administrarlos con eficiencia. A cada grupo de datos se le llama Intervalo.

IntervalosFrecuenci

a

   

   

   

   

   

   

Page 18: Capítulo 2.2

1-2008 1818

DISTRIBUCIÓN DE FRECUENCIAS

Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras, las más generalizadas son:

DatoMenor pero menos que DatoMayor

IntervalosFrecuenci

a

   

   

   

   

   

   

Page 19: Capítulo 2.2

1-2008 1919

Precios de plato en $ Restaurantes

14 pero menos que 21 1

21 pero menos que 28 5

28 pero menos que 35 7

35 pero menos que 42 16

42 pero menos que 49 10

49 pero menos que 56 9

56 pero menos que 63 1

63 pero menos que 70 1

Total . . . . 50

Page 20: Capítulo 2.2

1-2008 2020

DISTRIBUCIÓN DE FRECUENCIAS

La información en cada intervalo debe ser única.

Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango.

IntervalosFrecuenci

a

   

   

   

   

   

   

Page 21: Capítulo 2.2

1-2008 2121

DISTRIBUCIÓN DE FRECUENCIAS

Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.

Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones.

IntervalosFrecuen

cia

Intervalo 1 Frec. 1

Intervalo 2 Frec. 2

Intervalo 3 Frec. 3

Intervalo 4 Frec. 4

Intervalo 5 Frec. 5

Intervalo 6 Frec. 6

Page 22: Capítulo 2.2

1-2008 2222

DISTRIBUCIÓN DE FRECUENCIAS

Los datos por ser numéricos, pueden ir de 100 a 1000, o se pueden extender a 10,000, etc.

Un intervalo es similar al rango, el cual tiene un dato mayor y un dato menor, solo que la distancia entre ellos recibe el nombre de Amplitud

IntervalosFrecuenci

a

Intervalo 1 Frec. 1

Intervalo 2 Frec. 2

Intervalo 3 Frec. 3

Intervalo 4 Frec. 4

Intervalo 5 Frec. 5

Intervalo 6 Frec. 6

Page 23: Capítulo 2.2

1-2008 2323

DISTRIBUCIÓN DE FRECUENCIAS

Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias.

IntervalosFrecuenci

a

Intervalo 1 Frec. 1

Intervalo 2 Frec. 2

Intervalo 3 Frec. 3

Intervalo 4 Frec. 4

Intervalo 5 Frec. 5

Intervalo 6 Frec. 6

Page 24: Capítulo 2.2

1-2008 2424

• Calcular el rango.• Elegir el número de intervalos• Calcular la anchura de cada intervalo• Generar los intervalos de clases (no

deben menos de 5 ni más de 15)• Determinar la frecuencia para cada

intervalo.

Procedimiento para generar una distribución de frecuencias

Page 25: Capítulo 2.2

1-2008 2525

Calcular las frecuencias de la distribución para los 50 restaurantes citadinos

Precio de plato

14 22 23 25 26 27 30 31 31 32

33 34 34 35 35 35 36 36 37 37

38 38 38 39 39 39 39 40 41 42

43 44 44 44 44 45 45 48 48 49

50 50 50 50 51 51 53 53 56 63

Page 26: Capítulo 2.2

1-2008 2626

78.65

34

5

34

337

3

37

Amplitud

Intervalos

Rango

Rango

DatoMenor

DatoMayor

Page 27: Capítulo 2.2

1-2008 2727

• En este caso, se iniciará el primer intervalo con el dato menor de la muestra = 14

• A 14 se le suma la amplitud que es 7 y es = 21

• El primer intervalo será el siguiente:

14 pero menos de 21

Page 28: Capítulo 2.2

1-2008 2828

• Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28.

• El segundo intervalo resulta ser:De 21 a menos de 28

• Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35

• El tercer intervalo será:De 28 a menos de 35

Page 29: Capítulo 2.2

1-2008 2929

• En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 = 42.

• El cuarto intervalo resulta ser:De 35 a menos de 42

• En el quinto intervalo, al dato menor 42 se le suma 7 = 49

• El quinto intervalo es:De 42 a menos de 49

Page 30: Capítulo 2.2

1-2008 3030

PRECIO DE PLATO Frecuencia

14 pero menos de 21   

21 pero menos de 28  

28 pero menos de 35  

35 pero menos de 42  

42 pero menos de 49  

49 pero menos de 56

56 pero menos de 63

63 pero menos de 70

Intervalos o clases

Page 31: Capítulo 2.2

1-2008 3131

Calcular la frecuencia de cada intervalo.

El primer intervalo de “14 pero menos de 21”, se cuenta el número de datos que tienen esa

característica y solo es 14. Al contar los números resulta que es 1 dato

El segundo intervalo de de “21 pero menos de 28” se cuenta 22, 23, 25, 26 y 27 que son 5

Page 32: Capítulo 2.2

1-2008 3232

PRECIO POR PLATO Frecuencia

14 pero menos de 21  1

21 pero menos de 28 5

28 pero menos de 35

35 pero menos de 42  

42 pero menos de 49

49 pero menos de 56

56 pero menos de 63

63 pero menos de 70

Page 33: Capítulo 2.2

1-2008 3333

El tercer intervalo de “28 pero menos de 35”, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7.

El cuarto intervalo de “35 pero menos de 42” se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan 16

Page 34: Capítulo 2.2

1-2008 3434

PRECIO POR PLATO Frecuencia

14 pero menos de 21  1

21 pero menos de 28 5

28 pero menos de 35 7 

35 pero menos de 42 16 

42 pero menos de 49

49 pero menos de 56

56 pero menos de 63

63 pero menos de 70

Page 35: Capítulo 2.2

1-2008 3535

El quinto intervalo de “42 pero menos de 49”, está formado por se cuenta ; la frecuencia es 7.

El sexto intervalo de “35 pero menos de 42” se cuentan y resultan 16

Page 36: Capítulo 2.2

1-2008 3636

Page 37: Capítulo 2.2

1-2008 3737

Page 38: Capítulo 2.2

1-2008 3838

Los intervalos quedan de la siguiente manera:

Page 39: Capítulo 2.2

1-2008 3939

Fronteras de clase

• Las fronteras de clase o límites de clase, son los extremos numéricos de una clase.

• Un intervalo tiene la forma “a – b”, contiene los números que empiezan en “a” y que casi terminan de “b”

Page 40: Capítulo 2.2

1-2008 4040

Intervalo 14 pero menos de 21

• La frontera inferior es 14

• La frontera superior se acerca a 21

Intervalo 21 pero menos de 28

• La frontera inferior es 21

• La frontera superior se acerca a 28

Page 41: Capítulo 2.2

1-2008 4141

Frontera real de clase

• Numéricamente, “antes de A” no es un número.• Se establece un límite de acuerdo a la formulación

de los datos.• Si los datos se ministran con dos decimales, se

busca el número que está exactamente antes de la frontera superior.

Intervalo normal Fronteras reales

21 pero menos de 28

21 y 27.9

21 pero menos de 28

21 y 27.99

Page 42: Capítulo 2.2

1-2008 4242

Calcular las fronteras reales de la siguiente distribución:

Page 43: Capítulo 2.2

1-2008 4343

Marca de Clase

Es el punto medio de un intervalo de clase, se calcula

sumando sus fronteras y dividiendo el resultado entre dos. El intervalo es dividido a

la mitad

Page 44: Capítulo 2.2

1-2008 4444

Marca de Clase

Page 45: Capítulo 2.2

1-2008 4545

Calcular las marcas de clase de la siguiente distribución:

Page 46: Capítulo 2.2

1-2008 4646

Frecuencia Relativa

La frecuencia relativa es la proporción de frecuencia que corresponde un intervalo con

relación al tamaño de la muestra.

Page 47: Capítulo 2.2

1-2008 4747

Frecuencia Relativa

Page 48: Capítulo 2.2

1-2008 4848

Cálculo de la frecuencia relativa

• Se suman todas las frecuencias• Se divide la frecuencia de cada

intervalo entre el total de frecuencias.• Todas las frecuencias son valores

entre 0.0 y 1.0• La suma de todas las frecuencias

relativas debe ser igual a uno (1)

Page 49: Capítulo 2.2

1-2008 4949

CUENTAS X COBRAR

Número de

facturas Cálculo

Frecuencia Relativa

De 03 a menos de 10 7 7 / 20 = 0.35 0.35

De 10 a menos de 17 7 7 / 20 = 0.35 0.35

De 17 a menos de 24 3 3 / 20 = 0.15 0.15

De 24 a menos de 31 1 1 / 20 = 0.05 0.05

De 31 a menos de 38 2 2 / 20 = 0.10 0.10

Total . . . . . 20   1.00

Cálculo de frecuencia relativa

Page 50: Capítulo 2.2

1-2008 5050

Frecuencia Acumulada

La frecuencia acumulada es la suma parcial para cada intervalo, permite

hacer observaciones sobre los intervalos que están por debajo de él.

Page 51: Capítulo 2.2

1-2008 5151

Cálculo de la frecuencia acumulada

• Se suman todas las frecuencias• Se suma la frecuencia del intervalo

con todas las frecuencias anteriores.• La frecuencia acumulada de cada

intervalo nunca es menor que el valor del intervalo anterior.

• El último intervalo debe tener como resultado la suma de todas las frecuencias (tamaño de la muestra)

Page 52: Capítulo 2.2

1-2008 5252

CUENTAS X COBRAR

Número de

facturasFrecuencias menores que la frontera inferior

Frec. Acumu-

lada

De 03 a menos de 10 7 7 7

De 10 a menos de 17 7 7 + 7 14

De 17 a menos de 24 3 7 + 7 + 3 17

De 24 a menos de 31 1 7 + 7 + 3 + 1 18

De 31 a menos de 38 2 7 + 7 + 3 + 1 + 2 20

Total . . . . . 20    

Page 53: Capítulo 2.2

1-2008 5353

Frecuencia Porcentual

La frecuencia porcentual es la misma frecuencia relativa pero en formato de % (porcentaje). El total de la muestra siempre resulta ser

100%

Page 54: Capítulo 2.2

1-2008 5454

Frecuencia Porcentual

La frecuencia porcentual se puede calcular para las

frecuencias absolutas o las acumuladas

Page 55: Capítulo 2.2

1-2008 5555

CUENTAS X COBRAR FacturasFrecuencia

RelativaFrecuencia porcentual

Frecuencia Porcentual Acumulada

De 03 a menos de 10 7 0.35 35% 35%

De 10 a menos de 17 7 0.35 35% 70%

De 17 a menos de 24 3 0.15 15% 85%

De 24 a menos de 31 1 0.05 5% 90%

De 31 a menos de 38 2 0.10 10% 100%

Total20

100%

Page 56: Capítulo 2.2

1-2008 5656

Fin del capítulo 2.2

Continúa el capítulo 2.3(Investigación)