Final Estadistica 1

11
LECCION 1 LA PRESENTACION DE DATOS EN TABLAS Una vez recopilados sus datos, los investigadores se ponen a trabajar en una tarea igualmente importante como es la presentacion eficiente de los mismos, labor particularmente crucial cuando la recopilacion es grande. Existen dos procedimientos comunes para hacer inteligibles las recopilaciones de datos: la construccion de tablas y graficas. 1. LA DISTRIBUCION DE FRECUENCIAS 0 TABLAS DE FRECUENCIAS Una forma en que podemos comprimir los datos es la tabla de frecuencias o distribucion de frecuencias. Una distribucion de frecuencias es una tabla en la que organizamos los datos en los distintos valores que toma la variable bajo estudio donde se presenta. Asi, una distribucion de frecuencias muestra el numero de observaciones del conjunto de datos que corresponden a cada uno de los valores de la variable. Si uno puede determinar la frecuencia con la que se presenta los valores de un conjunto de datos, uno puede construir una distribucion de frecuencias. Tabla o Cuadro Estadistico Se define como el conjunto de datos estadisticos ordenados en columnas y filas, que permite leer, comparar e interpretar las caracteristicas de una o mas variables. Estructura y elementos de un cuadro estadIstico 1. Numero (cuando hay varias tablas) 2. Titulo (,DOnde?, ,Que?, COmo?,,Cuando?) ;.DOnde?.- Se refiere al lugar al que corresponde la informacion. ;.Que?:- Se refiere al hecho observado o caracteristica principal que se quiere mostrar. 50

description

Final Estadistica 1

Transcript of Final Estadistica 1

Page 1: Final Estadistica 1

LECCION 1

LA PRESENTACION DE DATOS EN TABLAS

Una vez recopilados sus datos, los investigadores se ponen a trabajar en una

tarea igualmente importante como es la presentacion eficiente de los mismos, labor

particularmente crucial cuando la recopilacion es grande.

Existen dos procedimientos comunes para hacer inteligibles las recopilaciones de

datos: la construccion de tablas y graficas.

1. LA DISTRIBUCION DE FRECUENCIAS 0 TABLAS DE FRECUENCIAS

Una forma en que podemos comprimir los datos es la tabla de frecuencias o

distribucion de frecuencias.

Una distribucion de frecuencias es una tabla en la que organizamos los datos en

los distintos valores que toma la variable bajo estudio donde se presenta. Asi, una

distribucion de frecuencias muestra el numero de observaciones del conjunto de

datos que corresponden a cada uno de los valores de la variable.

Si uno puede determinar la frecuencia con la que se presenta los valores de un

conjunto de datos, uno puede construir una distribucion de frecuencias.

Tabla o Cuadro Estadistico

Se define como el conjunto de datos estadisticos ordenados en columnas y

filas, que permite leer, comparar e interpretar las caracteristicas de una o mas

variables.

Estructura y elementos de un cuadro estadIstico

1. Numero (cuando hay varias tablas)

2. Titulo (,DOnde?, ,Que?, �COmo?,,Cuando?)

;.DOnde?.- Se refiere al lugar al que corresponde la informacion.

;.Que?:- Se refiere al hecho observado o caracteristica principal que se quiere

mostrar.

50

Page 2: Final Estadistica 1

i.Como?.- Se refiere at orden en que se presenta is informacion, empezando con

las variables del encabezamiento, que iran precedidas por la preposicion "POR" y

continuando con las variables y clasificaciones de la columna matriz, que iran

precedidas por la preposicion "SEGUN".

;.Cuando?.- Se refiere al periodo temporal que cubre la informacion.

3. Encabezamiento (referente a la primera fila) es donde se indica la

naturaleza (las categorias de la variable) del contenido de cada columna.

Viene precedida por la preposicion "POR".

4. Columna matriz. Es el elemento localizado at lado izquierdo del cuadro.

Aqui es designada la naturaleza (las modalidades de la variable) del

contenido de cada fila. Sigue a la preposicion "SEGUN".

5. Cuerpo. Donde se consignan los datos.

6. Pie (Nota, Ilamada, fuente, elaboracion).

Ejemplo:

TablaN°1 ♦---

4

HUANUCO: TASA DE ANALFABETISMO POR SEXO SEGUN AREA DE RESIDENCIA, 2010

Area de residencia TOTAL Sexo

Masculino Femenino TOTAL

Urbana Rural

}

}s

2

61 Fuente: Ministerio de Educacion-Oficina de Sistemas de Informacion

�Donde? : HUANUCO

LQue? : TASA DE ANALFABETISMO

,Como? : Por sexo, segun Area de referencia

LCuando? : 2010

51

{

Page 3: Final Estadistica 1

2. TABULACION DE DATOS

Tabulacion.- Es ordenar la informacion en una tabla y contar.

Conceptos

Sea X una variable estadistica de la poblacion en estudio que toma diferentes valores xi, i= 1, ........ k

Frecuencia absoluta de un dato (f; )

Llamaremos frecuencia absoluta de un valor x de la variable estadistica X, at

numero de veces que aparece repetido dicho valor en el conjunto de

observaciones.

Frecuencia relativa de un dato (hi )

La frecuencia relativa de un valor observado x; de la variable X , es el cociente

entre su frecuencia absoluta (f) y el numero de observaciones realizadas (n) y se

denota por

h;=f;/n,i=1 ..... K

Se expresa en terminos de porcentajes.

Frecuencia absoluta acumulada (F; )

La frecuencia absoluta acumulada de un valor x de la variable X es igual a la

suma de los valores inferiores o iguales a dicho valor. Es decir

F;=F f;

Frecuencia relativa acumulada (H; )

Se llama frecuencia relativa acumulada de un valor x de una variable X, al

cociente entre su frecuencia absoluta acumulada y el numero de observaciones

realizadas (n).

Se denote por H; = F; In

52

Page 4: Final Estadistica 1

Propiedades de las frecuencias

Sea n el numero total de observaciones realizadas de la variable X que toma

valores xi

1. Yfi = n

2. Yhi = 1 6 100% 3. Fk = n (la ultima frecuencia absoluta acumulada = n) 4. Hk = 1 (la ultima frecuencia relativa acumulada = 1)

5. 0<_ f;<_ n i=1. ...., k

6.05 his 1 i=1, ........ k

3. DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE CUALITATIVA

Se hace una lista de las posibles categorias de la variable X: x1, x2, ........... xk y se

ve cuantas veces se repite cada una (fi) y se calcula las frecuencias relativas de

cada categoria (hi).

X fi hi

hi .. h2

XK fK hK Total n 1

Ejemplo:

Una encuesta a 24 hogares realizada en Lima Metropolitana, dio los siguientes

resultados en cuanto al tipo de vivienda que ocupan:

Hogar 1 2 3 4 5 6 7 8 9 10 11 12

Vivienda 1 1 0 4 1 2 4 0 1 1 1 3

Hogar 13 14 15 16 17 18 19 20 21 22 23 24

Vivienda 0 2 0 0 0 1 1 2 4 4 0 1

0: casa independiente 1: dpto. en edificio 2: vivienda en quinta 3: vivienda en vecindad 4: otro

Solucidn

53

Page 5: Final Estadistica 1

Se consideran los valores que toma la variable Tipo de Vivienda y se registra el

numero de veces que se repite cada una.

Tabla N2 1

HOGARES DE LIMA METROPOLITANA SEGUN EL TIPO DE VIVIENDA QUE

OCUPAN. 2012

Tipo de vivienda Casa independiente -----..------------

Dpto. en edificio Vivienda en quinta .....--..-...-..------------ Vivienda en vecindad

11 Otro

Total

Interpretacion:

f; h;

7 7/24=0.29

9 9/24=0.38

3 3/24=0.12

1 1/24=0.04

4 4/24=0.17

24 1.00

Se observa que el 38% de los hogares entrevistados, viven en Dpto. en edificio

y solo el 4% viven en vivienda en vecindad..

4. DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE DISCRETA (De

recorrido corto)

Sea una variable discreta X cuyos valores observados son x, , X2 ......... xk

Se hace una lista de los diferentes valores que toma la variable, se ordena en

forma ascendente y se determina cuantas veces se repite cada valor.

Valores de X

X1

X2

XK

L Total

Frecuenci Frecuencia a Absoluta Relativa

f; h;

fl h, =f,In

f2 h2=f,/n

hk=fk/n

n 1

Frecuencia

Absoluta Acumulada

F;

F1 =f,

F2=f, +f2

Fk=f, +..+fk=n

54

Frecuencia Relativa Acumulada

H;

H, = h1 . _ ... ......... H2 = F2 /n

Hk=Fk/n=1

Page 6: Final Estadistica 1

5. DISTRIBUCION DE FRECUENCIAS DE VARIABLE CONTINUA Y DE

VARIABLE DISCRETA (de recorrido amplio)

Cuando se trata de datos de una caracteristica cuantitativa de variable continua se

tienen que formar intervalos sucesivos que abarquen todo el recorrido.

Igualmente si tenemos una caracteristica cuantitativa de variable discreta de

recorrido amplio no conviene enumerar uno a uno los valores que toma sino

conviene formar intervalos.

Reglas para la construcci6n de una tabla (distribuci6n de frecuencias)

1. Determinaci6n del recorrido o rango de los datos (R)

Rango = Valor maximo valor minimo

2. Determinacion del numero de intervalos (I )

a) Se calcula de forma tentativa y aproximada.

b) Usando la regla de Sturges: I = 1+ 3.3 log n, en donde n es igual al tamano

del conjunto de datos.

(En este caso usaremos la regla)

3. Determinaci6n de la amplitud del intervalo (A )

A=R/I

4. Determinaci6n de los limites del intervalo semiabierto (cerrado en el limite

inferior, abierto en el limite superior).

Se debe tomar el resultado numerico mas bajo como el limite inferior del

primer intervalo. Luego agregar A para obtener el limite superior y asi

sucesivamente.

X fi h; F; H;

fi hi F, H1

f2 h2 F2 H2 ------------------------

fK hK FK = n =1

Total I N 1 1

56

Page 7: Final Estadistica 1

LECCION 2

LA PRESENTACION DE DATOS: GRAFICAS

Las graficas indudablemente, son el medio mas conocido de presentar datos

estadisticos. De una forma u otra, Ia informacion condensada en cualquier tipo de

tabla tambien se puede presentar con ayuda de una grafica.

1. PRESENTACION GRAFICA DE VARIABLES CUALITATIVAS

1.1 Barras.- Se usan cuando la variable tiene muchas categorias.

a) Simples: son rectangulos cuya altura es la frecuencia absoluta o relativa de

los valores de la variable.

Ejemplo: Graficar la informacion contenida en la Tabla N° 1

Grafico N° 1 HOGARES DE LIMA METROPOLITANA, SEGON TIPO DE VIVIENDA QUE OCUPAN. 2008.

0 2 4 6 8 10

Numero

59

Page 8: Final Estadistica 1

b) Componentes

Es cuando cada barra se divide en dos 6 mas partes de acuerdo a cierta

caracteristica.

Ejemplo: Hogares (Tipo de vivienda).

Grafico N9 2 NUMERO DE HOGARES EN LIMA METROPOLITANA Y EL RIMAC, SEGUN

TIPO DE VIVIENDA QUE OCUPAN. 2008.

Numero de Hogares segun tipo de vivienda que ocupan

■ Otros

OVivien. en Vecindad O

Vivienda en quinta ■

Dpto. en edificio

• Casa Indepen.

Lima Rimac

Distrito

c) Sistemas de barras

Se usa cuando se quiere en un solo grafico representar comparativamente los

datos de dos muestras o poblaciones.

Ejemplo:

Grafico N9 3

60

Page 9: Final Estadistica 1

1.2 Circulares.- Se usa cuando la variable tiene pocas categorias (<=5). El

grafico es por medio de sectores circulares.

Para construir este grafico, se divide el circulo en sectores, cuyas areas seran

proporcionales a los valores de las variables. Esta division es obtenida

mediante la siguiente operacion:

Total de datos=3609.

Ejemplo:

Usando la informacion contenida en la Tabla N4 1, graficar las frecuencias

mediante sectores circulares.

Soluci6n:

Realizando una regla de tres simple

24-360° 24-360° 24-360° 24-360° 24-360°

7- x 9- x 3- x 1- x 4- x

x =105° x =135° x=452 x=15° x= 60°

Grafico N4 4

NUMERO DE HOGARES EN LIMA METROPOLITANA, SEGUN TIPO DE VIVIENDA QUE OCUPAN. 2008.

Casa

Vivienda Otro independi

en 1 6,7% ente

vecindad1 \ / 29,2% 4,2%

Vivienda

en quintal Dpto. en 12,5% edificio

37,5%

61

Page 10: Final Estadistica 1

3. PRESENTACION GRAFICA DE VARIABLES CONTINUAS 0 DISCRETAS

(de recorrido amplio)

3.1 El Histograma de frecuencias

Un histograma de frecuencias es una representacion grafica de una distribucion de

frecuencias absolutas o relativas para datos cuantitativos continuos o

discretos de recorrido amplio, de modo tal que las frecuencias de clase o

intervalo, absoluta o relativa, se representen por areas rectangulares en la

grafica.

Histograma para distribuciones de frecuencias absolutas

Considerese el caso de graficar la informacion contenida en la tabla N9 3 en un

histograma de frecuencias; dicho histograma se dibuja en un conjunto de

coordenadas rectilineas y consta de una serie de rectangulos continuos,

tambien conocidos como barras o columnas, puestos en el eje horizontal de

modo que sus bases correspondan a las clases o intervalos de anchos

posiblemente diferentes o iguales y sus areas a frecuencias del intervalo.

Ejemplo: Graficar las frecuencias absolutas de la Tabla N9 3

Grafico N9 7

Histograma de la variable tiempo para armar la totalidad de

una pagina editorial durante 50 anos

12

10 a M

Std. Dev= 1.74

Mean = 22.33 N =

50.00

19.00 20.00 21.00 22.00 23.00 24.00 25.00

19.50 20.50 21.50 22.50 23.50 24.50 25.50

Tiempo

63

Page 11: Final Estadistica 1

Histograma para distribuciones de frecuencias relativas

Los histogramas para distribuciones de frecuencias relativas se construyen con

los mismos principios que los de distribuciones absolutas. Volviendo a la

informacion en la tabla N9 3, el histograma tendria la misma forma que el que

muestra la figura N2 7, sin embargo, las Ieyendas del eje vertical cambiarian

para reflejar las proporciones de dias.

3.2 El poligono de frecuencias

Es una forma alterna de representar graficamente una distribucion de

frecuencias absoluta o relativa de una variable cuantitativa continua o discreta de

recorrido amplio.

Para construir un poligono de frecuencias se usa el mismo conjunto de

coordenadas que para el histograma, pero esta vez la marca de clase, o punto

medio de cada ancho del intervalo o clase y se pone un punto arriba de ella a una

altura igual a la densidad de frecuencias absoluta o relativa, luego se unen los

puntos mediante lineas rectas. Para completar el poligono, tambien se dibujan

lineas rectas desde los puntos por encima de la primera y ultima marca de clase,

respectivamente.