Final Estadistica 1
-
Upload
jhonathan-chumpitaz -
Category
Documents
-
view
213 -
download
0
description
Transcript of Final Estadistica 1
LECCION 1
LA PRESENTACION DE DATOS EN TABLAS
Una vez recopilados sus datos, los investigadores se ponen a trabajar en una
tarea igualmente importante como es la presentacion eficiente de los mismos, labor
particularmente crucial cuando la recopilacion es grande.
Existen dos procedimientos comunes para hacer inteligibles las recopilaciones de
datos: la construccion de tablas y graficas.
1. LA DISTRIBUCION DE FRECUENCIAS 0 TABLAS DE FRECUENCIAS
Una forma en que podemos comprimir los datos es la tabla de frecuencias o
distribucion de frecuencias.
Una distribucion de frecuencias es una tabla en la que organizamos los datos en
los distintos valores que toma la variable bajo estudio donde se presenta. Asi, una
distribucion de frecuencias muestra el numero de observaciones del conjunto de
datos que corresponden a cada uno de los valores de la variable.
Si uno puede determinar la frecuencia con la que se presenta los valores de un
conjunto de datos, uno puede construir una distribucion de frecuencias.
Tabla o Cuadro Estadistico
Se define como el conjunto de datos estadisticos ordenados en columnas y
filas, que permite leer, comparar e interpretar las caracteristicas de una o mas
variables.
Estructura y elementos de un cuadro estadIstico
1. Numero (cuando hay varias tablas)
2. Titulo (,DOnde?, ,Que?, �COmo?,,Cuando?)
;.DOnde?.- Se refiere al lugar al que corresponde la informacion.
;.Que?:- Se refiere al hecho observado o caracteristica principal que se quiere
mostrar.
50
i.Como?.- Se refiere at orden en que se presenta is informacion, empezando con
las variables del encabezamiento, que iran precedidas por la preposicion "POR" y
continuando con las variables y clasificaciones de la columna matriz, que iran
precedidas por la preposicion "SEGUN".
;.Cuando?.- Se refiere al periodo temporal que cubre la informacion.
3. Encabezamiento (referente a la primera fila) es donde se indica la
naturaleza (las categorias de la variable) del contenido de cada columna.
Viene precedida por la preposicion "POR".
4. Columna matriz. Es el elemento localizado at lado izquierdo del cuadro.
Aqui es designada la naturaleza (las modalidades de la variable) del
contenido de cada fila. Sigue a la preposicion "SEGUN".
5. Cuerpo. Donde se consignan los datos.
6. Pie (Nota, Ilamada, fuente, elaboracion).
Ejemplo:
TablaN°1 ♦---
4
HUANUCO: TASA DE ANALFABETISMO POR SEXO SEGUN AREA DE RESIDENCIA, 2010
Area de residencia TOTAL Sexo
Masculino Femenino TOTAL
Urbana Rural
}
}s
2
61 Fuente: Ministerio de Educacion-Oficina de Sistemas de Informacion
�Donde? : HUANUCO
LQue? : TASA DE ANALFABETISMO
,Como? : Por sexo, segun Area de referencia
LCuando? : 2010
51
{
2. TABULACION DE DATOS
Tabulacion.- Es ordenar la informacion en una tabla y contar.
Conceptos
Sea X una variable estadistica de la poblacion en estudio que toma diferentes valores xi, i= 1, ........ k
Frecuencia absoluta de un dato (f; )
Llamaremos frecuencia absoluta de un valor x de la variable estadistica X, at
numero de veces que aparece repetido dicho valor en el conjunto de
observaciones.
Frecuencia relativa de un dato (hi )
La frecuencia relativa de un valor observado x; de la variable X , es el cociente
entre su frecuencia absoluta (f) y el numero de observaciones realizadas (n) y se
denota por
h;=f;/n,i=1 ..... K
Se expresa en terminos de porcentajes.
Frecuencia absoluta acumulada (F; )
La frecuencia absoluta acumulada de un valor x de la variable X es igual a la
suma de los valores inferiores o iguales a dicho valor. Es decir
F;=F f;
Frecuencia relativa acumulada (H; )
Se llama frecuencia relativa acumulada de un valor x de una variable X, al
cociente entre su frecuencia absoluta acumulada y el numero de observaciones
realizadas (n).
Se denote por H; = F; In
52
Propiedades de las frecuencias
Sea n el numero total de observaciones realizadas de la variable X que toma
valores xi
1. Yfi = n
2. Yhi = 1 6 100% 3. Fk = n (la ultima frecuencia absoluta acumulada = n) 4. Hk = 1 (la ultima frecuencia relativa acumulada = 1)
5. 0<_ f;<_ n i=1. ...., k
6.05 his 1 i=1, ........ k
3. DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE CUALITATIVA
Se hace una lista de las posibles categorias de la variable X: x1, x2, ........... xk y se
ve cuantas veces se repite cada una (fi) y se calcula las frecuencias relativas de
cada categoria (hi).
X fi hi
hi .. h2
XK fK hK Total n 1
Ejemplo:
Una encuesta a 24 hogares realizada en Lima Metropolitana, dio los siguientes
resultados en cuanto al tipo de vivienda que ocupan:
Hogar 1 2 3 4 5 6 7 8 9 10 11 12
Vivienda 1 1 0 4 1 2 4 0 1 1 1 3
Hogar 13 14 15 16 17 18 19 20 21 22 23 24
Vivienda 0 2 0 0 0 1 1 2 4 4 0 1
0: casa independiente 1: dpto. en edificio 2: vivienda en quinta 3: vivienda en vecindad 4: otro
Solucidn
53
Se consideran los valores que toma la variable Tipo de Vivienda y se registra el
numero de veces que se repite cada una.
Tabla N2 1
HOGARES DE LIMA METROPOLITANA SEGUN EL TIPO DE VIVIENDA QUE
OCUPAN. 2012
Tipo de vivienda Casa independiente -----..------------
Dpto. en edificio Vivienda en quinta .....--..-...-..------------ Vivienda en vecindad
11 Otro
Total
Interpretacion:
f; h;
7 7/24=0.29
9 9/24=0.38
3 3/24=0.12
1 1/24=0.04
4 4/24=0.17
24 1.00
Se observa que el 38% de los hogares entrevistados, viven en Dpto. en edificio
y solo el 4% viven en vivienda en vecindad..
4. DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE DISCRETA (De
recorrido corto)
Sea una variable discreta X cuyos valores observados son x, , X2 ......... xk
Se hace una lista de los diferentes valores que toma la variable, se ordena en
forma ascendente y se determina cuantas veces se repite cada valor.
Valores de X
X1
X2
XK
L Total
Frecuenci Frecuencia a Absoluta Relativa
f; h;
fl h, =f,In
f2 h2=f,/n
hk=fk/n
n 1
Frecuencia
Absoluta Acumulada
F;
F1 =f,
F2=f, +f2
Fk=f, +..+fk=n
54
Frecuencia Relativa Acumulada
H;
H, = h1 . _ ... ......... H2 = F2 /n
Hk=Fk/n=1
5. DISTRIBUCION DE FRECUENCIAS DE VARIABLE CONTINUA Y DE
VARIABLE DISCRETA (de recorrido amplio)
Cuando se trata de datos de una caracteristica cuantitativa de variable continua se
tienen que formar intervalos sucesivos que abarquen todo el recorrido.
Igualmente si tenemos una caracteristica cuantitativa de variable discreta de
recorrido amplio no conviene enumerar uno a uno los valores que toma sino
conviene formar intervalos.
Reglas para la construcci6n de una tabla (distribuci6n de frecuencias)
1. Determinaci6n del recorrido o rango de los datos (R)
Rango = Valor maximo valor minimo
2. Determinacion del numero de intervalos (I )
a) Se calcula de forma tentativa y aproximada.
b) Usando la regla de Sturges: I = 1+ 3.3 log n, en donde n es igual al tamano
del conjunto de datos.
(En este caso usaremos la regla)
3. Determinaci6n de la amplitud del intervalo (A )
A=R/I
4. Determinaci6n de los limites del intervalo semiabierto (cerrado en el limite
inferior, abierto en el limite superior).
Se debe tomar el resultado numerico mas bajo como el limite inferior del
primer intervalo. Luego agregar A para obtener el limite superior y asi
sucesivamente.
X fi h; F; H;
fi hi F, H1
f2 h2 F2 H2 ------------------------
fK hK FK = n =1
Total I N 1 1
56
LECCION 2
LA PRESENTACION DE DATOS: GRAFICAS
Las graficas indudablemente, son el medio mas conocido de presentar datos
estadisticos. De una forma u otra, Ia informacion condensada en cualquier tipo de
tabla tambien se puede presentar con ayuda de una grafica.
1. PRESENTACION GRAFICA DE VARIABLES CUALITATIVAS
1.1 Barras.- Se usan cuando la variable tiene muchas categorias.
a) Simples: son rectangulos cuya altura es la frecuencia absoluta o relativa de
los valores de la variable.
Ejemplo: Graficar la informacion contenida en la Tabla N° 1
Grafico N° 1 HOGARES DE LIMA METROPOLITANA, SEGON TIPO DE VIVIENDA QUE OCUPAN. 2008.
0 2 4 6 8 10
Numero
59
b) Componentes
Es cuando cada barra se divide en dos 6 mas partes de acuerdo a cierta
caracteristica.
Ejemplo: Hogares (Tipo de vivienda).
Grafico N9 2 NUMERO DE HOGARES EN LIMA METROPOLITANA Y EL RIMAC, SEGUN
TIPO DE VIVIENDA QUE OCUPAN. 2008.
Numero de Hogares segun tipo de vivienda que ocupan
■ Otros
OVivien. en Vecindad O
Vivienda en quinta ■
Dpto. en edificio
• Casa Indepen.
Lima Rimac
Distrito
c) Sistemas de barras
Se usa cuando se quiere en un solo grafico representar comparativamente los
datos de dos muestras o poblaciones.
Ejemplo:
Grafico N9 3
60
1.2 Circulares.- Se usa cuando la variable tiene pocas categorias (<=5). El
grafico es por medio de sectores circulares.
Para construir este grafico, se divide el circulo en sectores, cuyas areas seran
proporcionales a los valores de las variables. Esta division es obtenida
mediante la siguiente operacion:
Total de datos=3609.
Ejemplo:
Usando la informacion contenida en la Tabla N4 1, graficar las frecuencias
mediante sectores circulares.
Soluci6n:
Realizando una regla de tres simple
24-360° 24-360° 24-360° 24-360° 24-360°
7- x 9- x 3- x 1- x 4- x
x =105° x =135° x=452 x=15° x= 60°
Grafico N4 4
NUMERO DE HOGARES EN LIMA METROPOLITANA, SEGUN TIPO DE VIVIENDA QUE OCUPAN. 2008.
Casa
Vivienda Otro independi
en 1 6,7% ente
vecindad1 \ / 29,2% 4,2%
Vivienda
en quintal Dpto. en 12,5% edificio
37,5%
61
3. PRESENTACION GRAFICA DE VARIABLES CONTINUAS 0 DISCRETAS
(de recorrido amplio)
3.1 El Histograma de frecuencias
Un histograma de frecuencias es una representacion grafica de una distribucion de
frecuencias absolutas o relativas para datos cuantitativos continuos o
discretos de recorrido amplio, de modo tal que las frecuencias de clase o
intervalo, absoluta o relativa, se representen por areas rectangulares en la
grafica.
Histograma para distribuciones de frecuencias absolutas
Considerese el caso de graficar la informacion contenida en la tabla N9 3 en un
histograma de frecuencias; dicho histograma se dibuja en un conjunto de
coordenadas rectilineas y consta de una serie de rectangulos continuos,
tambien conocidos como barras o columnas, puestos en el eje horizontal de
modo que sus bases correspondan a las clases o intervalos de anchos
posiblemente diferentes o iguales y sus areas a frecuencias del intervalo.
Ejemplo: Graficar las frecuencias absolutas de la Tabla N9 3
Grafico N9 7
Histograma de la variable tiempo para armar la totalidad de
una pagina editorial durante 50 anos
12
10 a M
■
Std. Dev= 1.74
Mean = 22.33 N =
50.00
19.00 20.00 21.00 22.00 23.00 24.00 25.00
19.50 20.50 21.50 22.50 23.50 24.50 25.50
Tiempo
63
Histograma para distribuciones de frecuencias relativas
Los histogramas para distribuciones de frecuencias relativas se construyen con
los mismos principios que los de distribuciones absolutas. Volviendo a la
informacion en la tabla N9 3, el histograma tendria la misma forma que el que
muestra la figura N2 7, sin embargo, las Ieyendas del eje vertical cambiarian
para reflejar las proporciones de dias.
3.2 El poligono de frecuencias
Es una forma alterna de representar graficamente una distribucion de
frecuencias absoluta o relativa de una variable cuantitativa continua o discreta de
recorrido amplio.
Para construir un poligono de frecuencias se usa el mismo conjunto de
coordenadas que para el histograma, pero esta vez la marca de clase, o punto
medio de cada ancho del intervalo o clase y se pone un punto arriba de ella a una
altura igual a la densidad de frecuencias absoluta o relativa, luego se unen los
puntos mediante lineas rectas. Para completar el poligono, tambien se dibujan
lineas rectas desde los puntos por encima de la primera y ultima marca de clase,
respectivamente.