Entrega Final Proyecto Estadistica

15
PROYECTO FINAL ESTADISTICA Integrantes: Sandra Yineth Galindo Castro – Cód 1121070193 Jilly Brigitte Torres López – Cód 0211090806 Ivonne Alexandra Sarmiento F – Cód 1111070825 Michael Johani Rodríguez Urrego – Cód Arturo Javier Castro Guzmán – Cód 0820014000

description

11

Transcript of Entrega Final Proyecto Estadistica

PROYECTO FINALESTADISTICA

Integrantes:

Sandra Yineth Galindo Castro Cd 1121070193

Jilly Brigitte Torres Lpez Cd 0211090806

Ivonne Alexandra Sarmiento F Cd 1111070825

Michael Johani Rodrguez Urrego Cd

Arturo Javier Castro Guzmn Cd 0820014000UNIVERSIDAD POLITENCNICO GRAN COLOMBIANO

BOGOTA D.C. 2012

PROPUESTA A ESTUDIAR

El Departamento Administrativo Nacional de Estadstica -DANE, realiza la Encuesta Nacional de Hogares (ENH) en forma ininterrumpida desde 1976, su objetivo es medir los cambios en los niveles de empleo, desempleo y otras variables relacionadas con la fuerza de trabajo de la poblacin. Adems busca informacin de otras variables como: nmero de personas en la familia, ingresos familiares anuales, gastos de alimentacin anuales, gastos adicionales anuales, si tiene vivienda propia, si tiene automvil y si tiene computador personal, entre otras.

La codificacin empleada en la base de datos es:

CODIGOVARIABLE

NIDNMERO DE PERSONAS

PENMERO DE PERSONAS EN LA FAMILIA

INGINGRESOS FAMILIARES ANUALES (EN MILES DE PESOS)

ALGASTOS DE ALIMENTACIN ANUALES (EN MILES DE PESOS)

ADGASTOS ADICIONALES ANUALES (EN MILES DE PESOS)

VVIVIENDA PROPIA. SI=1 NO= 0

ATIENE AUTOMVIL. . SI=1 NO= 0

OTIENE COMPUTADOR PERSONAL. . SI=1 NO= 0

MMUNICIPIO. VALORES DE 1

SE TOMA COMO BASE DE ESTUDIO LA HOJA3 CORRESPONDIENTE AL ESTRATO 2 De acuerdo al caso planteado determine la poblacin objeto de estudio y la muestra. La poblacin: 1500 familias encuestadas La muestra: 633 familias que corresponden al estrato 2

Clasificacin de la variable y escala de la medida

HOGARES ESTRATO 2

VARIABLETIPO DE VARIABLEESCALA DE MEDIDA

NID: NMERO DE ORDENCualitativa Nominal

PE: NMERO DE PERSONAS EN LA FAMILIACuantitativa discretaRazn

ING: INGRESOS FAMILIARES ANUALESCuantitativa continuaRazn

AL: GASTOS DE ALIMENTACIN ANUALESCuantitativa continuaRazn

AD: GASTOS ADICIONALES ANUALESCuantitativa continuaRazn

V: VIVIENDA PROPIA. S:1, NO:0Cualitativa Nominal

A: TIENE AUTOMOVIL. S:1, NO:0Cualitativa Nominal

O: TIENE COMPUTADOR PERSONAL. S:1, NO:0Cualitativa Nominal

M: MUNICIPIO. VALORES DE 1 A 100Cualitativa Nominal

VARIABLE CUANTITATIVA DISCRETA - (PE) NMERO DE PERSONAS EN LA FAMILIAFRECUENCIA CUANTITATIVA DISCRETANUMERO DE PERSONA POR FAMILIA

NUMERO DE PERSONAS EN LA FAMILIA (NID )NUMERO DE FAMILIAS (PE)NUMERO ACOMULADO DE FAMILIAS PROPORCION DE FAMILIASPROPORCION ACOMULADA DE FAMILIAS

XiniNihiHi

11181180,18618,6%

21752930,27646,3%

31624550,25671,9%

41255800,19791,6%

5466260,07398,9%

676330,011100,0%

TOTAL6336331100%

VARIABLE CUANTITATIVA CONTINUA - (ING) INGRESOS FAMILIARES ANUALES Se halla el valor mnimo de ingresos: 38.007 Se halla el valor mximo de ingresos: 43.9701. RANGO

RANGO = ING MAX - ING MIN RANGO = 43.970-38.007

RANGO = 5.963

2. NUMERO DE INTERVALOS

m = 10,24

m= 10

3. AMPLITUD DEL GRUPO

C= 596.3 PRIMERA COLUMNA INICIA (Li)= 38.007

SEGUNDA INICIA (Ls) = Li + C

GRUPO LiCLs=Li+C

138007596,338603,3

238603,3596,339199,6

339199,6596,339795,9

439795,9596,340392,2

540392,2596,340988,5

640988,5596,341584,8

741584,8596,342181,1

842181,1596,342777,4

942777,4596,343373,7

1043373,7596,343970

PUNTO MEDIO GXi= 38305.15

INGRESOS FAMILIARES INGRESOS FAMILIARES MEDIONUMERO DE FAMILIAS PROPORCION DE FAMILIAS NUMERO ACOMULADO DE FAMILIAS PROPORCION ACOMULADO DE FAMILIAS

Li-LsXinihiNiHi

3800738603,338305,15630,1006310%

38603,339199,638901,45660,10412920%

39199,639795,939497,75550,08718429%

39795,940392,240094,05720,11425640%

40392,240988,540690,35370,05829346%

40988,541584,841286,65650,10335857%

41584,842181,141882,95670,10642567%

42181,142777,442479,25640,10148977%

42777,443373,743075,55920,14558192%

43373,74397043671,85520,082633100%

TOTAL DAT6331

VARIABLE CUALITATIVA -A: TIENE AUTOMOVIL.

AUTOMOVIL SI(1) NO(0)NUMERO DE FAMILIAS (NID)PORCENTAJE

038761,14%

124638,86%

TOTAL633100%

GRAFICO BARRAS FAMILIAS CON AUTOMOVIL

VARIABLE CUALITATIVA -O TIENE COMPUTADOR PERSONAL

COMPUTADOR PERSONAL SI(1) NO(0)NUMERO DE FAMILIAS (NID)PORCENTAJE

056689,42%

16710,58%

TOTAL633100%

.ENTREGA FINAL DEL PROYECTO

MEDIDAS DESCRIPTIVAS

A continuacin se analizan algunas medidas de tendencia central, ciertas medidas de localizacin, as como tambin determinadas medidas de dispersin para las variables cuantitativas que dan cuenta del nmero de personas en la familia y los ingresos familiares anuales. stas, hacen parte de un conjunto de variables que son incluidas en la Encuesta Nacional de Hogares y permiten realizar un anlisis socioeconmico de las familias encuestadas.

Con relacin a la primera variable, inicialmente se realizan algunos clculos en la tabla de frecuencia, as:

VARIABLE CUANTITATIVA DISCRETA

NUMERO DE PERSONA EN LA FAMILIA

NUMERO DE ORDEN (NID )NUMERO DE PERSONAS EN LA FAMILIS (PE)NUMERO ACOMULADO DE PERSONAS PROPORCION DE PERSONAS PROPORCION ACOMULADA DE PERSONAS

XiniNihiHini*Xini*

11181180,18640,1864118118

21752930,27650,4629350700

31624550,25590,71884861458

41255800,19750,91635002000

5466260,07270,98892301150

676330,01111,000042252

TOTAL6331,0017265678

Los datos de esta tabla permiten calcular las medidas descriptivas que sern presentadas a largo del trabajo.

En primer lugar, resulta pertinente conocer cul es el promedio de personas por familia, dado que esto permite realizar un acercamiento al entorno de los individuos.

De ah, de acuerdo a los resultados extrados de la base de datos utilizada, en promedio existen 3 personas por familia en el estrato socioeconmico 2. Por su parte, al calcular n/2 (316,5) y compararlo con las frecuencias absolutas acumuladas (Ni), podemos observar que se encuentra contenido en Ni=455 (menor frecuencia que lo contiene) y por lo tanto la mediana es tres; esto es, el 50% de las familias con menores integrantes tiene como mximo 3 personas. Por otro lado, es posible afirmar que lo ms frecuente es encontrar familias con 2 integrantes, por lo que la Moda es igual a 2.

Ahora bien, tambin podemos hallar que el mnimo nmero de personas por familia que se encuentra en el 20% de los hogares con mayor nmero de integrantes (percentil 80), es equivalente a 4 personas. Este resultado surge de comparar k*n/100 (506,4) con Ni encontrando el menor Ni que contiene dicho valor, que en este caso corresponde a la fila de 4 personas. A su vez, encontramos que el 25% de las familias con menores integrantes tienen como mximo 2 personas (cuartil 1), lo cual se obtiene, de forma similar, comparando k*n/4 (158,250) con Ni.

Finalmente, con relacin a las medidas de dispersin, tenemos que la varianza es una medida de variabilidad que toma en cuenta la dispersin que los valores de los datos tienen respecto a la media. Por lo tanto, el promedio ponderado de las desviaciones cuadrticas de los valores de la variable con respecto al nmero de integrantes promedio por familia es equivalente a 1,535.

En tanto, el nmero de personas por familia tiene una variacin de 1,239 personas con respecto al nmero de integrantes promedio. Por su parte, el coeficiente de variacin nos dice que porcentaje de la media es desviacin tpica, como su valor para este caso es igual a 45,439% (CV=1,239/2,727*100%) y se encuentra entre 25% y 75%, es posible deducir que la muestra es relativamente homognea y por lo tanto el nmero de personas promedio por familia podra carecer de significado.

Con relacin a la segunda variable, tambin se realizan algunos clculos en la tabla de frecuencia, as:

VARIABLE CUANTITATIVA CONTINUA

INGRESOS FAMILIARES ANUALES

INGRESOS FAMILIARES INGRESOS FAMILIARES MEDIOSNUMERO DE FAMILIAS PROPORCION DE FAMILIAS NUMERO ACUMULADO DE FAMILIAS PROPORCION ACUMULADA DE FAMILIAS INGRESOS POR NMERO DE FAMILIASINGRESOS AL CUADRADO POR NMERO DE FAMILIAS

Li-LsXinihiNiHi xi*niXi2*ni

3800738603,3038305,15630,099526066630,0995260662413224,45092438924540,918

38603,339199,6038901,45660,1042654031290,2037914692567495,70099879305598,765

39199,639795,9039497,75550,0868878361840,2906793052172376,25085803974028,438

39795,940392,2040094,05720,1137440762560,4044233812886771,600115742364868,980

40392,240988,5040690,35710,1121642973270,5165876782889014,850117555025401,697

40988,541584,8041286,65610,0963665093880,6129541862518485,650103979835561,573

41584,842181,1041882,95770,121642974650,7345971563224987,150135071975554,092

42181,142777,4042479,25570,0900473935220,824644552421317,250102855740792,062

42777,443373,7043075,55570,0900473935790,9146919432455306,350105763671444,743

43373,743970,0043671,85540,08530805763312358279,900102990446050,815

TOTAL 633125907259,1501062081263842,080

La marca de clase (ingresos familiares medios) es el punto medio de cada intervalo, por lo tanto, para obtenerlo se suman los lmites en cada intervalo y se divide entre dos. Con base a esto, calculamos en otra columna la multiplicacin de cada marca de clase por las frecuencias, lo cual nos sirve para hallar la media.

Esto es, en promedio los ingresos anuales de los hogares analizados son equivalentes a $40.927,740. Mientras que el 50% de las familias con menores niveles de ingresos anuales obtienen como mximo $40.900,315. A su vez, lo ms usual es encontrar familias con unos ingresos anuales de $41.849,822. A continuacin se muestran los procedimientos realizados para obtener estos resultados:

Por otro lado, calculamos el cuartil 3, el cual nos indica que el 75% de los hogares con menores niveles de ingreso anuales reciben como mximo $42.283,099. En tanto, el 40% de las familias con menores ingresos anuales obtienen un valor mximo de $40.369,011.

En ltimo lugar, analizamos algunas medidas de dispersin tales como la varianza, la desviacin estndar y el coeficiente de variacin.

De ah, el promedio ponderado de las desviaciones cuadrticas de los valores de la variable con respecto a los ingresos promedios por familia es equivalente a $2773.630,788. En tanto, los ingresos anuales tienen una variacin de $1.655,422 con respecto a los ingresos promedio. Finalmente, el coeficiente de variacin que nos indica el porcentaje de la media que corresponde a desviacin tpica, indica que la muestra es homognea y por lo tanto los ingresos anuales promedio por familia son representativos, dado que esta medida es igual a 4,07% (CV=1665,422/40927,740*100%), menor al 25%.

CONCLUSIONES De acuerdo a la muestra que tomamos de esta base de datos, en este caso los hogares de estrato dos podemos concluir: *Las familias de acuerdo al numero de integrantes, observamos que el 73% de los hogares lo componen entre 2 y 4 personas; es muy notorio que los hogares de gran cantidad de integrantes ha venido disminuyendo, en especial por la falta de ingresos como limitante, de acuerdo a las necesidades bsicas que no siempre se pueden cubrir o satisfacer. En el estrato 2, la diferencia en ingresos anuales de acuerdo al menor y mayor valor equivale a una diferencia de 6 millones aproximadamente, en los intervalos de las 633 familias hay una diferencia de ingresos de 600mil pesos aprox. La diferencia de ingresos determina igualmente el poder adquisitivo de bienes y servicios, al igual que el pago de servicios, arriendos y dems.

C= QUOTE

C= QUOTE

Xi= QUOTE

Xi= QUOTE

NO SI