ESTADISTICA

36

description

Contenido temático de estadística descriptiva.

Transcript of ESTADISTICA

927

TEMA 1: DESCRIPCIN DE UNA MUESTRA

TEMA 1: DESCRIPCIN DE UNA MUESTRA

1. INTRODUCCIN1.1 DEFINICIN DE ESTADSTICA1.2 MODELO ESTADSTICO1.3 ESTADSTICA DESCRIPTIVA1.4 CONCEPTOS BSICOSPOBLACINVARIABLE: Cualitativas o Categricas y Cuantitativas (Discretas y Continuas)MUESTRATAMAO MUESTRALDATO

2. DISTRIBUCIONES DE FRECUENCIAS2.1 FRECUENCIA ABSOLUTA2.2 FRECUENCIA RELATIVA2.3 FRECUENCIA ACUMULADA2.4 FRECUENCIA RELATIVA ACUMULADA2.5 TABLA DE FRECUENCIAS2.6 DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

3. MTODOS GRFICOS3.1 FRECUENCIAS NO ACUMULADASDIAGRAMA DE BARRASDIAGRAMA DE SECTORES O DE PASTELPICTOGRAMAHISTOGRAMA3.2 FRECUENCIAS ACUMULADASPOLGONO DE FRECUENCIAS

4. MEDIDAS DESCRIPTIVAS4.1 MEDIDAS DE POSICIN4.1.1 MEDIDAS DE TENDENCIA CENTRALMEDIA ARITMTICAMEDIANAMODAMEDIA GEOMTRICAMEDIA ARMNICA4.1.2 MEDIDAS DE POSICIN NO CENTRALES: CUANTILESPERCENTILESCUARTILESDECILES4.1.3 MOMENTOSMOMENTOS RESPECTO AL ORIGENMOMENTOS CENTRALES O RESPECTO A LA MEDIA4.2 MEDIDAS DE DISPERSIN4.2.1 MEDIDAS DE DISPERSIN ABSOLUTASVARIANZADESVIACIN TPICACUASI-VARIANZADESVIACIN MEDIA RESPECTO A LA MEDIADESVIACIN MEDIA RESPECTO A LA MEDIANARECORRIDO O RANGO MUESTRALRECORRIDO INTERCUARTLICO4.2.2 MEDIDAS DE DISPERSIN RELATIVASCOEFICIENTE DE VARIACIN DE PEARSON4.3 OTRAS MEDIDAS DESCRIPTIVAS4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS4.3.2 MEDIDAS DE FORMAA: Medidas de ASIMETRACOEFICIENTE DE ASIMETRA DE FISHERCOEFICIENTE DE ASIMETRA DE PEARSONB: Medidas de APUNTAMIENTO O CURTOSISCOEFICIENTE DE APUNTAMIENTO DE FISHER4.3.3 MEDIDAS DE CONCENTRACINNDICE DE CONCENTRACIN DE GINICURVA DE LORENZ5. TRANSFORMACIONES LINEALES5.1 EN LA MEDIA5.2 EN LA MEDIANA5.3 EN LA VARIANZA5.4 EN LA DESVIACIN TPICA

TEMA 1 : DESCRIPCIN DE UNA MUESTRA

1. INTRODUCCIN

Ejemplo 1

El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto a la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos y ha obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Ejemplo 2

Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:3.94.73.75.64.34.95.06.15.14.55.33.94.35.06.04.75.14.24.45.83.34.34.15.84.43.86.14.35.34.54.05.43.94.73.34.54.74.24.54.8

1.1 DEFINICIN DE ESTADSTICA: es la ciencia que se encarga de la recopilacin, representacin y el uso de datos sobre una o varias caractersticas de inters para, a partir de ellos, tomar decisiones o extraer conclusiones generales.

1.2 MODELO ESTADSTICO: PASO 0: Planteamiento del problema en trminos precisos: mbito de aplicacin (poblacin) y caracterstica(s) a estudio (variable(s)) PASO 1: Recogida de datos de la poblacin de inters (MUESTREO) PASO 2: Organizacin, Presentacin y Resumen de los datos (o de la muestra).(ESTADSTICA DESCRIPTIVA). PASO 3: Confeccin de modelos matemticos. (TEORA DE LA PROBABILIDAD). PASO 4: Obtener conclusiones generales o verificar hiptesis (INFERENCIA ESTADSTICA).

1.3 ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga de organizar, resumir y dar una primera descripcin (sin conclusiones generales) de los datos.1.4 CONCEPTOS BSICOS:

POBLACIN: Es el conjunto de individuos o entes sujetos a estudio (En nuestro caso las poblaciones seran: en el ejemplo primero el conjunto de todas las familias espaolas y en el segundo ejemplo el conjunto de todos los hoteles de esta categora de esta ciudad.). Algunas poblaciones son finitas y pueden conocerse; otras pueden ser infinitas y abstractas: Ej: el conjunto de todos los hoteles o el conjunto de todas las piezas fabricadas por una mquina.

VARIABLE: Caracterstica que estamos midiendo (Ej 1: nmero de hijos, Ej 2: precio de la habitacin) Las variables se suelen denotar por letras maysculas: X, Y,...Tipos de variables:1. Cualitativas o Categricas: aquellas que no son medibles, es decir, aquellas cuyas observaciones no tienen carcter numrico. Expresan cualidades o categoras. Ej.: estado civil, sexo o profesin.(A las variables cualitativas tambin se les llama atributos).

2. Cuantitativas: aquellas que son medibles, es decir sus observaciones tienen carcter numrico. Estas se dividen a su vez en:* Discretas:toman valores en un conjunto numerable. Ej.: Nmero de habitaciones de un hotel, nmero de hijos de una familia, nmero de obreros de una fbrica.* Continuas:toman valores en un conjunto no numerable (los nmeros reales o un intervalo). Ej.: peso, estatura .

NOTA:La distincin entre variables discretas y continuas es ms terica que prctica, puesto que la limitacin de los aparatos de medida hace que todas las variables se comporten como discretas cuando se pretende observarlas. De momento haremos ms flexible el concepto de variable continua considerando continua a aquella variable que toma un gran nmero de valores diferentes, en este sentido podemos considerar la variable precio de la habitacin como continua.

MUESTRA: Es un conjunto finito de elementos seleccionados de la poblacin. (las 50 familias, los 40 hoteles)

TAMAO MUESTRAL: nmero de observaciones en la muestra. Habitualmente se denotar por n.

DATO: cada valor observado de la variable. Si representamos por X a la variable, representaremos por xi cada dato diferente observado en la muestra, el subndice i indica el lugar que ocupa si los ordenamos de menor a mayor.Ej1:x1 =0, x2=1 Ej2:x1 =3.3, x2=3.7 Denotaremos por k al nmero de valores distintos.

2. DISTRIBUCIONES DE FRECUENCIAS

Observando los datos del ejemplo es fcil adivinar cual ser el primer paso en la organizacin de los datos; consistir en agrupar aquellos datos que se repiten varias veces. Tenemos las siguientes definiciones:

2.1 FRECUENCIA ABSOLUTA (ni): es el nmero de veces que se repite un determinado valor (xi) de la variable. Ej1: para el dato x1=0 n1=2, para el dato x4=3 n4=15.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al tamao muestral.

Este tipo de frecuencias no son comparables con las obtenidas en otras muestras de distinto tamao.

2.2 FRECUENCIA RELATIVA (fi): es igual a la frecuencia absoluta dividida por el nmero total de datos, es decir por el tamao muestral fi=ni/n. Ei1.: f1=2/50=0.04, f4=15/50=0.3

PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.

2.3 FRECUENCIA ACUMULADA (Ni): Nos dice el nmero de datos que hay igual o inferiores a uno determinado. Se calcula: Ej1: N1=2, N4=42.

PROPIEDAD: La ltima frecuencia acumulada absoluta es el tamao muestral.

2.4 FRECUENCIA RELATIVA ACUMULADA (Fi):Es el resultado de dividir cada frecuencia acumulada por el nmero total de datos Ej1: F1=0.04, F4=42/50=0.84.PROPIEDAD: La ltima frecuencia relativa acumulada es la unidad.

2.5 TABLA DE FRECUENCIAS :Llamamos as a una tabla conteniendo el conjunto de diferentes valores que ha tomado una variable (los datos sin repetir) ordenados de menor a mayor con sus correspondientes frecuencias.

Ejemplo 1:

xini fi Ni Fi

020.0420.04

140.0860.12

2210.42270.54

3150.3420.84

460.12480.96

510.02490.98

610.02501

Cul es el nmero de familias que tiene como mximo dos hijos? en la columna de las ni: 2+4+21=27 en la columna de las Ni: N2= 27 Cuntas familias tienen ms de 1 hijo pero como mximo 3? en la columna de las ni: 21+15=36 en la columna de las Ni: 42-6=36 Qu porcentaje de familias tiene ms de 3 hijos?en la columna de las fj: 0.12+0.02+0.02=0.16, que supone un 16% en la columna de las Fi: 1-0.84=0.16, 16%

Ejemplo 2:

x ni fj NiFj

3.620.0520.05

3.710.02530.075

3.810.02540.1

3.930.07570.175

410.02580.2

4.110.02590.225

4.220.05110.275

4.340.1 150.375

4.420.05170.425

4.540.1 210.525

4.740.1 25 0.625

4.810.025260.650

4.910.025270.675

5 20.05 9 0.725

5.120.05 31 0.775

5.32

5.41

5.61

5.82

61

6.12

LA TABLA ES ENORME!

2.6 DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Hemos visto en el caso anterior que los valores distintos que tomaba la variable eran muchos, es decir k era grande y eso haca que la tabla obtenida fuera muy poco manejable y por tanto poco clarificadora. Esto nos va a ocurrir frecuentemente en el caso en que la variable a estudiar sea continua. La solucin es agrupar los diferentes valores de la variable en intervalos o intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en informacin, con lo que los resultados sern aproximados.Agrupar en intervalos de clase consiste en agrupar los datos en un nmero relativamente pequeo de intervalos que cumplan:No se superpongan entre s, de forma que no exista ambigedad con respecto a la clase a que pertenece una observacin particular.Cubran todo el rango de valores que tenemos en la muestra.

Llamaremos:-A las fronteras del intervalo, lmites inferior y superior de la clase y los denotaremos por Li-1, Li.

-Marca de clase (ci) al punto medio del intervalo, es decir, al promedio aritmtico entre el lmite inferior y superior : .Es el valor que tomamos como representativo.- Amplitud (ai) a la diferencia entre el extremo superior e inferior: a i= Li - Li-1 .- Al nmero de observaciones de una clase se le llama frecuencia de clase (ni), si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia relativa de clase (fi), y del mismo modo que lo hacamos para datos sin agrupar definiramos Ni, y Fi.

NOTA: COMO CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADA EN INTERVALOS

1. Empezamos determinando el recorrido de la variable o rango de valores que tenemos en la muestra. Se define como la diferencia entre el mayor y el menor valor de la variable. Re=xk-x1

2. Nmero de clases: depende del tamao de la muestra. Para muestras de tamao moderado, n