Download - estimaciones e intervalos de confianzaUNI

PROF: Ing. Rosa Quispe Solórzano.

La Inferencia Estadística es elproceso por el cual se obtieneinformación sobre poblaciones enbase a muestras.

Hay dos tipos de Inferencia:

◦ Estimación

◦ Pruebas de Hipótesis

El objetivo de la Estimación esdeterminar el valor de un parámetropoblacional en base a un estadísticomuestral.

Hay dos tipos de Estimaciones:

◦ Estimación Puntual◦ Estimación por Intervalos

Un estimador puntual permite hacer unainferencia acerca de una población, estimandoel valor de un parámetro desconocido de lamisma usando solamente un valor o un puntoobtenido de una muestra.

◦ Una estimación por Intervalo permitehacer inferences acerca de un poblaciónestimando el valor de un parámetrodesconocido usando un intervalo.

Un intervalo de confianza , es un intervalo con limites finitos o infinitos, donde por lo menos uno de los extremos es una variable aleatoria

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Se trata de asignar al parámetro poblacionaldesconocido ϑ un rango de valores posibles, dentro delos cuales se encuentra el verdadero valor del parámetrocon un determinado nivel de confianza fijada deantemano y que permite precisar la incertidumbre queexiste en la estimación.

Si podemos encontrar dos variables aleatorias A y B, tales que:P( A≤ϑ≤B) = 1-α y representamos las realizaciones particulares de A y B por ay b, entonces, el intervalo (a, b)se denomina intervalo de confianza del 100(1-α)% para ϑ.

La cantidad (1-α) se denomina nivel de confianza del intervalo.

(a , b )

La confianza de un intervalo debe interpretarse en el sentido

siguiente:

Por cada 100 intervalos que construyamos para estimar un mismo

parámetro (a partir de otras tantas muestras aleatorias y para un

valor α prefijado) el (1-α)% de los intervalos obtenidos recogerán en

su interior al verdadero valor del parámetro, mientras que el α%

restante, por cosas del azar, pueden resultar ‘equivocados’.

Si elegimos el nivel de confianza (1-α)% grande, por ejemplo del

95%, entonces nuestra esperanza al elaborar un intervalo a partir de

una muestra es que sea uno de los 95 de cada 100 intervalos

‘acertados’

GENERALIZANDO:Sea (X1, …..Xn) una m.a. extraída de una población con función de

densidad f( x, θ ) y sean, A = a(X1,..., Xn) y B = b(X1,..., Xn) , dos estadísticas tal que A≤ B, para todo (X1,..., Xn) del espacio muestral

Se dice entonces que el intervalo aleatorio I = [ A , B ] es un intervalo de confianza para θ con coeficiente de confianza γ= (1-α) donde (0≤α≤1) .

P (A≤θ≤ B) = 1-αA = a(X1,..., Xn) Limite inferior del intervaloB = b(X1,..., Xn) Limite superior del intervalo

Sus valores cambian de unas muestras a otras, el verdadero valor del parámetro θ está en el intervalo el (1-α)% de las veces.

El cálculo de intervalos de confianza no es un proceso fácil cuando la

variable en estudio no sigue unas pautas de normalidad, por lo que

nosotros vamos a suponer siempre que la variable con la que vamos a

trabajar sigue una distribución normal.

• El proceso para obtener el intervalo es dar una v.a. donde intervenga

el parámetro a estimar y el correspondiente de la muestra. A esta variable

se le llama estadístico pivote y debe seguir una distribución de

probabilidad conocida.

Definición:

Sea (X1, …..Xn) una m.a. extraída de una población con función de densidad f( x, θ ) y sean, Q = q(X1,..., Xn, θ ) una función de X1,..., Xn y θ, (θ, Є Θ R )

Si la distribución de Q no depende de θ, , entonces Q es definido como cantidad pivotal.

Caso 1: Media poblacional μ (Varianza poblacional s2

conocida)

Situación: Se tiene una población con media desconocida m, pero

se supone conocida la varianza s2.

Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra

se calcula el estadístico el cual es un estimador puntual

insesgado para la media m desconocida. Se puede obtener un

intervalo de confianza del 100(1-a) % para m si consideramos

los siguientes hechos acerca de la distribución de :

1. Si la población es Normal, la distribución de es Normal

2. Si la población no es Normal, el Teorema del límite central nosgarantiza una distribución de aproximadamente normalcuando N

3. La media de es µ ( es insesgado)

4. La varianza de es s2 /N

Teorema del Límite Central:

Afirma que la media muestral tiene una distribución Normal aunque la

población original no la tenga, siempre y cuando la muestra sea muy

grande (de manera práctica N>30)


conocida)

-za/2 za/2 Z

a/2 a/2

de la figura: P{-za/2 Z za/2 }=1-α.

Con lo cual el intervalo de confianza del 100(1-α)% para la media

es

Nσ/zμNσ/z α/2

__

α/2

__

xx

De acuerdo a lo anterior, podemos suponer que la variable

Tiene una distribución N(0,1)N/

μX___

Zσ


conocida)

Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft- F):

41.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.04

Una estimación puntual para la media, es = 41.924. Hallar un

intervalo de confianza del 95 % y uno del 99% para la media.

Se supone que la población tiene una distribución Normal con s=0.3

Usamos la expresión para encontrar el intervalo de confianza para la media:

l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.110

Entonces el intervalo de confianza del 95% es

41.738 µ 42.11

Y la longitud de este intervalo es 3.92 s/ N

Nσ/zμNσ/z α/2

__

α/2

__

xx

IC para una media poblacional (s2 conocida) : ejemplo

Deseamos estimar el promedio de edad de cierta población.

Tomamos una muestra de tamaño 100 en la cual se obtuvo

una media muestral de 35. La variable considerada tiene

distribución normal con una varianza igual a 3. Calcular el

intervalo de confianza al 95 % e indicar la imprecisión.

Solución: aplicando simplemente la fórmula para calcular los

límites del intervalo de confianza (IC), tenemos:

339.0100

396.1I

100

396.135

Caso 2: Media poblacional μ (Varianza poblacional s2 desconocida)

Si no se conoce la varianza σ2 de la población, una posibilidad esutilizar la varianza muestral S2 en las ecuaciones obtenidas paraestimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30), porello los intervalos de confianza anteriores se les suele llamarintervalos de confianza para muestras grandes.

Si las muestras son pequeñas el enfoque anterior nofunciona y para lograr un procedimiento válido se supondráque la población tiene una distribución Normal

En forma general si no se conoce s se sustituye por la

desviación estándar de la muestra, es decir, por s, si

además el tamaño de la muestra es n>30.

El intervalo de confianza para un nivel de confianza

de 1-a, de la media poblacional es:

n

sZX

n

sZX

22aa m

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:

MUESTRAS GRANDES


Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de

depresión (mayor puntaje significa mayor depresión).

2 5 6 8 8 9 9 10 11

11 11 13 13 14 14 14 14 14

14 15 15 16 16 16 16 16 16

16 16 17 17 17 18 18 18 19

19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional,

asumamos que los datos tienen distribución normal, con varianza poblacional

desconocida. Como es desconocido, lo estimamos por s =18,7.

Luego, un intervalo de confianza aproximado es:

Luego, el intervalo de confianza para µ es (13,2 , 15,8).

Es decir, el puntaje promedio poblacional se encuentra

entre 13,2 y 15,8 con una confianza 95%.

Se utiliza el estadístico pivote:

Que sigue una distribución llamada t –student con n-1 grados de libertad que presenta una forma en la curva muy similar a la de la distribución normal.

y toma como intervalo de confianza aquella región en la que

-ta/2,N-1 ta/2,N-1

a/2 α /2

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:

MUESTRAS PEQUEÑAS ( n≤ 30)

Es decir, hemos obtenido el intervalo que contiene a

la media poblacional y que podemos expresar:

n

stx

n

stxIC n

nn

n1

11

1%95 m

Factor relacionado

con la confianzaParámetro: Media Poblacional Error Estándar

Estimo

Nivel de

confianzaLímites de confianza

X= p’n

a/2 a/2

-za/2 za/2

)/)ˆ1(ˆ(ˆ)/)ˆ1(ˆ(ˆ22

nppZppnppZp aa

En un estudio de prevalencia de factores de riesgo en una cohorte de

412 mujeres mayores de 15 años en la Región Metropolitana, se

encontró que el 17.6% eran hipertensas. Un intervalo de 95% de

confianza para la proporción de mujeres hipertensas en la Región

Metropolitana está dado por:

Luego, la proporción de hipertensas varía entre (0,139 , 0,212)

con una confianza de 95%.

412/)176.01(176.096.1176.0412/)176.01(176.096.1176.0 p

Ejemplo: De 1000 casos de cáncer pulmonar seleccionados

al azar, 823 son de pacientes que fallecieron. Construya

un intervalo de confianza del 95% para la tasa de

mortalidad del cáncer pulmonar.

Solución: La tasa de mortalidad es la proporción de los que mueren a los que

contraen el cáncer pulmonar, de la muestra tenemos que = 0.823. Por otro

lado z0.025=1.96, entonces:

Es decir, 0.799 p 0.847

p^

0.823 1.960.82310.823

1000 p0.823 1.960.82310.823

1000≤ ≤

A partir de las fórmulas que se utilizan para construir los intervalos de confianza, podemos calcular el tamaño muestral necesario para obtener una precisión determinada.

Llamamos error de estimación(E) a la máxima diferencia que nos permitimos admitir, con un nivel de confianza 100(1-α)%, entre el parámetro desconocido y el estadístico que usamos como estimador

DETERMINACIÓN DEL TAMAÑO ÓPTIMO MUESTRAL