PROF: Ing. Rosa Quispe Solórzano.
La Inferencia Estadística es elproceso por el cual se obtieneinformación sobre poblaciones enbase a muestras.
Hay dos tipos de Inferencia:
◦ Estimación
◦ Pruebas de Hipótesis
El objetivo de la Estimación esdeterminar el valor de un parámetropoblacional en base a un estadísticomuestral.
Hay dos tipos de Estimaciones:
◦ Estimación Puntual◦ Estimación por Intervalos
Un estimador puntual permite hacer unainferencia acerca de una población, estimandoel valor de un parámetro desconocido de lamisma usando solamente un valor o un puntoobtenido de una muestra.
◦ Una estimación por Intervalo permitehacer inferences acerca de un poblaciónestimando el valor de un parámetrodesconocido usando un intervalo.
Un intervalo de confianza , es un intervalo con limites finitos o infinitos, donde por lo menos uno de los extremos es una variable aleatoria
ESTIMACIÓN POR INTERVALOS DE CONFIANZA
Se trata de asignar al parámetro poblacionaldesconocido ϑ un rango de valores posibles, dentro delos cuales se encuentra el verdadero valor del parámetrocon un determinado nivel de confianza fijada deantemano y que permite precisar la incertidumbre queexiste en la estimación.
Si podemos encontrar dos variables aleatorias A y B, tales que:P( A≤ϑ≤B) = 1-α y representamos las realizaciones particulares de A y B por ay b, entonces, el intervalo (a, b)se denomina intervalo de confianza del 100(1-α)% para ϑ.
La cantidad (1-α) se denomina nivel de confianza del intervalo.
(a , b )
La confianza de un intervalo debe interpretarse en el sentido
siguiente:
Por cada 100 intervalos que construyamos para estimar un mismo
parámetro (a partir de otras tantas muestras aleatorias y para un
valor α prefijado) el (1-α)% de los intervalos obtenidos recogerán en
su interior al verdadero valor del parámetro, mientras que el α%
restante, por cosas del azar, pueden resultar ‘equivocados’.
Si elegimos el nivel de confianza (1-α)% grande, por ejemplo del
95%, entonces nuestra esperanza al elaborar un intervalo a partir de
una muestra es que sea uno de los 95 de cada 100 intervalos
‘acertados’
GENERALIZANDO:Sea (X1, …..Xn) una m.a. extraída de una población con función de
densidad f( x, θ ) y sean, A = a(X1,..., Xn) y B = b(X1,..., Xn) , dos estadísticas tal que A≤ B, para todo (X1,..., Xn) del espacio muestral
Se dice entonces que el intervalo aleatorio I = [ A , B ] es un intervalo de confianza para θ con coeficiente de confianza γ= (1-α) donde (0≤α≤1) .
P (A≤θ≤ B) = 1-αA = a(X1,..., Xn) Limite inferior del intervaloB = b(X1,..., Xn) Limite superior del intervalo
Sus valores cambian de unas muestras a otras, el verdadero valor del parámetro θ está en el intervalo el (1-α)% de las veces.
El cálculo de intervalos de confianza no es un proceso fácil cuando la
variable en estudio no sigue unas pautas de normalidad, por lo que
nosotros vamos a suponer siempre que la variable con la que vamos a
trabajar sigue una distribución normal.
• El proceso para obtener el intervalo es dar una v.a. donde intervenga
el parámetro a estimar y el correspondiente de la muestra. A esta variable
se le llama estadístico pivote y debe seguir una distribución de
probabilidad conocida.
Definición:
Sea (X1, …..Xn) una m.a. extraída de una población con función de densidad f( x, θ ) y sean, Q = q(X1,..., Xn, θ ) una función de X1,..., Xn y θ, (θ, Є Θ R )
Si la distribución de Q no depende de θ, , entonces Q es definido como cantidad pivotal.
Caso 1: Media poblacional μ (Varianza poblacional s2
conocida)
Situación: Se tiene una población con media desconocida m, pero
se supone conocida la varianza s2.
Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra
se calcula el estadístico el cual es un estimador puntual
insesgado para la media m desconocida. Se puede obtener un
intervalo de confianza del 100(1-a) % para m si consideramos
los siguientes hechos acerca de la distribución de :
1. Si la población es Normal, la distribución de es Normal
2. Si la población no es Normal, el Teorema del límite central nosgarantiza una distribución de aproximadamente normalcuando N
3. La media de es µ ( es insesgado)
4. La varianza de es s2 /N
Teorema del Límite Central:
Afirma que la media muestral tiene una distribución Normal aunque la
población original no la tenga, siempre y cuando la muestra sea muy
grande (de manera práctica N>30)
Caso 1: Media poblacional μ (Varianza poblacional s2
conocida)
-za/2 za/2 Z
a/2 a/2
de la figura: P{-za/2 Z za/2 }=1-α.
Con lo cual el intervalo de confianza del 100(1-α)% para la media
es
Nσ/zμNσ/z α/2
__
α/2
__
xx
De acuerdo a lo anterior, podemos suponer que la variable
Tiene una distribución N(0,1)N/
μX___
Zσ
Caso 1: Media poblacional μ (Varianza poblacional s2
conocida)
Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft- F):
41.60 41.48 42.34 41.95 41.8642.18 41.72 42.26 41.81 42.04
Una estimación puntual para la media, es = 41.924. Hallar un
intervalo de confianza del 95 % y uno del 99% para la media.
Se supone que la población tiene una distribución Normal con s=0.3
Usamos la expresión para encontrar el intervalo de confianza para la media:
l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.110
Entonces el intervalo de confianza del 95% es
41.738 µ 42.11
Y la longitud de este intervalo es 3.92 s/ N
Nσ/zμNσ/z α/2
__
α/2
__
xx
IC para una media poblacional (s2 conocida) : ejemplo
Deseamos estimar el promedio de edad de cierta población.
Tomamos una muestra de tamaño 100 en la cual se obtuvo
una media muestral de 35. La variable considerada tiene
distribución normal con una varianza igual a 3. Calcular el
intervalo de confianza al 95 % e indicar la imprecisión.
Solución: aplicando simplemente la fórmula para calcular los
límites del intervalo de confianza (IC), tenemos:
339.0100
396.1I
100
396.135
Caso 2: Media poblacional μ (Varianza poblacional s2 desconocida)
Si no se conoce la varianza σ2 de la población, una posibilidad esutilizar la varianza muestral S2 en las ecuaciones obtenidas paraestimar intervalos en el caso de varianza conocida
Este procedimiento funciona para muestras grandes (N>30), porello los intervalos de confianza anteriores se les suele llamarintervalos de confianza para muestras grandes.
Si las muestras son pequeñas el enfoque anterior nofunciona y para lograr un procedimiento válido se supondráque la población tiene una distribución Normal
En forma general si no se conoce s se sustituye por la
desviación estándar de la muestra, es decir, por s, si
además el tamaño de la muestra es n>30.
El intervalo de confianza para un nivel de confianza
de 1-a, de la media poblacional es:
n
sZX
n
sZX
22aa m
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:
MUESTRAS GRANDES
Caso 2: Media poblacional μ (Varianza poblacional s2 desconocida)
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de
depresión (mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional,
asumamos que los datos tienen distribución normal, con varianza poblacional
desconocida. Como es desconocido, lo estimamos por s =18,7.
Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para µ es (13,2 , 15,8).
Es decir, el puntaje promedio poblacional se encuentra
entre 13,2 y 15,8 con una confianza 95%.
Se utiliza el estadístico pivote:
Que sigue una distribución llamada t –student con n-1 grados de libertad que presenta una forma en la curva muy similar a la de la distribución normal.
y toma como intervalo de confianza aquella región en la que
-ta/2,N-1 ta/2,N-1
a/2 α /2
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL:
MUESTRAS PEQUEÑAS ( n≤ 30)
Es decir, hemos obtenido el intervalo que contiene a
la media poblacional y que podemos expresar:
n
stx
n
stxIC n
nn
n1
11
1%95 m
Factor relacionado
con la confianzaParámetro: Media Poblacional Error Estándar
Estimo
Nivel de
confianzaLímites de confianza
Caso 1: Media poblacional μ (Varianza poblacional s2 desconocida)
X= p’n
a/2 a/2
-za/2 za/2
)/)ˆ1(ˆ(ˆ)/)ˆ1(ˆ(ˆ22
nppZppnppZp aa
En un estudio de prevalencia de factores de riesgo en una cohorte de
412 mujeres mayores de 15 años en la Región Metropolitana, se
encontró que el 17.6% eran hipertensas. Un intervalo de 95% de
confianza para la proporción de mujeres hipertensas en la Región
Metropolitana está dado por:
Luego, la proporción de hipertensas varía entre (0,139 , 0,212)
con una confianza de 95%.
412/)176.01(176.096.1176.0412/)176.01(176.096.1176.0 p
Ejemplo: De 1000 casos de cáncer pulmonar seleccionados
al azar, 823 son de pacientes que fallecieron. Construya
un intervalo de confianza del 95% para la tasa de
mortalidad del cáncer pulmonar.
Solución: La tasa de mortalidad es la proporción de los que mueren a los que
contraen el cáncer pulmonar, de la muestra tenemos que = 0.823. Por otro
lado z0.025=1.96, entonces:
Es decir, 0.799 p 0.847
p^
0.823 1.960.82310.823
1000 p0.823 1.960.82310.823
1000≤ ≤
A partir de las fórmulas que se utilizan para construir los intervalos de confianza, podemos calcular el tamaño muestral necesario para obtener una precisión determinada.
Llamamos error de estimación(E) a la máxima diferencia que nos permitimos admitir, con un nivel de confianza 100(1-α)%, entre el parámetro desconocido y el estadístico que usamos como estimador
DETERMINACIÓN DEL TAMAÑO ÓPTIMO MUESTRAL
Top Related