Distribuciones de Prob y Estadistica

14
1 Distribuciones de probabilidad 1. Variable aleatoria Una variable aleatoria X es una función que asocia a cada elemento del espacio muestral E un número real: X: E ÷ ú Ejemplo: Consideremos el experimento aleatorio consistente en lanzar 3 monedas al aire. Podemos definir la variable aleatoria X=”número de caras obtenido”. Esta variable toma los valores del conjunto{0,1,2,3}. Se trata de una variable aleatoria discreta porque su recorrido es un número finito de valores. Cuando el recorrido está formado por los infinitos números reales de un intervalo hablaremos de variable aleatoria continua. 2. Distribución de probabilidad discreta Una variable aleatoria adquiere todo su significado cuando se asigna a cada valor de la variable la probabilidad de que se verifique al realizar el experimento. 2.1 Función de probabilidad La función de probabilidad de una variable aleatoria discreta es aquella que hace corresponder a cada valor de la variable su probabilidad: X ÷ [0, 1] x i ÷ p i donde p i es la probabilidad de que la variable aleatoria tome el valor x i : p( X= x i ) = p i Ejercicio Halla la función de probabilidad de la variable aleatoria X=”Número de caras obtenido al lanzar 3 monedas al aire”. Solución: p(X=0)=1/8 p(X=1)=3/8 p(X=2)=3/8 p(X=3)=1/8 2.2 Distribución binomial Es la más importante de las distribuciones de probabilidad discretas. Corresponde a la realización de un experimento que cumpla las condiciones siguientes: # Únicamente se observa si se cumple un suceso, A (éxito), o si, por el contrario, no se cumple (fracaso). A # La probabilidad del suceso A es constante, es decir, no varía al repetir el experimento. Si p(A) = p entonces p( ) = 1- p = q A La variable aleatoria que expresa el número de éxitos obtenidos en cada realización del experimento recibe el nombre de variable de la distribución binomial. Si se realizan n pruebas del experimento hablaremos de una binomial de parámetros n y p: B( n, p)

description

estadistica

Transcript of Distribuciones de Prob y Estadistica

Page 1: Distribuciones de Prob y Estadistica

1

Distribuciones de probabilidad

1. Variable aleatoria

Una variable aleatoria X es una función que asocia a cada elemento del espacio muestral E un númeroreal:

X: E ÷ úEjemplo:

Consideremos el experimento aleatorio consistente en lanzar 3 monedas al aire. Podemos definir lavariable aleatoria X=”número de caras obtenido”. Esta variable toma los valores del conjunto{0,1,2,3}.Se trata de una variable aleatoria discreta porque su recorrido es un número finito de valores.Cuando el recorrido está formado por los infinitos números reales de un intervalo hablaremos de variablealeatoria continua.

2. Distribución de probabilidad discreta

Una variable aleatoria adquiere todo su significado cuando se asigna a cada valor de la variable laprobabilidad de que se verifique al realizar el experimento.

2.1 Función de probabilidad

La función de probabilidad de una variable aleatoria discreta es aquella que hace corresponder a cadavalor de la variable su probabilidad:

X ÷ [0, 1]xi ÷ pi

donde pi es la probabilidad de que la variable aleatoria tome el valor xi : p( X= xi ) = pi

Ejercicio

Halla la función de probabilidad de la variable aleatoria X=”Número de caras obtenido al lanzar 3monedas al aire”.

Solución: p(X=0)=1/8 p(X=1)=3/8 p(X=2)=3/8 p(X=3)=1/8

2.2 Distribución binomial

Es la más importante de las distribuciones de probabilidad discretas. Corresponde a la realización deun experimento que cumpla las condiciones siguientes:

# Únicamente se observa si se cumple un suceso, A (éxito), o si, por el contrario, no se cumple (fracaso).A# La probabilidad del suceso A es constante, es decir, no varía al repetir el experimento.Si p(A) = p entonces p( ) = 1- p = qA

La variable aleatoria que expresa el número de éxitos obtenidos en cada realización del experimento recibeel nombre de variable de la distribución binomial. Si se realizan n pruebas del experimento hablaremos deuna binomial de parámetros n y p: B( n, p)

Page 2: Distribuciones de Prob y Estadistica

2

Función de probabilidad

La función de probabilidad de una distribución binomial B( n, p) viene dada por la expresión:

( )p k exitos p X k p qk

n k n k( ) ( ) . .= = = −

Ejercicio

Cuatro de cada diez trabajadores de una determinada empresa son mujeres. Si elegimos 8 personas de esaempresa al azar, calcula la probabilidad de que sean:a) 3 mujeres.b) más de 5 mujeres.c) al menos 2 mujeres.

Solución:Sea A el suceso A=” Elegir una mujer”. Es claro que p(A) = 0,4 = p y que p( ) = 0,6 = qA

La variable aleatorria X=”Número de mujeres elegidas” es una binomial B(8, 0,4). Por tanto:

a) p(X=3)= ( )38 3 50 4 0 6. , . ,

b) p(X>5)= p(X=6) + p(X=7) + p(X=8)= ( ) ( ) ( )68 6 6

78 7

88 80 4 0 6 0 4 0 6 0 4. , . , . , . , . ,+ +

c) p(X$2)= 1- p(X<2)= 1- p(X=0) - p(X=1)= 1- ( ) ( )08 8

18 70 6 0 4 0 6. , . , . ,−

Media, varianza y desviación típica

Si se realizan n pruebas, se puede demostrar que la media, la varianza y la desviación típica son,respectivamente:

: = n.p F2 = n.p.q F = n p q. .

3. Distribución de probabilidad continua.

Dada una variable aleatoria continua X , carece de sentido asignar a cada uno de sus valores xi sucorrespondiente probabilidad pi, ya que X puede tomar los infinitos valores de un intervalo. En unadistribución continua, la probabilidad de que la variable tome un determinado valor es siempre cero.Puesto que no es posible definir la función de probabilidad para una variable continua, es preciso introducirun nuevo concepto que la sustituya y que caracterice a la distribución de probabilidad continua, como hacíala función de probabilidad con la discreta. Es así como nace el concepto de función de densidad, f(x), quesiempre debe cumplir:# f(x) $0 en todo su dominio.# El área encerrada bajo la curva f(x) vale 1.

3.1 Distribución normal

La distribución normal se caracteriza por tener una función de densidad de probabilidad f(x), cuyarepresentación gráfica tiene forma de campana. Una distribución normal de media : y desviación típica F serepresenta por N ( :, F ).

Page 3: Distribuciones de Prob y Estadistica

3

f x e

x

( ).

.=−

1

2

1

2

2

σ π

µ

σ

- Su dominio es ú.- Es una función simétrica respecto de la recta x = :- El eje de abscisas es una asíntota horizontal.- Tiene un máximo en x = :.- El área encerrada entre la curva f(x) y el eje de abscisas es 1.

La más sencilla, denominada normal estándar, es la normal de media 0 y desviación típica 1: N(0,1) de lacual se han tabulado las probabilidades.Con el manejo de las tablas se pueden calcular probabilidades del tipo p(Z#k).

Ejercicio 1

Sea Z una variable aleatoria N(0,1). Calcula:a) p(Z$1,32) b) p(Z$-1,32) c) p(1,52<Z<2,03) d) p(-2,03<Z#1,52)

Solución: a) 0,0934 b) 0,9066 c) 0,0431 d) 0,9146

Ejercicio 2

a) ¿ Para qué valor de k se cumple p(Z#k)=0,84 ?b) ¿ Para qué valor de k se cumple p(-k#Z#k)=0,8 ?

Solución: a) k=0,995 b) k=1,28 El intervalo (-1,28, 1,28) encierra un 80% del área total en una N(0,1)

Intervalo característico y nivel de confianza

Si un intervalo (-k, k) encierra un área igual a p, recibe el nombre de intervalo característico correspondientea la probabilidad p, y k es el valor crítico.Habitualmente la probabilidad p se designa por 1- " y se llama nivel de confianza. De la misma forma, elvalor crítico k se designa por z"/2.

p(Z$z"/2)="/2

p(-z"/2 #Z#z"/2)=1- "

Page 4: Distribuciones de Prob y Estadistica

4

Ejercicio 3

Calcula z"/2 para 1- "= 0,9

Solución:Si el intervalo abarca un área de 0,9, fuera de él deberá haber un área de 0,1 ; el área de cada una de las“colas” es 0,05.

Se trata de buscar el valor de k tal que p(Z$k)=0,05 , esto es, p(Z#k)=0,95En las tablas encontramos:

p(Z#1,64)=0,9495p(Z#1,65)=0,9505

El valor promedio entre 1,64 y 1,65 es 1,645. Por tanto z"/2 =1,645El intervalo característico [-1,645,1,645] es aquel dentro del cual, en una distribución de probabilidad N(0,1),hay un área 90% del total.En la siguiente tabla figuran los intervalos característicos que se suelen utilizar más:

1- " "/2 z"/2 Intervalo característico

0,9 0,05 1,645 (-1,645, 1,645)

0,95 0,025 1,96 (-1,96, 1,96

0,99 0,005 2,575 (-2,575, 2,575)

Tipificación de la variable

Las distribuciones normales que nos encontramos más a menudo no son del tipo N(0,1).Para calcular las probabilidades de una distribución normal N( :,F ) utilizando la tabla se debe efectuar el

cambio de variable . En este caso se dice que se ha tipificado la variable. Una vez tipificada,ZX

=− µ

σla variable seguirá una distribución normal N(0,1) y utilizaremos las tablas.

Ejemplo

La longitud de las truchas de una piscifactoría sigue una normal de media 25 cm, con una desviación típicade 2 cm. Calcula la probabilidad de que una trucha tomada al azar tenga un tamaño inferior a 26 cm.

Solución:Se trata de una normal N(25, 2).

P(X#26) = p(X

p Z−

≤−

= ≤ =

25

2

26 25

20 5 0 6915( , ) ,

Page 5: Distribuciones de Prob y Estadistica

5

Aproximación de la binomial por la normal

La distribución binomial puede aproximarse a una distribución normal cuando n es grande y p y qtoman valores cercanos a 0,5. En la práctica la aproximación es buena si npq>10.

En este caso B(n,p) se puede aproximar a N(np, )npq

Para calcular p(X< k) se toma p(X#k- 0,5) para no incluir el valor de k.Para calcular p(X#k) se toma p(X# k+ 0,5) para contar con el valor k.Para calcular p(X=k) se aplica p(k- 0,5#X#k+ 0,5).

Ejercicio

La probabilidad de que un tenista obtenga un punto de saque directo es de 0,02. Si durante un torneo realiza3000 servicios, ¿cuál es la probabilidad de que consiga más de 80 puntos de saque directo?.

Solución:Se trata de una binomial B(3000, 0,02).

Como npq>10 se puede aproximar por una normal N(np, ) es decir N(3000.0,02, )npq 3000 0 02 0 98. , . ,

Operando tenemos N(60, 7,67)

Luego p(X>80)=1- p(X#80) = 1- p(X#80,5) = 1- p(Z# )= 1- p(Z#2,67) =1- 0,9962=0,003880 5 60

7 67

,

,

Teoría de muestras

1. Distribución de variables aleatorias en el muestreo

1.1 Distribución de medias muestrales

Dada una variable estadística observada en una población, se puede calcular se media y suxdesviación típica F.Si tomamos una muestra aleatoria de la población y calculamos su media, ésta no tiene por qué coincidir conla media de la población .xSi consideramos k muestras del mismo tamaño de una población y calculamos sus medias , la distribuciónxide estas medias muestrales constituye una nueva variable aleatoria llamada distribución de medias

muestrales. Los valores no son iguales a ,sin embargo, cuanto mayores sean las muestras, más sexi x

aproximarán sus medias a la media poblacional.

1.2 Teorema central del límite

Dada una población de media : y desviación típica F, si se extraen muestras de tamaño n, ladistribución de las medias de todas las muestras, denominada distribución de las medias muestrales, verificalo siguiente:• Tiene la misma media, :, que la población.

• Su desviación típica es .sn

• Cuando n>30, se aproxima a una distribución normal si la población de partida no lo era. (Por supuesto esnormal si la población de partida ya lo era cualquiera que sea el valor de n).

Page 6: Distribuciones de Prob y Estadistica

6

Este teorema nos permitirá, conociendo la distribución de las medias muestrales de tamaño n, extraerconclusiones de la media de la población. Debemos observar también que cuando n aumenta, la desviacióntípica disminuye.

Ejercicio 1

El cociente intelectual de unos universitarios se distribuye normalmente con media 100 y desviación típica11.a) Se elige una persona al azar. Halla la probabilidad de que si C.I esté entre 100 y 103.b) Se elige al azar una muestra de 25 personas. Halla la probabilidad de que la media de sus cocientesintelectuales está entre 100 y 103.

Solución:La población de partida es N(100, 11).a)

p X p Z p Z p z p z( ) ( , ) ( , ) ( ) , , ,100 103100 100

11

103 100

110 0 27 0 27 0 0 6064 0 5 0 1064< ≤ =

−< ≤

= < ≤ = ≤ − ≤ = − =

b) Como la población de partida es normal, la distribución de la media muestral es normalindependientemente del valor de la muestra n.

Los parámetros de esta distribución son: : = 100 ;σ

n= =

11

252 2,

Por tanto, la distribución de la media muestral es N(100, 2,2)

p X p Z p Z p Z p Z( ), ,

( , ) ( , ) ( ) , , ,100 103100 100

2 2

103 100

2 20 1 36 1 36 0 0 9131 0 5 0 4131≤ ≤ =

−≤ ≤

= ≤ ≤ = ≤ − ≤ = − =

Ejercicio 2

En una urna hay 3 bolas con los números 1,2 y 3.a) Calcula la media y la desviación típica de esta poblaciónb) Forma todas las muestras posibles que podemos extraer con devolución de esta población de tamaño 2.c) Forma la distribución de las medias de las muestras, halla la media, la desviación típica y confirma elteorema central de límite.

Solución:

a) Media poblacional := donde N es el número total de población.x

N

i∑=

+ +=

1 2 3

32

Desviación típica poblacional F=x

N

i

2

22 2 2

21 2 3

32

14

34

2

30 8165

∑− =

+ +− = − = =µ ,

b) El número de muestras posibles con devolución de tamaño 2 son :VR3 223 9, = =

(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); (3, 3)c) Distribución de las medias de las muestras: 1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; 3

Media de esta distribución: x =+ + + +

=1 15 2 2 3 2 5 2 3

92

, . . , .

Desviación típica de esta distribución s=+ + + +

− =1 15 2 2 3 2 5 2 3

92 0 5774

2 2 2 2 22, . . , .

,

Se confirma el teorema central del límite porque si la población tenía media : = 2 ,la distribución de las

Page 7: Distribuciones de Prob y Estadistica

7

medias muestrales también tiene media 2 y si la desviación típica de la población era F = 0,8165, la

desviación típica de la distribución de medias centrales es sn

= = =σ 0 8165

20 5774

,,

Ejercicio 3

En una universidad se sabe que las tallas de los alumnos se distribuyen normalmente con media 172 cm ydesviación típica 17,5 cm. Se toman muchas muestras de 35 estudiantes.a) ¿Cuál es la media y la desviación típica de la distribución de las medias muestrales?.b) Halla la probabilidad de que la media muestral sea inferior a 171 cm.c) Si se eligen 150 muestras de 35 alumnos, ¿en cuántas de ellas cabe esperar que la media muestral sea mayorque 170 cm y menor que 171,5 cm?.

Solución:a) Las tallas siguen una N(172, 17,2). La distribución de las mediales muestrales seguirá una normal de media y desviación típicax cm= 172

,esto es, N(172, 2,96)sn

= = =σ 17 5

352 96

,,

b) p x p Z p Z( ),

( , ) ,< = <−

= < − =171

171 172

2 960 3378 0 3678

c) p x p Z p Z( , ),

,

,( , , ) ,170 1715

170 172

2 96

1715 172

2 960 67 017 01833< ≤ =

−< ≤

= − < ≤ − =

Por lo tanto 150. 0,1833 .27 muestras.Es decir, cabe esperar que en 27 muestras de las 150 seleccionadas, la media muestral será mayor que 170y menor que 171,5.

1.3 Intervalo de confianza para las medias muestrales

Tenemos una población que sigue una normal N( :, F ) y queremos estimar, mediante un intervalo,el parámetro :. Se toma una muestra de tamaño n y se calcula su media . Sabemos que la distribución dex

la variable aleatoria formadas por las medias de todas las muestras del mismo tamaño n es una N( :, )xiσ

n

Si se tipifica la variable, presentará una distribución N(0,1) donde p(-z"/2 #Z#z"/2)=1 - " comoZx

n=

− µ

σ /se vio anteriormente. Sustituyendo la expresión de Z, tenemos:

p(-z"/2 # #z"/2) =1 - " , p(-z"/2 A # - : # z"/2 A )=1 - " , x

n

− µ

σ /σ / n x σ / n

, p( - z"/2 . + z"/2 . ) = 1 - "x σ µ/ n ≤ ≤ x σ / n

Por tanto el intervalo de confianza para el parámetro : de una población N( :, F ) a un nivel de confianza

1 - " es un intervalo centrado en y de radio ,esto es:x z nα σ/ . /2

IC = ( )x z n x z n− +α ασ σ/ /. / , . /2 2

Si F es desconocida y n >30 se usa en su lugar la cuasivarianza sn

n2 2

1=

−σ .

Page 8: Distribuciones de Prob y Estadistica

8

Ejercicio

Un psicólogo escolar ha estudiado que el tiempo de reacción de 1º de Primaria se distribuye normalmente.Con una muestra de 100 alumnos, la media de tiempo de reacción fue de 45 segundos y la desviación típicade 0,04 segundos. Halla un intervalo de confianza para la media de tiempos de reacción al nivel de confianzade:a) 90%b) 95%c) Interpretar los resultados

Solución: IC = ( )x z n x z n− +α ασ σ/ /. / , . /2 2

Sabemos que se trata de una normal N( 45, 0,04). Por tanto x y= =45 0 04σ ,a) Calculemos z"/2 para un nivel de confianza del 90%:Si el intervalo abarca un área de 0,9, fuera de él deberá haber un área de 0,1 ; el área de cada una de las“colas” es 0,05.Se trata de buscar el valor de k tal que p(Z$k)=0,05 , esto es, p(Z#k)=0,95En las tablas encontramos:

p(Z#1,64)=0,9495p(Z#1,65)=0,9505

El valor promedio entre 1,64 y 1,65 es 1,645. Por tanto z"/2 =1,645

El intervalo de confianza será: 45 16450 04

10045 1 645

0 04

10044 993 45 007− +

=, .

,, , .

,( , , , )

El tiempo de reacción está entre 44,993 y 45,007 con una confianza del 90% o lo que es lo mismo, esteintervalo cubre el valor de la media con una probabilidad de 0,9.

b) Para calcular z"/2 para un nivel de confianza del 95% se procede de forma análoga obteniendo z"/2 =1,96

El intervalo de confianza será 45 1960 04

10045 196

0 04

10044 992 45 008− +

=, .

,, , .

,( , , , )

c) Cuanto mayor es el nivel de confianza, mayor es la amplitud del intervalo, con lo que aumenta el margende error.

1.4 Tamaño de la muestra. Error de estimación.

Hasta ahora, conocido el tamaño de la muestra se calculaba el intervalo de confianza correspondiente.Se podría plantear la pregunta a la inversa:¿cuál debe ser el tamaño de la muestra para tener una confianzadeterminada.El error máximo vendrá determinado por la amplitud del intervalo de confianza, es decir:

E zn

= ± α

σ/ •2

Ejercicio 1

En un determinado barrio se seleccionó al azar una muestra de 100 personas cuya media de ingresosmensuales era de 600 i, con una desviación típica de 120 i.

Page 9: Distribuciones de Prob y Estadistica

9

a) Si se toma un nivel de confianza del 95 %, ¿cuál es el intervalo de confianza para la media de los ingresosmensuales de toda la población?.b) Si se toma un nivel de confianza del 99 %, ¿cuál es el tamaño muestral necesario para estimar la media deingresos mensuales con un error menor a 18 i ?.

Solución

a) Se trata de una normal N(600, 120)Sabemos ya que a un nivel de confianza del 95% le corresponde z"/2 =1,96.

El intervalo de confianza será IC= 600 196120

100600 196

120

100576 48 62352− +

=, • , , • ( , , , )

b) A un nivel de confianza de 99 % le corresponde z"/2 =2,575

El error es E zn n

n n= ± ⇒ = ⇒ = = ⇒ = ±α

σ/ • , •

. ,, ,2 18 2 575

120 120 2 575

1817 17 294 69

Por tanto se necesita una muestra de 295 personas.

Ejercicio 2

Un fabricante de pilas alcalinas sabe que el tiempo de duración, en horas, de las pilas que fabrica sigue unadistribución normal de media desconocida y varianza 3600. Con una muestra de su proucción, elegida al azar,y un nivel de confianza del 95% ha obtenido para la media el intervalo de confianza (372,6 392,2).a) Calcula el valor que obtuvo para la media de la muestra y el tamaño muestral utilizado.b) ¿Cuál será el error de su estimación, si hubiese utilizado una muestra de tamaño 225 y un nivel deconfianza del 86,9%?.

Solución

a) Un intervalo de confianza para la media tiene la forma ( )x z n x z n− +α ασ σ/ /. / , . /2 2

A un nivel de confianza del 95% le corresponde un z"/2 =1,96.Igualando con el intervalo dado tenemos:

Sumando las ecuaciones obtenemos 2 =764,8 , =382,4

xn

xn

− =

+ =

19660

372 6

1 9660

392 2

, • ,

, • ,

x x

Sustituyendo el valor de en, por ejemplo la primera ecuación: x 382 4 19660

372 6 144, , • ,− = ⇒ =n

n

El tamaño muestral utilizado es 144.

b) E zn

= ± α

σ/ •2

Si el nivel de confianza es de un 86,9%, el intervalo abarca un área de1- "=0,869; fuera de él deberá haber un área de 0,131 ; el área de cadauna de las “colas” es 0,0655.Se trata de buscar el valor de k tal quep(Z$k)=0,0655 , esto es, p(Z#k)=0,9345En las tablas encontramos:

p(Z#1,64)=0,9345

Por tanto z"/2 =1,51 y el error E = ± = ±15160

156 04, • ,

Page 10: Distribuciones de Prob y Estadistica

10

160 2 3320

500160 2 33

20

500157 16 162 08− +

=, • , , • ( , , , )

Ejercicio 3

Las alturas, expresadas en cm, de los estudiantes de segundo de bachiller se distribuyen normalmente con unadesviación típica de 20 cm. En un colectivo de 500 estudiante de segundo de bachiller se ha obtenido unamedia de 160 cm.a) Calcula, con una probabilidad del 98%, entre qué valores estará la media de la altura de la población totalde estudiantes de segundo de bachiller,b) Interpreta el resultado del intervalo obtenido.

Solución:

a) Nos piden un intervalo de confianza para la media. Su forma es ( )x z n x z n− +α ασ σ/ /. / , . /2 2

A una probabilidad del 98% le corresponde un z"/2 =2,33.El intervalo de confianza será

b) En el 98% de las posiblesmuestral, la media de la alturade la población está entre157,16 cm y 162,08 cm.

Inferencia estadística

1 Hipótesis estadística

Cuando en un estudio estadístico queremos determinar si una población cumple una determinadacaracterística, previamente debemos plantear un test estadístico que será el procedimiento que nos permitiráevaluar, a partir de una muestra, si una determinada hipótesis formulada sobre una característica de lapoblación se verifica o no.Una vez concluido el test podemos considerar la hipótesis que, en principio, admitimos como válida, y quellamaremos hipótesis nula, H0 y una hipótesis contraria a ésta, que denominaremos hipótesis alternativa, H1,que es la que admitiremos como válida si nos vemos obligados a rechazar la hipótesis H0.

2 Contraste de hipótesis

Es un procedimiento del que depende la decisión de aceptar o rechazar la hipótesis nula y estaaceptación o rechazo dependerá, a su vez, de cuál sea la discrepancia entre la hipótesis y la informaciónmuestral que tengamos. Si la discrepancia es menor que un determinado valor que consideramos aceptable,la hipótesis se dará por cierta; este valor se llama valor de significación y se representa por ".Es evidente que una hipótesis estadística no se puede aceptar o rechazar con una certeza del 100%, sino quese define un nivel crítico para ", que nos marcará los límites para aceptar o rechazar la hipótesis nula.Así, por ejemplo, si el nivel de significación es "= 0,05, rechazaremos como improbables el 5% de los casosextremos; por esta razón, en ocasiones, también se dice que estamos trabajando con un nivel de confianzadel 95%.Nosotros trabajaremos con hipótesis nulas relativas a la media. Los valores de la media que nos lleven aaceptar la hipótesis nula H0, forman la región de aceptación, y los que nos conducen a rechazarla, constituyenla región de rechazo.

3 Fases del contraste de hipótesis

Para efectuar un contraste de hipótesis debemos seguir los pasos siguientes:

Page 11: Distribuciones de Prob y Estadistica

11

• Se debe enunciar la hipótesis nula y la alternativa.• Se extrae una muestra de tamaño n y se calcula en ella el valor del parámetro estadístico que se deseaencontrar.• Se elige el nivel de significación con el que se quieren tomar las decisiones; generalmente los niveles designificación son "= 0,10; "= 0,05 y "= 0,01.• A continuación se construye la zona de aceptación de la hipótesis, es decir, los intervalos característicos,fuera de los cuales se encuentra el porcentaje de "A100% de casos que queremos rechazar.• Si el valor del parámetro muestral se encuentra dentro de la zona de aceptación, se acepta la hipótesis conun nivel de significación ". En caso contrario, se rechaza.

4 Contraste de hipótesis para la media

Se inicia el contraste definiendo la hipótesis nula y la alternativa.En el momento de definir la hipótesis nula, ésta se puede plantear en términos de igualdad o de desigualdad:H0: o bien H0: µ µ µ µ µ≥ ≤0 0o

En el primer caso es un contraste bilateral, o de dos colas, y los otros dos, contrastes unilaterales o de unacola.

Contraste bilateral Contrate unilateral Contraste unilateral

4.1 Contraste bilateral

Ya hemos visto que las medias muestrales se distribuyen de la forma . El intervalo deNn

µσ

,

aceptación para esta distribución será: µσ

µ µσ

α α0 2 0 2− ≤ ≤ +

z

nz

n/ /• •

Si el valor de la media , se encuentra en ese intervalo, se aceptará la hipótesis nula; en caso contrario, sexrechazará.

Ejercicio 1

Se quiere estimar la media de la nómina mensual que reciben los directivos de las compañías multinacionalesque operan en Europa.

Page 12: Distribuciones de Prob y Estadistica

12

µσ

µσ

α α0 2 0 2 275 19620

10275 196

20

1027108 278 92− +

= − +

=z

nz

n/ /• , • , • , , • ( , , , )

a) Si la varianza de la nómina en la población es de 1000 i, ¿cuál es la varianza de la media muestral cuandoel tamaño de la muestra es de 100?.b) Si en las condiciones del apartado anterior, la media muestral es de 4008 i, ¿se rechazaría, con un nivelde confianza del 95%, la hipótesis de que la nómina media es de 4000 i?.

Solución:

La varianza es F2= 1000. Por tanto la desviación típica de la población es .σ = 1000

La desviación típica de la media muestral es . Por tanto, la varianza de la media muestralσ

n= =

1000

10010

es ( )10 102

=

b) Se trata de una hipótesis bilateral para la media:H0: := 4000H1: : 4000≠A un nivel de confianza del 95% corresponde un z"/2= 1,96La zona de aceptación tiene la forma:

( )µσ

µσ

α α0 2 0 2 4000 196 10 4000 196 10 3993 8 4006 2− +

= − + =z

nz

n/ /• , • , • , , • ( , , , )

Se rechaza la hipótesis de que la nómina media es de 4000 i con un nivel de confianza de 0,95 ya que =x4008ó (3996,8, 4006,2).

Ejercicio 2

El peso medio de una muestra aleatoria de 100 naranjas de una determinada variedad es de 272 g. Se sabe quela desviación típica poblacional es de 20 g. A un nivel de significación de 0,05, ¿hay suficiente evidencia pararefutar la afirmación de que el peso medio poblacional es de 275 d?.

Solución:

Se trata de un test de hipótesis bilateral para la media:H0: := 275H1: : 275≠La zona de aceptación de la hipótesis nula, H0,es:

Como = 272 0(271,08, 278,92), no hay suficiente evidencia para rechazar la hipótesis nula.x

4.2 Contraste unilateral

Se plantea cuando la hipótesis nula es de la forma: H0: µ µ µ µ≥ ≤0 0o

El contraste unilateral ha de verificar que el área correspondiente a la región de aceptación esté toda hacia unlado de la distribución, de modo que la región rechazable quede totalmente al otro lado.Si la región de aceptación ha de ser 1- ", la región de rechazo vendrá determinada por el valor de z"/2.

Page 13: Distribuciones de Prob y Estadistica

13

µ µ≥ 0µ µ≤ 0

En el primer caso el intervalo de aceptación será − ∞ +

, •µ

σα0 z

n

y en el segundo µσ

α0 − + ∞

z

n• ,

Ejercicio

En los últimos años el consumo familiar diaria de cierta ciudad en electricidad (en Kw) seguía una Normalde media 6,3 y desviación típica 1,2. Sin embargo, desde hace unos meses las tarifas eléctricas hanexperimentado varias reducciones, y se piensa que esto ha podido repercutir en un aumento del consumo.Recientemente, para una muestra de 47 familias se ha obtenido un consumo medio diario de 6,8. Suponiendoque el consumo sigue siendo aproximadamente Normal y que la desviación típica se ha mantenido:

a) Plantea en test para contrastar que el abaratamiento de las tarifas no ha influido en el consumo, frente a queha tenido la repercusión que se piensa, como parecen indicar los datos. Si se concluyera que la media deconsumo se ha mantenido y realmente subió, ¿cómo se llama al error cometido?.

b) ¿A qué conclusión se llega en el test planteado en el apartado anterior con un nivel de significación del1%?.

Solución:

a) Se trata de plantear un test de hipótesis unilateral para la media:H0: µ ≤ 6 3,H1: µ > 6 3,Si se concluye que la media del consumo se ha mantenido cuando realmente subió, se está aceptando que lahipótesis nula es verdadera cuando realmente es falsa. Se comete un error de tipo II según la tabla:

H0 cierta H0 falsa

Aceptamos H0 No hay error Error de tipo II

Aceptamos H1 Error de tipo I No hay error

b) A un nivel de significación "= 0,1 le corresponde un z"= 2,33

Page 14: Distribuciones de Prob y Estadistica

14

La zona de aceptación tiene la forma − ∞ +

, •µ

σα0 z

n

En este caso la zona de aceptación es − ∞ +

= − ∞, , , •

,( , , )6 3 2 33

1 2

476 7

Como 6,8 ó , 6,7), se rechaza la hipótesis, es decir, el abaratamiento de las tarifas ha repercutido en(− ∞

un aumento del consumo, con un nivel de significación del 1%.