Introducción a la Inferencia Estadística

19
Objetivos : María Isabel Bautista [email protected] m Estadística Aplicada Hipótesis Estadística Procedimiento para probar una Hipótesis para una Muestra (uso de “Z”). Hipótesis nula (H0) e Hipótesis alternativa (H1) Nivel de significación Tipos de prueba Distribución muestral asociada La regla de decisión Introducción a la Inferencia Estadística 1 Introducción a la Inferencia Estadística

description

Hipótesis Estadística Procedimiento para probar una Hipótesis para una Muestra (uso de “Z”). Hipótesis nula (H0) e Hipótesis alternativa (H1) Nivel de significación Tipos de prueba Distribución muestral asociada La regla de decisión

Transcript of Introducción a la Inferencia Estadística

Page 1: Introducción a la Inferencia Estadística

Objetivos :

María Isabel [email protected]

Estadística Aplicada

Hipótesis Estadística Procedimiento para probar una Hipótesis para

una Muestra (uso de “Z”). Hipótesis nula (H0) e Hipótesis alternativa (H1) Nivel de significación Tipos de prueba Distribución muestral asociada La regla de decisión

Hipótesis Estadística Procedimiento para probar una Hipótesis para

una Muestra (uso de “Z”). Hipótesis nula (H0) e Hipótesis alternativa (H1) Nivel de significación Tipos de prueba Distribución muestral asociada La regla de decisión

Introducción a la Inferencia Estadística

1 Introducción a la Inferencia Estadística

Page 2: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Hipótesis Estadística

La Hipótesis es la aseveración que se hace sobre una población

La Hipótesis es la aseveración que se hace sobre una población

Introducción a la Inferencia Estadística2

¿Prueba? de hipótesis

Será cierto o no una suposición que se ha hecho sobre un parámetro que caracteriza a una población

Page 3: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Hipótesis Estadística

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

Introducción a la Inferencia Estadística3

¿Prueba? de hipótesis

Será cierto o no una suposición que se ha hecho sobre un parámetro que caracteriza a una población

Page 4: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Hipótesis Estadística

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable

Introducción a la Inferencia Estadística4

¿Prueba? de hipótesis

Será cierto o no una suposición que se ha hecho sobre un parámetro que caracteriza a una población

Page 5: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Hipótesis Estadística

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable

Usualmente se desea probar una suposición que se ha hecho sobre un parámetro que caracteriza a una población en particular, tal como la media poblacional.

La Hipótesis es la aseveración que se hace sobre una población

En el análisis estadístico se hace una aseveración, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable

Usualmente se desea probar una suposición que se ha hecho sobre un parámetro que caracteriza a una población en particular, tal como la media poblacional.

Introducción a la Inferencia Estadística5

¿Prueba? de hipótesis

Será cierto o no una suposición que se ha hecho sobre un parámetro que caracteriza a una población

Page 6: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Procedimiento para probar una Hipótesis

La prueba de una hipótesis se realiza mediante un procedimiento sistemático de cinco pasos.

Al llegar al 5º paso se puede o no rechazar la hipótesis.

Esta prueba aporta una clase de prueba más allá de una duda razonable.

El propósito de la prueba de hipótesis es el de hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

La prueba de una hipótesis se realiza mediante un procedimiento sistemático de cinco pasos.

Al llegar al 5º paso se puede o no rechazar la hipótesis.

Esta prueba aporta una clase de prueba más allá de una duda razonable.

El propósito de la prueba de hipótesis es el de hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

Introducción a la Inferencia Estadística6

Procedimiento para probar una Hipótesis

Aceptar o Rechazar

Hipótesis

Decidir

Page 7: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Procedimiento para probar una Hipótesis

Introducción a la Inferencia Estadística7

Procedimiento para probar una Hipótesis

• Definir Hipótesis nula (H0) e Hipótesis alternativa (H1), es decir traducir a lenguaje estadístico la hipótesis científica

1.- Definir

• Controlar los supuestos y definir el nivel de significación (α y β)y el error tipo I y tipo II

2.- Nivel de significación

• Identificar la Distribución Muestral asociada (distribución Normal estándar “z”o la “ t ” de student) y seleccionar el estadístico de prueba.3.- Calcular Estadístico

• Establecer la Regla de Decisión bajo las cuales se acepta o no H0. 4.- Decidir

• Formular conclusiones basado en la evidencia muestral y tomar una DECISION : Rechazar o No la H0

5.- Aceptar o No

Analizaremos cada paso en

detalle

Analizaremos cada paso en

detalle

Page 8: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Paso 1: Definir Hipótesis nula (H0) e Hipótesis alternativa (H1)

Consiste en establecer el valor supuesto del parámetro en consideración antes de empezar el muestreo. Ese valor supuesto que se desea probar se le denomina Hipótesis Nula (H0)

La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa.

El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.

La hipótesis alternativa (H1) se refiere a cualquier hipótesis que difiera de H0.

Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa.

El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro

Consiste en establecer el valor supuesto del parámetro en consideración antes de empezar el muestreo. Ese valor supuesto que se desea probar se le denomina Hipótesis Nula (H0)

La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa.

El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.

La hipótesis alternativa (H1) se refiere a cualquier hipótesis que difiera de H0.

Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa.

El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro

Introducción a la Inferencia Estadística8

Ejemplo:

El jefe de la zona escolar desea probar que el promedio de calificaciones de

física de 9º (media: µ) de planteles privados es igual a 12

H0 : µ = 12

Si H0 no es cierta se presentan las

siguientes 3 alternativas:

1. H1 : µ ≠ 12 la media de

calificaciones es diferente de 12 puntos

2. H1: µ > 12 la media de calificaciones

es mayor a 12 puntos

3. H1: µ < 12 la media de calificaciones

es menor a 12 puntos

Page 9: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Se refiere a la probabilidad α de rechazar H0

cuando en realidad es verdadera, cometiendo así un ERROR tipo I. O por el contrario la probabilidad β de aceptar H0 cuando en realidad es falsa, cometiendo así un ERROR tipo II

Aunque no existe una regla general para seleccionar los valores de α, suele utilizarse α= 0,05 (5%) y α= 0,01 (1%) y debe especificarse antes de realizar la prueba.

Si por ejemplo se elige un α= 5% al diseñar una prueba entonces podemos esperar que en 5 ocasiones de cada 100 se rechazará la H0 cuando debería ser aceptada (porque por azar la muestra cae en la región de rechazo), o sea que tenemos una probabilidad = 0.95 (95%) de que no rechazaremos la H0 siendo cierta.

Se refiere a la probabilidad α de rechazar H0

cuando en realidad es verdadera, cometiendo así un ERROR tipo I. O por el contrario la probabilidad β de aceptar H0 cuando en realidad es falsa, cometiendo así un ERROR tipo II

Aunque no existe una regla general para seleccionar los valores de α, suele utilizarse α= 0,05 (5%) y α= 0,01 (1%) y debe especificarse antes de realizar la prueba.

Si por ejemplo se elige un α= 5% al diseñar una prueba entonces podemos esperar que en 5 ocasiones de cada 100 se rechazará la H0 cuando debería ser aceptada (porque por azar la muestra cae en la región de rechazo), o sea que tenemos una probabilidad = 0.95 (95%) de que no rechazaremos la H0 siendo cierta.

Acepta la H0

Rechaza la H0

Si H0 es verdadera

Decisión Correcta

ERROR tipo I

Si H0 es falsa

ERROR tipo II

Decisión Correcta

Paso 2: Seleccionar el nivel de significación

Ejemplo:

Si la muestra de 25 colegios la media de las calificaciones supera los 12 puntos. Se rechaza H0 . Se comete

error tipo I si la media de la población es igual a 12 puntos.

Si la muestra de 25 colegios la media de las calificaciones es igual a 12 puntos. Se acepta H0 . Se comete

error tipo II si la media de la población supera los 12 puntos.

9 Introducción a la Inferencia Estadística

Page 10: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Md. población = Md. muestra

10 Introducción a la Inferencia Estadística

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de NO rechazo (aceptación).

Si el estadístico de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. El Valor crítico separa la región de no rechazo de la de rechazo.

Se rechaza H0 si la Media Muestral cae en cualquiera de las dos regiones de rechazo.

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de NO rechazo (aceptación).

Si el estadístico de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. El Valor crítico separa la región de no rechazo de la de rechazo.

Se rechaza H0 si la Media Muestral cae en cualquiera de las dos regiones de rechazo.

Paso 2: Tipos de prueba. Prueba de H0 de dos colas

Page 11: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Md. población = Md. muestra

11 Introducción a la Inferencia Estadística

La prueba de las dos colas se considera apropiada cuando:

la H0 : Md población ( μ ) = Md muestra ( X ) yla H1 : Md población ( μ ) ≠ Md Muestra ( X )

La hipótesis planteada se formula con la igualdad

La prueba de las dos colas se considera apropiada cuando:

la H0 : Md población ( μ ) = Md muestra ( X ) yla H1 : Md población ( μ ) ≠ Md Muestra ( X )

La hipótesis planteada se formula con la igualdad

Paso 2: Tipos de prueba. Prueba de H0 de dos colas

Page 12: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Paso 2: Tipos de prueba. Prueba de H0 de una cola

La hipótesis planteada H0 se formula con ≥ o ≤

Por ejemplo el departamento de admisión de una universidad ha considerado que completará el 100% de sus matrículas disponibles solo con los bachilleres de los liceos cuyos promedios sean al menos de 14 puntos (µ ≥ 14 puntos).

Para esto toma una muestra de 30 bachilleres por liceo y si el promedio del grupo (X) es igual o supera este parámetro, los bachilleres son convocados a presentar la prueba de admisión.

H0 : µ ≥ 14 puntos y H1 : µ < 14 puntos

La hipótesis planteada H0 se formula con ≥ o ≤

Por ejemplo el departamento de admisión de una universidad ha considerado que completará el 100% de sus matrículas disponibles solo con los bachilleres de los liceos cuyos promedios sean al menos de 14 puntos (µ ≥ 14 puntos).

Para esto toma una muestra de 30 bachilleres por liceo y si el promedio del grupo (X) es igual o supera este parámetro, los bachilleres son convocados a presentar la prueba de admisión.

H0 : µ ≥ 14 puntos y H1 : µ < 14 puntos

µ = 14 ptos

Región de aceptación

Región de rechazo

Si la media muestral X cae en esta región se acepta

12 Introducción a la Inferencia Estadística

Page 13: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Paso 3: Identificar la Distribución Muestral asociada

Se refiere al valor determinado a partir de la información muestral que se utiliza para aceptar o rechazar la hipótesis nula H0

Existen muchos estadísticos de prueba, en nuestro caso utilizaremos los estadísticos Z para distribución normal de la población y t “t de student” para la muestra.

La elección de uno de estos depende del tamaño de la muestras, si las muestras son grandes (mayor a 30 observaciones) el estadístico recomendado es el de la Distribución Normal Estándar (z) , o en caso de muestras pequeñas utilizar el estadístico t .

En las pruebas de hipótesis para la media de la población (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de:

Se refiere al valor determinado a partir de la información muestral que se utiliza para aceptar o rechazar la hipótesis nula H0

Existen muchos estadísticos de prueba, en nuestro caso utilizaremos los estadísticos Z para distribución normal de la población y t “t de student” para la muestra.

La elección de uno de estos depende del tamaño de la muestras, si las muestras son grandes (mayor a 30 observaciones) el estadístico recomendado es el de la Distribución Normal Estándar (z) , o en caso de muestras pequeñas utilizar el estadístico t .

En las pruebas de hipótesis para la media de la población (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de:

13 Introducción a la Inferencia Estadística

Page 14: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Caso ejemplo 1

Promedio de calificaciones de física de 9º de planteles privados. Se conoce μ

y σPaso 1

Paso 2

Nivel de significación α = 0,05 (5%), que es la probabilidad de cometer error

tipo I, es decir rechazar H0 cuando esta es verdadera. Nivel de confianza

95%

Paso 3

El estadístico apropiado es Z ya que se dijo que la distribución es normal. Para hacer el cálculo se utiliza Excel, función “PRUEBA.Z”

Paso 3: Identificar la Distribución Muestral asociada

H0: µ ≤ 12 μ = 12

H1 : µ > 12 σ = 1,8

Para calcular Z fácilmente puedes utilizar Excel. Revisa el material de apoyo respectivo a esta sesión.

14 Introducción a la Inferencia Estadística

Page 15: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Representación gráfica del Ejemplo 1

Introducción a la Inferencia Estadística15

Promedio de calificaciones de física de 9º de planteles privados

H0: µ ≤ 12

H1 : µ > 12

α= 5%

Acepto H0 Acepto H1Rechazo H0

Page 16: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Paso 4: Formular la regla de decisión

Se establece las condiciones específicas en la que se rechaza la hipótesis nula H0 y las condiciones en que no se rechaza la hipótesis nula.

La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota

En nuestro ejemplo, la PRUEBA.Z confirma H0, es decir que la población en estudio tiene una calificación promedio menor o igual a 12 puntos si la desviación estándar de 1,8 es cierta, basada en una media de muestral menor o igual a 11,9 con una probabilidad de 59%.

Se establece las condiciones específicas en la que se rechaza la hipótesis nula H0 y las condiciones en que no se rechaza la hipótesis nula.

La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota

En nuestro ejemplo, la PRUEBA.Z confirma H0, es decir que la población en estudio tiene una calificación promedio menor o igual a 12 puntos si la desviación estándar de 1,8 es cierta, basada en una media de muestral menor o igual a 11,9 con una probabilidad de 59%.

Caso ejemplo 1Promedio de calificaciones de física de 9º de planteles privados.

Se conoce μ y σPaso 1

Paso 2

Nivel de significación α = 0,05 (5%), que es la probabilidad de

cometer error tipo I, es decir rechazar H0 cuando esta es

verdadera

Paso 3

El estadístico apropiado es Z ya que se dijo que la distribución es normal. Para hacer el cálculo se utiliza Excel, función “PRUEBA.Z” Utiliza DISTR.NORM.ESTAND.INV

Paso 4

Si Z es ≥ 95% ( 1- α) se acepta que el promedio de notas de los planteles privados de la zona escolar no están alcanzando los objetivos de aprendizaje de Física de 9º

16 Introducción a la Inferencia Estadística

H0: µ ≤ 12 μ = 12

H1 : µ > 12 σ = 1,8

DISTR.NORM.ESTAND.INV

Page 17: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Paso 5: Tomar una decisión

En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula.

Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula.

En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula.

Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula.

Caso ejemplo 1Promedio de calificaciones de física de 9º de planteles privados. Se

conoce μ y σPaso 1

Paso 2

Nivel de significación α = 0,05 (5%), que es la probabilidad de cometer

error tipo I, es decir rechazar H0 cuando esta es verdadera

Paso 3

El estadístico apropiado es Z ya que se dijo que la distribución es normal. Para hacer el cálculo se utiliza Excel, función “PRUEBA.Z”

Paso 4

Si Z es ≥ 95% ( 1- α) se acepta que el promedio de notas de los planteles privados de la zona escolar no están alcanzando los objetivos de aprendizaje de Física de 9º

Paso 5 Se acepta H0

17 Introducción a la Inferencia Estadística

H0: µ ≤ 12 μ = 12

H1 : µ > 12 σ = 1,8

Page 18: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Aplicando fórmulas para el Ejemplo 1

Introducción a la Inferencia Estadística18

Z = (X – μ)/( α /√ n)

X =11,9μ =12

S = 1,399n =25α =0,05

Valores tabulados de Z para 1 Cola

derecha +1,645

Z =-2,36 Acepto H0 Acepto H1Rechazo H0

Z= -2,36

Z calculado está en la región de aceptación

α= 5%

H0: µ ≤ 12

Page 19: Introducción a la Inferencia Estadística

María Isabel [email protected]

Estadística Aplicada

Lista de Referencias

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Tarjeta de referencia rápida: Funciones estadísticas de Excel http://support.microsoft.com/kb/828296/es

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Tarjeta de referencia rápida: Funciones estadísticas de Excel http://support.microsoft.com/kb/828296/es

Introducción a la Inferencia Estadística19