TAV 03 Métodos Estadísticos

107
Mag. Helga Kelly Quiroz Chavil MÉTODOS ESTADÍSTICOS

description

estadistica

Transcript of TAV 03 Métodos Estadísticos

Presentacin de PowerPoint

Mag. Helga Kelly Quiroz Chavil Mtodos Estadsticos

1Muestreo e intervalos de confianza

Introduccin a la Inferencia Estadstica Podemos definir Inferencia Estadstica como el conjunto de tcnicas estadsticas que nos permiten extraer conclusiones de una poblacin a partir de una muestra representativa de la misma. El muestreo es necesario ya por motivos de tiempo, dinero o naturaleza del experimento (prueba de una vacuna, resistencia de materiales, etc ) no podemos hacer el estudio de la poblacin completa.Mtodos de Muestreo Muestreo es la actividad por la cual se toman ciertas muestras de una poblacin de elementos de los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante porque a travs de l podemos hacer anlisis de situaciones de una empresa o de algn campo de la sociedad

Razones del Muestreo La naturaleza destructiva de algunas pruebas La imposibilidad fsica de observar todos los elementos de la poblacin.El costo de estudiar a toda la poblacin es muy alto.El tiempo para contactar a toda la poblacin es inviable.

Razones del Muestreo Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero para que podamos extraer conclusiones, es importante que elijamos bien las muestras para nuestros estudios. Hay cuestiones que debemos especificar a la hora de elegir una muestra:El tipo de muestreo que se va a utilizar.Razones del Muestreo El tamao de la muestra.El nivel de confianza de las conclusiones que vamos a presentar.

Clasificacin de los muestreosLos mtodos de muestreo pueden dividirse en dos grandes grupos: Mtodos de muestreo probabilstico Mtodos de muestreo no probabilstico Muestreos no Probabilsticos No sirven para realizar generalizaciones, pues no se tienes la certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En general se selecciona a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa Muestreo intencional o de conveniencia:Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

Bola de nieveSe localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

Muestreos Probabilsticos Los muestreos probabilsticos son aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los mtodos de muestreo probabilstico encontramos los siguientes tipos: Muestreo aleatorio simple.Muestreo sistemtico.Muestreo estratificado.Muestreo por conglomerados.Muestreo aleatorio simple.El procedimiento empleado es el siguiente: Se asigna un nmero a cada individuo de la poblacin y a travs de algn medio mecnico (como una urna, bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.)

Muestreo aleatorio simple.Se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido.Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.

Ejemplo:En una compaa de 150 trabajadores se quiere obtener una muestra aleatoria de 15 elementos para un chequeo mdico. Se sigue el siguiente procedimiento: Los trabajadores son enumerados del 1 al 150Mediante una tabla de nmeros aleatorios se procede a seleccionarlos Ejemplo:El punto de arranque en la tabla se fija mediante la hora de ese momento 4 : 03, por lo tanto se inicia en la fila 4 y la columna 3Como los nmeros de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las primeras 3 cifras de cada nmero y se registran los nmeros que se vayan encontrando es ese rango Muestreo Sistemtico Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, Muestreo Sistemtico Siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k.Muestreo Sistemtico El riesgo de este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k)Podemos introducir una homogeneidad que no se da en la poblacin.Ejemplo:Suponga que la poblacin de inters consiste de 2000 expedientes en un archivo. Para seleccionar una muestra de 100 con el mtodo aleatorio simple primero se tendra que numerar todos los expedientes, luego se divide 2000/100= 20 y se selecciona un expediente cada 20 hasta llegar a 100 expedientes.Muestreo Aleatorio Estratificado:Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.).

Muestreo Aleatorio Estratificado:Para ello debemos conocer la composicin estratificada de la poblacin objetivo a muestrear. Una vez calculado el tamao muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos de la poblacin usando una simple regla de tres.

Muestreo Aleatorio Estratificado:Entre sus ventajas, este mtodo asegura que la muestra representa adecuadamente a la poblacin en funcin de ciertas variables seleccionadas, adems de obtener estimaciones ms precisas.La desventaja es que se ha conocer como se distribuye la poblacin de acuerdo a las variables utilizadas para la estratificacin.EjemploSe quiere obtener una muestra de 50 estudiantes de la universidad, se pretende que la muestra sea representativa en relacin al lugar de origen de los estudiantes (si son de la localidad o son forneos). Se sabe que en esta universidad el 30% de los estudiantes son forneos.Solucin Primero debemos identificar los estratos de la poblacin y sus respectivas proporciones:Estudiantes locales: 0.7Estudiantes forneos: 0.3La muestra deber mantener esas mismas proporciones, para lo cual es preciso multiplicar el tamao de la muestra (n)Solucin Por las proporciones de los estratos y obtenemos el nmero de elementos que sern seleccionados de cada estrato Estudiantes locales: 0.7(50)=35Estudiantes forneos: 0.3(50)=15Luego se procede a seleccionarlos por medio de alguno mtodos estudiados anteriormente.

Muestreo Aleatorio por Conglomerados El muestreo por conglomerados consiste en dividir la poblacin en sectores o conglomerados, seleccionar una muestra aleatoria de esos sectores, y finalmente obtener una muestra aleatoria de cada uno de los sectores seleccionados. Entre sus ventajas se encuentra que es muy eficiente cuando la poblacin es muy grande y dispersa.Muestreo Aleatorio por Conglomerados Adems que no es preciso tener un listado de toda la poblacin, solo de las unidades primarias de muestreo.Su desventaja radica en que una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto da menor precisin de las estimaciones acerca de la poblacin) que una aleatoria simple del mismo tamao.EjemploSe quiere conocer la opinin de los padres de familia sobre los temas educacin sexual tratados en los libros de texto de educacin primaria en el pas. Como la poblacin es muy grande y dispersa, es necesario hacer un muestreo por conglomerados en varias etapas.Primero dividimos en sectores geogrficos y seleccionamos una muestra aleatoria de ellos.EjemploLuego en cada uno de ellos hacemos una seleccin aleatoria de escuelas primarias, y por ltimo en las escuelas seleccionadas obtenemos una muestra aleatoria de padres de familia.Tamao de muestraPara estudios cuya variable principal es deTipo cuantitativoCuando no se conoce el tamao de la poblacin

Donde:n: Tamao de muestraZ: Nivel de confianzah: Tolerancia de error2: varianza de la poblacin (en caso de no conocerse, se estima mediante una muestra piloto)

Cuando se conoce el tamao de la poblacinDonde:n: Tamao de muestraZ: Nivel de confianzah: Tolerancia de error2: varianza de la poblacin (en caso de no conocerse, se estima mediante una muestra piloto)N: Tamao de la poblacin

Ejemplo:Datos

Para estudios cuya variable principal es detipo cualitativoCuando no se conoce el tamao de la poblacin

Donde:n: Tamao de muestraZ: Nivel de confianza h: Tolerancia de errorp: Proporcin de la poblacin que tiene la caracterstica de intersq: complemento de P

Ejemplo Se quiere estudiar la preferencia de un nuevo partido poltico en una poblacin sobre el cual nunca se ha hecho ningn estudio anterior, el margen de error mximo a aceptar es del 2 % . Determine el tamao de la muestra para un nivel de confianza del 90 %.Solucin Datos Z= 90 %= 1.65 h= 2 %=0.02 p = 0.5 q = 0.5

Solucin

Cuando se conoce el tamao de la poblacinDonde:n: Tamao de muestraZ: Nivel de confianzah: Tolerancia de errorp: Proporcin de la poblacin que tiene la caracterstica de intersq: complemento de PN: Tamao de la poblacin

EjemploSe harn elecciones para elegir el director de cierta Universidad, que consta de 5 facultades, el total de alumnos es de 10 100. Se desea realizar una encuesta para saber cul es la tendencia del voto entre los alumnos. Se requerir de un porcentaje de confianza del 95% y un porcentaje de error de 3 %Solucin Datos: N = 10 100 Z = 95% = 1.96 h = 3% = 0.03 p = 0.5 q= 0.5

Solucin

Intervalo de ConfianzaEstimador puntual: Utiliza un nmero nico o valor para localizar una estimacin del parmetro.

Estimador por intervalo de confianza: Denota un rango dentro del cual se puede encontrar el parmetro y el nivel de confianza que el intervalo contiene al parmetro.

46Intervalo de ConfianzaLimites de confianza: Son los lmites del intervalo de confianza inferior (LIC) y superior (LSC), se determinan sumando y restando a la media de la muestra un cierto nmero Z (dependiendo del nivel o coeficiente de confianza) de errores estndar de la media .

Intervalo de Confianza

Intervalo de Confianza para la Media

Segundo Caso:

Ejemplo Como consecuencia de la falta de gas registrada en la ciudad de Chiclayo, en los meses de invierno, la empresa de Gas decide hacer un estudio para determinar las cantidad gastada es este combustible para calefaccin casera en una ao en particular.Con tal motivo se selecciona una muestra de 64 hogares de la ciudad. La media muestral del gasto en gas para la calefaccin Ejemplo Result de $ 83.6. se sabe por experiencia que la desviacin de la poblacin es $17.8Halle un intervalo de confianza del 95 % para el gasto promedio anual en este tipo de combustible en las viviendas de la ciudad de Chiclayo.Calcule un intervalo de confianza del 99% para este gasto promedio anual Qu conclusiones puede sacar de a) y b)Datos

Solucin Solucin

Tabla

Solucin Conclusin EjemploLos vuelos de una empresa de aviacin tienen una duracin bimestral aproximadamente distribuida de forma normal con una desviacin de 40 horas. Si una muestra de 30 vuelos tienes una duracin promedio de 780 horas, encuentre los intervalos de confianza de 95 % para la media de la poblacin de todos los vuelos de esta empresa.Solucin

Solucin Tercer caso:

Ejemplo:Las ventas diarias de cierta oficina comercial que supone que siguen una distribucin normal. Para estimar el volumen medio de ventas por da se realiza una muestra de 10 das escogidos al azar, resultando que la media de las ventas de esos 10 das es 100 u.m con una desviacin tpica de 4 u.m. dar un intervalo de estimacin para el volumen medio de ventas por da con una confianza de 95 % Solucin

TablaLuego el intervalo es: EjemploUna mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de piezas cuyos dimetros son: 1.01 - 0.97 -1.03 - 1.04 - 0.99 - 0.98 - 0.99 - 1.01 - 1.03, con una desviacin de 0.02455. Encuentre un intervalo de confianza del 99% para el dimetro promedio de piezas de esta mquina si se supone una distribucin aproximadamente normal. Solucin

Datos Tabla

Solucin Intervalo de confianza para la proporcin

Ejemplo:De una muestra aleatoria de 2100 personas de una poblacin hay 630 que leen un determinado diario. Calcular el intervalo de confianza para la proporcin poblacional para un nivel de confianza del 99 %SolucinTabla

Luego la Prueba de Hiptesis y la asociacin de dos variables

Pruebas de HiptesisOtra manera de hacer inferencia es haciendo una afirmacin acerca del valor del parmetro de la poblacin bajo estudio. Esta afirmacin, puede estar basada en alguna creencia o experiencia pasada, que ser contrastada con la evidencia que nosotros obtengamos, a travs de la informacin contenida en la muestra. Esto es a lo que llamamos Prueba de HiptesisDefiniciones Prueba estadstica: Tcnica que permite tomar una decisin, en la aceptacin o rechazo de una hiptesis estadstica. Hiptesis estadstica: Es una afirmacin respecto a los parmetros de una poblacin.

Pruebas de HiptesisUna prueba de hiptesis comprende cuatro componentes principales:Hiptesis NulaHiptesis AlternativaEstadstica de PruebaRegin de Rechazo

Hiptesis Alternativa

Hiptesis AlternativaExisten dos tipos de hiptesis alternativa: La Unilateral: Se especifica una direccin: > < La Bilateral: No se especifica una direccin:

Conclusiones Incorrectas Como las conclusiones a las que lleguemos se basan en una muestra, entonces existen posibilidades de que nos equivoquemos. Podra llegarse a una conclusin incorrecta en varios casos:Error del Tipo I : Rechazo de la hiptesis nula, cuando en realidad es verdadera Error del Tipo II: Aceptacin de la hiptesis nula, cuando en realidad es falsa.

Prueba de Hiptesis

Grafica

Conclusiones de una Prueba de Hiptesis Si rechazamos la Hiptesis Nula, concluimos que hay suficiente evidencia estadstica para inferir que la hiptesis nula es falsaSi no rechazamos la Hiptesis Nula, concluimos que no hay suficiente evidencia estadstica para inferir que la hiptesis nula es falsaPrueba de Hiptesis La Probabilidad de cometer un error Tipo I se conoce como Nivel de Significancia, se denota como y es el tamao de la regin de rechazoEl complemento de la regin de rechazo es 1 y es conocido como el Coeficiente de ConfianzaEn una prueba de Hiptesis de dos colas la regin de no rechazo corresponde a un intervalo de confianza para el parmetro en cuestinRegin de Rechazo La Regin de Rechazo es el conjunto de valores tales que si la prueba estadstica cae dentro de este rango, decidimos rechazar la Hiptesis Nula. Su localizacin depende de la forma de la Hiptesis Alternativa:Estadstica de Prueba La Estadstica de Prueba es una estadstica que se deriva del estimador puntual del parmetro que estemos probando y en ella basamos nuestra decisin acerca de si rechazar o no rechazar la Hiptesis Nula

Siempre se calcula considerando la Hiptesis Nula como si fuera verdadera.

Prueba de hiptesis para la mediaDefinicin de regin de rechazo para hiptesis estadstica referente a un promedio poblacional (). Vlido para el caso de una variable normalmente distribuida y para una muestra grande (n>30).

DondeEjemplo: Se somete a prueba a la totalidad de los integrantes del magisterio para enseanza bsica primaria de un pas y un experto en educacin afirma que el promedio de la calificacin, sobre una base de 100, fue de 76. Un representante del alto gobierno pone en duda dicha afirmacin, por lo cual se toma una muestra aleatoria de 400 maestros cuya media fue de 74 con desviacin estndar de 16. Probar la hiptesis con un nivel de significacin del 1%.Solucin Solucin Solucin EjemploUn proceso manufacturero usado por una fbrica durante los ltimos aos da una produccin media de 100 unidades por hora con una desviacin estndar de 8 unidades. Se acaba de introducir en el mercado una nueva mquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que est ahora en uso, si la media de produccin de la nueva mquina es de ms de 150 unidades por hora, su adopcin dara bastantes beneficios.EjemploPara decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se le permite hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades por hora. Con sta informacin qu decisin se debe tomar si se asume un nivel de confianza del 99 por ciento.

Solucin Solucin Solucin Conclusin La estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva mquina.