javier Web viewLa prueba t de Student es utilizada para la estimación de medias y...

28
INDICE GENERAL ESTIMACIÓN DE LA INFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES. CASO DE MUESTRAS INDEPENDIENTES…………………………………………………………………………………………………3 HIPÓTESIS…………………………………………………………………………………………………………………………………………..11 INFERENCIAS DEDUCIR SOBRE DOS MEDIAS POBLACIONALES CASO DE MUESTRAS PARALELAS……………………………………………………………………………………………………………………………………………14 INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPÓTESIS SOBRE DOS PROPORCIONES POBLACIONALES………………………………………………………………………………………………18 CHI CUADRADA………………………………………………………………………………………………………………………………….25

Transcript of javier Web viewLa prueba t de Student es utilizada para la estimación de medias y...

Page 1: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

INDICE GENERAL

ESTIMACIÓN DE LA INFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES. CASO DE MUESTRAS INDEPENDIENTES…………………………………………………………………………………………………3

HIPÓTESIS…………………………………………………………………………………………………………………………………………..11

INFERENCIAS DEDUCIR SOBRE DOS MEDIAS POBLACIONALES CASO DE MUESTRAS PARALELAS……………………………………………………………………………………………………………………………………………14

INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPÓTESIS SOBRE DOS PROPORCIONES POBLACIONALES………………………………………………………………………………………………18

CHI CUADRADA………………………………………………………………………………………………………………………………….25

Page 2: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

ESTIMACIÓN DE LA INFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES. CASO DE MUESTRAS INDEPENDIENTES

Estimar: Evaluar, calcular, dar valor.Estimación: Conjunto de técnicas utilizadas para conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra. Cualquier inferencia extraída de la población se basa en estadísticos muestrales.

Tipos de estimación

Estimación por intervalos: Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En los que incluye: Intervalo de confianza, Error de la estimación, Límite de Confianza, Valor α o nivel de significación y Valor crítico.

*Estimación puntual: Consiste en la estimación del valor del parámetro mediante un solo valor, obtenido de una fórmula determinada.Inferir: Proceso de indagar, recabar información y dar significado a lo que percibimos en base a supuestos, conocimientos previamente adquiridos y las experiencias previas, sacando conclusiones adecuadas de forma deductiva e inductiva que permiten el esclarecimiento de datos.Inferencia estadística o estadística inferencial: Proceso de estimación de resultados válidos que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). Las conclusiones probabilísticas no son definitivas, es decir al repetir el estudio pueden obtenerse resultados diferentes.El propósito de la estadística

Usar los estadísticos de la muestra para estimar el valor de los parámetros de la población:

2

POBLACIÓNSe quiere conocer el

parámetro θ

Se extrae una muestra

probabilística de n elementos

Page 3: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

x

m

Estadístico (muestral): Medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico. Es importante notar que los estadísticos son variables aleatorias (toma valores distintos, no son fijos) pues previo a realizar el muestreo no se conoce el valor que el estadístico tomará. El valor del estadístico depende de la muestra que se tome. Por ello es importante estudiar las distribuciones que tienen los estadísticos que se usan. La elección de los estadísticos adecuados dependerá de cuál sea el parámetro poblacional que interese.Población: Conjunto formado por la totalidad de elementos con arreglo a unas características concretas.Muestra: Subconjunto de elementos de la población elegidos para estudiar y así tratar de inferir características de la población.Parámetro: Medida de una característica determinada de una población. Si esta medida está referida a una muestra entonces se denomina estadístico. La diferencia entre ambos valores es el error muestral. El valor del parámetro es siempre desconocido.Valor: Medida de la importancia o utilidad de un ser, de una cosa, de una idea.

PARÁMETROS Y ESTADÍSTICOS

Estadístico Parámetro que EstimaPromedio muestral ( ) Media Poblacional (µ)

Mediana Muestral ( ) Media Poblacional (µ) o el segundo cuartil

3

Mediante el estimador

correspondiente se calcula un valor

(estadístico)

Generaliza el valor

Page 4: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

q0.5.

Moda ( ) Media Poblacional (µ)Varianza muestral ( S2 ) Varianza poblacional (2)Proporción de la muestra ( ) Proporción de la población p.

Ejemplo

Supongamos que para un evento se producen un cierto número de trufas. No todas las trufas van a tener el mismo diámetro, si escogemos, al azar una trufa, tendremos un valor para el diámetro. Podemos suponer que los diámetros tienen la distribución normal, debido a nuestra experiencia con el proceso, conocemos que la desviación estándar de la población es de 4 mm (aproximadamente). Pero, también por experiencia, sabemos que el diámetro promedio puede variar. De modo que tenemos:

Una Población, que son todas las trufas que se producen. Un Parámetro de la población conocido (o casi) que es la desviación

estándar. Otro Parámetro cuyo valor es desconocido: la media.

Para tratar de conocer el valor del parámetro que desconocemos, tomamos una muestra de las trufas. Supongamos que son 100 trufas en la muestra. Con un instrumento de precisión, y con mucho cuidado, medimos los diámetros de las 100 trufas de la muestra y calculamos su promedio.

¿Qué nos dice el valor de la media de la muestra respecto a la media de la población?

Por un lado, definitivamente la media de la muestra no va a ser igual a la de la población.

Por otra parte, no tenemos mejor información respecto a la media de la población que la que extraigamos de la muestra. Cualquier otra información no pasa de chisme.

Además, si alguien nos preguntara ¿Cómo cuánto es el diámetro promedio de la población de las trufas? Le contestaríamos diciendo el valor que hayamos visto en la muestra.

4

Page 5: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Si la muestra de 100 trufas arroja un valor del promedio de 43.5 mm, diríamos que estimamos el promedio de la población en 43.5 mm.

A nuestra contestación se le debe agregar alguna advertencia como: "más o menos'', o ``aproximadamente''.

A un valor calculado con los datos de una muestra se le llama estadística. Cuando usamos una estadística para jugar el papel de decir, aproximadamente, el valor de un parámetro de la población, le llamamos estimador. Cuando andamos un poco pedantes le llamamos estimador puntual (queremos decir que para estimar el parámetro estamos usando un valor único).

Distribución del Promedio Muestral

Cuando se toma una muestra mayor a 30 la distribución se comporta normalmente con una curva de Gauss y existe lo que se conoce como el Teorema del límite central La distribución del promedio de la muestra depende de la distribución misma de la población (Curva normal), además generaliza la distribución del promedio independientemente de la distribución de la población. La fórmula estandariza la muestra para que se pueda estimar la población. Si se toma una muestra de tamaño n de una población con media µ y varianza 2, entonces la distribución se aproxima a la normal estándar N (media 0 (distribuye los datos) y desviación estándar 1 (define el tamaño de la curva).

Dónde:X= Media muestral µ= Media poblacionalσ= Desviación estándar poblacionaln= Número total de datosz= Estandarización de la muestra.σ/√n: Error estándar

5

Page 6: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

EjemploSe sabe que el zacahuil que se prepara en la población huasteca (Hidalgo,

Puebla, Querétaro, San Luis Potosí, Tamaulipas y Veracruz), tiene un tamaño promedio de 1.65 m con una varianza de .64. Se toma una muestra de tamaño 30. ¿Cuál es la probabilidad de que la muestra sea menor a 1.7?

Identificar datos:µ= 1.65σ2= .64σ= √.64= .8n= 30

= 1.7Sustituir datos:

Z= 1.7-1.65 = .05____ = .05__ = .3424 .8/√30 .8/5.4772 .1460 Z=.3424

Se puede obtener la probabilidad a través de Excel, de la siguiente manera:1. Abrir la ventanilla de Excel2. Formulas3. Autosuma4. Más funciones5. Estadísticas6. Distr. Norm.Estand.N7. Aceptar8. Anotar valor de z y promedio (Acumulado)9. EnterOh también se puede localizar en la Tabla de valores de probabilidad acumulada

para la Distribución Normal Estándar [z].Tabla de valores de probabilidad acumulada para la Distribución Normal

Estándar [z]Segunda cifra decimal del valor de z

6

Page 7: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .090.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .53590.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .57530.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .61410.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .65170.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .68790.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .72240.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .75490.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .78520.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .81330.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .83891.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .86211.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .88301.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90151.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .91771.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .93191.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .95451.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .97672.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .98172.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .98572.2 .9861 .9864 .9868 .9871 .9875 .4878 .9881 .9884 .9887 .98902.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .99162.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .99362.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .99522.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .99642.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .99742.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .99812.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986

7

Page 8: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .99903.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .99933.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .99953.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .99973.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998

Éste resultado expresa, que existe un 63% de probabilidad de que la muestra sea menos a 1.7m

Pruebas t de student

La prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas poblaciones. Prueba z y t para grupos independientesSe utilizan en experimentos en los cuales hay dos o más condiciones de control o experimental. No existe base alguna para que cada sujeto entre en uno u otro grupo, por eso se denomina independiente. Se calculan los estadísticos de manera separada y se comparan entre ellos para determinar si es el azar, por sí solo, la explicación razonable para las diferencias. µ1 σ1 y µ2 σ2El hecho de modificar el nivel de la variable independiente afecta la media, pero no debe afectar la desviación estándar. Tiene una distribución t de Student con n – 1 grados de libertad. Las distribuciones t y normal estándar son prácticamente iguales cuando los grados de libertad superan a 30.La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.Grados de libertadEl número de grados de libertad de un estadístico se define como el número N de observaciones independientes en la muestra (o sea, el tamaño de la muestra)

8

Page 9: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

menos el número k de parámetros de la población, que debe ser estimado a partir de observaciones muestrales.

HIPÓTESIS

Es una suposición acerca de un parámetro de la población, que se desarrolla con el objeto de probar algo.

Prueba de hipótesis: Es un procedimiento basado en la evidencia de la Muestra y en La teoría de probabilidad para determinar si la hipótesis es un enunciado razonable ó por el contrario debe ser rechazado.

Supuesto acerca de la distribución de una variable aleatoria. Una hipótesis estadística se especifica dando el valor o los valores del parámetro.

 REALIZACION DE UAN HIPÓTESIS ESTADÍSTICA

Se lleva a cabo un experimento, obteniendo datos a través de una muestra.

La hipótesis formulada es desechada si los resultados obtenidos del experimento son improbables bajo dicha hipótesis. Si los resultados no son improbables, la hipótesis no es desechada por falta de evidencia. La prueba de hipótesis es un procedimiento de toma de decisiones, relacionada principalmente con la elección de una acción entre dos conjuntos posibles de valores del parámetro, es decir, en dos hipótesis estadísticas, a las cuales llamaremos:

 Hipótesis nula H0

 Hipótesis alternativa H1

• Hipótesis nula corresponde a la ausencia de una modificación en la variable investigada, y por lo tanto se especifica de una forma exacta:

H0 : q = q0

H0 : q q0

H0 : q q0

• Hipótesis alternativa se especifica de manera más general :

9

Page 10: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

H1: q ¹ q0

H1: q > q0

H1: q < q0.

TIPOS DE ERROR

Rechazar una hipótesis no significa que ésta sea falsa, como tampoco el no rechazarla significa que sea verdadera. La decisión tomada no está libre de error.

Error Tipo I: Rechazar una hipótesis que es verdadera.

Error Tipo II: No rechazar una hipótesis que es falsa.

MEDICIÓN DE ERRORES

a es la Probabilidad de cometer un Error tipo I. Se llama Nivel de significación . a Nivel de confianza: probabilidad de no rechazar H0 cuando es verdadera.

b es la probabilidad de cometer un Error tipo II . b Potencia de la prueba: probabilidad de rechazar H0 cuando es falsa.

Es deseable que estas dos probabilidades de error sean pequeñas.

PRUEBA SIGNIFICATIVA

Las probabilidades de cometer errores de tipo I y II se consideran los "riesgos" de decisiones incorrectas. Al realizar la prueba se toma en cuenta el error de tipo I. Por lo tanto, la prueba es significativa si se rechaza la hipótesis nula, pues en este caso se conoce la probabilidad de haber cometido un error.

NIVEL DE SIGNIFICACIÓN

Nivel de Significación (a) = P (rechazar H0 / H0 es cierta) .

Críticas a la selección Nivel significación El resultado es arbitrario (Rechazo con a del 5% y acepto con a del 4 %. Dar solo el resultado no permite diferenciar el grado de evidencia de la muestra a favor ó en contra de H0.

NIVEL CRITICO “P”

“bip” es la Probabilidad de obtener una discrepancia mayor o igual que la observada en la muestra n cuando Ho es cierta .El valor de “p” no se fija a priori, sino que se determina a partir de la muestra .A menor valor de “p” , menor es la credilidad de Ho .

CÓMO PONER A PRUEBA UNA HIPÓTESIS NULA

1. Formule y establezca H0.

10

Page 11: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

2. Formule y establezca H1.

3. Escoja un estadístico de prueba que sea apropiado.

4. Formule y establezca una regla de decisión.

5. Calcule el estadístico de prueba para una muestra.

6. Tome una decisión: (a) no se rechaza H0, se rechaza H0.

INFERENCIAS DEDUCIR SOBRE DOS MEDIAS POBLACIONALES CASO DE MUESTRAS PARALELAS

11

Page 12: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

La Inferencia Estadística: proceso de estimación de resultados válidos para una población a partir de los resultados obtenidos de una muestra de esa población. La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar conclusiones de una población en estudio, a partir de la información que proporciona una muestra representativa de la misma. También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.

La muestra: subconjunto de elementos de la población elegidos para estudiar y así tratar de inferir características de la población. La muestra se obtiene por observación o experimentación.

Población: conjunto formado por la totalidad de elementos con arreglo a unas características concretas.

PUEDE DIVIDIRSE EN DOS DE ACUERDO CON A LA DISTRIBUCIÓN EN LA POBLACIÓN.

Inferencia Paramétrica: Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc.) pero se desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la distribución conocida.

Inferencia No Paramétrica: Forma y parámetros desconocidos. Se realizan inferencias sobre características que no tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de Orden).

LA INFERENCIA PUEDE DIVIDIRSE EN DOS APARTADOS:

Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas sobre posibles valores de los mismos.

Estimación puntual: Un único valor para cada parámetro. Estimación por intervalos: Intervalo de valores probables para el

parámetro. Contraste de Hipótesis: Se realizan hipótesis sobre los parámetros

desconocidos y se desarrolla un procedimiento

MUESTREO

Cconjuntó de operaciones encaminadas a determinar una muestra, su tamaño y demás características necesarios para identificar a los elementos que la forman.Error muestral: es el imputable al estudio de una parte de la población o muestra.

12

Page 13: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Error no muestral: es el que se produce en toda la investigación como consecuencia de definiciones conceptuales incorrectas, de fallos en los instrumentos de medida, en la entrevista o en el desarrollo del trabajo de campo.

ETAPAS EN LA SELECCIÓN DE LA MUESTRA1. Definición de la población objetivo: en términos de contenido,

unidades, extensión y tiempo.2. Identificar el marco muestral: normalmente es imposible confeccionar

una lista que no excluya a algunos miembros de la población.3. Determinar el método de muestreo: si la unidad de muestreo es

diferente del elemento es necesario especificar también cómo se deben seleccionar los elementos dentro de la unidad de muestreo.

4. Determinar el tamaño de la muestra: se deben considerar los siguientes factores cualitativos: Importancia de la decisión, Naturaleza de la investigación, Número de variables, Naturaleza del análisis, Tamaños de muestra utilizados en estudios similares, Restricciones de recursos.

5. Selección material de la muestra: elegir los componentes de la muestra y localizar materialmente la muestra, es decir, localización física de las unidades.

6. Decidir el trato que se ha de dar a la falta de respuestas: se niega a responder, no se localiza, no sabe contestar o no es accesible. Para reducir este riesgo de no respuesta hay varios procedimientos: Mejorar el diseño de la investigación para reducir las negativas. Repetir los intentos. Estimar los efectos de la falta de respuesta en lo que respecta a la

calidad de la información.

TIPOS DE MUESTREO

Muestreo no probabilístico: La selección de la muestra no es aleatoria, sino que se basa, en parte, en el juicio del entrevistador o de responsable de la investigación.

No se basa en ninguna teoría de la probabilidad y, por lo tanto, no es posible calcular la precisión o acotar el error cometido.No es posible calcular estos errores ni la confianza de las estimaciones que, además, no siempre se reducen aumentando el tamaño de la muestra.

13

Page 14: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

En el muestreo no probabilístico los costes y la dificultad del diseño son más reducidos (al no ser necesario disponer de un marco). Este muestreo puede dar buenos resultados, pero también apareja el riesgo de proporcionar una información errónea

Muestreo probabilístico: Las muestras se seleccionan al azar, no se seleccionan por los

investigadores. Cada elemento de la población tiene la misma probabilidad de ser elegido. Se puede conocer el error muestral, el nivel de confianza y el nivel de

precisión de las estimaciones. Los resultados se pueden generalizar. Es el único método que puede evaluar la representatividad de la muestra. Es más caro que el muestreo no probabilística. Es, en general, más lento y complicado que el muestreo no probabilística

Muestreo aleatorio simple: Se trata de un procedimiento de muestreo (sin reemplazamiento), en el que

se seleccionan n unidades de las N en la población, de forma que cualquier posible muestra del mismo tamaño tiene la misma probabilidad de ser elegidas.

Se realizan n selecciones independientes de forma que en cada selección los individuos que no han sido elegidos tengan la misma probabilidad de serlo.

El procedimiento habitual consiste en numerar todos los elementos de la población y se seleccionan muestras del tamaño deseado utilizando una tabla de números aleatorios o un programa de ordenador que proporcione números aleatorios.

Muestreo aleatorio sistemático Se ordenan los individuos de la población y se numeran. Se divide la población en tantos grupos como individuos se quieren tener en

la muestra. Se selecciona uno al azar en el primer grupo y se elige el que ocupa el mismo lugar en todos los grupos.

La ventaja principal es que es más sencillo y más barato que el muestreo aleatorio simple, además, se comporta igual si no hay patrones o periodicidades en los datos.

La aparición de patrones desconocidos puede llevar a importantes errores en la estimación de los parámetros.

Este tipo de muestreo puede utilizarse, por ejemplo, en encuestas telefónicas programadas mediante ordenador.

Muestreo aleatorio estratificado Se divide la población en grupos homogéneos (estratos) de acuerdo

con las características a estudiar. Por ejemplo, en un estudio de las características socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen presentar características diferenciales.

14

Page 15: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Se selecciona una muestra aleatoria de cada estrato tratando de que todos los estratos de la población queden representados.

Permite utilizar información a priori sobre la estructura de la población en relación con las variables a estudiar.

Obtiene representantes de todos los estratos de la población. Diferentes opciones de selección del tamaño de la muestra en los

estratos: El mismo número en cada estrato. Proporcional. (La más común) Optima.

Muestreo por conglomerados Se divide la población en grupos de acuerdo con su proximidad

geográfica o de otro tipo. (conglomerados). Cada grupo ha de ser heterogéneo y tener representados todos las

características de la población. Por ejemplo, los conglomerados en un estudio sobre la situación de

las mujeres en una determinada zona rural pueden ser los municipios de la zona.

INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPÓTESIS SOBRE DOS PROPORCIONES POBLACIONALES.

Un intervalo de confianza es un rango de valores, calculado a partir de una muestra.

La probabilidad de que el valor del parámetro se encuentre en el intervalo, es el nivel de confianza, el cual se denota 1- α.

En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo (probabilidad de error).

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

15

Page 16: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Generalmente se construyen intervalos con confianza 1-a=95% (o significancia =5%). Menos frecuentes son los intervalos con a=10% o a=1%.

Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro se distribuya normalmente.

En definitiva, un intervalo de confianza al 1 - α % para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

En la aplicación estadística, para el análisis de resultados, cada vez se prefiere mas el uso de intervalos de confianza que las pruebas de hipótesis, debido a que el intervalo de confianza aporta información tanto de la magnitud, como de la precisión de las estimaciones, pudiéndose interpretar el intervalo en términos del margen de error de la estimación puntual. Esto hace los intervalos muy atractivos a la hora de presentar resultados, mientras que el valor-p en las pruebas de hipótesis es una elaboración probabılistica de interpretación más compleja.

El valor P es el mínimo nivel de significancia en el cual Ho sería rechazado cuando se utiliza un procedimiento de prueba especificado con un conjunto dado de información. Una vez que el valor de P se haya determinado, la conclusión en cualquier nivel particular resulta de comparar el valor P con α.

El uso de estimadores es un buen paso para estimar los parámetros de una población.

La estimación por intervalos pretende producir intervalos de tal manera que exista cierta “confiabilidad” de que el parámetro real de la población se encuentre incluido en el intervalo propuesto.

Los intervalos de confianza representan una mejor alternativa para estimar un parámetro desconocido ya que proporcionan una medida de la incertidumbre.

Los intervalos de confianza se calculan usando

El estimador puntual El tamaño de la muestra El error estándar del estimador puntual Un grado de confianza.

El ancho del intervalo de confianza proporciona una idea de la incertidumbre de la estimación de un parámetro desconocido.

16

Page 17: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

El que un intervalo sea demasiado ancho es un indicador de la necesidad de obtener más información (tamaño de muestra mayor) para tener mejor calidad en la estimación.

Los resultados de un intervalo de confianza se pueden generalizar con cierta confianza.

Un intervalo del (1 - a ) 100% de confianza para un parámetro poblacional se construye a partir de los datos de una muestra de tal manera que el (1 - a )100% de los intervalos similares para un número muy grande de muestras contienen el parámetro real.

Si el tamaño de la muestra es grande, el intervalo del (1 - a ) 100% de confianza esta dado por

/ 2 / 2,S Sx z x zn na a

Donde es el valor de z de tal manera que P [z > / 2za ] = / 2a para una distribución normal estándar.

Valores de típicos de pz son

EJEMPLO:

Los focos tipo B proporcionados por una firma a un teatro para usarlos en sus señales de pantalla tienen una vida útil con desviación estándar de 35 horas. Si una muestra aleatoria de 45 focos tipo B tienen una vida media de 750 horas, encuentre un intervalo de 95% de confianza para la vida media poblacional de todos los focos tipo B fabricados por la firma.

17

Page 18: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

1−α=0 .95 ;α=0 .05 ; α /2=0.025 ; z0.025=1.96

[X−zα /2 σ√n ,X+ zα /2σ√n ]=[750−(1 .9635√45 ) ,750+(1 .9635√45 )]¿ (739.77 ,760.23 )

Nivel

99.73%

99%

98%

96%

95.45%

95%

90% 80%

68.27%

50%

zc 3.00 2.58

2.33

2.05

2.00 1.96

1.645

1.28

1.00 0.6745

Si el tamaño de la muestra es grande, el intervalo del (1 - a ) 100% de confianza esta dado por

X±zcσ√N

La estatura de 100 estudiantes varones representan una muestra aleatoria de 1546 estudiantes de la universidad XYZ, Hayar los intervalos de confianza 95% y 99% para estimar la estatura media de los estudiantes, con:

= 67.45 in. Y S2 = 8.6136

Los límites de confianza 95% son +-1.96/

Límites de confianza 67.45 +- 0.57 in.

Luego el intervalo de confianza 95% para la media de la población µ 66.88 a 68.02 in.

Que denotamos por 66.88<µ<68.02.

Los límites de confianza 99% son: +-2.58/

67.45 +- 0.76 in. Luego el intervalo de confianza 99% para la media de la población µ es 66.69 a 68.21 in. Que se denota por 66.69<µ<68.21.

Intervalo de Confianza para una Proporción

18

Page 19: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Si el tamaño de la muestra es grande, un intervalo del (1 - ) 100% de confianza para la proporción esta dado por

/ 2 / 2

ˆ ˆ ˆ ˆ1 1ˆ ˆ,

p p p pp z p z

n na a

Hipótesis: Es una suposición acerca de un parámetro de la población, que se desarrolla con el objeto de probar algo.

Prueba de hipótesis: Es un procedimiento basado en la evidencia de la Muestra y en La teoría de probabilidad para determinar si la hipótesis es un enunciado razonable ó por el contrario debe ser rechazado.

Signo en la afirmación de Ho

< = >

Direccional De una cola (izquierda)

No direccional De dos colas

Direccional De una cola (derecha)

Por lo que a es la Probabilidad de cometer un Error tipo I y se llama Nivel de significación

19

Page 20: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

T STUDENT

20

Page 21: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

21

Page 22: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Distribución Normal

Distribución t Student

X1 media X2

La distribución t student es menor en la media y mas alta en los extremos que una distribución normal.

CHI CUADRADA

Se basa en la relación entre lo observado y lo esperado.

Observar las discrepancias existentes entre la diferencia que se muestran y las que debiesen obtenerse si las variables fuesen independientes

22

X1 X2Media

Page 23: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

Entonces a grandes discrepancias, mayor es la posibilidad de dependencia entre las variables.

Sirve para probar la bondad de ajuste, la independencia de dos variables y las hipótesis relativas a las proporciones, una de las proporciones poblacionales, que es la extensión de la prueba de diferencia entre dos proporciones poblacionales.

Prueba de bondad de ajuste

La hipótesis nula es una prueba de bondad de ajuste es un especificación respecto al patrón de frecuencia esperado de un conjunto de categorías , el patrón esperado puede ajustarse a la suposición de igual posibilidad y por tanto puede ser uniforme , o puede ajustarse tales como el binominal , el de poisson o el normal .

Cuando la hipótesis nula sea aceptada, las diferencias entre las frecuencias observadas y específicas deben ser atribuibles a la variabilidad de muestra para el nivel de significancia estipulada.

El valor de chi cuadrada para probar la diferencia entre los patrones de frecuencias obtenidas y esperadas es :

X2 = ∑ (fe- fe)2 Fe

Las frecuencias observadas difieran de las frecuencias esperadas, el valor de chi cuadrada se hará mayor , por lo tanto se concluye que en una prueba chi cuadrada para determinar si el patrón de frecuencia observada es diferente del patrón esperado , solo se emplea la cola superior de la distribución chi cuadrada .

El valor del estadístico de prueba chi cuadrada para rechazar la hipótesis nula depende del nivel de significancia que se establezca y de los grados de libertad , las pruebas de bondad de ajustes , los grados de libertad gl son los números de categorías menos el numero de parámetros estimados , a partir de la muestra , menor a 1, si k =de numero de categorías para los datos m= al numero de parámetros estimados basándose en la muestra , lo grados de libertad en una prueba de bondad de ajustes chi cuadrada son :

gl=k-m-1

PRUEBA DE HIPÓTESIS PARA PROPORCIONES

Prueba para un valor hipotético es una porción observada en una muestra aleatoria tomando de la población , se usa la distribución de probabilidad normal como aproximación al proceso binominal con objeto de probar una hipótesis nula .

PRUEBA DE LA INDEPEND, EL TAMAÑO DE DOS VARIABLES CATEGORÍAS

23

Page 24: javier Web viewLa prueba t de Student es utilizada para la estimación de medias y proporciones en variables cuantitativas y para la comparación de medias y proporciones en distintas

La prueba de bondad de ajustes existe una variedad de de categorías, como por ejemplo el tamaño de la pantalla de los aparatos de televisión que han sido vendidos, y lo que se prueba una hipótesis que se refiere al patrón de la frecuencia, es decir la distribución de la variable, la frecuencia observada se puede enumerar en un solo reglón o en una sola columna de categorías.

Las pruebas independientes consideran cuando menos dos variables categóricas, y lo que se prueba es la hipótesis que las variables son estadísticamente independientes, la independencia implica que el conocimiento de la categoría en la que se clasifica una observación con respecto de una de las variables no tienen efecto sobre la probabilidad de que en relación con otra variable, este en una de las diferentes categorías.

Las dimensiones de las tablas se definen como r X k donde r indica el numero de renglones y k el numero de columnas.

La prueba independiente de las dos variables, al frecuencia esperada en cada una de las casillas de la tabla de contingencia debe estar en proporción a las frecuencias totales observadas en la columna y en el renglón donde se ubica la casilla en relación con el tamaño de la muestra, así la fres la frecuencia esperada en la casilla de la tabla contingencia que se ubique en el renglón y esta es la columna es :

fe = fe fk /n

24