3 tamao[1]avance

ESTADISTICA INFERENCIAL

Mtra. A Elsa Retureta Álvarez Página 1

TEMA

Canales Hernández Anabel

Escobar Martínez Marisol

Fernández Zapata Ana Karen

González López Ana Karen

Jiménez Flores Jessica

Muñoz Rivera Claribel

Torres Utrera Brenda Lilián

Reyes Ovalles Anahí

http://www.uv.mx/index.html



TEMA: TAMAÑO DE LA MUESTRA

APLICACION

El determinar el tamaño de una muestra representa una parte esencial del método

científico para poder llevar a cabo una investigación. Al muestreo lo podemos

definir como el conjunto de observaciones necesarias para estudiar la distribución

de determinadas características en la totalidad de una población, a partir de la

observación de una parte o subconjunto de una población, denominada muestra.

El cálculo del tamaño de la muestra es uno de los aspectos a concretar en las

fases previas de la investigación comercial y determina el grado de credibilidad

que concederemos a los resultados obtenidos.

Al definir el tamaño de la muestra, nosotros deberemos procurar que ésta

información sea representativa, válida y confiable y al mismo tiempo nos

represente un mínimo costo. Por lo tanto, el tamaño de la muestra estará

delimitado por los objetivos del estudio y las características de la población,

además de los recursos y el tiempo de que se dispone.


http://www.monografias.com/trabajos11/metods/metods.shtml

http://www.monografias.com/trabajos35/el-poder/el-poder.shtml

http://www.monografias.com/trabajos11/tebas/tebas.shtml

http://www.monografias.com/trabajos11/travent/travent.shtml

http://www.monografias.com/trabajos11/metcien/metcien.shtml#OBSERV

http://ads.us.e-planning.net/ei/3/29e9/cfa010f10016a577?rnd=0.7692006734343009&pb=eb453fef091bf260_04&fi=1cb10f5741f6c8c7&fR=fe536feef7792b47&kw=estudio



GLOSARIO DE TAMAÑO DE LA MUESTRA

CONCEPTO DEFINICION TRADUCCION

HIPOTESIS

Es una afirmación con respecto a una distribución de probabilidad.




FORMULARIO

MUESTRA

Se llama muestra a una parte de la población a estudiar qué sirve para representarla.

POBLACION

Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

PORCENTAJE DE

CONFIANZA

(CONFIANZA)

Es el porcentaje de seguridad que existe para generalizar los resultados obtenidos.

PORCENTAJE DE ERROR

Equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa.

VARIABILIDAD

Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual.




TAMAÑO DE LA MUESTRA

CASO

ESTADISTICO

ESTIMAR LA MEDIA

donde:

n = es el tamaño de la muestra;

Z = es el nivel de confianza;

E = es la precisión o error.

= es la varianza.

donde:



N = es el tamaño de la población;

= es la varianza.

E = es la precisión o el error.

ESTIMAR LA PROPORCION

donde:




INTRODUCCION

TEORIA



p = es la variabilidad positiva;

q = es la variabilidad negativa; E = es la precisión o el error.

donde:



N = es el tamaño de la población

p = es la variabilidad positiva;

q = es la variabilidad negativa;

E = es la precisión o error




En Estadística el tamaño de la muestra es el número de sujetos que componen la

muestra extraída de una población, necesarios para que los datos obtenidos sean

representativos de la población.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.

2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.

3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población.

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.

La variabilidad es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa, denotada por q.

Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Además, cuando se habla de la máxima variabilidad, en el caso de no existir antecedentes sobre la investigación (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.

Una vez que se han determinado estos tres factores, entonces se puede calcular

el tamaño de la muestra como a continuación se expone.

SUPUESTOS Y RESTRICCIONES


http://es.wikipedia.org/wiki/Estad%C3%ADstica

http://es.wikipedia.org/wiki/Muestra_estad%C3%ADstica

http://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica



SUPUESTOS

El tamaño de la muestra depende de tres aspectos:

1) Error permitido

2) Nivel de confianza estimado

3) Carácter finito o infinito de la población.

Las fórmulas generales para determinar el tamaño de la muestra son las siguientes:

Para poblaciones infinitas (más de 100,000 habitantes)

Para poblaciones finitas (menos de 100,000 habitantes)

Nomenclatura:

n = Número de elementos de la muestra

N = Número de elementos de la población o universo

P/Q = Probabilidades con las que se presenta el fenómeno.

Z2 = Valor crítico correspondiente al nivel de confianza elegido; siempre se opera con valor zeta 2, luego Z = 2.

E = Margen de error permitido (determinado por el responsable del estudio).

Cuando el valor de P y de Q sean desconocidos o cuando la encuesta abarque diferentes aspectos en los que estos valores pueden ser desiguales, es conveniente tomar el caso más adecuado, es decir, aquel que necesite el máximo tamaño de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.

RESTRICCIONES

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.




Parámetro. Son las medidas o datos que se obtienen sobre la población.

Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error Muestral, de estimación o Standard. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

FORMULAS

Vamos a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se conozca con precisión el tamaño de la población, y es:




Donde:

n es el tamaño de la muestra; Z es el nivel de confianza;

p es la variabilidad positiva; q es la variabilidad negativa; E es la precisión o error.

Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.

También hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la proporción que le correspondería, a pesar de que se expresa en términos de porcentajes. El nivel de confianza se obtiene a partir de la distribución normal estándar, pues la proporción correspondiente al porcentaje de confianza es el área simétrica bajo la curva normal que se toma como la confianza, y la intención es buscar el valor Z de la variable aleatoria que corresponda a tal área.

En el caso de que sí se conozca el tamaño de la población entonces se aplica la siguiente fórmula:

Donde:

n es el tamaño de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; N es el tamaño de la población; E es la precisión o el error.

La ventaja sobre la primera fórmula es que al conocer exactamente el tamaño de la población, el tamaño de la muestra resulta con mayor precisión y se pueden incluso ahorrarse recursos y tiempo para la aplicación y desarrollo de una investigación.

TABLAS

Para obtener el cálculo adecuado del tamaño de la muestra, la formula exige

un determinado nivel de confianza, el cual se puede consultar por medio de

una tabla con valores estándar.

Los valores Za según la seguridad y Zb según el poder se indican en la Tabla siguiente.


http://www.uaq.mx/matematicas/estadisticas/xu4.html#dist_normal





Tabla 2. Valores de Za y Zb más frecuentemente

utilizados

Za

a Test unilateral Test bilateral

0.200

0.150

0.100

0.050

0.025

0.010

0.842

1.036

1.282

1.645

1.960

2.326

1.282

1.440

1.645

1.960

2.240

2.576

Potencia

b (1-b) Zb

0.01

0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

0.50

0.99

0.95

0.90

0.85

0.80

0.75

0.70

0.65

0.60

0.55

0.50

2.326

1.645

1.282

1.036

0.842

0.674

0.524

0.385

0.253

0.126

0.000

UTILIDAD

El tamaño de la muestra nos permite obtener una cantidad significativa de la

población que abarca nuestro campo de investigación, por lo tanto es de gran

utilidad; ya que reduce el tiempo y los costos de una investigación, agiliza el

proceso de esta y se obtienen resultados significativos para la investigación. Es

por eso que para su mejor aprovechamiento y adecuados resultados es

necesario el correcto cálculo del tamaño de la muestra. Un calculo equivocado




podría generar lo contrario de todos los beneficios antes mencionados que este

aporta.

EJEMPLOS

Ejemplo 1.

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución normal. Si se supone que la desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parámetro se diferencien modularmente en menos de 0,1 kg.

Solución:

Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe aproximar por exceso. El tamaño de muestra sería de 97.

Si la varianza de la población es desconocida, que es lo que mas frecuente se ve en la práctica el tratamiento será diferente, no es posible encontrar una fórmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento-

Primeramente, se toma una pequeña muestra, que se le llama muestra piloto, con

ella se estima la varianza poblacional ( ) y con este valor se evalúa en la

formula (1), sustituyendo ( ) por su estimación ( ). El valor de obtenido será

aproximadamente el valor necesario, nuevamente con ese valor de se extrae una muestra de este tamaño de la población se le determina la varianza a esa

muestra, como una segunda estimación de ( ) y se aplica de nuevo la formula

(1), tomando la muestra con el obtenido como muestra piloto para la siguiente


http://www.monografias.com/trabajos16/industria-ingenieria/industria-ingenieria.shtml



iteración, se llegará a cumplir con las restricciones prefijadas. Se puede plantear

esta afirmación ya que la de tiende a estabilizarse a medida que aumenta

alrededor de la por lo que llegará el momento en que se encuentre el tamaño de muestra conveniente, sin embargo, en la práctica es mucho más sencillo pues, a lo sumo con tres iteraciones se obtiene el tamaño de muestra deseado, este procedimiento para obtener el tamaño de muestra deseado se puede realizar utilizando en Microsoft Excel en la opción análisis de datos las opciones estadística descriptiva para ir hallando la varianza de cada una de las muestras y la opción muestra para ir determinado las muestras pilotos. Para obtener el tamaño de la muestra utilizando este método recomendamos la utilización de un paquete de computo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y estadística descriptiva.

Para determinar el tamaño de la muestra cuando los datos son cualitativos es decir para el análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenómeno a estudiar, se recomienda la utilización de la siguiente formula:

(2)

siendo sabiendo que:

es la varianza de la población respecto a determinadas variables.

es la varianza de la muestra, la cual podrá determinarse en términos de

probabilidad como

es error estandar que está dado por la diferencia entre ( ) la media poblacional y la media muestral.

es el error estandar al cuadrado, que nos servirá para determinar , por

lo que = es la varianza poblacional.


http://www.monografias.com/trabajos16/sepa-excel/sepa-excel.shtml

http://www.monografias.com/trabajos12/guiainf/guiainf.shtml#HIPOTES



Ejemplo 2.

De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una información adecuada con error estandar menor de 0.015 al 90 % de confiabilidad.

Solución:

= 1 176

= 0,015

por lo que

Es decir para realizar la investigación se necesita una muestra de al menos 298 adolescentes.

Ejemplo 3. En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30% (0,3) de los niños de la zona del proyecto padecen de malnutrición crónica. Este dato se basa en estadísticas nacionales sobre malnutrición en las zonas rurales. Utilizando los valores estándar indicados supra se efectúa el cálculo siguiente: Cálculo:

Càlculo:

n= 1.96² x .3(1-.3)


http://www.monografias.com/trabajos15/adolescencia-crisis/adolescencia-crisis.shtml

http://www.monografias.com/Computacion/Programacion/



.05² n = 3.8416 x .21 .0025 n = .8068 .0025 n = 322.72 ~ 323

Ejemplo 4.

Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas.

Solución:

n=500

p = 15/500 = 0.03

z(0.90) = 1.645

0.0237<P<0.0376

Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.

Ejemplo 5.

En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa muestra se usa para estimar P, que vendrá a ser la proporción verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error de estimación tal que se pueda tener un 95% de confianza en que P dista menos de de p.




Solución:

p=x/n = 20/400=0.05

z(0.95)=1.96

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para erstimar P, el error máximo de estimación será aproximadamente 0.021 con un nivel de confianza del 95%.

Para calcular el intervalo de confianza se tendría:

Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe que la proporción de pulas defectuosas de esta compañía está entre 0.029 y 0.071.

Si se requiere un menor error con un mismo nivel de confianza sólo se necesita aumentar el tamaño de la muestra.

EJERCICIOS RESUELTOS

PROBLEMAS:

1.- ¿Cuál sería el tamaño de muestra necesario, para estimar a nivel de confianza

del 90% la media poblacional con un error menor o igual de 1 si la desviación

típica de la población es 3?

a) para un n.c. del 90% z tabulado para 0.45 = 1.645

2.- Determinar el tamaño de muestra necesario para estimar una proporción poblacional a nivel de confianza de 0.95, con un error absoluto menor que 0.05, siendo que en una muestra piloto se obtuvo una p = 0.2




a) para un n.c. del 95% z tabulado para 0.475 = 1.96

3.- En un estudio de 300 accidentes de automóvil en una ciudad específica, 60

tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo

del 90% de confianza para aproximar la proporción de todos los accidentes

automovilísticos que en esa ciudad tienen consecuencias fatales.

4.-Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado

de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación

estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra

para que el biólogo tenga el 95% de confianza de que el error de estimación es a

lo más de 4 libras?

5.-Una empresa eléctrica fabrica focos que tienen una duración aproximadamente

normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita

una muestra si se desea tener 96% de confianza que la media real esté dentro de

10 horas de la media real?

RESULTADO:

1.-

( 1.645 x 3 )2 = 24.35 1

b) El tamaño de muestra requerido sería mayor o igual a 25

2.-

1.96 2 x 0.2 x 0.8 = 245.86 0.052




b) El tamaño de muestra necesario para estimar la proporción poblacional será mayor o igual a 246

3.-

P= 60/300 = 0.20

Z(0.90) = 1.645

0.162<P<0.238

4.-

1.

En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95%

de confianza en que difiere en menos de 4 libras de .

5.-

1.

Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas.

BIBLIOGRAFÍA

http://es.wikipedia.org/wiki/Tama%C3%B1o_de_la_muestra

http://www.uaq.mx/matematicas/estadisticas/xu5.html

http://www.monografias.com/trabajos12/muestam/muestam.shtml

http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp

http://www.ifad.org/gender/tools/hfs/anthropometry/s/ant_3.htm

http://www.itch.edu.mx/academic/industrial/estadistica1/cap01d.html


http://www.uaq.mx/matematicas/estadisticas/xu5.html

http://www.monografias.com/trabajos12/muestam/muestam.shtml

http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp

http://www.ifad.org/gender/tools/hfs/anthropometry/s/ant_3.htm

3 tamao[1]avance

Education

Transcript of 3 tamao[1]avance