Tamaño Optimo de la muestra

10
Estadística aplicada a la Investigación (Electiva) Licdo. Anthony Ramos UNEFM 2009 Página 1 UNIVERSIDAD NACIONAL EXPERIMENTAL “FRANCISCO DE MIRANDA” PROGRAMA DE EDUCACIÓN ÁREA CIENCIAS DE LA EDUCACIÓN SANTA ANA DE CORO; JULIO DE 2012

description

En este documento se explica de forma detallada las distintas formulas para calcular el tamaño de la muestra

Transcript of Tamaño Optimo de la muestra

Page 1: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 1

UNIVERSIDAD NACIONAL EXPERIMENTAL

“FRANCISCO DE MIRANDA”

PROGRAMA DE EDUCACIÓN

ÁREA CIENCIAS DE LA EDUCACIÓN

SANTA ANA DE CORO; JULIO DE 2012

Page 2: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 2

CÁLCULO TAMAÑO DE LA MUESTRA

ANÁLISIS ESTADÍSTICO

CÁLCULO DEL TAMAÑO ÓPTIMO DE LA MUESTRA

Para determinar el tamaño de una muestra se deberán tomar en cuenta varios

aspectos, relacionados con el parámetro y estimador, el sesgo, el error muestral, el

nivel de confianza y la varianza poblacional.

El parámetro se refiere a la característica de la población que es objeto de

estudio y el estimador es la función de la muestra que se usa para medirlo.

Ejemplo: Para evaluar la calidad de un grupo de estudiantes (parámetro) se

mide a través de los promedios obtenidos (estimador).

El error muestral siempre se comete ya que existe una pérdida de la

representatividad al momento de escoger los elementos de la muestra. Sin embargo, la

naturaleza de la investigación nos indicará hasta qué grado se puede aceptar.

El nivel de confianza, por su parte, es la probabilidad de que la estimación

efectuada se ajuste a la realidad; es decir, que caiga dentro de un intervalo determinado

basado en el estimador y que capte el valor verdadero del parámetro a medir.

Tamaño de Muestra para Proporciones

Cuando deseamos estimar una proporción, debemos conocer varios aspectos:

a) El nivel de confianza o seguridad (1 - α). El nivel de confianza prefijado da lugar a

un coeficiente (Zα).

Ejemplo: Para una seguridad del 95%, Zα = 1.96, para una seguridad del

99%, Zα = 2.58. (Estos valores provienen de las tablas de la distribución normal Z).

b) La precisión que deseamos para el estudio.

Page 3: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 3

c) Una idea del valor aproximado del parámetro que queremos medir (en este

caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio

pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5

(50%). El problema que puede enfrentarse en un estudio de investigación es la cantidad

de información con la que se cuente; específicamente se pueden tener dos casos:

desconocer la población del fenómeno estudiado, o bien, conocerla.

Cálculo del Tamaño de la Muestra conociendo el Tamaño de la Población.

La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la

población es la siguiente:

qpZ1)-(Nd

qpZNn

22

2

opt.

En donde:

N = tamaño de la población

Z = nivel de confianza,

p = probabilidad de éxito, o proporción esperada

q = probabilidad de fracaso

2d = precisión (Error máximo admisible en términos de proporción)

Ejemplo No. 1: ¿A cuántas familias tendríamos que estudiar para conocer la

preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se conoce

que el número de familias con bebés en el sector de interés es de 15,000?

Seguridad = 95%;

Precisión = 3%;

Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese

ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el

tamaño muestral.

Page 4: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 4

200(

(

0.950.051.96)1)-(150000.03

0.950.051.96)15000n

22

2

opt.

Análisis: Se requeriría encuestar a no menos de 200 familias para poder tener una

seguridad del 95%.

Ejemplo No. 2: ¿Cómo hubiera cambiado el ejemplo anterior, si se desconoce la

proporción esperada?

Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio

conservador (p=q=0.5) = lo cual maximiza el tamaño de la muestra de la siguiente

manera:

Entonces:

• Zα = 1.962 (ya que la seguridad es del 95%)

• p = proporción esperada (en este caso 50% = 0.5)

• q = 1 – p (en este caso 1 – 0.5 = 0.5)

• 2d = precisión (en este caso deseamos un 3%) quedando como resultado:

996(

(

0.50.51.96)1)-(150000.03

0.50.51.96)15000n

22

2

opt.

Análisis: Se requeriría encuestar a no menos de 996 familias para poder tener una

seguridad del 95%.

EJEMPLO 3 :La población objeto de estudio estará conformada por todos los

pacientes de ambos sexos entre 40 y 65 años de edad que ingresan mensualmente al

Hospital X, los cuales según cifras obtenidas del servicio X asciende a 1500 pacientes,

los cuales cumplieron con los criterios de inclusión y exclusión.

MUESTRA

Para el cálculo de la muestra se utilizó la fórmula del tamaño óptimo de muestra

cuando la población es conocida, y se obtuvieron los siguientes resultados:

Page 5: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 5

222

22

opt.ENσZ

σNZn

9090,3

0,0815000,161,96

0,1615001,96n

22

2

opt.

Donde:

N = Tamaño de la población = 1500 pacientes

p = Probabilidad de tener factor de riesgo = 80%

q = 1 – p = Probabilidad de no tener factor de riesgo = 20%

Z = 1,96 (Valor en la tabla de la distribución Normal Estándar correspondiente a un

Nivel de Confianza del 95%)

E = Error máximo permisible = 8%

2 = Varianza de la Población = p x q = 0,16

El tamaño óptimo de la muestra es de 90 pacientes del Hospital X.

Otra fórmula es la del autor Sierra (1992);

pxq4E

q x pN4n

2opt.

)1(N

Donde:

N = Tamaño de la población

p = Probabilidad de tener factor de riesgo

q = 1 – p = Probabilidad de no tener factor de riesgo

Z = 1,96 (Valor en la tabla de la distribución Normal Estándar correspondiente a un

Nivel de Confianza)

E = Error máximo permisible

4= Constante

Page 6: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 6

Gabaldon (1980):

q x pZ

q x pNZn

2

2

opt.

2)1( xEN

Kish, 1982 cp Parra Olivares (2006):

2

2

2

2

)( I

I

SZ

E

S

I2

I

opt.

N).N

1(

N).N

1(

n

Cálculo del Tamaño de la Muestra desconociendo el Tamaño de la Población.

La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño

de la población es la siguiente:

2

2

.d

qpZnopt

Z = nivel de confianza,

p = probabilidad de éxito, o proporción esperada

q = probabilidad de fracaso

2d = precisión (error máximo admisible en términos de proporción)

Ejemplo No. 4: ¿A cuántas familias tendríamos que estudiar para conocer la

preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se

desconoce la población total?

Seguridad = 95%;

Precisión = 3%;

Page 7: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 7

Proporción esperada = asumamos que puede ser próxima al 5%; si no

tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que

maximiza el tamaño muestral.

Entonces:

• Zα = 1.962 (ya que la seguridad es del 95%)

• p = proporción esperada (en este caso 5% = 0.05)

• q = 1 – p (en este caso 1 – 0.05 = 0.95)

• 2d = precisión (en este caso deseamos un 3%)

20303.0

95.005.096.12

2

.

optn

Análisis: Se requeriría encuestar a no menos de 203 familias para poder tener una

seguridad del 95%.

Ejemplo No. 5: ¿Cómo hubiera cambiado el ejemplo anterior, si se desconoce la

proporción esperada?

Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio

conservador (p = q = 0.5) = lo cual maximiza el tamaño de la muestra de la siguiente

manera:

Entonces:

• Zα = 1.962 (ya que la seguridad es del 95%)

• p = proporción esperada (en este caso 50% = 0.5)

• q = 1 – p (en este caso 1 – 0.5 = 0.5)

• 2d = precisión (en este caso deseamos un 3%)

106803.0

5.05.096.12

2

.

optn

Análisis: Se requeriría encuestar a no menos de 1068 familias para poder tener una

seguridad del 95%.

Otra fórmula muy similar a la anterior es la siguiente:

Page 8: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 8

Población desconocida

2

22

.E

Znopt

Z = Valor estandarizado en función del grado de confiabilidad de la muestra calculada.

Por ejemplo, si consideramos trabajar con un 95% de confiabilidad la muestra

seleccionada, entonces el valor estandarizado asumir es igual a 1.96 (Para dos colas).

Algunos valores estandarizados (z) en función de grado de confiabilidad asumido (para

dos colas):

Para un: 99 % ------------- z = 2, 58 (Empleado con frecuencia)

95 % ------------- z = 1, 96 (El más empleado)

90 % ------------- z = 1, 64

E: Error asumido en el Cálculo. Toda expresión que se calcula contiene un error de

cálculo debido a las aproximaciones decimales que surgen en la división por decimales,

error en la selección de la muestra, entre otras, por lo que este error se puede asumir

entre un 1 hasta un 10%; es decir, que se asume en valores de probabilidad

correspondiente entre un 0.01 hasta un 0.1. No obstante, se propone la siguiente tabla

para valores óptimos del error para el cálculo del número de elementos de una muestra:

Para 3 ≤ N ≤ 10 --------------------- Se asume E = 0.1 (un error del 10 %).

Para N > 10 --------------------- Se asume E = 0.05 (un error del 5 %).

2 = Varianza de la Población = p x q

q: probabilidad de la población que no presenta las características.

Este es un parámetro muy importante, debido a que mediante el mismo se asume qué

por ciento o proporción de la muestra no puede presentar las mismas características de

la población, debido a diversos factores subjetivos y objetivos de los individuos u

objetos que conforman la población. Muchos autores plantean esta probabilidad entre

un 1 hasta un 25 %, otros asumen, cuando no se conoce esta variable asumir el valor

máximo de 50 %. Se propone la siguiente tabla:

Para 3 ≤ N ≤ 19 ------- Se asume q = 0,01 (un 1 %). Para 20 ≤ N ≤ 29 ------ Se asume q = 0,01 hasta 0,02 (del 1 al 2 %). Para 30 ≤ N ≤ 79 ----- Se asume q = 0,02 hasta 0,05 (del 2 al 5 %). Para 80 ≤ N ≤ 159 ---- Se asume q = 0,05 hasta 0,10 (del 5 al 10 %).

Page 9: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 9

Para N ≥ 160 --------- Se asume q = 0,05 hasta 0,20 (del 5 al 20 %).

p: Probabilidad de la población que presenta las características. Dicho de una

forma más comprensible, es la probabilidad que tiene la muestra en poseer las

mismas cualidades de la población (homogeneidad) y está determinada por:

Como p + q = 1 (Probabilidad máxima), p = 1 – q

Conclusiones sobre el nivel de seguridad en el muestreo

Según diferentes seguridades, el coeficiente de Zα varía así:

• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645

• Si la seguridad Zα fuese del 95% el coeficiente sería 1.96

• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24

• Si la seguridad Zα fuese del 99% el coeficiente sería 2.576

IMPORTANTE: Si los recursos del investigador son limitados, debe recordar que

a medida que se disminuya el nivel de seguridad, se permitirá un mayor error en el

estudio de investigación, lo cual a su vez permitirá al investigador trabajar con un

número de muestra más reducido, sacrificando la confiabilidad de los resultados.

EJERCICIOS

A continuación se presentan algunos problemas de investigación en la cual

debes aplicar el tamaño óptimo de la muestra cuando la población es conocida.

1. Determinar el tamaño óptimo de la muestra adecuado, para estimar la altura

media de los estudiantes de la Unefm cuya matricula es de 1.500 estudiantes,

con un error máximo admisible de 3 cm y un nivel de confianza del 95%.

Nota : aplicar a este mismo ejercicio un nivel de confianza del 99%

2. Se esta realizando una investigación a tres secciones de estadística para

diagnosticar el rendimiento académico de la misma, la cual tiene una

Page 10: Tamaño Optimo de la muestra

Estadística aplicada a la Investigación (Electiva)

Licdo. Anthony Ramos UNEFM 2009 Página 10

población total de 700 estudiantes, calcular el tamaño optimo de la muestra y

trabajar con un nivel de confianza del 95%

3. Se desea aplicar un instrumento de investigación para determinar la baja

motivación de los estudiantes en la unidad curricular matemática, la población

esta conformada por 550 estudiantes distribuidos en 5 secciones, calcular el

tamaño optimo de la muestra con un nivel de confianza de un 99%

4. Se quiere aplicar un instrumento de investigación para diagnosticar el nivel de

conocimientos que poseen los estudiantes en el contenido temático cónicos,

la población está conformada por 450 estudiantes calcular el tamaño óptimo

de la muestra con nivel de confianza de 95% Nota: Realizar este mismo

problema cuando se desconoce la proporción esperada ó probabilidad de

éxito.

Importante: Para cada problema realizar el análisis estadístico

respectivo.