GUÍA DE LABORATORIO N°1 ESTADISTICA

26
ING. CLAUDIO CERRÓN LANDEO Contenido: Muestreo Aleatorio Simple Muestreo Aleatorio Sistemático Muestreo Aleatorio Estratificado Ejercicios Unidad 1 Muestreo Muestreos Probabilísticos

description

PARA PRINCIPIANTES

Transcript of GUÍA DE LABORATORIO N°1 ESTADISTICA

Page 1: GUÍA DE LABORATORIO N°1 ESTADISTICA

ING. CLAUDIO CERRÓN LANDEO

Contenido:

Muestreo Aleatorio Simple

Muestreo Aleatorio Sistemático

Muestreo Aleatorio Estratificado

Ejercicios

Unidad 1

Muestreo

Muestreos Probabilísticos

Page 2: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Contenido teórico:

Muestreo Aleatorio Simple

Muestreo Aleatorio Sistemático

Muestreo Aleatorio Estratificado

Todas las aplicaciones se realizaran en base al archivo de datos Datos de

Empleados.sav, disponible en la carpeta Lectura…CCERRON…ESTADÍSTICA

II…ARCCHIVOS SPSS.

Muestreo Aleatorio Simple

Archivo de datos Datos de Empleados.sav:

Observe que en este archivo se han registrado 474 observaciones para un total de 10

variables.

Puede solicitar un reporte de frecuencias para alguna variable de interés, como por

ejemplo Categoría laboral (catlab)

Page 3: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Ejercicio 1.

Seleccione una muestra aleatoria simple de 50 empleados

Para ello debe seguir los pasos siguientes:

Datos → Seleccionar casos

Por defecto siempre estarán activos Todos los casos. Elija Muestra aleatoria de casos,

haga clik en el botón Ejemplo …

Page 4: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Importante:

En la ventana anterior note que: por defecto se encuentra activa, en el

recuadro inferior de Resultado, la opción: Descartar casos no seleccionados.

Esto permite realizar la selección sin eliminar el caso no seleccionado.

En seguida se muestra la siguiente

ventana en la que usted puede

solicitar al programa seleccione

aproximadamente cierto

porcentaje de casos, conocidos

también como registros u

observaciones, para la muestra.

También puede solicitar al

programa la selección de un

número exacto de casos o

registros. Para nuestro caso

utilizaremos esta opción para

solicitar que seleccione

exactamente 50 observaciones de

los primeros 474 casos.

En esta selección se obtuvo una muestra en la que se ha seleccionado las observaciones

9, 10, 12 y otras. Observe que el programa tacha con una línea oblicua la observación

que NO ha sido seleccionada. Además, ha generado una variable Filtro (filter_$) en la

última columna en la que ha asignado el código 0 a las observaciones que no han sido

seleccionadas y 1 a las que sí han sido seleccionadas.

Page 5: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Si usted vuelve a solicitar un reporte de frecuencias para la variable catlab, observará

que ahora solo son consideradas las 50 observaciones que han sido seleccionadas.

Observación:

Cualquier análisis que usted solicite se efectuará solamente sobre las 50

observaciones seleccionadas.

Las observaciones que no han sido seleccionadas no se han perdido,

simplemente por ahora no se encuentran disponibles.

Si desea reestablecer todo el archivo de datos debe hacer lo siguiente:

Datos → Seleccionar casos → Todos los casos

Page 6: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Observe que ahora ya no se encuentran tachados los números correspondientes a cada

caso. Nuevamente tenemos disponibles TODOS los casos, a pesar que la variable

filter_$ permanezca.

Es muy frecuente observar que quienes se inician en el manejo de esta herramienta

olvidan reestablecer toda la data y luego obtienen resultados solo de la última muestra

seleccionada.

Muestreo Aleatorio Sistemático

La aplicación del muestreo sistemático se hará siempre sobre el mismo archivo de datos

Datos de Empleados.sav:

Ejercicio 2.

Seleccione una muestra aleatoria sistemática de 50 empleados

Recuerde que para l aplicación de un muestreo sistemático debemos determinar el valor

de K correspondiente al salto sistemático o período de selección.

948,950

474 K

n

NK

Luego, de los primeros 9 registros del archivo de datos seleccionaremos uno,

aplicando el mismo procedimiento del muestreo aleatorio simple, a este elemento

seleccionado se le conoce como punto de arranque que se le puede denotar como A.

Posteriormente debemos seleccionar a partir de A, incluyendo A, cada 9 registros uno

para la muestra hasta completar los 50 registros solicitados para la muestra.

Por ejemplo: si A = X7 este sería el primer elemento seleccionado.

Page 7: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Luego seleccionamos: X16 , X25 , X34 , … , X439 , X448

Para lograr esto con ayuda del SPSS, se debe seguir los pasos siguientes:

Elección del Punto de Arranque. Aplicaremos un muestreo aleatorio simple para

seleccionar un caso de los primeros nueve registrados en el archivo de datos.

Datos → Seleccionar casos → Muestra aleatoria de casos

En nuestro caso se ha seleccionado como Punto de arranque el caso 7: A = X7

Page 8: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Ahora viene la parte más importante para la selección automática de los siguientes

elementos de la muestra.

Primero recuperamos la selección de Todos los casos

Page 9: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Luego elegimos la opción condicional para la selección de casos.

Al hacer picar en el botón Sí la op… se mostrará la siguiente ventana, que ofrece una

serie de funciones dentro del Grupo de funciones

Page 10: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Dentro del Grupo de funciones Aritméticas podemos encontrar la función Mod

(Módulo) que como señala el cuadro explicativo permite determinar el resto o residuo

de dividir una expresión numérica entre el módulo.

Page 11: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Para subir la función elegida picamos en la flecha

Luego debemos indicar para cada signo de interrogación lo que mostramos en el

siguiente cuadro.

Page 12: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Tenga en cuenta que:

id: es el código del empleado asignado en el archivo de datos

K = 9 : es el periodo de selección o salto sistemático

A = 7 : es el punto de arranque

n = 50 : es el tamaño de la muestra

Lo que se busca en la primera expresión es encontrar los registros cuya división con el

valor de K nos de residuo CERO. La segunda expresión busca establecer un tope hasta

donde se debe verificar estos cocientes. Dado que el valor de K, al ser redondeado al

menor entero, suele ocasionar que sobren casos para realizar más selecciones, esta

segunda expresión evitará que se tomen más observaciones que las establecidas para la

muestra.

Observe que:

Si id = 1 1 + (9 – 7) entre 9 no muestra resto CERO el registro 1 no será

seleccionado

……

Si id = 7 7 + (9 – 7) entre 9 si muestra resto CERO el registro 7 si será

seleccionado

……

Si id = 447 447 + (9 – 7) entre 9 no muestra resto CERO el registro 447 no será

seleccionado

Page 13: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Si id = 448 448 + (9 – 7) entre 9 si muestra resto CERO el registro 448 si será

seleccionado

Picamos en: Continuar Aceptar

Observe en el cuadro siguiente que el primer registro seleccionado corresponde al punto

de arranque A = X7 seguido del X7 + 9 = X16

Page 14: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Observe que los dos últimos casos seleccionados son precisamente: X439 y X448

Muestreo Aleatorio Estratificado

Recuerde que para l aplicación de esta técnica de muestreo debemos separar la

población en sub-poblaciones homogéneas. En nuestro caso generaremos un archivo

para cada estrato. El archivo de datos ha utilizar sigue siendo Datos de Empleados.sav.

No olvide que primero debe observar que tenga todos los casos del archivo disponibles.

Ejercicio 3.

Page 15: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Seleccione una muestra aleatoria estratificada de 50 empleados con asignación

proporcional a la categoría laboral.

Dado que la muestra se desea asignar proporcionalmente a la categoría laboral podemos

solicitar una tabla de frecuencias para esta variable y así conocer el tamaño de cada

estrato

En seguida hacemos los cálculos para la determinación del tamaño de muestra para cada

estrato (categoría laboral)

Categoría Laboral Frecuencia Proporción ni = ( Ni / N ) * n

Administrativo 363 ,7658 38,3 38

Seguridad 27 ,0570 2,8 3

Directivo 84 ,1772 8,9 9

Total 474 1,0 50

Para la conformación de los estratos hacemos uso de la selección condicional:

Datos → Seleccionar casos → Si se satisface la condición → Si la op…

Page 16: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Seleccionamos la variable catlab y la igualamos a 1 esto permitirá seleccionar todos

los casos cuya categoría laboral sea Administrativo (1).

Algo muy importante con el Resultado, ahora solicitaremos que Copie los casos

seleccionados a un nuevo conjunto de datos que llamaremos Administrativo,

obteniendo de esta manera nuestro primer estrato.

Page 17: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

El resultado será un nuevo archivo de datos que considera solo los 363 casos

correspondientes a Administrativos.

Repetimos el procedimiento anterior para generar el segundo y tercer estrato que

llamaremos respectivamente: Seguridad (catlab = 2) y Directivo (catlab = 3)

Page 18: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Page 19: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Observe que hasta aquí se ha logrado conformar el estrato que llamaremos Seguridad

que cuenta con 27 casos registrados.

Page 20: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Tenemos el estrato llamado Directivo conformado por 84 casos.

Page 21: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Muestra por estrato. Ahora estamos en condición de aplicar un muestreo aleatorio

simple por cada estrato, seleccionando el número de observaciones calculado al inicio.

ADMINISTRATIVO

Page 22: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Ahora puede hacer uso de la tercera opción de Resultados: Eliminar casos no

seleccionados

Es importante que esté conciente que al elegir esta opción los casos no seleccionados

serán eliminados sin posibilidad de volverles a recuperar.

Page 23: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Observe que el archivo correspondiente a la muestra seleccionada del estrato de

Administrativos cuenta con 38 casos.

SEGURIDAD

Del estrato Seguridad seleccionaremos con una muestra aleatoria simple de 3 de los 27

casos

No olvide elegir en Resultados la opción de Eliminar casos no seleccionados. El

resultado debe ser un archivo correspondiente a Seguridad reducido a 3 casos.

Page 24: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

DIRECTIVO

Si hacemos lo propio para el estrato de Directivos lograremos obtener este archivo

reducido a 9 casos de los 84 que muestra inicialmente.

Finalmente puede unir los tres archivos en uno solo teniendo la muestra total de 50

registros

Page 25: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Solicite un reporte de frecuencias para este último archivo

Page 26: GUÍA DE LABORATORIO N°1 ESTADISTICA

Muestreo

Este resultado confirma que la muestra ha sido seleccionada conforme se ha solicitado,

respetando la asignación proporcional a la categoría laboral.