Manual Instructor 15 Investigacion de mercados

67
CAPÍTULO 15 – PROCEDIMIENTOS MÁS COMPLEJOS DE MUESTREO 1. ¿Cómo se selecciona una muestra estratificada? El muestreo estratificado es un proceso de dos fases. Primero, la población definida se divide en subgrupos o estratos mutuamente excluyentes y colectivamente exhaustivos usando alguna variable de estratificación como el sexo. Luego, se extrae una muestra aleatoria simple e independiente de cada estrato. Pregunta del instructor para sondeo: ¿La estratificación debe aplicarse siempre antes de que se tome la muestra? Respuesta sugerida al sondeo: No, la estratificación puede aplicarse después de que se han tomado los datos; sin embargo, debido al control disponible en la planeación y organización de la estratificación antes de que se tome la muestra, aplicar la estratificación antes de tomar la muestra es el método preferido. 2. ¿Cuál es el objetivo del muestreo estratificado? El muestreo estratificado puede producir errores estándar más pequeños de los estimados que el muestreo aleatorio simple. Por tanto, puede ganarse precisión sin incrementar el tamaño de la muestra, o de manera equivalente, puede obtenerse el mismo nivel de precisión con un tamaño de muestra más pequeño. Pregunta del instructor para sondeo: ¿Qué es necesario para que la estratificación sea efectiva en la minimización del error? Respuesta sugerida al sondeo: A fin de que la estratificación sea efectiva, los estratos deben correlacionarse en gran medida con la o las características que se están estimando. Además, las medias y la varianza deben diferir en forma amplia por estratos para que la estratificación sea efectiva. 175

description

Manual Instructor 15 Investigacion de mercados

Transcript of Manual Instructor 15 Investigacion de mercados

  • CAPTULO 15 PROCEDIMIENTOS MS COMPLEJOS DE MUESTREO 1. Cmo se selecciona una muestra estratificada?

    El muestreo estratificado es un proceso de dos fases. Primero, la poblacin definida se divide en subgrupos o estratos mutuamente excluyentes y colectivamente exhaustivos usando alguna variable de estratificacin como el sexo. Luego, se extrae una muestra aleatoria simple e independiente de cada estrato.

    Pregunta del instructor para sondeo: La estratificacin debe aplicarse siempre antes de que se tome la muestra? Respuesta sugerida al sondeo: No, la estratificacin puede aplicarse despus de que se han tomado los datos; sin embargo, debido al control disponible en la planeacin y organizacin de la estratificacin antes de que se tome la muestra, aplicar la estratificacin antes de tomar la muestra es el mtodo preferido. 2. Cul es el objetivo del muestreo estratificado?

    El muestreo estratificado puede producir errores estndar ms pequeos de los estimados que el muestreo aleatorio simple. Por tanto, puede ganarse precisin sin incrementar el tamao de la muestra, o de manera equivalente, puede obtenerse el mismo nivel de precisin con un tamao de muestra ms pequeo.

    Pregunta del instructor para sondeo: Qu es necesario para que la estratificacin sea efectiva en la minimizacin del error? Respuesta sugerida al sondeo: A fin de que la estratificacin sea efectiva, los estratos deben correlacionarse en gran medida con la o las caractersticas que se estn estimando. Adems, las medias y la varianza deben diferir en forma amplia por estratos para que la estratificacin sea efectiva.

    175

  • 3. Qu es muestreo estratificado proporcional?

    El muestreo estratificado proporcional implica elegir elementos de la muestra de cada estrato de tal manera que la proporcin (1) del nmero de elementos de la muestra extrados del estrato j con el tamao total de la muestra sea igual a la proporcin (2) del nmero de elementos de la poblacin dentro del estrato j con el nmero total de elementos de la poblacin. En la notacin del captulo 9:

    n

    nj =

    N

    Nj

    Pregunta del instructor para sondeo: Cul es el propsito de usar una proporcin para el muestreo estratificado? Respuesta sugerida al sondeo: La naturaleza de algunos experimentos requiere que se hagan slo comparaciones relativas (proporciones) y puede ser que no se puedan especificar los nmeros absolutos o ni siquiera se desee hacerlo. 4. Qu es muestreo estratificado no proporcional?

    Aqu n

    nj

    Nj

    N

    Los estratos estn submuestreados o sobremuestreados con relacin al tamao de su poblacin.

    Pregunta del instructor para sondeo: Cmo se relaciona la variabilidad con el muestreo estratificado no proporcional?

    176

  • Respuesta sugerida al sondeo: Cuando los estratos tienen diferente variabilidad entre s, entonces los tamaos de la muestra requerida varan de un estrato a otro, lo que produce un muestreo estratificado no proporcional. Entre mayor es la variabilidad, ms grande es el tamao necesario de la muestra. Del mismo modo, entre menor es la variabilidad, es menor el tamao necesario de la muestra. 5. Cmo se calcula la media de una muestra total y el error estndar de una muestra

    estratificada?

    La media de la muestra total tan slo es un promedio ponderado de la media del estrato.

    X = jA

    j

    j XNN

    =

    1 =

    =

    A

    jjj Xw

    1

    El error estndar es la raz cuadrada de la combinacin ponderada del cuadrado del error estndar dentro de cada estrato

    Xs = 2

    Xs

    donde

    2Xs =

    22

    1jX

    A

    j

    j sNN

    =

    =

    =

    A

    jjXj sw

    1

    22

    Pregunta del instructor para sondeo: Cmo se representan los valores de los estratos en los clculos que implican estratificacin?

    177

  • Respuesta sugerida al sondeo: Por lo general, se usa el subndice ST para denotar un estrato, y un punto decimal y un nmero que siguen a ST indican a cul estrato corresponde ese valor. 6. Bajo qu circunstancias el muestreo estratificado reduce el error estndar?

    Las variables que se correlacionan altamente con la medicin de inters son candidatas a variables de estratificacin. Tales variables producen estratos que son relativamente homogneas al interior, y por tanto reducen el error estndar.

    Pregunta del instructor para sondeo: Si deseamos obtener los mismos resultados con una muestra no estratificada de los que podramos obtener con una muestra estratificada, qu modificaciones sera necesario hacerle a la muestra no estratificada para obtener la misma precisin? Respuesta sugerida al sondeo: La muestra no estratificada necesitara de una muestra ms pequea. 7. Por qu el muestreo estratificado reduce el error estndar?

    Slo se usa la variabilidad interna de los estratos para calcular el error estndar, y estas variabilidades son ms pequeas que la variabilidad global. Esto se debe a que no son posibles ciertas medias de valores extremos en la distribucin muestral de las medias.

    Pregunta del instructor para sondeo: D algunos ejemplos de varios tipos de caractersticas de estratificacin que puede usar un estudio de mercados para establecer un estudio de muestra estratificada. Respuesta sugerida al sondeo: Algunos ejemplos de caractersticas de estratificacin incluyen tipo, modelo, sexo, edad, ocupacin y ubicacin geogrfica, como estado.

    178

  • 8. Qu es muestreo por conglomerados?

    El muestreo en el cual los conglomerados o grupos de elementos son muestreados al mismo tiempo se llama muestreo por conglomerados.

    Pregunta del instructor para sondeo: D algunos ejemplos de unidades de conglomerados. Respuesta sugerida al sondeo: Algunos ejemplos de unidades de conglomerados incluyen hogares con relacin a los miembros individuales, una escuela con relacin a los estudiantes y un contenedor para embarque de un producto con relacin a cada producto individual. 9. Qu son eficiencia estadstica y eficiencia global?

    La eficiencia global (o eficiencia total) es una medicin de la eficiencia estadstica y el costo de un procedimiento de muestreo. Es el tamao del error estndar por dlar. La eficiencia estadstica se relaciona con el tamao del error estndar para un tamao de la muestra dado.

    Pregunta del instructor para sondeo: Cmo se relaciona el muestreo por conglomerados con otros procedimientos de muestreo desde el punto de vista de la eficiencia global? Respuesta sugerida al sondeo: Con frecuencia el muestreo por conglomerados es el procedimiento global con ms eficiencia. 10. Cmo se selecciona una muestra sistemtica?

    El investigador selecciona cada k-simo elemento del marco, despus de un inicio aleatorio en alguna parte dentro de los primeros k elementos donde k = N/n.

    179

  • Pregunta del instructor para sondeo: Cul es el procedimiento de muestreo por conglomerados de una etapa? Respuesta sugerida al sondeo: Cuando se usan todos los elementos en el conglomerado generado por muestreo sistemtico, se llama procedimiento de muestreo por conglomerados de una etapa. 11. Qu significa periodicidad? Cmo se genera y soluciona?

    La periodicidad ocurre cuando la lista de elementos que conforman el marco forma un patrn cclico que coincide con un mltiplo del tamao del intervalo muestral.

    Es causada por tener un marco que tiene un ciclo especfico. Se soluciona al reordenar el marco.

    Pregunta del instructor para sondeo: Qu significa reordenar el marco? Respuesta sugerida al sondeo: Reordenar el marco implica reacomodar los elementos de la muestra en un orden diferente a fin de evitar la periodicidad. 12. Cmo se presenta la estratificacin implcita?

    Si el marco est ordenado con base en lo que podra utilizarse como una variable de estratificacin, entonces la seleccin de una muestra sistemtica suministrar en forma automtica una muestra estratificada.

    Pregunta del instructor para sondeo: Por qu es ventajosa la estratificacin implcita para el investigador?

    180

  • Respuesta sugerida al sondeo: En vista de que los marcos ordenados ocurren en el muestreo sistemtico, es muy fcil y conveniente si el marco ordenado se ordena con base en lo que se usa como una muestra de estratificacin. De esta manera, no se requiere trabajo adicional para estratificar la muestra. 13. Qu es muestreo por reas?

    La muestra por reas es un tipo de muestra por conglomerados en la cual se seleccionan regiones geogrficas.

    Pregunta del instructor para sondeo: Por qu los investigadores usan muestras por reas? Respuesta sugerida al sondeo: En vista de que el listado preciso de los residentes y sus patrones de compra y otros datos no estn disponibles, es importante encuestar una regin geogrfica. Sin embargo, en vista de que los investigadores no pueden encuestar todas las reas bajo investigacin, debe tomarse una muestra (por reas). 14. Qu es muestreo por reas de mltiples etapas?

    Aqu el proceso de enumerar unidades muestrales y la seleccin aleatoria de esta lista ocurre repetidas veces. El nmero de veces que se enumera y selecciona es igual al nmero de etapas en el proceso muestral.

    Pregunta del instructor para sondeo: Exponga el potencial de error en el muestreo por reas de mltiples etapas. Respuesta sugerida al sondeo: El muestreo por reas de mltiples etapas es mucho menos eficiente desde el punto de vista estadstico que el muestreo aleatorio simple. Un muestreo de mltiples etapas de n etapas est sujeto a n errores de muestreo. Adems, es bastante complejo calcular el error estndar para este tipo de muestreo.

    181

  • 15. Cmo se obtiene una probabilidad igual de seleccin de elementos utilizando un procedimiento de muestreo por reas de mltiples etapas?

    1) Una oportunidad igual de seleccin de unidades muestrales en cada etapa del

    proceso sin importar qu tan grandes sean los conglomerados con relacin a los otros.

    2) Seleccionar los conglomerados de la primera etapa con probabilidad proporcional al tamao (PPT) y seleccionar el mismo nmero de unidades muestrales de cada conglomerado seleccionado de la primera etapa. Para etapas ms all de la segunda, seleccionar por mtodos de oportunidad iguales.

    Pregunta del instructor para sondeo: Cul es una aplicacin comn de la tcnica PPT? Respuesta sugerida al sondeo: Como sugiere el texto, es comn el uso de investigacin de mercados que implica regiones geogrficas. 16. Por qu algunas veces se obtienen probabilidades desiguales de la seleccin de

    elementos?

    1) El investigador quiere hacer un anlisis de subgrupos detallado y por tanto toma de manera intencional una muestra excesiva de este grupo.

    2) El investigador est realizando un muestreo estratificado no proporcional. 3) Una muestra genera una proporcin ms pequea de un subgrupo particular que

    la proporcin de la poblacin. 4) En un diseo PPT, no se realiz el tamao esperado del conglomerado.

    Pregunta del instructor para sondeo: Las probabilidades desiguales de la seleccin de elementos pueden obstaculizar los esfuerzos del investigador para obtener datos lo ms precisos posible?

    182

  • Respuesta sugerida al sondeo: Las probabilidades desiguales no presentan problemas en tanto el investigador est interesado en hacer slo anlisis intrasubgrupo. 17. Cmo se hacen estimativos de una muestra total cuando los elementos tienen

    probabilidades desiguales de seleccin?

    Los elementos se asignan a un factor ponderado en proporcin al inverso de su probabilidad de ser seleccionado.

    Pregunta del instructor para sondeo: Demuestre cmo se calcula este factor de ponderacin. Respuesta sugerida al sondeo: Tomamos la probabilidad de seleccin, luego tomamos el inverso matemtico y multiplicamos ese nmero por los valores de los subgrupos. Luego tomamos la suma de los valores de los subgrupos y llegamos al tamao muestral ponderado. 18. Describa los pasos en la marcacin aleatoria de dgitos.

    1) Usar procedimientos de muestreo por reas tan abajo hasta la ciudad o pueblo de inters.

    2) Obtener los directorios telefnicos de las ciudades o pueblos seleccionados y seleccionar en forma sistemtica una muestra de los nmeros telefnicos de los directorios.

    3) Reemplazar el ltimo o los dos ltimos dgitos de estos nmeros seleccionados por nmeros aleatorios.

    4) Llamar a los nmeros obtenidos. Pregunta del instructor para sondeo: Cules son algunas desventajas del procedimiento de marcacin aleatoria de dgitos?

    183

  • Respuesta sugerida al sondeo: Algunas desventajas posibles incluyen: llegar al mismo hogar debido a lneas mltiples y la posibilidad de llegar a computadoras, faxes u otros dispositivos de comunicacin electrnicos en lugar de a una lnea de voz.

    Para las preguntas 19 a la 21 prepare un diseo muestral. Asegrese de que su diseo incluya una descripcin de cada uno de los siguientes aspectos y un enunciado de su razonamiento.

    a. La poblacin b. El marco muestral c. El tamao de la muestra d. El procedimiento muestral (asegrese de incluir una descripcin paso por paso sobre

    cmo se obtendr en realidad la muestra) e. Un mtodo para determinar la exactitud de los resultados de la muestra

    Note que para la parte c) los estudiantes deben abordar alguno de los problemas cualitativos que surgieron al determinar la exactitud de los resultados de la muestra.

    19. Frank Jackson era el director de servicios estudiantiles en la escuela de administracin

    de una importante universidad. Frank quera realizar una encuesta de estudiantes con grado de Licenciado en Administracin de Empresas y Mster en Administracin de Empresas, a fin de determinar sus actitudes hacia las propuestas de los cursos, servicios de consejera disponibles y oportunidades de empleo. Haba un total de 3,000 estudiantes con grado de Licenciado en Administracin de Empresas y 700 con Mster en Administracin de Empresas en la escuela de administracin. Como no era posible un censo, Frank necesitaba desarrollar un diseo muestral.

    184

  • a) Poblacin

    El principal problema relacionado con la definicin de la poblacin es si los Licenciados en Administracin de Empresas y los Mster en Administracin de Empresas son considerados como dos poblaciones diferentes o no. El argumento para tratarlos como separados es que pueden sostener actitudes muy diferentes acerca de los cursos, consejera, oportunidades y empleos. Estn en diferentes programas con diferentes cursos, oportunidades, etc. Combinar sus actitudes puede slo formar un punto medio entre dos segmentos distintos de actitud.

    El argumento para tratar a los dos como una sola poblacin es que el inters puede estar en la actitud global. Para nosotros esto parece un argumento ms dbil. Dos poblaciones parece una mejor forma de proceder.

    Las poblaciones pueden ser:

    I. A. Elementos estudiantes con grado de Licenciado en Administracin de Empresas

    B. Unidades muestrales estudiantes con grado de Licenciado en Administracin de Empresas

    C. Extensin la escuela en cuestin D. Tiempo el semestre actual II. A. Elementos estudiantes con grado de Mster en Administracin de

    Empresas B. Unidades muestrales estudiantes con grado de Mster en

    Administracin de Empresas C. Extensin la escuela en cuestin D. Tiempo el semestre actual

    185

  • Por supuesto que es posible combinar las dos poblaciones y slo tratar a los estudiantes con grado de Licenciado en Administracin de Empresas y Mster en Administracin de Empresas como dos subgrupos o estratos. A condicin de que los resultados de los diferentes subgrupos no se combinen para dar estimados de muestra total, sta es una forma apropiada de pensar.

    b) Marco muestral

    Lo ms probable es que aqu se disponga de un marco ya hecho para ambas poblaciones. Se trata de la lista de registro de: 1) estudiantes con grado de Licenciado en Administracin de Empresas y 2) estudiantes con grado de Mster en Administracin de Empresas.

    c) Tamao de la muestra

    Es difcil ser definitivos acerca de la pregunta sobre el tamao de la muestra. Sin embargo, los estudiantes deben estar preparados para dar una, y defenderla. Para hacerlo, deben discutir: 1) el error muestral, 2) el error no muestral, 3) los objetivos de estudio, 4) las restricciones de tiempo, 5) las restricciones de costos y 6) los planes de anlisis de datos. Todos estos aspectos no se esbozan en el ejercicio. Sin embargo, deben declarar sus suposiciones y ser claros acerca de ciertos aspectos; de manera especfica: es probable que las restricciones de tiempo y costos sean severas, y es probable que el anlisis de datos sea de la clase de una forma simple (por ejemplo, el informe de la media de las puntuaciones de actitud).

    Uno puede examinar la pregunta del tamao de la muestra desde un punto de vista estadstico. Suponga una designada: 1) precisin absoluta de .25 (asumiendo que estaremos usando una escala de clasificacin de 7 puntos, la cual se supone que provee datos de intervalo), 2) al nivel de confianza de 95% y 3) la desviacin estndar, s, es .75.

    186

  • Entonces resolvemos la siguiente ecuacin para n, el tamao de la muestra requerido.

    .25 = 2 n

    )75(.

    .25 = n50.1

    .25 n = 1.50

    n = 1.50/.25

    n = 6 n = 36

    Los estudiantes que usen este tipo de procedimiento deben reconocer que tienen que especificar una precisin y un nivel de confianza adems de asumir un valor de s. Adems, deben discutirse el costo y otros factores junto con el hecho de que n = 36 no permitira un anlisis de tabulacin cruzada, si se deseara.

    d) Procedimiento muestral

    Aqu es posible el muestreo aleatorio simple dada la existencia de listas de estudiantes. Sin embargo, este procedimiento es ineficiente desde el punto de vista del esfuerzo de trabajo. La persona que seleccione los elementos estara saltando por toda la lista mientras se seleccionan los nmeros aleatorios. Un mejor procedimiento sera seleccionar una muestra sistemtica, ya que no hay razn para esperar un problema con periodicidad en la lista. Adems, si se desea un anlisis de muestra combinada (tanto con grados de Licenciado en Administracin de Empresas como con grados de Mster en Administracin de Empresas), una muestra sistemtica producira una muestra estratificada proporcionada, ya que no hay razn para esperar un problema con periodicidad en la lista.

    187

  • e) Exactitud

    La nica medicin de exactitud disponible es la del tamao del error muestral. El error muestral puede medirse usando la frmula de intervalo de confianza:

    X 2 ns para el intervalo de confianza de 95%.

    En el flujo de la clase, algunos estudiantes pueden sugerir el uso de un procedimiento de muestreo no probabilstico, por lo general una muestra por prorrateo. Debe quedar claro que tiene poco sentido dada la facilidad con que se puede seleccionar una muestra de probabilidad aqu, y el problema de la medicin del error con una muestra por prorrateo.

    20. Sara Ranski es consultora de World Church Council. Una necesidad de informacin

    del consejo consiste en desarrollar un perfil demogrfico de los miembros de las iglesias en Estados Unidos. A Ranski se le ha pedido que desarrolle un diseo muestral para facilitar la recoleccin de esta informacin.

    a) Poblacin

    Una posible definicin de poblacin es como sigue:

    A. Elementos adultos en listas de la iglesia B. Unidades muestrales regiones del condado; ciudades y pueblos; secciones de

    ciudades y pueblo; iglesias; adultos en listas de la iglesia C. Extensin la parte continental de Estados Unidos D. Tiempo algn periodo especfico.

    188

  • Se plantearan preguntas acerca de la definicin de los elementos. Los adultos en listas de la iglesia no necesariamente asisten a la iglesia y por consiguiente pueden no desear ser incluidos. Sin embargo, cmo puede obtenerse una lista de aquellos que asisten en realidad? Esto puede agregar una etapa en el procedimiento muestral donde tendra que calificarse a aquellos que aparecen en listas de iglesia como asistentes y luego seleccionarlos.

    Las unidades muestrales especficas tambin pueden variar. El instructor debe estar abierto a otras secuencias razonables.

    b) Marco muestral

    En cada etapa de la muestra de mltiples etapas debe obtenerse una lista de las unidades muestrales disponibles. Por tanto, debe obtenerse una lista de regiones, luego una lista de ciudades y pueblos en las regiones seleccionadas, luego secciones de las ciudades y pueblos seleccionados, luego iglesias dentro de las secciones seleccionadas y, por ltimo, los adultos en las listas de las iglesias seleccionadas.

    c) Tamao de la muestra

    Los factores a considerar en el tamao de la muestra son de nuevo: 1) error muestral, 2) error no muestral, 3) objetivos de estudio, 4) restricciones de tiempo, 5) restricciones de costos y 6) planes de anlisis de datos. Algunos de estos puntos son ambiguos en la situacin y por tanto deben ser claras las suposiciones del estudiante.

    Hay dos puntos que deben considerarse. Primero, las frmulas estadsticas presentadas en el texto no ayudan, ya que no se present ninguna para un problema de mltiples etapas. En teora, uno puede derivar el error estndar para este proceso muestral y resolver para un tamao de la muestra. Tendrn que designarse los niveles de precisin e intervalo de confianza, la media y las desviaciones estndar esperadas en las escalas de actitud.

    189

  • Segundo, es probable que aqu el anlisis de datos no sera slo un anlisis univariado simple. Son probables las tabulaciones cruzadas entre datos demogrficos y cosas como denominacin, regin del pas, etc. Por tanto, el tamao de la muestra tendr que ser lo bastante grande para acomodar este proceso, digamos entre 400 y 500 personas. Si las diferencias de denominacin detalladas son de inters, entonces el tamao de la muestra tendr que ser an ms grande.

    d) Procedimiento muestral

    Es claro que, con base en la exposicin hecha hasta ahora, este problema se presta para un procedimiento de muestreo por rea de mltiples etapas. El ciclo de repeticin de listar las unidades muestrales y seleccionarlas usando un procedimiento de probabilidad continuar a travs de tantas etapas como sea necesario. El tiempo y costo de desarrollar una lista completa de elementos de poblacin imposibilita un procedimiento que no sea de mltiples etapas.

    Algunos estudiantes pueden argumentar a favor de una muestra no probabilstica debido a consideraciones de costo. El costo de obtener las listas requeridas puede ser bastante alto en esta situacin. La prdida de entendimiento del error muestral es, por supuesto, importante y debe discutirse. Podra plantearse aqu un buen argumento para una muestra por prorrateo hecha con cuidado que controle la denominacin y la regin del pas. La gran ventaja sera en el costo. Los estudiantes que sugieran una muestra de reas de mltiples etapas debern estar preparados para declarar cmo asegurarn una probabilidad igual en la seleccin de elementos. Seleccionar una proporcin igual de unidades muestrales disponibles en cada etapa puede excluir algunas regiones o ciudades grandes consideradas importantes desde el punto de vista del perfil religioso. Por tanto, puede argumentarse a favor de usar la probabilidad proporcional al tamao (PPT) en la primera etapa de la seleccin.

    190

  • e) Exactitud

    Podra calcularse un intervalo de confianza en las mediciones demogrficas si se usa un procedimiento muestral probabilstico. Para hacer esto tendran que usarse las frmulas relevantes disponibles en libros de muestreo ms avanzados. Adems, el anlisis ji cuadrado de tabulacin cruzada sera posible para probar asociaciones significativas entre variables. Ningn procedimiento estara disponible si se usara un procedimiento no probabilstico.

    21. Roy Lena era el gerente de producto para una nueva marca de cereal, llamado Multi-

    Vit, que actualmente estaba en desarrollo por una importante empresa de bienes empacados, localizada en la ciudad de Nueva York. El producto contena vitaminas y otros nutrientes no disponibles en otros cereales. Lena se encontraba en el proceso de diseo de una prueba de uso del producto en los hogares. El objetivo de la prueba era medir la reaccin de los adultos al sabor del producto. Los resultados de esta prueba se utilizaran para perfeccionar an ms el producto, antes de ser sometido a pruebas adicionales de mercado y en los hogares. El problema que enfrentaba Lena era disear la muestra para la prueba de colocacin en los hogares.

    a) Poblacin

    Es probable que aqu estar bien una poblacin local o regional cerca de las oficinas de la compaa, ya que no hay razn para creer que las reacciones al gusto variarn por regin. Por consiguiente, una definicin de poblacin sera:

    A. Elementos usuarios de cereal listo para comer B. Unidades muestrales hogares, usuarios de cereal listo para comer C. Extensin rea metropolitana de Minneapolis D. Tiempo algn periodo especfico

    191

  • b) Marco muestral

    Un directorio de hogares en el rea metropolitana de Minneapolis formara el marco en la primera etapa, luego los hogares seran calificados respecto a si est presente un usuario de cereal listo para comer o no para formar la segunda etapa del marco.

    c) Tamao de la muestra

    Dado el objetivo del estudio, se usara una muestra muy pequea, digamos entre 50-150 personas. Slo se est probando el producto, no prediciendo su participacin en el mercado.

    d) Procedimiento muestral

    Todo lo que se present hasta ahora sostiene una muestra por conveniencia de dos etapas. Se contactar a las familias, se determinar si est presente un usuario de cereal listo para comer y se intentar solicitar cooperacin. Alguien podra argumentar que sera mejor una muestra por prorrateo que controlara los aspectos demogrficos de la audiencia objetivo (no especificadas en el ejercicio). Para hacer esto la familia sera cuestionada sobre estas dimensiones antes de solicitar la cooperacin.

    Aqu parece haber poca necesidad de procedimientos muestrales de probabilidad complejos, dados los intercambios de costo y beneficio.

    e) Exactitud

    Dados los procedimientos sugeridos, no puede determinarse la exactitud.

    22. De acuerdo con la seccin Investigacin de mercados en accin sobre STP/Lou

    Harris, responda las siguientes preguntas:

    192

  • a. Qu unidades muestrales se definieron a travs de este procedimiento? Cules eran los marcos muestrales?

    Las unidades muestrales eran residentes de Estados Unidos (sin incluir residentes de Alaska y Hawai, prisioneros, estudiantes ni clrigos), estados, regiones y reas metropolitanas, condados, divisiones/pueblos/ciudades civiles menores y nmeros telefnicos. Los marcos muestrales fueron listas de cada tipo de unidad.

    b. Por qu se utiliz la estratificacin?

    La estratificacin de Estados Unidos sobre una base geogrfica les permite asegurarse de tomar una muestra geogrficamente representativa de la poblacin de Estados Unidos, y para correlacionar las diferencias entre los consumidores con informacin geogrfica/demogrfica contenida en el censo.

    c. Qu propsito haba al seleccionar ciudades o pueblos con probabilidad

    proporcional a los estimativos de censos de sus respectivas poblaciones de familias? Cmo se podra lograr esto?

    El propsito era obtener una muestra de personas representativas del censo de poblacin, al dar a reas metropolitanas grandes una probabilidad mayor de ser seleccionadas. El procedimiento para seleccionar una muestra PPT se presenta en forma clara en el texto.

    d. Qu procedimientos muestrales alternativos se podran utilizar en este caso?

    Para este tipo de investigacin, por lo comn se usa el prorrateo, e incluso el muestreo por conveniencia. Son menos costosas que el procedimiento Harris/STP.

    23. Para la seccin Investigacin de mercados en accin sobre AT&T al comienzo de este

    captulo:

    193

  • a. Por qu la muestra se seleccion a partir de una poblacin estratificada?

    Para controlar cualquier impacto en los pronsticos de ventas de los efectos debidos al segmento del mercado y la exposicin a la variacin de niveles por precio, promocin y distribucin. Esto habilita a AT&T para experimentar con la variacin del precio, promocin y distribucin, para ver cul combinacin de mezcla de variables de marketing funcionarn mejor para cada segmento de consumidor.

    b. Por qu el tamao de la muestra era superior a 2,600? Es ste el tamao de

    muestra apropiado para este estudio?

    S, el tamao de la muestra era apropiado. Con 16 grupos y 2,600 observaciones, hay un promedio de 162 observaciones por grupo. Para hacer comparaciones vlidas entre grupos, a la mayora de los estadsticos le gusta ver al menos 100 observaciones por grupo.

    24. MINICASO

    Para el caso 4-1 titulado Milan Food Cooperative (A), la media de la poblacin para gastos semanales en alimentos es US$43.20. Seleccione las muestras que se enumeran a continuacin de estos datos y estime los gastos medios semanales en alimentos y el intervalo de confianza de 95% asociado. Utilice la tabla A-1 en el apndice, al final del libro, para obtener nmeros aleatorios. a. Muestra aleatoria simple, n = 10 b. Muestra aleatoria simple, n = 30 c. Muestra estratificada, n = 10 d. Muestra sistemtica, n = 10 e. Muestra por conveniencia, n = 10 f. Muestra por prorrateo, n = 10 Qu conclusiones puede sacar acerca de cada uno de estos mtodos muestrales?

    194

  • PROPSITO

    Los propsitos de esta pregunta son 1) mejorar la comprensin de los estudiantes del proceso de muestreo y 2) mejorar su capacidad para extraer muestras. Siguiendo los procedimientos delineados en las clases, el estudiante extrae muestras de una poblacin y compara sus resultados con los de otros estudiantes. ANTECEDENTES

    La pregunta presenta una poblacin de estudio completa (N = 500) organizada en un marco muestral. El elemento de la poblacin es una familia. Cada familia se describe con referencia a seis variables: 1) gastos semanales en alimentos, 2) nmero de personas en la familia, 3) ingreso anual familiar, 4) educacin del jefe de familia, 5) edad del jefe de familia y 6) edad de los hijos. Los ejemplos ilustran la extraccin de muestras probabilsticas (muestreo aleatorio simple, estratificado y sistemtico) y no probabilsticas (por conveniencia y prorrateo) de la poblacin de estudio. Se us un programa de cmputo para calcular los estadsticos para un nmero mayor de muestras extradas por estudiantes de la Universidad de Michigan usando cada uno de los procedimientos de seleccin de muestras probabilsticos y no probabilsticas. La seccin Resultados de computadora de la seleccin de muestras presenta la salida de estos clculos. Usando esta salida de computadora, el instructor puede comparar los estadsticos calculados a partir de cada una de sus muestras con los de un grupo grande de estudiantes, y puede comparar tambin cada uno de los procedimientos de seleccin de muestras basados en los resultados de computadora. ESTRATEGIA DE ENSEANZA

    Los clculos de muestra, hojas de trabajo y salida de computadora se encuentran en este manual para usarse con este problema. El instructor puede copiar y repartir las hojas de trabajo y hacer que los estudiantes completen los ejercicios de muestreo en su casa, registrando los estadsticos de cada muestra en la seccin Resumen de clculos al final de la hoja de trabajo. En clase, haga que varios estudiantes expongan sus resultados para cada tipo de muestra, para ilustrar la variacin posible entre muestras seleccionadas con el mismo mtodo de muestreo. Luego use los resultados de computadora para hacer generalizaciones sobre las diferencias producidas por la eleccin del mtodo de muestreo.

    195

  • Acerca de la salida de computadora

    Para cada uno de los seis problemas de muestreo, se dispone de salida de computadora para utilizarse en la exposicin en clase. La salida fue generada tomando 60 o ms muestras usando cada procedimiento de seleccin y tabulando los resultados. La tabla 1 contiene un resumen de los resultados (nmero de muestras, media, error estndar y porcentaje en el intervalo de confianza) para cada uno de los procedimientos de muestreo. Las figuras 1 a 10 presentan la distribucin de las medias muestrales para cada procedimiento. Las tablas 2 y 3 presentan una salida de computadora ms detallada producida por muestreo aleatorio simple y por muestreo por conveniencia. a) Muestra aleatoria simple, n = 10

    1. Procedimiento: Seleccione de manera sistemtica 10 nmeros de tres dgitos en el rango de 001 a 500 de la tabla de dgitos aleatorios proporcionada en el texto. La siguiente ilustracin le muestra cmo calcular la media, la desviacin estndar y el intervalo de confianza para los datos de gastos semanales en alimentos.

    196

  • 2. Muestra de 10 familias:

    Nmero aleatorio de

    familia

    Gasto ($) X

    X2

    100 75 5,625.00 375 37.5 1,406.25 084 30 900.00 128 20 400.00 310 86 7,396.00 118 20 400.00 099 40 1,600.00 441 30 900.00 125 22.5 506.25 154 75 5,625.00 X = 436 X2 = 24,758.5

    3. Media muestral:

    6.4310436 ===

    nX

    X

    (media poblacional = $43.2) 4. Desviacin estndar muestral:

    ( )9

    6.009,195.758,249

    10096,1905.758,24

    1

    22

    =

    =

    =

    nnX

    xs

    197

  • 27.258.6389

    9.748,5 ===s

    (desviacin estndar poblacional = $20.9) 5. Estimacin muestral de Xs (desviacin estndar de la media muestral o error

    estndar de la media):

    nssX =

    16.327.25

    1027.25 ==

    = 8.0

    6. Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):

    ( XsZX ) X + ( )XsZ

    43.6 2(8) 43.6 + 2(8)

    43.6 16 43.6 + 16

    27.6 59.6

    Nota: (43.2) aparece en este intervalo.

    198

  • 7. Interpretacin del intervalo de confianza: Si uno toma una gran cantidad de muestras aleatorias simples de esta poblacin y construye un intervalo de confianza de 95% para cada una, alrededor de 95% de estos enunciados ser correcto.

    b) Muestra aleatoria simple, n = 30

    1. Procedimiento: Seleccione de manera sistemtica 30 nmeros de tres dgitos en el rango de 001 a 500 de la tabla de dgitos aleatorios que se proporciona en el texto. Para este ejemplo, continuamos con la misma cadena de nmeros aleatorios utilizada para la muestra anterior. Esto se hizo para resaltar las diferencias en las medias, desviaciones estndar, errores estndar de la media e intervalos de confianza producidos por diferentes tamaos de muestra.

    2. Muestra de 30 familias:

    Nmero aleatorio de

    familia

    Gasto ($) X

    X2

    100 75 5,625.00 375 37.5 1,406.25 084 30 900.00 128 20 400.00 310 86 7,396.00 118 20 400.00 099 40 1,600.00 441 30 900.00 125 22.5 506.25 154 75 5,625.00

    199

  • 424 75 5,625.00 235 37.5 1,406.25 044 12 144.00 005 46.5 2,162.25 359 45 2,025.00 460 9 81.00 321 30 900.00 195 40 1,600.00 451 75 5,625.00 331 35 1,225.00 186 60 3,600.00 116 15 225.00 483 37.5 1,406.25 196 45 2,025.00 093 50 2,500.00 340 22.5 506.25 455 45 2,025.00 020 32 1,024.00 053 15 225.00 035 34.5 1,190.00 X = 1,197.5 X2 = 60,278.75

    3. Media muestral:

    91.3930

    5.197,1 === n

    XX

    200

  • 4. Desviacin estndar muestral:

    ( )29

    2.800,475.278,6029

    305.197,15.278,60

    1

    2

    2

    =

    =

    =

    nnX

    Xs

    29748,12=s

    s = 20.97

    5. Estimacin muestral de Xs (desviacin estndar de la media muestral o error estndar de la media):

    nssX =

    48.597.20

    3097.20 ==

    = 3.83

    6. Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):

    ( XsZX ) X + ( )XsZ

    39.51 2(3.83) 39.51 + 2(3.83)

    201

  • 39.51 7.66 39.51 + 7.66

    31.85 47.17 7. Interpretacin del intervalo de confianza:

    Si uno toma una gran cantidad de muestras aleatorias de esta poblacin y construye un intervalo de confianza de 95% para cada una, alrededor de 95% de estos enunciados sern correctos. Al comparar este ejemplo con el anterior, note que la muestra mayor gener una desviacin estndar ms pequea, un error estndar de la media ms pequeo y un intervalo de confianza de 95% ms estrecho.

    c) Muestra estratificada (n = 10)

    1. Procedimiento:

    a. La poblacin de familias que se va a muestrear se subdivide (o estratifica) en grupos que son mutuamente excluyentes pero que juntos incluyen todos los elementos en la poblacin.

    b. Luego se elige una muestra aleatoria simple independiente de cada grupo o estrato.

    202

  • 2. Estratos y pesos:

    Peso relativo del estrato Grupo de educacin

    f % Estrato n

    1 104 20.8 = W1 2 2 102 20.4 = W2 2 3 180 36.0 = W3 4

    4 y 5 114 22.8 = W4 2 500 100.0 10

    3. Nmero de familias por estrato:

    Estrato Nmero de familias

    W1 001-104 W2 105-206 W3 207-386 W4 387-500

    203

  • 4. Muestreo aleatorio de diez familias:

    W1 W2 Nmero

    aleatorio de familias Xst.1

    Nmero aleatorio de

    familias Xst.2 (1) 023 37.50 (1) 146 40.00 (2) 086 60.00 (2) 190 37.50 Xst.1 = 97.50 Xst.2 = 77.50

    W3 W4 Nmero

    aleatorio de familias Xst.3

    Nmero aleatorio de

    familias Xst.4 (1) 269 50.00 (1) 437 30.00 (2) 251 37.50 (2) 450 57.00 (3) 291 45.00 Xst.4 = 87.00 (4) 314 60.00 Xst.3 = 192.50

    5. Media del estrato muestral:

    X st.1 = 250.97 = 48.75 X st.3 = 4

    50.192 = 48.13

    X st.2 = 250.77 = 38.75 X st.4 = 2

    00.87 = 43.50

    204

  • 6. Media muestral ( X st):

    Estrato

    Media muestral en el estrato

    X st.j

    Peso relativo del estrato

    (Wj) Wj X st.j 48.8 .208 10.15 38.7 .204 7.89 48.1 .360 17.32 43.5 .228 9.91 1.000 X st = 45.27

    d) Sistemtico (n = 10)

    1. Procedimiento:

    a. Determine el nmero total de elementos en la poblacin (N = 500). b. Divida esta cifra entre el tamao de muestra deseado (500 10 = 50). c. El resultado se llama intervalo muestral (50). d. Seleccione un nmero aleatorio de 1 hasta el intervalo muestral de 50. e. Esto identifica al primer elemento en la lista que se va a incluir en la

    muestra. f. Sume a este nmero aleatorio el intervalo muestral. g. El resultado identifica al segundo elemento que se va a incluir en la muestra. h. Contine sumando el intervalo y tomando los elementos identificados de

    esta manera hasta que se extraiga la muestra (n = 10).

    205

  • 2. Muestreo sistemtico de diez familias:

    a. Nmero aleatorio = 23 b. Muestra

    Nmero aleatorio de familia

    Gasto X

    (1) 23 37.50 (2) 73 24.00 (3) 123 45.00 (4) 173 27.00 (5) 223 30.00 (6) 273 50.00 (7) 323 22.50 (8) 373 52.50 (9) 423 75.00

    (10) 473 60.00 X = 423.50

    3. Media muestral:

    X = 10

    5.423 = 42.4

    206

  • e) Muestra por conveniencia (n = 10)

    1. Procedimiento: Seleccione 10 nmeros de familias en una manera conveniente para usted. En la siguiente ilustracin, la seleccin implic ir a la tercera pgina del conjunto de datos adjunto y seleccionar de manera arbitraria 10 familias (119 a 128).

    2. Muestra por conveniencia de 10 familias:

    Nmero de familia

    Gasto X

    (1) 119 50 (2) 120 57 (3) 121 47 (4) 122 48 (5) 123 45 (6) 124 15 (7) 125 22.5 (8) 126 52.5 (9) 127 15

    (10) 128 20 X = 372

    3. Media muestral:

    X = 10372 = 37.2

    207

  • f) Muestra por prorrateo (n = 10)

    1. Muestra por prorrateo variable de dos controles: Distribucin de la poblacin por ingreso y nmero de personas en la familia

    Nmero de personas en la familia Ingreso anual ($) 1 o 2 3 o 4 5 o ms

    Menos de 6,000

    84 43 25

    6,000 a 14,999

    59 107 81

    15,000 y ms

    26 44 31

    N = 500 2. Asignacin de la muestra entre celdas (n = 10) Para n = 10, una familia por celda y las familias restantes asignadas a la celda

    mayor. 3. Procedimiento:

    a. Escoja un punto de partida arbitrario y busque familias que cumplan con los requisitos del prorrateo.

    208

  • 4. Muestra por prorrateo de 10 familias:

    Nmero de familia

    Gasto X

    (1) 119 50.0 (2) 181 45.0 (3) 282 69.0 (4) 144 40.0 (5) 171 55.0 (6) 187 37.5 (7) 154 75.0 (8) 218 30.0 (9) 257 45.0

    (10) 383 54.0 X = 500.5

    3. Media muestral:

    X = 10

    5.500 = 50.0

    Uso de nmeros aleatorios

    Los procedimientos de seleccin de muestras probabilsticas usan un conjunto de nmeros aleatorios para seleccionar los elementos de la poblacin. Esta lista, como su nombre implica, est compuesta por nmeros que no tienen un patrn de ocurrencia. Cualquier nmero tiene la misma probabilidad de aparecer en cualquier punto de la tabla que cualquier otro.

    209

  • En el Conjunto de datos de poblaciones, cada familia es identificada por un nmero de identificacin de familias de tres dgitos que van de 001 a 500. Por tanto, podemos usar la tabla de dgitos aleatorios para que nos d un nmero de tres dgitos en el rango de 001 a 500 para seleccionar un elemento para la muestra. Usaramos tantos de estos nmeros de tres dgitos como deseemos en la muestra. Un ejemplo ayudar a aclarar esto. Suponga que deseamos seleccionar una muestra con n = 5. Si comenzamos en la tabla de dgitos aleatorios en un punto arbitrario en la fila 11, columnas 16 y 17 (primeros dos dgitos de la columna 16 y el primer dgito de la columna 17) y nos movemos en forma vertical hacia abajo de las columnas, seleccionaramos una muestra consistente de los elementos 294, 184, 211, 455 y 436. stos son los primeros cinco nmeros de tres dgitos en el rango de 001 a 500 que encontramos. En consecuencia, hemos seleccionado en forma aleatoria un tamao de muestra de 5 de una poblacin de tamao 500.

    210

  • Nombre _____________________________________

    HOJAS DE TRABAJO PARA LA SELECCIN DE MUESTRAS Mtodo de muestreo probabilstico A. Muestreo aleatorio simple

    1. Muestra de 10 familias:

    Nmero aleatorio de

    familia

    Gasto ($),

    X

    X2

    (1) __________ __________ __________ (2) __________ __________ __________ (3) __________ __________ __________ (4) __________ __________ __________ (5) __________ __________ __________ (6) __________ __________ __________ (7) __________ __________ __________ (8) __________ __________ __________ (9) __________ __________ __________

    (10) __________ __________ __________ X = X2 =

    211

  • Nombre _____________________________________ 2. Media muestral:

    == n

    XX

    (media poblacional = $43.2) 3. Desviacin estndar muestral:

    ( )=

    =

    1

    22

    nnX

    Xs

    (desviacin estndar de la poblacin = $20.9)

    212

  • Nombre _____________________________________

    B. Muestreo aleatorio simple 1. Muestra de 30 familias:

    Nmero de familia

    aleatorio

    Gasto ($),

    X

    X2

    (1) __________ __________ __________ (2) __________ __________ __________ (3) __________ __________ __________ (4) __________ __________ __________ (5) __________ __________ __________ (6) __________ __________ __________ (7) __________ __________ __________ (8) __________ __________ __________ (9) __________ __________ __________ (10) __________ __________ __________ (11) __________ __________ __________ (12) __________ __________ __________ (13) __________ __________ __________ (14) __________ __________ __________ (15) __________ __________ __________ (16) __________ __________ __________ (17) __________ __________ __________

    213

  • Nombre _____________________________________

    Nmero de familia

    aleatorio

    Gasto ($),

    X

    X2

    (18) __________ __________ __________ (19) __________ __________ __________ (20) __________ __________ __________ (21) __________ __________ __________ (22) __________ __________ __________ (23) __________ __________ __________ (24) __________ __________ __________ (25) __________ __________ __________ (26) __________ __________ __________ (27) __________ __________ __________ (28) __________ __________ __________ (29) __________ __________ __________ (30) __________ __________ __________ X = X =

    2. Media muestral:

    == n

    XX

    (media poblacional = $43.2)

    214

  • Nombre _____________________________________ 3. Desviacin estndar muestral:

    ( )=

    =

    1

    2

    2

    nnX

    xs

    (desviacin estndar poblacional = $20.9)

    4. Estimacin muestral de Xs (error estndar de la media):

    ==nssX

    5. Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):

    ( XsZX ) X + ( )XsZ

    Aparece (43.2) en este intervalo? S No (encierre una en un crculo)

    215

  • Nombre _____________________________________ C. Muestreo estratificado

    1. Muestra de 10 familias:

    W1 W2 Nmero

    aleatorio de familias Xst.1

    Nmero aleatorio de

    familias Xst.2 (1) __________ __________ (1) __________ __________(2) __________ __________ (2) __________ __________ Xst.1 = __________ Xst.2 = __________

    W3 W4 Nmero

    aleatorio de familias Xst.3

    Nmero aleatorio de

    familias Xst.4 (1) __________ __________ (1) __________ __________(2) __________ __________ (2) __________ __________(3) __________ __________ Xst.4 = __________(4) __________ __________ Xst.3 = __________

    216

  • Nombre _____________________________________ 2. Media del estrato muestral:

    X st.1 = X st.2 = X st.3 = X st.4 =

    3. Media muestral ( X st.j):

    Estrato

    Media muestral en el estrato

    X st.j

    Peso relativo del estrato

    (Wj) Wj X st.j W1 __________ .208 __________ W2 __________ .204 __________ W3 __________ .360 __________ W4 __________ .228 __________

    1.000 X st =

    217

  • Nombre _____________________________________

    D. Muestreo por conglomerado Sistemtico 1. Muestra de 10 familias:

    a. Nmero aleatorio = __________

    Nmero aleatorio de familia

    Gasto X

    (1) __________ __________ (2) __________ __________ (3) __________ __________ (4) __________ __________ (5) __________ __________ (6) __________ __________ (7) __________ __________ (8) __________ __________ (9) __________ __________

    (10) __________ __________ X =

    2. Media muestral:

    == n

    XX

    (media poblacional = $43.2)

    218

  • Nombre _____________________________________ E. Muestra por conveniencia

    1. Muestra de 10 familias:

    Nmero aleatorio de familia

    Gasto X

    (1) __________ __________ (2) __________ __________ (3) __________ __________ (4) __________ __________ (5) __________ __________ (6) __________ __________ (7) __________ __________ (8) __________ __________ (9) __________ __________

    (10) __________ __________ X =

    2. Media muestral:

    == n

    XX

    (media poblacional = $43.2)

    219

  • Nombre _____________________________________ 3. Desviacin estndar muestral:

    ( )=

    =

    1

    2

    2

    nnX

    Xs

    (desviacin estndar de la poblacin = $20.9) 4. Estimacin de la muestra de Xs (error estndar de la media):

    Xs = ns =

    5. Estimacin del intervalo de (coeficiente de confianza de 95%; Z = 2):

    ( XsZX ) ( )XsZX +

    Aparece (43.2) en este intervalo? S No (encierre una en un crculo)

    220

  • Nombre _____________________________________

    F. Muestra por prorrateo 1. Muestra de 10 familias:

    Nmero aleatorio de familia

    Gasto X

    (1) __________ __________ (2) __________ __________ (3) __________ __________ (4) __________ __________ (5) __________ __________ (6) __________ __________ (7) __________ __________ (8) __________ __________ (9) __________ __________

    (10) __________ __________ X =

    2. Media muestral:

    == n

    XX

    (media poblacional = $43.2)

    221

  • Nombre _____________________________________ Resumen de clculos

    Procedimiento de muestreo

    Muestreo aleatorio simple Estratificado Sistemtico

    Por conveniencia

    Por prorrateo

    n = 10 n = 30 n = 10 n = 10 n = 10 n = 10

    Media muestral

    Desviacin estndar

    El intervalo

    de confianza incluye a

    ? (S No)

    222

  • RESULTADOS DE COMPUTADORA DE LA SELECCIN DE MUESTRAS

    Tabla de contenido 1. Tabla 1 Resumen de resultados 2. Figura 1 Muestra aleatoria simple (n = 10) 3. Figura 2 Muestra aleatoria simple (n = 30) 4. Figura 3 Muestra estratificada (n = 10) 5. Figura 4 Muestra estratificada (n = 30) 6. Figura 5 Muestra sistemtica (n = 10) 7. Figura 6 Muestra sistemtica (n = 30) 8. Figura 7 Muestra por conveniencia (n = 10) 9. Figura 8 Muestra por conveniencia (n = 30) 10. Figura 9 Muestra por prorrateo (n = 10) 11. Figura 10 Muestra por prorrateo (n = 30) 12. Tabla 2 Salida de computadora: Muestra aleatoria simple (n = 30) 13. Tabla 3 Salida de computadora: Muestra por conveniencia (n = 30)

    223

  • Tabla 1 Resumen de resultados

    Nmero de muestras

    Media de las muestras

    Error estndar de la media

    Porcentaje de en el intervalo de confianza

    Muestra aleatoria simple (n = 10)

    64 $42.6 6.45 92.2%

    Muestra aleatoria simple (n = 30)

    62 $43.7 3.61 93.5%

    Muestra estratificada (n = 10)

    64 $44.0 6.43 92.2%

    Muestra estratificada (n = 30)

    61 $43.7 3.79 96.7%

    Muestra sistemtica (n = 10)

    65 $41.6 5.75 90.8%

    Muestra sistemtica (n = 30)

    62 $43.4 3.72 100.0%

    Muestra por conveniencia (n = 10)

    65 $43.6 6.05 75.4%

    Muestra por conveniencia (n = 30)

    60 $42.9 3.60 75.0%

    Muestra por prorrateo (n = 10)

    63 $44.2 6.07 90.5%

    Muestra por prorrateo (n = 30)

    61 $44.0 3.68 100.0%

    224

  • Media pob. = 43.2 Nmero de muestras = 64 Media de las muestras = 42.6 Error est. de la media = 6.45 en int. de confianza = 92.2%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 1 Muestra aleatoria simple (n = 10)

    Media pob. = 43.2 Nmero de muestras = 62 Media de las muestras = 43.7 Error est. de la media = 3.61 en int. de confianza = 93.5%

    Proporcin de

    muestras

    Media muestral ($) Figura 2 Muestra aleatoria simple (n = 30)

    225

  • Media pob. = 43.2 Nmero de muestras = 64 Media de las muestras = 44.0 Error est. de la media = 6.43 en int. de confianza = 92.2%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 3 Muestra estratificada (n = 10)

    Media pob. = 43.2 Nmero de muestras = 61 Media de las muestras = 43.7 Error est. de la media = 3.79 en int. de confianza = 96.7%

    Proporcin de

    muestras

    Media muestral ($) Figura 4 Muestra estratificada (n = 30)

    226

  • Media pob. = 43.2 Nmero de muestras = 65 Media de las muestras = 41.6 Error est. de la media = 5.75 en int. de confianza = 90.8%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 5 Muestra sistemtica (n = 10)

    Media pob. = 43.2 Nmero de muestras = 62 Media de las muestras = 43.4 Error est. de la media = 3.72 en int. de confianza = 100%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 6 Muestra sistemtica (n = 30)

    227

  • Media pob. = 43.2 Nmero de muestras = 65 Media de las muestras = 43.6 Error est. de la media = 6.05 en int. de confianza = 75.4%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 7 Muestra por conveniencia (n = 10)

    Media pob. = 43.2 Nmero de muestras = 60 Media de las muestras = 42.9 Error est. de la media = 3.60 en int. de confianza = 75%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 8 Muestra por conveniencia (n = 30)

    228

  • Media pob. = 43.2 Nmero de muestras = 63 Media de las muestras = 44.2 Error est. de la media = 6.07 en int. de confianza = 90.5%

    Proporcin de

    muestras

    Media muestral ($)

    Figura 9 Muestra por prorrateo (n = 10)

    Media pob. = 43.2 Nmero de muestras = 61 Media de las muestras = 44.0 Error est. de la media = 3.68 en int. de confianza = 100%

    Media muestral ($)

    Figura 10 Muestra por prorrateo (n = 30)

    229

  • Tabla 2 Muestras aleatorias simples de 30 casos* MEDIA ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

    43.15 4.2099 34.73-51.57 1

    44.90 3.2395 38.42-51.38 1

    45.40 4.6985 36.00-54.80 1

    49.57 3.4537 42.66-56.47 1

    41.45 2.9575 35.53-47.37 1

    42.23 2.6683 36.90-47.57 1

    48.50 4.7611 38.98-58.02 1

    45.05 3.2358 38.58-51.52 1

    41.32 2.7417 35.83-46.80 1

    51.95 3.6000 44.75-59.15 11111

    47.53 3.8684 39.80-55.27 1

    42.28 4.3186 33.65-50.82 1

    37.68 2.4388 32.81-42.56 11111

    45.32 4.7707 35.78-54.86 1

    35.13 2.4171 30.30-39.97 11111

    49.55 3.8031 41.94-57.16 1

    44.17 2.9504 38.27-50.07 1

    36.37 3.0412 30.28-42.45 11111

    37.50 3.5242 30.45-44.55 1

    43.33 3.6012 36.13-50.54 1

    47.90 3.7679 40.36-55.44 1

    41.38 2.9920 35.40-47.37 1

    47.57 3.5630 40.44-54.69 1

    40.30 4.0177 32.26-48.34 1

    44.12 3.2108 37.70-50.54 1

    39.17 2.6162 33.93-44.40 1

    39.18 3.3552 32.53-45.83 1

    41.92 2.7490 36.42-47.41 1

    230

  • Tabla 2 Muestras aleatorias simples de 30 casos* (continuacin) MEDIA ERROR ESTNDAR. DE LA

    MEDIA INTERVALO DE CONFIANZA

    44.48 2.5028 39.48-49.49 1

    46.93 3.7234 39.49-54.38 1

    45.12 4.0732 36.97-53.26 1

    43.88 3.9478 35.99-51.78 1

    44.57 4.1746 36.22-52.92 1

    44.13 3.8023 36.53-51.74 1

    46.40 3.8566 38.69-54.11 1

    43.03 4.6926 33.65-52.42 1

    44.57 3.7030 37.16-51.97 1

    42.40 3.5064 1

    46.05 4.4272 37.20-54.90 1

    51.83 4.7911 42.25-61.42 1

    40.03 4.2141 31.61-48.46 1

    45.05 3.5235 38.00-52.10 1

    42.03 4.4319 33.17-50.90 1

    44.12 4.5250 35.07-53.17 1

    49.32 4.6731 39.97-58.66 1

    46.93 3.8023 39.33-54.54 1

    42.75 3.2364 36.28-49.22 1

    45.48 3.5953 38.29-52.67 1

    46.50 3.7164 39.07-53.93 1

    41.67 2.7407 36.19-47.15 1

    39.65 2.7068 34.24-45.06 1

    47.00 3.7759 39.45-54.55 1

    35.39-49.41

    *1 indica que la media poblacional cae dentro del intervalo; 11111 indica que la media

    poblacional no cae dentro del intervalo

    231

  • Tabla 3 Muestras por conveniencia de 30 casos MEDIA ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

    50.83 3.9337 42.97-58.70 1

    52.55 3.6086 45.33-59.77 11111

    51.08 3.9171 43.25-58.92 11111

    36.92 2.1683 32.58-41.25 11111

    50.50 3.9355 42.63-58.37 1

    20.77 2.1184 16.53-25.00 11111

    42.03 4.2657 33.50-50.56 1

    41.62 4.0817 33.45-49.78 1

    46.08 4.2997 37.48-54.68 1

    35.60 3.9515 27.70-43.50 1

    43.24 3.9458 35.35-51.13 1

    55.97 4.0798 47.81-64.13 11111

    43.53 4.2503 35.03-52.03 1

    40.72 3.6191 33.48-47.95 1

    46.82 4.0205 38.78-54.86 1

    36.88 2.4927 31.90-41.87 11111

    48.93 3.0886 42.76-55.11 1

    51.77 2.9559 45.85-57.68 11111

    38.68 2.4662 33.75-43.62 1

    48.93 3.0886 42.76-55.11 1

    45.28 3.2817 38.72-51.85 1

    28.07 3.6801 20.71-35.43 11111

    46.20 3.1253 39.95-52.45 1

    48.37 4.7530 38.86-57.87 1

    50.50 3.9355 42.63-58.37 1

    39.48 3.1492 33.18-45.78 1

    39.02 2.8358 33.35-44.69 1

    38.62 2.9027 32.81-44.42 1

    232

  • Tabla 3 Muestras por conveniencia de 30 casos (continuacin) MEDIA ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

    37.13 4.1017 28.93-45.34 1

    43.63 3.9944 35.64-51.62 1

    45.95 3.4997 38.95-52.95 1

    36.72 2.5162 31.68-41.75 11111

    44.50 5.1851 34.13-54.87 1

    42.13 3.7422 34.65-49.62 1

    46.13 3.2478 39.64-52.63 1

    43.63 3.0695 37.49-49.77 1

    41.12 3.4571 34.20-48.03 1

    34.10 3.7280 26.64-41.56 11111

    35.60 3.9515 27.70-43.50 1

    44.63 3.3273 37.98-51.29 1

    46.63 3.2175 40.20-53.07 1

    52.08 3.6474 44.79-59.38 11111

    43.63 4.0405 35.55-51.71 1

    40.38 4.5304 31.32-49.44 1

    50.42 5.6712 39.07-61.76 1

    35.60 3.9515 27.70-43.50 1

    44.00 5.3473 33.31-54.69 1

    51.13 2.9852 45.16-57.10 11111

    38.00 3.8845 30.23-45.77 1

    47.42 2.8877 41.64-53.19 1

    233

  • Nombre _____________________________________ HOJAS DE TRABAJO PARA LOS RESULTADOS DE COMPUTADORA

    1. Revise el resumen de resultados en la tabla 1. Las figuras 1-10 presentan la

    distribucin de las medias muestrales para cada procedimiento. Qu conclusiones pueden obtenerse de estos resultados?

    2. Bajo qu condiciones el procedimiento de muestreo estratificado no exhibira ms

    eficiencia que el procedimiento de muestreo aleatorio simple? 3. Compare los resultados de computadora para los procedimientos de muestreo

    estratificado y aleatorio simple (figuras 1 a 4). Concluira que la eficiencia del procedimiento de muestreo estratificado fue mejor que la del procedimiento de muestreo aleatorio simple? Apoye su posicin.

    234

  • 4. En el muestreo estratificado, la educacin se seleccion como la variable estratificadora. Cul otra variable sera mejor? Apoye su posicin.

    5. El intervalo de confianza de 95% para el muestreo sistemtico (n = 30) inclua a para todas las muestras (vase la tabla 1). Qu caractersticas de la poblacin enlistada contribuye a esta exactitud?

    6. Qu condicin debe existir para que la muestra por conveniencia sea considerada una

    muestra aleatoria simple?

    235

  • 7. Compare los resultados de computadora para las muestras por conveniencia y aleatoria simple (figuras 1, 2, 7 y 8). Concluira que esta condicin especial (vase la pregunta 6) existe para estos datos? Apoye su posicin.

    8. Por qu result tan bien el procedimiento de muestreo por prorrateo (n = 30)? (Vase

    la tabla 1.) 9. Las tablas 2 y 3 presentan resultados de muestras individuales de un programa de

    computadora que calcula las medias y los intervalos de confianza e indica si la media poblacional () fue incluida en el intervalo de confianza. En la columna de la derecha, un 1 indica que fue incluida en el intervalo de confianza, mientras que cinco 1 indican que no se incluy en el intervalo de confianza. Compare los resultados de computadora para la muestra aleatoria simple (tabla 2) y la muestra por conveniencia (tabla 3). A qu conclusin puede llegar respecto a la razn por la que algunas muestras no incluyeron a en el intervalo de confianza?

    236

  • Respuestas a las preguntas proporcionadas en las hojas de trabajo para los resultados de computadora

    1. Revise el resumen de resultados en la tabla 1. Las figuras 1-10 presentan la

    distribucin de las medias muestrales para cada procedimiento. Qu conclusiones pueden obtenerse de estos resultados?

    a. Media de las muestras:

    1) La media de las muestras para n = 30 tiende a estar ms cerca de ($43.2) que para n = 10.

    b. Error estndar de la media

    1) El error estndar de la media para n = 30 es considerablemente menor que para n = 10.

    c. Porcentaje incluido en el intervalo de confianza:

    1) El intervalo de confianza inclua a la media poblacional en un mayor grado cuando n = 30 que cuando n = 10.

    2) Los mtodos de muestreo probabilstico funcionaron mejor que los mtodos de muestreo no probabilstico (con la excepcin del prorrateo, n = 30).

    3) La muestra por conveniencia (n = 10, n = 30) fue el peor mtodo.

    d. Distribucin de medias muestrales:

    Tanto los procedimientos de muestreo probabilsticos como los no probabilsticos exhiben distribuciones en forma aproximada de campana. Las muestras de n = 30 exhiben formas de campana mejores que las de n = 10.

    2. Bajo qu condiciones el procedimiento de muestreo estratificado no exhibira ms eficiencia que el procedimiento de muestreo aleatorio simple?

    a. Donde la variable estratificadora (educacin) no se correlaciona con los gastos de alimentos.

    237

  • b. Entre mayor es la correlacin es ms eficiente el procedimiento en comparacin con el muestreo aleatorio simple.

    3. Compare los resultados de computadora para los procedimientos de muestreo

    estratificado y aleatorio simple (figuras 1 a 4). Concluira que la eficiencia del procedimiento de muestreo estratificado fue mejor que la del procedimiento de muestreo aleatorio simple? Apoye su posicin.

    a. No.

    b. Apoyo:

    1) La distribucin de las medias muestrales (error estndar de la media) es similar para los procedimientos aleatorio y estratificado.

    2) El porcentaje de en el intervalo de confianza es similar para los procedimientos aleatorio y estratificado.

    3) La correlacin entre la variable estratificadora (educacin) y los gastos en alimentos parece ser baja (la correlacin real es r = .23).

    4. En el muestreo estratificado, la educacin se seleccion como la variable

    estratificadora. Cul otra variable sera mejor? Apoye su posicin.

    a. El nmero en la familia sera una mejor variable estratificadora.

    b. Apoyo:

    1) Esperara una correlacin mayor con el nmero de personas en la familia que con la educacin debido a la asociacin causal lgica entre el nmero de personas que se tienen que alimentar, la necesidad de alimento y la cantidad gastada en alimentos. (La correlacin para educacin es r = .23 mientras que para el nmero de personas en la familia es r = .43.)

    5. El intervalo de confianza de 95% para el muestreo sistemtico (n = 30) inclua a para todas las muestras (vase la tabla 1). Qu caractersticas de la poblacin enlistada contribuye a esta exactitud?

    238

  • a. La poblacin enlistada contiene un ciclo til, aunque imperfecto, por el nmero de personas en la familia, una variable de estratificacin excelente.

    b. Tomar una muestra sistemtica de una poblacin estratificada producir una muestra ms eficiente que una muestra sistemtica tomada de un listado de poblacin aleatorio. Esto asume que hay alguna correlacin entre la variable estratificadora y la variable de inters.

    6. Qu condicin debe existir para que la muestra por conveniencia sea considerada una

    muestra aleatoria simple?

    a. El listado de la poblacin debe ser aleatorio.

    7. Compare los resultados de computadora para las muestras por conveniencia y aleatoria simple (figuras 1, 2, 7 y 8). Concluira que esta condicin especial (vase la pregunta 6) existe para estos datos? Defienda su posicin.

    a. No.

    b. Apoyo:

    1) El rango de las medias muestrales es mayor para las muestras por conveniencia (n = 10, n = 30).

    2) El porcentaje incluido en el intervalo de confianza es menor para las muestras por conveniencia (n = 10, n = 30).

    3) El listado de poblacin agrupado por educacin y un tanto por nmero de personas en la familia.

    8. Por qu result tan bien el procedimiento de muestreo por prorrateo (n = 30)? (Vase

    la tabla 1.)

    a. Las variables de control de ingreso y nmero de personas en la familia tienen una asociacin lgica con la cantidad de gasto en alimentos. (Las correlaciones reales son: ingreso r = .38, nmero de personas en la familia r = .43.)

    239

  • b. Estas dos variables de control descartan muchas combinaciones de muestras no representativas.

    9. Las tablas 2 y 3 presentan resultados de muestra individuales de un programa de

    computadora que calcula las medias y los intervalos de confianza e indica si la media poblacional () fue incluida en el intervalo de confianza. En la columna de la derecha, un 1 indica que fue incluida en el intervalo de confianza, mientras que cinco 1 indican que no se incluy en el intervalo de confianza. Compare los resultados de computadora para la muestra aleatoria simple (tabla 2) y la muestra por conveniencia (tabla 3). A qu conclusin puede llegar respecto a la razn por la que algunas muestras no incluyeron a en el intervalo de confianza? a. La media de la muestra del valor extremo combinada con el error estndar

    promedio o por debajo del promedio de la media.

    b. Media muestral razonablemente representativa combinada con un error estndar de la media por debajo del promedio.

    TCNICA DE ENSEANZA

    Hemos encontrado que es til comenzar una clase sobre esta cuestin haciendo un sondeo de la clase con respecto a si el intervalo de confianza de las muestras tomadas por los integrantes de la clase contiene a la media poblacional o no. Haga esto para:

    1) Muestra aleatoria simple, n = 10.

    2) Muestra aleatoria simple, n = 30.

    3) Muestra por conveniencia, n = 10.

    240

  • 241

    Luego haga notar con rapidez a la clase el porcentaje de intervalos de confianza de cada uno de los puntos 1-3 anteriores que contienen la media poblacional verdadera. Estos porcentajes podran compararse luego con el resumen de resultados en la tabla 1 de la seccin Resultados de computadora para la seleccin de muestras. Es probable que sus resultados sean muy parecidos a los de la tabla 1 con excepcin de la muestra por conveniencia, n = 10. Nuestra experiencia indica que aqu los resultados pueden variar mucho. Por tanto, su clase puede encontrar que menos de 50% de los intervalos de confianza de la muestra por conveniencia (n = 10) contiene la media poblacional.

    Una vez que se hace esto, la clase procedera a responder una por una las preguntas de las Hojas de trabajo para los resultados de computadora.

    Esta cuestin abarca por lo general ms de un periodo de clase completo. El instructor puede desear reservar algn tiempo al final para un repaso breve sobre muestreo. Esto podra ayudar a robustecer los conocimientos sobre muestreo que, hemos encontrado, siempre surgen con el uso de este ejercicio.