Esta Di Stica

11
Métotlos y distribucianes de muestreo [ntrodueelón Los capÍtulos 'l a 3 acentuaron ias técnicas para describir los datos. Para ilustrar estas tácnicas, los precios de B0 vehículos vendidos el mes pasado en Whiiner Pontiac se oiganizaron en una clisiribución de frecuencia y se calcularon diversas medidas de ubica- cidn y clispersiórr. Tales mediclas son la media y la desviaciÓn estándar descritas en el preció típico de venta y la dispersión de éstos. En estos capítulos, el énfasis se puso en ia clescripción de la condición de los datos. Es decir, se describió algo que ya había ocurrido. En el capítulo 4 comenzantos a esiablecer las bases para la inferencia estadística con el estudio de la probabiiidad. Becuerde que, en la inferencia estadística, la meia consiste en determinar aigo relaiiv o a la población can base en la rnuestra. La poblaciÓn es el grupo iotal Ce iñdivicluos u objetos que se consideran, y la muestra es una pane o Jubconjunto de dicha población. En el capítulo 5 se ampliaron los conceptos de probabi- lidad pór medio de la descripción de tres distribuciones de probabilidad discreta: binomial, hipergeométrica;r cle Poisson. En el capítulo 6 se describió la distribución de probabilidad norráI, que es uña distribución de probabilidad continua ampliamente aplicable. Las dis- trib,uciones de probabilidac abarcan todos los resultados posibles de un experimenio y la probabilidad asociada con cada resultado. Se utilizan las distribuciones de probabilidad para evaluar algo que pudiera ocurrir. En este cápílulo comenzamos el estudio del muestreo. El muestreo es una herra- mienta para inferir algo respecto de una población mediante la selección de una muestra de esa población. A óontinuacion se oonstruye una distribución mu¡e$tral de rnedias de la muestra, para comprender la forma en que ésta tiende a agruparse en torno a la media de la población y la forma cje esta distribución tiencie a seguir una distribuciÓn normal. Se construirán intervalos de confiar¡za, que definen un rango de valores dentro del que es posible que ocurra el valor de la poDlación, Por último, se definen fÓrnrulas que cleterrli- nan el número de observaciones que se requieren para diversas situa.ciones de muestreo. Seleeeióm de Émuestras de la poblaeién En muchos casos, el muestreo es la única manera de determinar algo respecto de la población. Algunas razones poi- las que el mues[reo es necesario son: 1. El costo de estudiar a todos los inte- grantes de una población con frecuen- cia es prohibitivo. Las encuestas de opinión pública y las organizaciones de pruebas de consumidores, como las Gallup Polls and Marketing Facts, por lo general se ponen en contacto con me- nos de 2 000 familias de los aproxima- damente 50 millones de éstas que hay en Estados Unidos. Una organizaciÓn de paneles de consumidores cobra más o menos 40 000 dÓlares Por enviar muestras y tabular respuestas para pro- bar un producto (cereal para el desayu- no, comida para gatos o Perfume)' La misma prueba de producto, utilizando los 50 millones, costaría aproximadamente mil millones de dólares. 2. La idoneidad de los resultados de la muestra. Aun si se pudiera contar con los fondos, es dudoso que la precisión adicional de una muestra del 100 por ciento, es decir, el estudio de la poblaciÓn completa, sea esencial en la mayoría de las situacio- 22L i:,li ¡r¿

Transcript of Esta Di Stica

Page 1: Esta Di Stica

Métotlos y distribucianes de muestreo

[ntrodueelónLos capÍtulos 'l a 3 acentuaron ias técnicas para describir los datos. Para ilustrar estas

tácnicas, los precios de B0 vehículos vendidos el mes pasado en Whiiner Pontiac se

oiganizaron en una clisiribución de frecuencia y se calcularon diversas medidas de ubica-

cidn y clispersiórr. Tales mediclas son la media y la desviaciÓn estándar descritas en el

preció típico de venta y la dispersión de éstos. En estos capítulos, el énfasis se puso en ia

clescripción de la condición de los datos. Es decir, se describió algo que ya había ocurrido.

En el capítulo 4 comenzantos a esiablecer las bases para la inferencia estadística con

el estudio de la probabiiidad. Becuerde que, en la inferencia estadística, la meia consiste

en determinar aigo relaiiv o a la población can base en la rnuestra. La poblaciÓn es el

grupo iotal Ce iñdivicluos u objetos que se consideran, y la muestra es una pane o

Jubconjunto de dicha población. En el capítulo 5 se ampliaron los conceptos de probabi-

lidad pór medio de la descripción de tres distribuciones de probabilidad discreta: binomial,

hipergeométrica;r cle Poisson. En el capítulo 6 se describió la distribución de probabilidad

norráI, que es uña distribución de probabilidad continua ampliamente aplicable. Las dis-

trib,uciones de probabilidac abarcan todos los resultados posibles de un experimenio y la

probabilidad asociada con cada resultado. Se utilizan las distribuciones de probabilidad

para evaluar algo que pudiera ocurrir.En este cápílulo comenzamos el estudio del muestreo. El muestreo es una herra-

mienta para inferir algo respecto de una población mediante la selección de una muestra

de esa población. A óontinuacion se oonstruye una distribución mu¡e$tral de rnedias de la

muestra, para comprender la forma en que ésta tiende a agruparse en torno a la media de

la población y la forma cje esta distribución tiencie a seguir una distribuciÓn normal. Se

construirán intervalos de confiar¡za, que definen un rango de valores dentro del que es

posible que ocurra el valor de la poDlación, Por último, se definen fÓrnrulas que cleterrli-

nan el número de observaciones que se requieren para diversas situa.ciones de muestreo.

Seleeeióm de Émuestras de la poblaeién

En muchos casos, el muestreo es la única manera de determinar algo respecto de lapoblación. Algunas razones poi- las que el mues[reo es necesario son:

1. El costo de estudiar a todos los inte-grantes de una población con frecuen-cia es prohibitivo. Las encuestas de

opinión pública y las organizaciones depruebas de consumidores, como las

Gallup Polls and Marketing Facts, por logeneral se ponen en contacto con me-nos de 2 000 familias de los aproxima-damente 50 millones de éstas que hay

en Estados Unidos. Una organizaciÓnde paneles de consumidores cobra más

o menos 40 000 dÓlares Por enviarmuestras y tabular respuestas para pro-

bar un producto (cereal para el desayu-no, comida para gatos o Perfume)' La

misma prueba de producto, utilizando los

50 millones, costaría aproximadamentemil millones de dólares.

2. La idoneidad de los resultados de la muestra. Aun si se pudiera contar con los

fondos, es dudoso que la precisión adicional de una muestra del 100 por ciento, es

decir, el estudio de la poblaciÓn completa, sea esencial en la mayoría de las situacio-

22L

i:,li

¡r¿

Page 2: Esta Di Stica

222 Capítulo siete

nes. Por ejempro, el gobierno federal ütiliza una muestra de tiendas de abarrotesdispersas en todo Estados Unidos para determinar el índice *"nu*l del precio dealimentos. En er índice se incruyen ros precios de pan, frijoles, recr,e y átros arimentosimpodantes' Es poco probable que la inclusión de todaó las tiendas de abarrotes enel país afecte significativamente el índice, ya que ros precios de la leche, er pan y otrosalimentos impoftantes.por lo general no varíran más de uno. po.o. .ánt"uo. de unacadena de tiendas a otra.con frecuencia, ponerse en contacto.con toda ra pobración supondría muchotiempo. Talvszun candidato para un puesto de erección en erámbitó nacionarquier¿determinar sus posibilidades de elección. una encuesta aplicada a una muestra poruna empresa profesional, con personal regular y entrevistas de campo, tomaría sólouno o dos días. Con el mismo personaly éntrevistadores y trabajanóo siete días a lasemana ¡se necesitarían casi 200 años para ponerse en contacto con la totalidad dela poblaciÓn votante! Aun si pudiera reunirse una gran cantidad de entrevistadores,quizá el costo de ponerse en contacio con todos ios uotrni". no ,e justifique. si ercandidato fuera popular en extremo, la encuesta de muestreo indicará con gran cer_teza que el candidato recibiria entre el 7g y gl por ciento del voto popular, Fl gasto yel tiempo adicionales que se requieren para descubrir que dicho candidato recibiráexactamente er B0 por ciento der voto popurar, no parece justificarse,La naturaleza destructiva de ciedas pruebas. Si los catadores de rrino de SutterHome winery de california bebieran toáo d vino para evaluar la cosecha, consurni_rían la totalidad de ra cosecha, y no quedaría nada para vender, Fn er área de raproducción industrial, muchas veces las placas y cables de acero, y otros productosdel mismo tipo, deben tener cierta fuerza mínima de tensién. pará asegurar que elproducto cumple con la norma mínima, se elige una pequeña muestra. cada pieza seestira hasta que se rompe y se anota er puntó oe ruptulá, qr. párl" ó*nerar se mideen kilogramos por centímetro cuadrado (o en ribras por'purgádá.rááruda). obvia_mente, si se probara la fuerza de tensión de todos los cáoe! o placái no quedaríanada para la venta o er uso. por ra misma razón, Kodak sóro sereccioná una pequeñamuestra de perÍcura fotográfica para determinar ta catidad o* toJá ü ó"li.rrá ql," luproduce, y Burpee sÓlo prueba Ia germinacién de algunas semillas anils oe la épocade siembra.La imposibilidad física de verificar toejos los artículos de la poblacién. Las po_blaciones de peces, aveg, serpientes, mosquitos y otras simirares son grandes y es-tán en constante movimiénto, ro que incruye nacimientos v ,rá,tl-. rn vez de tratarde.contar a todos ros patos en canadá o todos ros peces *n .r rugo Eri--, * h*;estimaciones utilizando varias técnicas: como contar todos los patos en un estanqueelegido al azar, hacienco pruebas de nasas o corocando;"G. ;Lñ"res predeter_minados del lago.

¿La1111á

pag

con

en

sues

Tlós

I atr

iapcit

ti(

r.qtp

h(l

i

4.

iiii

,t'I

A

I Métodos de muestreo probabilísticoEn general, existen dos tipos de muestras:¿Qué es una muestra probabilistica?

Las probabilísficas y las no probabjlísticas.

Muebtra probabilístjia, ",'Múüé!!,i!.uéSl ra.geJego j onadad e tal f o rm a q u e c ad a art íc u I oó-Be¡qgna¡gntro.de,tapotot"g.1 i-á iá; (distinta, de cero)'dé,sei,inclüicia, en.lq,,fi uer*;a,

Losresubadosdeunmuestreo Si se hace el muestreo probabilístico, cada uno de los ar-tículos de la población tiene lano probabilístico puedeil estar misma oportunidad de ser elegido. sise utilizan metooós náf,roouuiti*ti"os, no todos' sesgados los artículos o personas en la póblación tienen la misma p*iuliá"á de ser incluidos. En talcaso' quizá los resultados estén sesgados, lo que signlficr qrá ""

posible que los resul-

l

il.,i

,ixiI

.H

tt,li

.llijrl

Page 3: Esta Di Stica

223Métodos y distribuciones de muestrea

lrroteslnyis de

t

ESTADÍSTICA

EN LOS HECI{OS

¡ eri P.ers cinnd I ou'a.'E!tÉ. -

tadosdelamuestranoseanrepresentativosdelapoblaciÓn,Elmu:Stleoporpanelesyelmuestreo de convenien-Jiá ,on oor*étodos

"":i,i"o"oni.ticos, Por ejemplo' un pahel

podrá consis tir de 2ooo óropietarios de gatos o dL madres de bebés recién nacidos' El

panet se forma ¡:ara "-ofCiiái5p'nione*

soÉre.una comic,a para gatos de reciente desarro-

*o, o de un nuevo pu""iá'Jr"Jrr"Oü puru beOés. La selecciÓn óe los miembrou-9:l!1::l

se basa en et criterio o" óri"" oii'gá'ta investigación, y por lo tanto, tal vez no sea repre-

sentativa deltotal de la población de propietutio. O"'guios o de las,nuevas madres (pues

no todos los dueños de gatos o las madres nu"*t iiJn*n oportunidad de ser selecciona-

dos). Los procedimientoiestadÍsticos que se usaron en este texto se basan en el muestreo

probabilístico. por lo tánto, en la siguiente ;;id sólo se analizarán los métodos de

muestreo Probabiiístico.Noexisteunmétodo..mejor,,paraseleccionarunamuestraprobabilísticadeuna

población de interés' óuiza er'método q* uu utiiit" pat? ¡'-1le^t^lP:ur

una muestra de

facturas de un cajón ;;;; ui iáOnuo para elegir una muestra nacional de votantes' Sin

embargo, todos tos *étodo, de muestreo póÉuniii.tito tienen similar finalidad: permitir

ái"á'l* ar,term¡ne los aftículos o personas que incluye la muestra'

Muestreo aleatorio sfunPle

El tipo que más se utiliza es un muestreo aleatorio simple'

Frluestre¡raleatoriosimptreUnamygst¡aseleccionadadernodog!9,""31ffi:"d;ü."#;H;;;ü;5;;" "ñ

ru póor""ión tensa tas mismas probabilidades

cie ser incluido.

laiquierasstr¿ p9¡raría sólodias a ialrlidad de'tadgrgg,:ytue. Si

)rán 9g¡".t gasto y,recibirá.

e Sutterrnsumi-ra de la)ductosr gue el .:

lteza se:e mideObvia.

uedaria

lqueña.$ue sebpoca

:

as po-syes-¡ tratarhacen;angue:deter-

rne laodosln talesul-

.;?prorimadamete 5 Por

.::ciento más qqe qürenes

á-:tie¡en un aspecto norma],

il.Quienes a su vez ganan un 5

- por ciento más que sus

homólogos de asPecro

:' co*iente' Esto es verdad Parait ho*bru, Y Puta mujeres''También

es válido Para una

amplia variedad de

ocuPaciones, desde el trabait'r

en la construcción a la

reparación de automóviles Y a

ias ventas Por teléfono,

ocugaciones en 1as que

¡rarecería que 1a aPariencia no

debiera imPortar.

Ilna tabla de nútneros

aleatorios es una formaeficiente de seleccionar los

niembros de lct muesfta

Paraiiustrarelmuestreoaleatoriosimple,supongaqueunapoblaciÓnconstadelos845 empleados que trabajan en Nitra tnoustries. 5e háde seleccionar una muestra de 52

empleados de esa poOfác1án. Una forma cte aseguiar que todos los empleados tengan la

misma oportunidad o"-# "r"éiáoá

es escribiiprimero el nombre de cada uno en un

papel y colocar todos los papéles en una u'n"' L'*go de haberlos.revuelto en forma

minuciosa, se hace Ia primera selección tomanáo un"papel de ia caia sin mirarla' Este

;;;t;;; iepite rrasta haber seleccionado la muestra de 52 personas'

Un método *a. conuániente cle seleccionar una muestra aleatorla es usar el número

deidentificaciÓndecadaempleadoyunatabladenúmeros,aleatorios,comolaque;ó"¿; en et apéndic;E.-¿fi" to iñdica el nombre, estos números se generaron me-

diante un proceso aleatoño. Para cada dígito de un número, la probabilidad de 0' 1 ' 2' " ' '

geslamisma.Porlotanio,laprobabilidaddeseleccionaralempleadonÚmero0].1eslamisma que para ur .,"nór"áoo ízz o puruet número 382. El sesgo se eiimina del proceso

de selecciÓn.Unapartedeunatablaoenúmerosale"átoriosapareceenla'siguienteiiustraciÓn.

para utilizar esta tabla "oiJptopO.ito

de seleccionar una muestra de empleados' prime-

ro se etige un punto or"ó"tt¡h" áñ ráiaora Cualquier punto de partida sirve' Suponga que

son las s:04 horas. se podría observar ra tercixá columna y luego descender hasta el

cuarto coniunto O" n6Á"ió". El número es OgzSó. Debido a que sÓlo hay 845 empleados'

se utitizarán los ires pritiiü ;igiü; ¡" un númlro aleatorio de cinco dígitos- Por lo tanto'

037 es el número del primer empleado qu" sátá *iembro de lamuestra. otra forma de

seleccionar el punto de partida es cerrar los ojos y apuntar a un número de la tabla' Para

continuar seleccionando a los empleados, se pue'de'mover en todas direcciones' supon-

ga que el movimiento á. á Lu áerecha. t-os pritiáros tres dígitos de la ciÍra a Ia derecha de

03759 son 447: el número dotsegundo riu*oió o" la muéstra. Los primeros tres dígiios

del siguiente número a la derecha son 961. 5" *"rtu este número porque sólo hay 845

empleados. se continúa a la derecha v ru.*r".óLna alempleadoTB4,luego 189 y asi

sucesivamente'

¡Jiscrimir,ar!ón se ]iev?

i',ri14 rtqde su:eheif¡¡-e-tde,

i*¡taide.¡6@4eE

Page 4: Esta Di Stica

224 capítulo siete

50525 5745472507 5338034986 74297

68851 2730506738 628791 1 448 107s4

2845553827001 44

ffisslosor olosesz

Y

WzsIr zssolzqsgtv

96'1CB491691 0420

68226 3465642486 5446538676 89967

38884 39Cl n71819 gllode886e sszai

189101891094496

[Jso de una tabla de nú.meros

rtleatorios para impedir eI

sesgo

"r'Y[S'"1338,.ff.Yfl"il#3t"JJ,g?:;iffiiJ irustra aún más er uso de una tabra de

En 18 bodegas en url depósito del ejércit-o estadounidense, se encontraban 1g6 gl0insumos mititares diferentes, tares cáÁállantas, tuórcas Éñ; orugas de tanque vrines para ,antas. En cad_a oooega náoá naves, y en cada nave había depósitos. porejempro, en ra bodega i z se arriáce-náLn partes para vehÍcuros de motor. La nar,.e

Í33;1"i""r?'lli;;;'iffi:]tL;enares óára jeeps La;á;"tod;;pósito 3, tenatapfiEi probrema suponía sereccionar un estante de una bodega ar azar,y contar ernúmero de artículos que contenra,'Lr"go se comparaba el-conteo físico contraet número que ros registros oe inv¿Átarüiidicaoan q; Jil";;;aber. Así, er probre-ma era básicamente de inventario fisico, que abarcaba uurióá rotoocls de muestreo.El obieti'o del proyecto oe investigááion consistia en cetermrnar qué tan precisoseran rcs registros. para asegurar "quá-caoa

depósito i;;á l;'r,.,nu oporlunidadde ser sereccionado, se empieó un" troru o" nb,náiárá"lriro. a fin de escooerbodesa, nave y estanre. si se s"láóáioiáo, lu n"o"óá slñáiá iss, depósito 6,in.verifrcador iba a ese iugar a contur ái n.,]r.,ero da ili;r". iul uutuoun en ese de_

¿Por qué se eligio un método tan oneroso,, en cuanto a tiempo, para seieccionar rosoepÓsitos que serían parle de lu tr".tiui iu -otra

aiternatjva era permrtir a ros verjficado-res contar ros anícuros^er cuaresquiera oepásito" que ei,gierá,iiü.'.i"ros. sin duda,los verificadores habrían evrtado contar ros-áñórios ón.ráie.qri"iát"poritos que contu_vleran partes pesadas "" f^r:: :: é ;;, ;H;á, tamoián-rr-a"olán' üio,.uoo ros depós itosen la parte más arta, a seis metroJpo,, un"*á der suero oer ár.a"tnl La omisión de rosar1ículos en esos deoósitos oei ¡nueniañá iriáo poorlu haber sesgado ros resurtados: esdecir' habríia dado una imagen farsa de iá pé.Lion de ros registros.

t-I

liI

11\I

AUTOEVATUACIÓN 2.1La lista de clase, que se encuentra en la página 228, enumera a los alumnos inscr¡tos en unculso de introducción a ra estadística c" i",

""óó"ás. Se sereccionr^ u t*'".tudiantes, a

ff:::* se res harán ,,arias preguntas respectJ der contenido y mérodo de instrucción der

Page 5: Esta Di Stica

18199

)7 44

En u,7 fluestreo sistemótico' el

priwer artículo se elige al o'zar

Métodos v disttibuciones de Ínuestreo

. luégb,, s'e'tórh*eede

Muestreo aleatorio sistematico

Eiprocedimientode|muestreoaleatoriosimplepuedeser-difícrlenciertoscasos'Porejempio, suponer qru ruioüáLién que i"tur..u-"ón.iste de 2 000 facturas que se locali-

zan en cajones. Tomar *iu *uárttu aleatoria runli¡u requeriría primero numerar las factu-

ras, ciel 0000 ai r ggS. úiiilza"Jo úna tabla de números aleatorios' se seleicionaría iuego

unamuestrade,porejemplo,l0Onúmeros'Lueqo'enloscajonesdeberálocalizarseunaÍactura que concuerd"'.Jn ó"áu uno de..touióO n¿.mero's' Estatarea puede requerir

mucho tiempo. En vez i¿ átálr" óoátia seteccioriai uÁa muestra aleatoria sistemática

recorriendo simptemeiJ tos'caones, contanló lás facturas y tomando todas las que

hagan et número ,o o"] g;ó", *á dl -:yOiá. ü p.mera fa.ótura debería elegirse utili-

zando un proceso aleatoiio: por eiemplo, unu iáüá áe números aieatorios' si se eligió la

decima factura "oro'birnio"ie

pa,tiba, ru *'ñiiá "onsistiría

en las facturas décima'

trisésima, quincuagesiñr"á,"="ói'áéáiit"' d;úil " que et primer número se elise al

azar, todos tienen la #;" d;ü¡Éiuáao o. .Já""ionarse para ia muestra' Por lo tanto'

iá ti"tu de un muestreo probabilístico'

2?5

NIVEI,

e{enÉvrrcoSEGI'NDO

PRIMERO

SEGUNDO

SEGUNDO

TERCERO

JV IU391 04496

n tabla de

l

n 186 8103 tanque yisitos, Porrr. La nave

enía tapo-

i contar el

co contrael proble-muestreo.r prccisos

)ortunidade escogerisito 6, un;n ese de.

;cionar losverificado-Sin duda,

¡ue contu-depósitos;ipn de los

{[ados: es

i

)s en un

ianteg, a

nión del

: ,l

ffi

¡¡JtMueo

ATEATORlO

00

01-

o2

03

04

05

06

a7

08

09

l011

r2

9:40 A,Ivl MW

NIVSL

ece¡ÉurcoSEGUNDO

SEGUNDO

PRIMERO

PRIMERO

SEGI]NDO

TERCERO

SEGUNDO

TERCERO

SEGUNDO

TERCERO

CUARTO

CUARTO

TERCERO

TERCERO

SEGUNDO

SEGUNDO

SEGUNDO

TERCERO

PRIMERO

SEGII}{DO

SEGUNDO

SEGUNDO

TERCERO

r¡últuno

AI,EATORIO

23)^?q

26

a9

to

30

3l-

33

341q

36

37

38

3Y

40

4!4)

43

44

45

SEGUNDO

SEGUNDO

TERCERO

SEGUNDO

CUARTO

SEGIJNDO

SEGUNDO

CUARTO

SEGUNDO

SEGUNDO

SEGUNDO

SEGT]NDO

SEGUNDO

,SEGUNDO

SEGUNDO

SEGUNDO

SEGI'NDC

TERCERC

1"3

I4l-5

16

CSPM 254 01

B:10 AM

NOMBRE

ANDERSON, RAYMOND

ANGER, .CHERYI, RENEE

BAI,],, CLAIRE JEANETTE

BERRY, CHRISTOPHER G

BOBAK, ,IAMES PAT4rcK

BRIGHT, U. STERR

CHONTOS, PAU], .IOSEPH

DETLEV, BRTAN I{ANS

DUDAS, Vf OLA

DULBS, RICHARD ZAI'FA

EDINGER, SUSA}Í KEE

FINK, FRANK JAMES

FRANCIS, JAMES P

GAGHEN, PA}{ELA I,YNN

GOUI,D, ROBYN KAY

GROSENBACHER, SCOTT ALAN

HEETFIELD, DIANE MARIE

KABAT, JAIVIES DAVID

KEMP, LISA ADRI4NE

KII,],ION. MICI{EI,LE A

KOPERSKT, ¡¿eRY pr,r,uN

KOPP. BRIDGETTE ANN

LEHMANN, KRISTINA MARIE

ccrQs Y ¡coxouÍe¡stnpÍstrce PARA NEGI

ST 1.18 I,IND D

NOMBRE

MEDI,EY, CHERY], ANN

MITCSELL, GREG R

MOLTER, KRlSTl MARIE

}IULCAHY, STEPHEN ROBERT

NICHOT.AS, ROBERT CT{AR]'ES

N]CKENS, V]RGINIA

PENNYWITT, SEAN PATRICK

POTEAU, KRIS E

PRICE, I{,ARY I,YNETTE

RTSTAS, JAIqES

SAGEi", ANNE MARIE

SMII,I,IE, HEATHER MICHELI'E

SNYDER, ],EfSHA KAY

STAHL, MARIA TASHERY

ST. JOHN, AIqY J

STURDEVA}IT, RICHARD P-

SWETYE, LYNN MICHETJE

WALASINSKI, MICHAEI'

WAI,KER, DIANE ELAINÉ

WARNOCK, JENNIFER MARY

WI],I,IAMS, WENDY A

YAP, HOCK BAN

YODER , ARL/I]\ UA¡

l718

19

20

2!22

Page 6: Esta Di Stica

226

En ciertas circunstancias, unam uestra si stemática p o dr á

producir resultado s sesgados

Una muestra estraürtcadagarantiza la representación de

. cadasubgrupo

Capítulo siete

No obstante, no debe utiliza-rse un muedtreo sistemálico si exíste un patrón o aregloque se relacione con el elemento de interés. Por ejemplo, "n "r ""tuáiá

iel inventario físicoque se mencionó antes, algunos de los ám"""n"a en el depósito t¡enen naves con unaaltura de seis depósitos. rñ la fila inferior se áncuentran los artícuios de movimiento másrápido, como la grasa, pintura. en aerosol para retocar y ar1ículos oé t"""i"riá.'"a;ü;artículos se colocan en el.nivel del piso put" ác"e* ertraúalo áe iós oespacr,acores quedeben.entregar ras requisiciones. En ta partemas arta se ""¿;;;;; üs artícuros de mo_vimiento más lento, como rines para ilantas, orugas para tanques y percutores para gati_llos' En las cuatro filas intermedias están bé artíCuroé o" r.nouiitLniJie rapioez modera-da' como llantas, faros para automóvil y chavetas. si se utilíza un muestreo sistemáticopara verificar el inventario, entonces es muy posible que se etijá una muestra sesgada.

9up91gu que el procedimientode muestreá'pádía que se nicieráuna setección cada tresdepósitos, y el primero que.se eJige gs el depósito'n¡*"ro-1. lr"*, .. seteccionaríansistemáticamente tos depósitos 1,-4, 7, j0, j5; 16, 19 y 22.

+ Artículos de movimiento lento

Artículos de movímiento moderadamente rápido

Artículos de mor¡imiento rápicio

Este procedimiento sistemático seleccionó cuatro depósitos llenos con artÍculos demovimiento relativamente rápido, y otros cuatro que están llenos con artícuios de mo-vimiento rápido o lento. La divisióá poi ritáá"u de ta muestra no coincide con las ca-racterísticas reales de la población. La población consiste en 16 depósitos con movimien-to de relativa rapidez y cuatro de aft'auros de movimiento rápido o rento. Sin duda, ros

F;*lt"oot de la muestra estanan sesgados ñacia tos artículói-Je rnovimiento rápido o

Muestreo aleatorio estratificado

otro tipo de muestreo probabilístico es er muestreo areatorio estratificado.

Muestreo aleatorio estratificado se divide una pobración en subgruposllamados estratos, y se serecciáil;;;r;.tra de cada uno de eros^

Una vez que la población se divide en estratos, es posible seleccionar una muestraproporcignal o no proporcional. como el nombre lo ¡mpraá, un p.'"ááir¡.nto de muestreol,:o!?:clo!al

requiere que er número de artícuros de cada "rtruto "rtá.n

ra misma propor-cron que en ta pobración. por e;empro, er probrema poorirsáiá.1J0¡ar ros gastos depublicidad de ras 3s2 empresas estadounidenses mayores. suponer que er objetivo derestudio consiste en determinar si las empresas con altos rendimientos sobre su inversión(una medición de ra rentabiridad) rran ga;táá;una mayor proporción de su presupuestode ventas en publicidad que las emprés". qr" tienen ún r"nb. ránJi*iento o incluso undéficit' suponer que las 352 empresar uá ávioi"ron "n

c¡ÁááLir"b; (Véase ta itustra-ción 7-1.) si se han de sereccionar pur, ., ".trdio

intensivo, por deci¡ 50 empresas,

l

':frlLirl

'j::!'j

I

C) iiF,.f.,'e 18 l+El

5 B tt 20

I ,K.&i ¿t

3 :i t3

2 11 14 23

lz !.i!trF¡ÉOA

Page 7: Esta Di Stica

Métodos y distribuciones de tnuestreo 227

IluStraCién 7- 1 Número seleccioñado para una nuestra aleatoria estratificada proporcional

i unamás:sioSquemo-gati-era-riicorda.;lreS

riían

-..,,',,Bentábirid"d

r::.:, { ndimiento

-9ü.$Bl+]nversón)

Número Númerode firmas muestreado Se encuentra por

1 3.9:Pof c.l.ento Y mása::::,:, : i'r'!r:li:'a::3a", lrr.,i

R1 - x50352

5

352

entonces se debería incluir una empresa con nivel de rentabilidad de 30 por crento p más,

cinco empresas en el estraio de 20 a 30 por ciento se seleccionarían al azat, etcétera.En una muestra estratificada no proporc¡onal, la cantidad de artículos que se selec-

cionan en cada estrato no guarda proporción con los números respectivos en la pobla-ción. lndependientemente.de que se use un procedimiento de muestreo proporcional ono proporcional, cada elemento o persona en la población tiene la misma opoñunidad deque se le seleccione parala muestra.

,"usi,íy"!l3i i"1'31;fJ,#ffi:::%:l5T[[e*l]"ff" ?,.""Jl?ig::¿X?;,i:'',,-,"il["3sistemático. Observar en la ilusiración7-1 que el 2 por ciento de las empresas tienen un

rendimiento sobre la inversión de 30 por ciento o más (estrato 1)y el 1 por ciento tiene un

déficit (estrato 5). Si se tomara una muestra aleatoria simple de 50 empresas, quizá porazar no se habría seleccionado ninguna empresa en los estratos I o 5. Una muestraaleatoria estratificada aseguraría que al menos una empresa del estrato '1 y otra del estra-to 5 están representadas en la muestra.

Muestreo por conglomerados

El muest¡:eo por conglomerarlos Otro tipo común de muestreo es el muestreo por conglomerados. Muchas veces se leredttce el costo del muestreo emplea para reducir el costo. de realizar un muestreo de una población dispersa en una

gran área geográfica. Suponga que desea determinar el punto de vista de los industria-

les de Texas, sopre las polÍticas federales y estatales de protección del entorno. La selec-cién de una muestra aleatoria de los industriales de Texas y el contacto personal con cadauno de ellos serían muy onerosos en cuanto a tiempo y dinero. En lugar de ello, se podríaemplear el muestreo por conglomerados subdividiendo el estado en unidades pequeñas,ya fueran condados o regiones. Muchas veces, éstas se conocen como unidades prima-nas. Suponga que se subdividió el estado de Texas en "12 unidades primarias y luegoescogió cuatro de ellas: las marcadas con los números 2,7, 4 y 12, y se concentrÓ el

esfuerzo en estas unidades primarias. Usted podría tomar una muestra aleatoria de losindustriales en cada una de estas regiones y los entrevistaría (observe que se trata de unacombinación del muestreo por conglomerados y el muestreo aleatorio simple)'

':i+. '-: .¡;L

.':' '' Déftóit

...:.,,:-:lCil3[.:

to

1

50

1,15

QA

-X5Uó32

18S_x5uaE

115

-X5Ueqt

Á

-x5u352

a

f,

,l

li)

I

.-i

ri,He'io-

in-

OS

o

Page 8: Esta Di Stica

228

Númerode identi-ficación

Muchos otros métodos de

muestrco

Distribuidor

Númerode identi-ficación Distribuidor

La discusiÓn de los métodos cle muestreo en las secciones precedentes no incluyó latotatidad de ros métodos de muestreo de que dispone ,i r"á.iiááior cuando ustedtoma parte en un proyecto de investigación en mercadotecnia, finánzas, contabilidad uotras áreas, quizá requiera consultar líóros dedicados de manera exclus¡va a la teoria y eldiseño de muestras.

Capítulo siete

AUTOEVAI,IJACIÓN 7-2

Ejercicios

I A continuación se enumeran ios 35 miembrcs de la Ascciación cle Disiribuidores de Automóviles del Área \4etropoiitana de Tulsa, Oklahoma.

Númerode ldenti-ficación Dishlbuidor

00

01

02

03

04

05

UC'

07

08

09

10

11

Dave White Acura

Autcfair Nissan

Autof air Toyota-suzuki

George Ballis Buick GMC liuckYark Automotive GroupBcb Schmidt Chevrolet

Bo\,vling Green Lincotn Mercury Jeep EagleBrondes Ford

Erown Honda

Brown Mazda

CharlieS Dodge

Thayer Chevrolet Ceo Toyota

Spurgeon Chevrolet Motor Sales, lnc.Dunn Chevrolet.Olds

Don Scott Chevroiet-pontiac-Geo. lncDave White Chevrolet Co.

Dick Wilson Pontiac

Doyle Pontiac Buick

Franklin Park Lincoln MercuryGenoa lvlotors

Great Lakes Forcl Nissan

Grogan Towne Chrysler

Hatfield Olds-Honda

K¡stler Ford, lnc,

Lexus of Tulsa

lvlaihews Ford Oregon, lnc.

Nodhtowne Chevrolet-GEO

Quality Ford Sales, lnc,

Touen Chrysler plymouth Jeep FagleSaturn of Tulsa

Ed Schmidt Pont¡ac Jeep Eagte

Southside Lincoln Mercury

Valiton Chrysler Flymouth

Vin Divers

Whitman Ford

12

JE

14

t5

16

17.18

19

2A

21

23

24

25

zo

27

28

t()

30

31

33

34

al

b)

se desea seleccionar una muestra aleatoria de cinco agentes distribuidores. Los númerosaleatoriosson0s,20,59,2l ,31 ,28,49,38,66,08,29y02.¿Quédistribuidoresquedaríanen la rnuestra?utilice el cuadro de números aleatorios para seleccionar una muestra pfjrsonal ce cjncodistribuiCcres.

Page 9: Esta Di Stica

Métodos y distribuciones de muestreo 1'to

c) Una muestra ha de consistir de un distribuidor de cada grupo de slete. Se selecciona elnúmero 04 como punto de partida. ¿Qué distribuidores se incluyen en la muestra?

2. A continuación se enumeran los 27 agentes de seguros de Nationwide lnsurance en el área dela ciudad de Toledo, Ohio.

Númercde ¡den-tificación Agente

Númerode iden-tificación Agente

Númerode iden-tificación Agenle

;luyó lausted

ridad utnYel

UU

01

02

03

o4

05

06

Bly Scoit íJ332 V/ Laskey Rd

Coyle Mike 5432W Central Av

Denker Brett 72f45 Airport H.wy

Denker Rollie 7445 Airport Hwy

Farley Ron 1837 W Alexis Rd

George Mark7247 W Central Av

G¡bellato Garlo 6616 Monroe St

3521 NavarreAv

Glemser Cathy 5602 Woodville Rd

Green Mike 4149 Holland Sylvania Rd

09 Harris Ev 2026 Albon Rd 18

1 0 Heini Bernie 71 10 W Central 19

11 H¡nckley Dave 20

14 N Holland Sylvania Rd 21

12 Joehlin Bob 3358 NavarreAv 2213 Keisser David 3030 W Sylvan¡a Av 2314 Ke¡sser Keith 5901 Sylvania Av 24.15 Lawrence Grant 342 W Dussel Dr 25

16 Miller Ken 2427 Woodville Rd 26

17 O'Donnell Jim7247 W Central Av

Priest Harvey 51 13 N Summit St

Riker Craig 2621 N Reynolds Rd

Schwab Dave 572 W Dussel Dr

Seibert John H 20'1 S Nlain

Smithers Bob 229 Superior St

Smithers Jetry 229 Superior St

Wr¡ght Steve 105 S Third St

Wood Tom I12 Louisiana Av

Yoder Scott 6 Willoughby Av07

08

bl

Se desea una muestra aleatoria de cuatro agentes. Los números aleatorios son 02, 5g, 51 ,

25, 14,29,77,69y 18. ¿Qué agentes se incluirían en la muestra?Utilice el cuadro de números aleatorios para se¡ecaionar una muestra personal de cuatro

Una muestra debe consistir de un agente de cada cinco, Se elige el número 2 como puntode partida, ¿Qué agentes deberán estar incluidos en la muestra?

tr ttError" en el muestreoEl análisis anter¡or acentuó la importancia de seleccionar una muestra a fin de que todoslos artículos de Ia muestra tengan la misma oportunidad de ser elegidos. Para lograr esio,se puede seleccionar una muestra aleatoria simple, una muestra sistemática, una mues-tra estratificada, una muestra por conglomerado o una combinac¡ón de estos métodos.Sin embargo, es improbable que la media de Ia muestra fuera idéntica a la media de lapoblaciÓn. Asimismo, talvez la desviación estándar u otra medición que se calcule conbase en la muestra no sea exac¿amente iguat al valoi'correppondiente de la población.Así, es posible que existan ciertas diferencias entre las esfadisiicas de la muestra, como lamedia o la desviación estándar de la mue3tra , y los parámefros de población correspon-dientes. La diferencia entre un estadístico de la muestra y un parámetro de la población seconoce como error de muestreo.

Suponga que las calificaciones de eficiencia de una población de cinco empleadosde producción fueron 97, 103, 96, 99 y 1ob, Asimismo, suponga que una muestra de doscalificaciones, 97 y 105, es seleccionada para calcular la media de la muestra. Ésta sería101, que se obtiene mediante (97 + 105)/2. Otra muestra de dos calificaciones sería: 103y 96, con una media de la muestra de 99.5. La media de todas las calificacioneq (es decir,lá media de la población) es 100, que se encuentra mediante: (97 + 103 + 96 + Ó9 + 105)/5 = 500/5 = 100. El error de muestreo de la primera muestra es de 1 .0, que se determ¡napor X - p =

-l 01 - 100. La segunda muestra tiene un error de muestreo de -0.5. Ambasdiferencias, 1.0 y -0.5, son el error que se comete al estimar la media de la población

a)

c)

.:*.:*.aa'' '"',l ,é:, ':]!

!¡irl ,::-,i,:

:::;l:!,!

;::!:,'l::rl

:n

¡:i::!.

*i¡

, ,i.ri,li::}:|:rijil

lf^c l:1..1t:

¡ían .,rtt¡r:

I ::¡¡$i'

r L:i

Page 10: Esta Di Stica

Capíttilo siete

mediante una media de la muestra, y,es-tos enores de muestreo se

tamaño de estos errores variará de una muestra a otra.deben ai azar. ?l

[.as meáias de muestraYarían

de una ffiuestrc a la siguiente

I Distribución nnuestral de las mediasde las muestras

Una vez que se clescubrió la posibilidad del error de muestreo cuando se utilizan los

resultados de la muestra para estimar el parámetro de una población, ¿cÓmo es posible

hacer una predicción precisa sobre el éxito de una pasta de dientes de reciente desarrollo,

con base sólo en los resultados de la muestra? ¿De qué manera puede el departamento

de aseguramiento de la calidad de una empresa que se dedica a la producciÓn masiva

liberar un embarque de microprocesadores; con base en una muestra de sólo diez unida-

des? ¿Cómo pueden Gallup o Harr,is hacer una predicción precisa de una votación presi-

denciái con base en una muestra de sólo 2 000 votantes registrados, de una poblaciÓn de

casi g0 millones de votantes? Para responder a estas preguntas, se examina la distribu-

ción muestral de las medias de la muestra'El ejemplo de calificación de eficiencia ilustró que las medias de muestras difei-enies

pueden variar de una muestra a otra. La media de la calificación de eficiencia de la primera

muestra de dos empleados fue de 'i 01 , y ta media de la segunda m'¡estra fue de 99.5. Es

probable que el resultado de una tercera muestra fuera diferente. La media de la pobia-

ción era 1OO. Si se organizaran las niedias de todas las muestras posibles de dos caltfica-

ciones en una distribución de probabilidad, se obtendría una dist.ribución rnt¡estral de

las medias de las rnue$tras,

El ejemplo siguiente ilusrra la construcción de una distribución muestral de Ias medias

de las muestras.

Tartus industries tiene siete empleados de producciÓn (tamaño de la poblaciÓn). Los

salarios por hora de cada uno de ellos se enlistan en la. ilustraciÓn 7 -2

1. ¿Cuál es la media de la Población?2. ¿Cuál es la distribución muestral de las medias del rrruestreo para muestras de

tamaño 2?

IlUStfaCión 7-2 Salaúos por hora de los empleados de producción de Tartus Industries

Sálarió por hora

', !r

'.i

$z7

II7

II

.'Joe,'Sám

Sue

:rBob'

Jan,,:Á( '.:,

teo

Page 11: Esta Di Stica

los!bie

,ilio,

nto;ivad^ud-

J5f -

'Cebu-

rtes

era

tsJta-

ca-de

,,i+'.,.í:

jil

Métodos y distribuciones de muestreo

3. ¿Cuái es la media de ia distrlbución muestral?4' ¿Qué se puede decir de la pobración y de ra distribución muestrar?

"1 , La rnedia de la población es $Z.Zl, que se encuentra mediante:

n!(rV - n)!

231

Solución

* - $7 + $7 + $8 + $g + $z + $g + $g7

2' Para llegar a la distribución muestral de las medias de las muestras, se selecciona-ron todas las muestras de tamaño dos sin remplazo de la población y se calcula-ron las medias. Existen 2'1 muestras posibles, que se encuentran utilizando lafórmula (4-t 0) de la página j S0.

7t

2(7 - 2\t-\'donde /v = 7 es el número de artículos en la población y n = 2 es el número deartículos en la muestra

Las 21 medias de todas las muestras posibles de tamaño dos que es posibletomar de la poblaciÓn se muestran en la ilustración 7-3. Esta distribución de pro-babilidad es la distribución muestral de las medias de muestras y se resume en lailustración 7-4.

3. La media de la distribución muestral de las medias de muestras se obtiene suman-do las diversas medias de muestras y dividiendo la suma entre el número de mues-tras. Por lo general, la media de todas las medlas cie la muestra se escribe p;, pnos recuerda que es un valor de población, porque se consideraron todas'lasposibles medias. El subíndice X indica que es la distribución muestral de las me-dias.

/vt

.. suma de todas las medias de las muestrasnúrnero de medias de las muestras

4r aovlw¿ d__2

nizt

Haga referencia al diagrama 7-1.

Ilustracién 7-3 u"diu. de muestra para todas ras muestras posibles de dos empleados

al

SalarioMu€stra Empleados por hora Suma Med¡a

10

14IF

'16

17

1B

10

20

21

Sue, Bob $8, $8Sue, Jan 8, 7

Sue, Art 8, 8

Sue, Ted 8, 9

Bob, Jan 8, 7

Bob, Art B, B

Bob, Ted 8, g

Jan, Art 7, IJan, Ted 7, IAñ, Ted 8, I

$16 $8,00

15 7 .50

16 8.00

17 8.50

15 7.50'16 8.00

17 8.50

15 7.50

16 8.00

17 8.50