La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

17
7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 1/17 La estadística es más que el cálculo de promedios y porcentajes. Específcamente, se trata de hallar el rango de valores dentro del cual pueden encontrarse los datos o la mayoría de ellos, es decir, caracterizar su variabilidad y, más generalmente, su distribución completa. Conocer la distribucin de los datos es importante. !n promedio puede tener signifcados muy dierentes seg"n sea la #orma en que se distribuyen los valores. Cuando se quiere obtener conclusiones respecto de toda la población pero no es posible, o no es deseable, registrar datos de esa poblacin completa, se los obtiene de alg"n subgrupo o muestra de la población. Este proceso se denomina inerencia estadística. $. Los datos son noticia $.% Encuestas de opinin !na encuesta de opinin es un mecanismo para acercarse a la visin que tiene el conjunto de la sociedad, o alg"n subgrupo, sobre un determinado tema. &e utilizan di#erentes m'todos( preguntas en la calle, por tel'#ono, mediante citas previas, etc. )eneralmente, requieren respuesta voluntaria. $.$ *azn, tasa y porcentaje Una razón es el cociente entre dos cantidades. +or ejemplo, La razn de ni-as a ni-os es de $ a / signifca que hay $ ni-as por cada ni-os. 0o debe entenderse que slo hay $ ni-as y ni-os en el grupo. Las razones se e1presan utilizando los t'rminos más bajos para simplifcar lo más posible. 2sí, esta razn e1presa la situacin de un curso de 3 alumnos con %3 ni-as y %4 ni-os, o de un colegio con $44 chicas y 44 chicos. Una tasa 5o velocidad6 es un cociente que reeja una cierta cantidad por unidad. +or ejemplo, un automvil se desplaza a 73 8m por hora 5la unidad es una hora6, o la tasa de robos en un barrio, $ robos por cada %.444 hogares 5la unidad es %.444 hogares6. Un porcentaje es un número entre 0 y 00 que mide la proporción de un total. +or ejemplo, cuando decimos que una camisa tiene un %49 de descuento, si el precio original 5el total6 es : ;4, el descuento es de : ;. &i decimos que el $39 de la poblacin está a #avor de un período de cuatro días de trabajo a la semana, y la poblacin tiene 34.444 habitantes, entonces son %<.344 534.444 1 4,$3 = %<.3446 los que están a #avor. La proporcin de los que están a #avor es 4,$3. > !n porcentaje del $39 es lo mismo que una proporcin de 4,$3 > +ara convertir un porcentaje en una proporción! se divide al porcentaje por %44. > +ara convertir una proporcin en un porcentaje, se multiplica la proporcin por %44. $.$. ?ariaciones relativas Cuando un porcentaje se utiliza para determinar un aumento o reduccin relativa 5relativa al valor inicial6, se denomina variación porcentual. "ariación porcentual# se toma el valor despu's de/ y se le resta el antes de/, luego se divide ese resultado por el antes de/. 2sí, se obtiene una proporcin. +ara trans#ormarla en un porcentaje se multiplica el resultado por %44. Las reducciones se re@ejan en variaciones porcentuales negativas. Las variaciones relativas se pueden e1presar como variaciones porcentuales o proporciones. Una tasa es un cociente. *e@eja una cantidad dividida por una cierta unidad. +or ejemplo una velocidad, espacioAtiempo 58mAhora6, es una tasa. $%u&l es el estadístico correcto' Bepende. uchas veces la respuesta en un ámbito estadístico es( depende. Bepende de la pregunta que queramos responder. &i nos interesa evaluar el '1ito de la política de educacin vial deberíamos utilizar tasas de muertesD pero si organizamos el servicio de ambulancias importa la cantidad de accidentes y no los motivos 5aumento de vehículos, aumento de la poblacin, aumento de la cantidad de conductores imprudentes6. La estadística interviene activamente en todas las etapas que componen el m'todo científco. 2unque para el m'todo científco no e1ista una secuencia "nica, se-alamos los siguientes pasos generales( > planteo de preguntas,

description

datos teoricos

Transcript of La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

Page 1: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 1/17

La estadística es más que el cálculo de promedios y porcentajes. Específcamente, se trata dehallar el rango de valores dentro del cual pueden encontrarse los datos o la mayoría de ellos, esdecir, caracterizar su variabilidad y, más generalmente, su distribución completa. Conocer ladistribucin de los datos es importante. !n promedio puede tener signifcados muydierentes seg"n sea la #orma en que se distribuyen los valores.Cuando se quiere obtener conclusiones respecto de toda la población pero no es posible, o noes deseable, registrar datos de esa poblacin completa, se los obtiene de alg"n subgrupo omuestra de la población. Este proceso se denomina inerencia estadística.

$. Los datos son noticia

$.% Encuestas de opinin!na encuesta de opinin es un mecanismo para acercarse a la visin que tiene el conjunto de lasociedad, o alg"n subgrupo, sobre un determinado tema. &e utilizan di#erentes m'todos(preguntas en la calle, por tel'#ono, mediante citas previas, etc. )eneralmente, requierenrespuesta voluntaria.

$.$ *azn, tasa y porcentajeUna razón es el cociente entre dos cantidades. +or ejemplo, La razn de ni-as a ni-os esde $ a / signifca que hay $ ni-as por cada ni-os. 0o debe entenderse que slo hay $ ni-as y ni-os en el grupo. Las razones se e1presan utilizando los t'rminos más bajos para simplifcar lo

más posible. 2sí, esta razn e1presa la situacin de un curso de 3 alumnos con %3 ni-as y %4ni-os, o de un colegio con $44 chicas y 44 chicos.Una tasa 5o velocidad6 es un cociente que reeja una cierta cantidad por unidad. +orejemplo, un automvil se desplaza a 73 8m por hora 5la unidad es una hora6, o la tasa de robosen un barrio, $ robos por cada %.444 hogares 5la unidad es %.444 hogares6.Un porcentaje es un número entre 0 y 00 que mide la proporción de un total. +or ejemplo,cuando decimos que una camisa tiene un %49 de descuento, si el precio original 5el total6 es :;4, el descuento es de : ;. &i decimos que el $39 de la poblacin está a #avor de un período decuatro días de trabajo a la semana, y la poblacin tiene 34.444 habitantes, entonces son %<.344534.444 1 4,$3 = %<.3446 los que están a #avor. La proporcin de los que están a #avor es 4,$3.> !n porcentaje del $39 es lo mismo que una proporcin de 4,$3> +ara convertir un porcentaje en una proporción! se divide al porcentaje por %44.> +ara convertir una proporcin en un porcentaje, se multiplica la proporcin por %44.

$.$. ?ariaciones relativasCuando un porcentaje se utiliza para determinar un aumento o reduccin relativa 5relativa alvalor inicial6, se denomina variación porcentual.

"ariación porcentual# se toma el valor despu's de/ y se le resta el antes de/, luegose divide ese resultado por el antes de/. 2sí, se obtiene una proporcin. +aratrans#ormarla en un porcentaje se multiplica el resultado por %44.

Las reducciones se re@ejan en variaciones porcentuales negativas.Las variaciones relativas se pueden e1presar como variaciones porcentuales o proporciones.

Una tasa es un cociente. *e@eja una cantidad dividida por una cierta unidad. +orejemplo una velocidad, espacioAtiempo 58mAhora6, es una tasa.

$%u&l es el estadístico correcto' Bepende.uchas veces la respuesta en un ámbito estadístico es( depende. Bepende de la pregunta quequeramos responder. &i nos interesa evaluar el '1ito de la política de educacin vial deberíamosutilizar tasas de muertesD pero si organizamos el servicio de ambulancias importa la cantidad deaccidentes y no los motivos 5aumento de vehículos, aumento de la poblacin, aumento de lacantidad de conductores imprudentes6.

La estadística interviene activamente en todas las etapas que componen elm'todo científco.2unque para el m'todo científco no e1ista una secuencia "nica, se-alamos los siguientes pasosgenerales(> planteo de preguntas,

Page 2: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 2/17

> planifcacin y realizacin de los estudios,> recoleccin de datos,

> análisis de la in#ormacin,> obtencin de las conclusiones

2unque en sí misma es una ciencia que se dedica al desarrollo de nuevos m'todos y modelos, laestadística es una disciplina que o#rece un conjunto de ideas y herramientas para el tratamientode datos. En este sentido, podemos decir que se trata de una disciplina metodolgica, sunecesidad se deriva de la omnipresencia de la variabilidad. Los estadísticos trabajan junto ae1pertos en di#erentes disciplinas.

(a estadística est& involucrada en el proceso que va desde la recolección de laevidencia! el planteo de las preguntas! )asta )allar las respuestas.

Lo importante es que haya preguntas. +ara hallar respuestas se pueden seguir di#erentescaminos.

3. Los conceptos requieren de palabras específcas para seridentifcados.La estadística tiene su propio vocabulario.El primer paso es determinar el grupo de personas a ser estudiadas! o sea determinar lapoblación en estudio.El segundo paso es recolectar los datos. 2quí aparecen varias cuestiones que nos permitenilustrar más t'rminos específcos. Cuáles individuos serán encuestadosF, esto es, cuál será lamuestraF &e los elegirá en #orma aleatoria de manera que todos los socios tengan la mismaoportunidad de ser seleccionadosF Gu' variables 5edad, g'nero6 serán importantes en relacinal tema central de la encuesta 5candidato pre#erido6F

3.% !nidades muestrales2 los objetos de inter's de un estudio se los denomina unidades muestrales o simplementeunidades. uchas veces, las unidades muestrales son individuos( tornillos, personas, tubos depasta dentí#rica, lamparitas. Htras veces, las unidades están compuestas por muc)osindividuos# ciudades, escuelas, lotes 5de tornillos6 etc.

3. ?ariablesLas variables son características que pueden cambiar de una unidad muestral a otra, comola edad de las personas, la poblacin de cada ciudad, el porcentaje de alumnos reprobados deuna escuela, la preerencia de una comida balanceada para un animal, la intensidad deemisin de rayos I de cada televisor, la capacidad de almacenamiento de un disco rígido, lalongitud de un tornillo, la duración o el consumo de una lamparita.

0o con#undir una unidad muestral como objeto completo y di#erenciado que seencuentra dentro de un conjunto 5una docena tiene doce unidades6 con las unidades quese utilizan para valorar una magnitud 5el metro es una unidad de longitud6.

3.$ +oblacin+ara cualquier pregunta que interese responder, primero es necesario dirigir la atencin a ungrupo particular de unidades muestrales( personas, ciudades, animales, televisores, discosrígidos, tornillos o lamparitas.&e llama población a todo el grupo de unidades muestrales 5generalmente son individuos6que interesa estudiar con el fn de responder una pregunta de investigacin. Las poblaciones, sinembargo, pueden ser di#íciles de defnir. En un buen estudio, los investigadores deben defnir lapoblación con toda claridad.

uchas veces, los investigadores quieren estudiar y sacar conclusiones sobre una población

amplia pero, con el fn de ahorrar tiempo, dinero, o simplemente porque no se les ocurre nadamejor, slo estudian una población muy restringida. Esto puede conducir a serios problemasal momento de sacar conclusiones.

3.7 uestra

Page 3: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 3/17

Los investigadores quieren averiguar algo sobre una poblacin, pero no tienen tiempo o dineropara estudiar a todos los individuos que la con#orman. +or lo tanto, qu' hacenF &eleccionan unacantidad peque*a de unidades muestrales de la población 5esto se llama una muestra6,estudian esas unidades, generalmente individuos, y utilizan esa in#ormacin para sacarconclusiones sobre toda de la poblacin.

!na buena muestra debe ser representativa de la poblacin. Esto signifca, que todaslas características importantes de la poblacin tienen que estar en la muestra en lamisma proporción que en la población.

!na muestra tiene, en peque-o y lo más parecidas posibles, las características de la poblacin.+odremos sacar conclusiones respecto de la poblacin total a partir de una muestra Jesto es,realizar una in#erenciaK, para todas aquellas características en las cuales la muestra representa ala poblacin.

+n la vida real! es muy di#ícil que una muestra tenga proporciones id'nticas a laspoblacionales, pero deberían ser muy parecidas en todas las características que se puedanconocer.

. uestreo.% uestreo aleatorio simpleEs bueno que la muestra se seleccione en #orma aleatoria, esto signifca que(

%ada uno de los individuos de la población tiene la misma oportunidad de serseleccionado.

> &e utiliza alg"n mecanismo probabilístico para elegirlos.> La gente no se selecciona a sí misma para participar.> 0adie en la poblacin es #avorecido en el proceso de seleccin.

-uestra aleatoria simple# !na muestra aleatoria simple es la que se obtiene a partirde un mecanismo que le da a cada una de las unidades muestrales la mismaprobabilidad de ser elegida.

El muestreo aleatorio 5el proceso por el cual se obtiene una muestra aleatoria6 comienza conuna lista de unidades muestrales de la que se e1traerá la muestra. Esta lista se llama marcomuestral. Mdealmente, el marco muestral debería contener la lista de la totalidad de lasunidades muestrales.El muestreo aleatorio simple tiene dos propiedades que lo convierten en el procedimientopor e1celencia de obtencin de muestras.

> Nodas las unidades tienen la misma oportunidad de ser elegidas 5es insesgado6.> La eleccin de una unidad no in@uye sobre la eleccin de otra 5independencia6.

+l nstituto /acional de +stadísticas y %ensos K M0BEC realiza peridicamente censospara registrar las características básicas sobre poblacin y vivienda, actividad econmica y

agropecuaria de nuestro país. Las unidades relevadas en los censos proveen el marco muestralpara las encuestas que realiza durante los períodos intercensales.

&e espera que el muestreo aleatorio provea muestras representativas de la poblacin.ediante un censo se intenta registrar todas las unidades muestrales de la poblacin paraproveer el marco muestral. &i se trata de un censo de poblacin, deberán localizarse todas laspersonas. &i se trata de un censo econmico, se registrarán todos los locales comerciales yproductivos. !na vez que se dispone del marco muestral se abre la oportunidad de seleccionar lamuestra. +or otra parte, es necesario aclarar que una unidad muestral puede contener muchosindividuos. !na escuela, con sus alumnos, puede ser una unidad muestral. El objetivo del estudiopueden ser las escuelas 5por ej. interesa conocer la superfcie cubierta por alumno6 o ser losalumnos 5por ej. interesa conocer el rendimiento en educacin #ísica6.

-uestra aleatoria simple en dos pasos #+aso %. &e asigna una etiqueta num'rica a cada individuo de la poblacin.+aso ( &e utilizan n"meros aleatorios para seleccionar las etiquetas al azar.

. uestras malas

Page 4: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 4/17

Cada vez que mire los resultados de un estudio, busque la #rase muestra aleatoria/. &i laencuentra, hile más fno para averiguar cmo #ue obtenida y si en realidad #ue elegida en #ormaaleatoria.

 Nodos los días encontramos ejemplos de muestras malas#> Cuando se pide a los oyentes de un programa de radio que voten por tal o cual cantante,llamando por tel'#ono o enviando un mensaje de correo electrnico, se trata de muestras derespuesta voluntaria. Las encuestas de opinin en las que se llama, o se escribe, por propiainiciativa son ejemplos de muestras de respuesta voluntaria, poco satis#actorias desde un puntode vista estadístico.

> Htro tipo de muestra mala es la muestra de conveniencia. &i una pedagoga elige a suspropios alumnos, del "ltimo a-o de la escuela secundaria en la que trabaja, para evaluar uncambio en el m'todo de ense-anza, los resultados no se podrán e1tender más allá de ese grupo.

.$ &esgoEs un #avoritismo de alguna etapa del proceso de recoleccin de datos benefciando algunosresultados! perjudicandootros y desviando las conclusiones en direcciones equivocadas.

Cuando alguna etapa del proceso de recoleccin de datos está sesgada, utilizar una

muestra grande no corrige el error! simplemente lo repite.

.$.% &esgo por eleccin de la muestra.$.%.% uestras por convenienciaHbtener una muestra de esta manera es rápido y econmico, pero la gente que contactan no esrepresentativa de la mayoría de la poblacin.

.$.%. uestras con sesgo personal+or simpatía, gusto o inter's, quien está realizando la encuesta puede pre#erir encuestar a ciertotipo de personas y no a otras.

.$.%.$ uestras de respuesta voluntaria&urgen a partir de los individuos que se o#recen voluntariamente a participar. &e trata, porejemplo, de las que alimentan las votaciones organizadas por programas de radio, televisin ode alg"n sitio de Mnternet. 0o producen resultados que tengan alg"n signifcado en relacin a laopinin de la poblacin en general. Los participantes voluntarios, que por alg"n motivodecidieron participar, suelen tener opiniones más polarizadas.

.$..% Bebido a la presentacin de las preguntasLas di#erentes palabras con las que se puede presentar una misma pregunta suele ser una#uente importante de sesgo en las respuestas.El sesgo debido a la #orma en que se presenta una pregunta puede ser intencional o no

intencional.

.$.. +ara tratar de agradar2 la gente no le gusta mostrarse con ideas que no están bien vistas socialmente. +or ejemplo,cuando est' cara a cara con un encuestador o llenando un #ormulario no annimo, un varnevitará una respuesta que parezca machista, o una mujer responderá tratando de ocultar alg"nprejuicio.

.$..$ +or recuerdo&i la pregunta está re#erida a un acontecimiento ocurrido alg"n tiempo atrás, la respuesta tendráun sesgo por recuerdo.

.$..7 +or no respuesta2lgunas veces las personas que han sido seleccionadas para una encuesta son muy di#íciles delocalizar o simplemente se niegan a responder. (os individuos que no responden puedenser muy dierentes de los que sí lo )acen. Este tipo de sesgo se puede reducir sustituyendoa los se niegan a responder por otros individuos con las mismas características de los que noresponden, pero suele ser di#ícil.

Page 5: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 5/17

Cuando mire los resultados de una encuesta que le interesa especialmente, antes de sacar suspropias conclusiones averigOe qu' se pregunt, cmo #ueron redactadas las preguntas, si lasrespuestas #ueron dadas en #orma annima o no y cuántos se negaron a responder. Es más #ácilobtener muestras malas que buenas.

.$..3 +or subcubrimiento!na encuesta tele#nica ignora a todos los sujetos que no tienen tel'#ono. !na encuesta querealiza las entrevistas en hogares ignora a los que viven en la calle.

.7 Htros tipos de muestreos.7.% uestreo sistemático

-uestreo sistem&tico# El muestreo comienza con una unidad elegida al azar y a partirde allí contin"a cada 8 unidades. &i n es el tama-o muestral y 0 es el tama-o de lapoblacin entonces 8 es apro1imadamente 0An.

Este tipo de muestreo permite evitar el sesgo personal y es más sencillo que el muestreoaleatorio. Es "til cuando la poblacin está ordenada naturalmente 5si no lo está, para utilizar estetipo de muestreo es necesario ordenarla, pero al ordenarla, se pierden las ventajas que tiene6.+or su simplicidad, se suele utilizar para control de calidad durante, o al fnalizar, la

#abricacin de diversos productos.

1dvertencia# Este muestreo no es adecuado cuando el período de la seleccin está relacionado conalguna característica que nos interesa evaluar.

2l realizar un muestreo sistemático es importante estar alerta para identifcar los #actores quepuedan estar invalidando los resultados.

.7. uestreo aleatorio estratifcado

En un muestreo estratifcado la poblacin se divide en grupos homog'neos llamadosestratos. Luego se realiza un muestreo aleatorio simple de unidades muestrales dentrode cada estrato.

Los estratos se eligen de acuerdo con los valores conocidos de algunas variables, de manera quehaya poca variabilidad dentro del estrato 5los valores de dichas variables para las unidadesde un estrato particular diferen poco6, pero que haya muc)a variabilidad entre estratos 5losvalores de dichas variables para las unidades de distintos estratos diferen mucho6.

2res pasos de un muestreo aleatorio estratifcado#3 4aso # las unidades se agrupan en estratos. Los estratos se eligen teniendo en cuenta queestos grupos tienen un inter's especial dentro de la poblacin, o porque los individuos en elestrato se parecen mucho.3 4aso 5# se establece la proporcin de unidades, o racción de muestreo! que se incluirá

para cada estrato3 4aso 6# dentro de cada estrato se realiza un muestreo aleatorio simple y la proporción deindividuos que se incluye en la muestra es la establecida en el paso . La unin de lasmuestras de cada estrato constituye la muestra completa.

.7.$ uestreo por conglomerados

En un muestro por conglomerados la poblacin se divide en grupos )eterog7neosllamados conglomerados. Luego se realiza un muestreo aleatorio simple en el que lasunidades muestrales son los conglomerados.

La idea del agrupamiento para un muestreo aleatorio por conglomerados 5tambi'nllamados aglomerados6 es opuesta a la del muestreo estratifcado. Mnteresa que los individuosque componen cada grupo sean lo más heterog'neos posibles y se espera que cadaconglomerado sea representativo de la poblacin. Los conglomerados son las unidades delmuestreo! pero las unidades de inter's son los individuos dentro de los conglomerados. &eselecciona una muestra aleatoria de conglomerados, y se observan todos los individuosdentro de cada conglomerado se selecciona una muestra aleatoria simple dentro del

Page 6: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 6/17

conglomerado. Este tipo de muestreo puede tener mejor rendimiento costoKe#ectividad que unmuestreo aleatorio simple, en especial si los costos de traslado son altos.

2res pasos de un muestreo aleatorio por conglomerados#3 4aso # Los individuos se agrupan en conglomerados. Los conglomerados generalmentetienen una pro1imidad #ísica, pero dentro de cada conglomerado las unidadesson heterog'neas.3 4aso 5# Los conglomerados son las unidades muestrales. &e establece la proporcinde unidades que se incluirá.3 4aso 6# &e realiza un muestreo aleatorio simple de conglomerados y se estudian todos

los individuos de cada conglomerado seleccionado. El tama-o fnal de la muestra esla cantidad de individuos que componen todos los conglomerados seleccionados.

.7.7 uestreo multietápico.

!n muestreo multiet&pico tiene dos o más pasos y, en cada uno de ellos se aplicacualquiera de los procedimientos de seleccin anteriores.

<. Batos J variablesLos datos num'ricos son valores de variables num'ricas.

Los datos categricos son valores de variables categricas.

Las variables son características que pueden tomar valores di#erentes de una unidada otra, como la edad de las personas, la cantidad de habitantes de cada ciudad, laduracin o el consumo de una lamparita.

Los datos son los valores observados delas variables.

Las variables tienen un nombre y un valor para cada individuo de la poblacin.Los datos son los valores observados KmedidosK de las variables para los individuosde una muestra.

Los datos solos dicen muy poco, si no sabemos a qu' variables corresponden.<.% ?ariables num'ricas y variables categricasLos datos num7ricos son valores de variables num'ricas. Los datos categóricos son valoresde variables categricas.La estadística trata con n"meros, pero no todas las variables son num7ricas.La mayoría de las variables 5y por consecuencia tambi'n de los datos6 se pueden clasifcar ennum7ricas y categóricas. Nambi'n se los denominan cuantitativos y cualitativosrespectivamente.

+ara analizar variables categricas se utilizan cantidades! proporciones yporcentajes.

8istribución de una variable# La distribucin de una variable nos dice cuáles son susposibles valores y con qu' #recuencia aparecen.

&e trata de recuencias absolutas. (a suma de las recuencias da como resultado lacantidad total de datos

(a recuencia relativa es el cociente entre la #recuencia absoluta y la cantidad total de datos.&u suma es %.

Cuando las #recuencias relativas están e1presadas en porcentaje, la suma es %44.

<.%.% )ráfcos para datos categricos<.%.%.% )ráfcos circulares

9r&fco circular# &e utiliza para representar la distribucin de los valores de unavariable categrica. El círculo representa el total de los datos. Cada sector dentro del

Page 7: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 7/17

círculo representa una categoría con el ángulo proporcional a su tama-o 5cantidad oporcentaje que pertenece a dicha categoría6.

Los gráfcos circulares permiten visualizar cmo las partes #orman el total, aunque es más di#ícilcomparar ángulos que longitudes. Estos gráfcos no son buenos para comparar con precisin lostama-os de las di#erentes partes, para eso lo gráfcos de barras son mejores. Los gráfcoscirculares muestran sectores de área proporcional al porcentaje del totalcorrespondiente a cada grupo o categoría, pero generalmente no muestran la cantidad total encada grupo, en t'rminos de unidades originales 5pesos, n"mero de personas, etc.6. Este en#oquese traduce en una p'rdida de in#ormacin.

0o se puede ir de los porcentajes a los valores originales sin el conocimiento del total. Esta #altade in#ormacin puede ser un verdadero problema, por ejemplo, cuando los gráfcos muestran losresultados de una encuesta de opinin. +ara evaluar el margen de error del porcentaje depersonas que respondieron a la pregunta de una manera determinada es necesario sabercuántas personas respondieron la encuesta.

<.%.%. )ráfcos de barras(os gr&fcos de barras se utilizan para representar la distribucin de los valores deuna variable categrica.

Las categorías se representan en el eje horizontal y la cantidad, o el porcentaje, de datos en eleje vertical. (a altura de las barras sobre cada categoría representa la cantidad de datos decada una de ellas. Nal como ocurre con los gráfcoscirculares, divide a los datos en grupos correspondientes a las categorías y muestra cuántos, oqu' porcentaje de individuos pertenecen a cada categoría. ientras que los gráfcos circularesutilizan #undamentalmente porcentajes para indicar el tama-o de cada clase, los gráfcos debarras utilizan tanto cantidades como porcentajes.

<.%. Bos variables categricas2 menudo los gr&fcos de barras se utilizan para comparar dos grupos! dividiendo labarra de cada categoría en dos y mostrándolas una al lado de la otra.

P. Hrigen de los datosCuál es el tipo de estudio adecuado para responder una pregunta enparticularFP.% Censos, encuestas, estudios observacionales y e1perimentales.Cuando un estudio se basa en consultar toda una poblacin se denomina censo.

%enso# El objetivo de un censo es obtener un registro de todos los miembros de unapoblacin en la #orma más completa posible. &e relevan las variables principales quepermitan la elaboracin del marco muestral para #uturas encuestas.

!n estudio puede ser muestral! cuando sus resultados están basados en in#ormacin obtenidaa partir una muestra. Este es el caso de la mayoría de los estudios de mercado, encuestas deopinin, evaluacin de drogas, etc. En todos estos casos, el objetivo es obtener conclusionesrespecto a la poblacin de la que se obtuvo la muestra.

+ara muchas investigaciones, provenientes tanto del ámbito privado como p"blico, no esrazonable realizar un censo por el tiempo y costo que involucra. ás aun, los intentos porrecolectar datos completos de una poblacin llevan muchas veces a in#ormacin de menorcalidad. !n estudio muestral bien dise*ado! y cuidadosamente conducido, es por lejossuperior a un estudio poblacional 5censo6 con mal dise*o o con escasos recursos. :i unapregunta est& redactada en orma conusa! sus respuestas pueden no tener ningún

signifcado! aunque )aya respondido toda la población.

En una encuesta el inter's está en obtener inormación sobre toda la poblaciónestudiando una parte de ella, es decir una muestra. &e intenta recoger in#ormacin sinperturbar o modifcar a la poblacin para no a#ectar la calidad de los resultados. E1istennumerosos procedimientos para recoger la in#ormacin a trav's de un muestreo. )ran parte dela in#ormacin que nos llega surge de encuestas.

Page 8: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 8/17

Los estudios pueden ser observacionales o e;perimentales. Nodos los estudios observacionales comparten un principio( <sólo mire=. &i le interesaestudiar los hábitos de los pájaros de un bosque y para ganarse su confanza les o#rece migas depan estará modifcando su comportamiento, entonces ya no será un estudio observacional puro.

Las encuestas son estudios observacionales, pero no todos los estudios observacionalesson encuestas.

un estudio e;perimental se quiere modifcar un comportamientoD no slo observar a los

individuos o realizar preguntas sin perturbar. :e impone en orma deliberada unamodifcación de las condiciones para observar las modifcaciones generadas.

P. +ueden estar mal los datosFLos buenos datos son el resultado de un en#oque inteligente y un gran es#uerzo. Los datos malosresultan de la #alta de cuidado, poco entendimiento del problema o incluso de la intencin deproducir resultados deliberadamente errneos. Cuando escuchamos resultados impactantescomo los anteriores, lo primero que tenemos que preguntarnos es( con qu' calidad de datos seobtuvieronF

P.$ 2spectos 'ticos

2 continuacin, describiremos estándares básicos que se deben cumplir en la realizacin de unestudio que toma datos de personas, ya sea observacional o e1perimental(

> La organizacin que lleva adelante el estudio tiene que tener una junta que revise poradelantado los estudios planifcados, para proteger a los sujetos participantes de un posibleda-o. Los hospitales suelen tener un comit7 de 7tica que se encarga de realizar ese control.> 2ntes del inicio, todos los individuos que participan en el estudio tienen que dar unconsentimiento inormado. Nienen que ser in#ormados, con anterioridad a la realizacin delestudio, sobre la naturaleza del mismo y el riesgo que ocurra alg"n da-o.> En una encuesta 5estudio observacional6 no hay da-o #ísico posible, se debe in#ormar qu' tipode preguntas se realizarán y cuánto tiempo ocupará responderlas.

> En los estudios e1perimentales los sujetos deben recibir la in#ormacin sobre la naturaleza yel objetivo del estudio y una descripción de los posibles riesgos. Luego deben e1presarsu consentimiento, generalmente por escrito.> Nodos los datos individuales se deben guardar en #orma confdencial. &olamente se pueden dara conocer resultados resumidos para grupos de individuos.

;. Estadísticos/yparámetros/Cuando un estadístico se calcula en base a los datos de toda la poblacin, ese resultado sedenomina parámetro.

La proporcin que se obtiene a partir de una muestra es un estadístico! lo llamamos p

El promedio de sus edades es un par&metro! lo llamamos media de la variable edad. +ero siseleccionamos una muestra de socios y calculamos el promedio de sus edades obtenemos unamedia muestral. La media muestral 5capítulo %P6 es un estadístico, cuyo valor depende de lamuestra elegida, se parecerá a la media poblacional5el parámetro6 pero en general no será igual. La media poblacional generalmente se indica por laletra griega mu, >.4ar&metros y estadísticos# Cuando el conjunto de datos proviene de la poblacincompleta, el valor del estadístico es un par&metro.

!n par&metro es un n"mero que describe la población! pero en la práctica casi nunca

sabremos cuál es ese n"mero porque no podemos conocer per#ectamente a toda lapoblacin.

Cuando el conjunto de datos proviene de una muestra, el n"mero obtenido es elestadístico que se utiliza como una estimación del par&metro.

Page 9: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 9/17

(a dierencia entre el parámetro y el estadístico es el error de estimación.

%4. ?ariabilidad entre muestra y muestra+sto signifca que el valor del p estadístico varía de muestra a muestra.

La primera ventaja de las muestras aleatorias es que eliminan el sesgo del procedimiento deseleccin de una muestra. 2"n así, suele no coincidir el resultado con el verdadero valor, debidoa la variabilidad que resulta de la seleccin al azar. Este tipo de variabilidad es llamadavariabilidad muestral.

Gue la variabilidad muestral sea muy grande, signifca que el valor del estadístico cambiamuc)o entre muestra y muestra. +or lo tanto no podemos creerle al resultado queobtenemos con una muestra en particular. +ero estamos salvados por una segunda ventajaque tienen las muestras aleatorias( la variacin entre muestra y muestra 5de unmismo tama-o6 seguirá un patrn predecible. Este patrn predecible muestra que(

(os resultados de muestras de mayor tama*o son menos variables que los resultadosde muestras m&s c)icas.

+ara ver cuánto le podemos creer al resultado de una muestra debemos preguntarnos qu' pasaría sitomásemos muchas muestras de la misma poblacinF

%4. argen de error+or suerte, los estadísticos han estudiado el problema de hallar el margen de error en general.Encontraron que cuando se utiliza una proporcin muestral p calculada a partir de una muestraaleatoria simple de tama-o n para estimar una proporcin poblacional p desconocida, con unaconfanza del ;39, el margen de error en un muestreo aleatorio simple seráapro1imadamente de . 2l aumentar el tama-o de la muestra se reduce el margen deerror.

Cuanto mayor sea el tama-o de la muestra, -+?@A.

+l margen de error no depende del tama*o de la población! únicamente depende del

tama*o de la muestra. Esto es cierto cuando la muestra es slo una peque-a parte de lapoblacin, tal como ocurre en la mayoría de las encuestas.

Gu' signifca <margen de error=FEl margen de error mide la di#erencia má1ima que se espera tener entre un resultado obtenidoa partir de una muestra y su valor poblacional verdadero, el ;39 de las veces.

%4.$ Error debido al muestreo aleatorio&e trata de errores aleatorios! surgen de utilizar una muestra en vez de la poblacin total.

%4.7 Errores que no son debidos al muestreo aleatorio

+odemos llamar equivocaciones a algunos de estos errores. +ueden ocurrir en cualquierencuesta e incluso en los censos. Estas equivocaciones son posibles en todos los pasos, desde elregistro del dato hasta obtencin fnal del valor del estadístico. 2ctualmente, con el uso deprocedimientos computarizados para muchos de los cálculos, se han reducido los errores decálculo.Htro tipo de errores son los debido a la presencia de sesgos en el muestreo, en las respuestasyAo en su registro 5seccin .$6. +or ejemplo, pueden ocurrir cuando un encuestado miente. Lollamamos sesgo de respuesta. !n respondente puede mentir respecto de su edad, de cuántashoras trabaja por día 5puede pensar que trabaja poco y entonces las aumenta6, de su salario5puede no querer que se sepa que gana mucho, o que gana poco6 o puede haber olvidadocuantos paquetes de cigarrillos #um la semana anterior.

(o que no mide el margen de error( /o mide el error que se comete debido al sesgo en elmuestreo, ni el generado por las respuestas incorrectas y su registro. Estos pueden ser muygrandes, en comparacin con el llamado margen de error y no se reducen al aumentar eltama-o de la muestra.

%%. Estudios e1perimentales

Page 10: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 10/17

El secreto está en la comparacin. )rupo tratamiento versus grupo control.Cuando en un estudio se impone un cierto grado de control sobre los participantes y su entorno,como cuando se restringe una dieta o se administra una determinada dosis de un medicamento,se trata de un estudio controlado. Los participantes del estudio se asignan a dos o más gruposmediante un mecanismo aleatorio. Cada grupo recibe, por ejemplo, una dosis prefjada de unadroga o di#erentes drogas alternativas. Construimos así un e;perimento comparativoaleatorizado! llamado tambi'n simplemente estudio controlado.

El objetivo de la mayoría de los estudios e1perimentales es se-alar una direccin causae#ectoentre dos variables. &e intenta resolver interrogantes del tipo( cuál es la relacin entre consumo

de alcohol y problemas de visinF

El e1perimento es aleatorizado cuando los sujetos han sido asignados a los distintos gruposmediante un mecanismo aleatorio.El e1perimento es comparativo cuando sus conclusiones se obtienen comparando los resultadosde los distintos grupos. &e espera que los grupos slo diferan en la característica estudiada.

%%..% )rupo tratamiento versus grupo controlel grupo control se compone de individuos no tratados, o que reciben un tratamiento estándarbien conocido, cuyos resultados se compararán con el tratamiento nuevo.

!n placebo es un tratamiento #also e inocuo, como una píldora de az"car. 2 menudo se da a losmiembros del grupo de control, para ocultar si están tomando el tratamiento 5por ejemplo,+aracetamol6 o no están recibiendo ning"n tratamiento en absoluto.+l placebo es dado a los participantes asignados al grupo de control! precisamente conel fn de controlar el #enmeno llamado eecto placebo# los pacientes in#orman alg"n tipo dee#ecto cuando tienen la percepcin de estar realizando un tratamiento, como tomar una píldora5aunque sea una píldora de az"car6.

En un e;perimento ciego los participantes del estudio no saben si est&n en un grupode tratamiento o en un grupo de control. !n e1perimento a ciegas intenta eliminarcualquier sesgo de respuesta del sujeto debido a la in#ormacin que recibe. !n paciente puedesentir una mejoría simplemente por saber que está tomando un medicamento de "ltimageneracin muy bueno, o sentirse mal por saber que el medicamento es nuevo yno ha sido probado a"n.

!n e;perimento doble ciego controla los posibles prejuicios tanto de los pacientes como delasAos investigadorasAes. /i los pacientes! ni lasBos investigadorasBes conocen qu7sujetos recibieron el tratamiento y cu&les no. !n dobleKciego es mejorD los investigadorespueden tener un especial inter's en los resultados 5por algo están haciendo el estudio6.En un e;perimento triple ciego ni los pacientes, ni lasAos investigadorasAes, ni lasAospro#esionales estadísticasAos que realizan el análisis de los datos pueden identifcar a los sujetoscon y sin tratamiento. Esto es lo mejor.

%. Estudios observacionalesEs necesario observar el mundo para intentar entender su #uncionamiento.La observacin es el primer paso, a partir de ella se abrirán diversos caminos para desarrollarnuevas teorías y modelosD podrá motivar la realizacin posterior de nuevos estudios. Besde unpunto de vista estadístico, los mejores resultados provendrán de estudios e1perimentales encomparacin con estudios observacionales, pero algunas veces slo es posible realizar estos"ltimos.

%.% Hbservar es bueno

En un estudio observacional se registran algunas características de individuos

tratando de no in@uir en dichas mediciones.

%$. Estudio observacional versus estudio e1perimental

%7. 0o siempre los tratamientos son tratamientos

Page 11: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 11/17

Cuando en un estudio interesa el e#ecto de un "nico #actor Cvariable e;plicativaD sobre unavariable respuesta se denomina tratamiento a cada uno de los niveles del actor.En estadística nos re#erimos a tratamientos no solo a los de medicina, sino tambi'n enre#erencia a distintas áreas, cuando se quiere comparar el e#ecto de cierto tipo de intervencinsobre alguna respuesta. ás precisamente se trata de #actores 5variables e1plicativas6 quepodrían tener e#ecto sobre variables de respuesta. !n grupo se trata/ con alg"n nivel de lavariable e1plicativa y el resultado a medir es de la variable respuesta.

%3. ediciones validas

!na variable es una medida valida de un concepto si lo representaadecuadamente.

edir una caracteristica de un individuo 5persona, objeto, animal, etc.6 signifca asignarle unnumero e1presable en distintas unidades que la represente. El resultado de esa medicion esvariable y toma di#erentes valores dependiendo del individuo a quien se le esta realizando lamedicion. 2lgunas caracteristicas, como el peso y la talla, pueden ser mas sencillas de medirque otras como la inteligencia o la percepcion del dolor.

La medicion requiere de(> !n proceso previo de transormación de conceptos 5longitud, desempleo, dolor, nivel

socioeconomico, etc.6 en variables defnidas con precision.> La eleccion del instrumento para medirlas.

uchas veces no disponemos de mecanismos o instrumentos de medicion adecuados paraabordar un tema de nuestro interes, pero podemos utilizar resultados de organismos del estadoo empresas privadas. 2l utilizarlos es importante evaluar como estan defnidos, y si se trata demedidas validas para describir las propiedades que se pretenden medir.

9r&fco de tiempo# Este tipo de gráfco se utiliza para e1aminar la evolucin a lo largodel tiempo de alguna variable. Niene una unidad de tiempo en el eje horizontal 5comomeses o a-os6 y en el eje vertical alguna cantidad 5ingresos de los hogares, tasa de

natalidad, ventas totales,porcentaje de la gente en #avor del presidente, y asísucesivamente6. En cada período de tiempo, la cantidad está representada por un punto,y los puntos están conectados por líneas.

!na variable es una medida v&lida de un concepto si lo representa adecuadamente, oes una característica importante.

Esta midiendo lo que le interesa medirF &i es asi la variable es validaD si no, no lo es. La validez,en terminos generales, se refere al grado en que una variable representa realmente lacaracteristica a medir. +or ejemplo, si interesa medir la inteligencia y se utiliza la memoria comomedida, esta no es valida. Es valido medir la altura con una cinta metrica, pero no es validoutilizar la altura como medida de la capacidad de un aspirante a ingresar a la universidad.

uchas veces una tasa 5dada como #raccin, proporcin o porcentaje6 es la medidaválida, en contraposicin con tomar simplemente cantidades.

La proporción y la razón son dos medidas válidas para medir el riesgo de padecer unaen#ermedad.

El número índice de una variable indica el valor de esa variable como porcentaje delvalor en el período base.

Conocer el período base es esencial para poder interpretar un n"mero índice.

Page 12: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 12/17

%3.7.%. Mndice de precios al consumidorEl indice de precios al consumidor es uno de los indicadores mas importantes generados por losinstitutos de estadisticas ofciales del mundo. Es una medida del poder de compra de la unidadmonetaria, pesos en nuestro caso. 2#ecta las decisiones gubernamentales y esta vinculadodirectamente con gran parte de la economia.

El indice de precios al consumidor es un indicador de la evolucion en el tiempo, en relacin a unperíodo base! de los precios de la canasta #amiliar. La canasta amiliar es un grupo prefjadode bienes y de servicios representativos del gasto de los hogares en una zona de reerencia.

La evolucion de los precios al consumidor puede ser di#erente entre provincias.

En el calculo del indice de precios al consumidor los bienes y servicios se mantienen fjos!tanto en tipo como en cantidades. Estos bienes y servicios fjos son llamados canasta amiliar.

+l índice de precios al consumidor! M+C, es un n"mero índice para el costo de un conjunto

de bienes y servicios fjo.

+or que es importante una canasta #amiliar fjaF+orque de esa #orma la comparacion es valida. Las di#erencias, se deberan unicamente a lavariacion de los precios. &ila canasta #amiliar no #uera fja, no podriamos saber si un aumento en el indice se debe a unaumento de los precios, aun aumento de las cantidades consumidas, o a cambios en los productos que se consumen.Como obtenemos una canasta #amiliar para representar a muchas #amiliasF !tilizamos unacanasta #amiliar promedio.+ero, Quna canasta promedio representa a muchas #amilias y a ninguna en particularQ

El índice de precios al consumidor y el costo de vida son dos conceptos distintos.

Cuando las mediciones no tienen sesgo decimos que son e1actas, y cuando el error aleatorio,que nunca se puede eliminar, es pequeno se trata de mediciones precisas. 2mbos tipos deerrores suelen estar presentes en los procesos de medicion, y los podemos e1presar como(

-odelo de medición# valor medido = valor verdadero R sesgo R error aleatorio

*esumiendo, un proceso de medicion tiene(> Error aleatorio, si mediciones realizadas sobre un mismo objeto dan resultados di#erentes.> &esgo, si sistematicamente sobreestima o subestima la propiedad que mide.

0ingun proceso de medicion es per#ectamente preciso. (os promedios mejoran la precisión.

%. ?ariables num'ricasSistogramas y distribuciones de #recuencias.

Page 13: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 13/17

La distribución de una variable nos dice cu&les son los valores que puede tomar y surecuencia! es decir, cuántas veces ocurre cada uno de los valores.

las tablas de #recuencias y los gráfcos 5circulares, de barras6 permiten conocer la distribucin5ya sea en una poblacin o en una muestra6 de los valores de una variable categrica. Ladistribucin de los valores de la variable dentro de las di#erentes categorías se puede e1presaren cantidades, en proporciones o en porcentajes.+ara representar gráfcamente la distribucin de los datos correspondientes a una variablenum7rica 5discreta o continua6 tambi'n se utilizan tablas de #recuencias y un gráfco similar algráfco de barras( el histograma.

!n )istograma representa, en el eje horizontal, los valores de una variablenum7rica divididos en intervalos de clase. En #orma similar a los gráfcos de barras,tiene una barra sobre cada intervalo cuya altura indica la cantidad 5#recuencia6 oproporción 5#recuencia relativa6 de datos. 0o se deja espacio entre las barras rectángulos.

Cuando los valores posibles de la variable num7rica son pocos, la altura de cada rectángulodel histograma muestra directamente la cantidad o proporcin de veces que cada uno de losvalores ocurri. Cuando son muchos, es necesario agruparlos defniendo previamente losintervalos.

%.%.%. ?ariables discretas!na variable num'rica es discreta cuando "nicamente puede tomar valores dentro de unasucesin determinada de n"meros. La cantidad de hermanos por alumno de una escuela es unavariable discreta( puede tomar los valores 4, %, , $, 7, pero nunca valores como ,34D <,D 4,$4.

!n histograma representa la distribución de una variable num'rica en unapoblación o en una muestra. Los intervalos de clase de una variable discreta estáncentrados en sus valores posibles y tienen la misma longitud.

%.%.. ?ariables continuas

!na variable num'rica es continua cuando, dados dos valores posibles de la variable, 'stasiempre puede tomar cualquier valor intermedio. El peso de una persona es una variablenum'rica continua, puede tomar valores como 7P 8g 7; 8g y tambi'n, 7P,3 8g 7P,3 8g etc.

%.. Construccin de tablas de #recuencias%..%. ?ariable discreta4aso . &e ordenan los valores posibles de la variable.4aso 5. &e cuenta cuántas veces aparece un dato con cada valor posible. Esto nos da la#recuencia.4aso 6. &e divide cada #recuencia por el total de datos, obteniendo así la #recuencia relativa.

%... ?ariable continua4aso . &e ordenan los datos.4aso 5. &e defnen intervalos de clase con igual longitud, cubriendo el rango de losvalores observados.4aso 6. &e cuentan cuantos datos pertenecen a cada uno de los intervalos. Esto indicala #recuencia.4aso E. &e divide cada #recuencia por el total de datos, obteniendo así la #recuencia relativa.

%P. edidas resumen!na medida resumen es un n"mero. &e obtiene a partir de una muestra y, en cierta #orma, lacaracteriza. Es el valor de un estadístico. +or ejemplo, un porcentaje o una proporcin son

medidas resumen. &e utilizan con datos categricos o con datos num'ricos categorizadospreviamente. (as medidas resumen permiten tener una idea r&pida de cómo son losdatos. +ero, un estadístico mal utilizado puede dar una idea equivocada respecto de lascaracterísticas generales que interesa mostrar.

El cálculo de medidas resumen es el primer pasoD se realiza cuando se recolectan los datos enun estudio para tener una idea de qu' está pasando. +osteriormente, los investigadores pondrán

Page 14: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 14/17

a prueba sus hiptesis respecto a alg"n parámetro poblacional, estimarán características de lapoblacin y estudiarán posibles relaciones entre las variables. Cuando presentan susconclusiones al p"blico en general, las medidas resumen muestran los resultados en #ormaconcisa y clara, volviendo a tener importancia. En principio, se pueden obtener muchísimas#ormas de resumir los valores de un conjunto de datos num'ricos. Es importante que sean#áciles de interpretar. Cualquier conjunto de datos tiene dos propiedades importantes# unvalor central y la dispersión alrededor de ese valor.

%P.%. +osicin del centro de los datosEl promedio defne el valor característico o central de un conjunto de n"meros. E1isten varios

m'todos para calcular el promedio. El m'todo utilizado puede in@uir en las conclusiones. Cuandovemos un anuncio con la palabra promedio, debemos alertarnos porque quien lo ha escrito,probablemente eligi el m'todo de cálculo para producir el resultado que le interesa marcar.?eremos con detalle las dos #ormas principales para obtener un valor central o promedio(3 (a media# &e obtiene sumando todos los valores del conjunto de datos y dividiendo la sumapor la cantidad de datos en ese conjunto.3 (a mediana# Es el valor central del conjunto de datos ordenados.

%P.%.%. La mediaLa media se representa por 1 5equis raya o equis barra6. &e obtiene sumando todos los datos ydividiendo por la cantidad total n de observaciones,

&i sobre una vara numerada sin peso, se colocan pesos id'nticos sobre el valor de cada dato, lavara queda en equilibrio cuando se la apoya en el punto correspondiente a la media.

%P.%.. La medianaLa mediana es otro tipo de centro. Es el punto central de los datos, como la línea central quedivide el campo de juego de #"tbol en dos partes iguales.(a mediana deja la misma cantidad de datos a cada lado.+ara hallar la mediana del conjunto de datos 57, %3, P, $%, %<6 del ejemplo %P.%(> +rimero los ordenamos de menor a mayor 57, P, %3, %<, $%6.> Luego, la mediana es el valor central 5%36.+ara las cuadras que caminan por día las cinco personas elegidas al azar, el valor central, lamediana, es %3. Guedan dos datos a cada lado de la mediana. En este ejemplo, la media

coincide con la mediana, pero puede no ocurrir.

Page 15: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 15/17

La regla general para calcular la mediana de n datos ordenados es(> &i la cantidad de datos es impar! la mediana es el valor del centro, se encuentra en laposicin 5nR%6A.> &i la cantidad de datos es par! la mediana es el promedio de los dos valores centrales, seencuentran en las posiciones nA y 5nA6R%

%P.%.$ +or qu' utilizamos más de una medida de posicin del centro de losdatosFCada una de las dos medidas presentadas tiene ventajas y desventajas.La media utiliza todos los datos para su cálculo. &i los datos presentan un histograma sim'tricocalcular la media es lo mejor para obtener el centro de los datos, en este caso la mediana serámuy parecida.

%P.. edidas de dispersin o variabilidad2demás de conocer el punto central de un conjunto de datos, tambi'n nos interesa describir sudispersin, es decir cuán lejos tienden a estar los datos de su centro.

La variabilidad está presente en todos los conjuntos de datos. &ea cual #uere la característica, escasi imposible que dos mediciones sean id'nticas. Esto se debe a que(> Bi#erentes individuos tienen di#erentes características 5peso, altura, inteligencia, glbulos rojosen sangre6, al cuantifcarlas resultan en valores di#erentes de las variables correspondientes.> Bi#erentes mediciones de una misma característica dan como resultado di#erentes valoresdebido al inevitable error de medicin.

Los m'todos estadísticos son imprescindibles para analizar los datos debido a su variabilidad.El truco consiste en tener medidas que la capten de la mejor manera posible.

%P..%. *angos y distancia intercuartilEl rango de valores donde se encuentran los datos permite apreciar su variabilidad o dispersin5cuán desparramados están6.La medida natural para evaluar dicha dispersin es la distancia entre el valor mínimo y el valormá1imo de los datos 5má1imoKmínimo6.

 Niene algunos inconvenientes(> Es muy sensible a la presencia de valores atípicos.> Como utiliza slo dos datos, no puede distinguir dos conjuntos con má1imos y mínimoscoincidentes, pero uno tendrá la mayoría de sus valores mucho más concentrados que el otro.

+ara corregir los problemas se utiliza la distancia entre el valor mínimo y el valor má1imo del349 central de los datos, llamada distancia intercuartil.

$%ómo se calcula la distancia intercuartil'#%. &e ordenan los datos.. &e calcula la mediana 5C6, que los divide en partes con igual cantidad de datos de cadalado.$. &e calcula la mediana de la mitad más baja 5grupo in#erior6, es el cuartil in#erior 5C%67. &e calcula la mediana de la mitad más alta 5grupo superior6, es el cuartil superior 5C$6

3. La distancia intercuartil 5BMC6 es la di#erencia entre el cuartil superior y el cuartil in#erior( 8%F %6 %

Gu' mide la distancia intercuartilFComo medida de dispersin, la distancia intercuartil mide la longitud del intervalo en el cual seencuentra el 349 central de los datos. Cuanto más dispersos est'n los datos, mayor será ladistancia intercuartil.

Page 16: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 16/17

La distancia intercuartil se obtiene como la di#erencia entre el cuartil superior y el cuartil in#erior.

%P... Los cinco n"meros resumen y el gráfco de caja y brazos

El mínimo, el cuartil in#erior, la mediana, el cuartil superior y el má1imo son cinco n"meros. Banuna idea de cmo está distribuido un conjunto de datos. &e los llama los cinco n"meros resumeny se los representa por(

ínimo C% C$ á1imoEl 349 de los datos se encuentran entre el cuartil in#erior y el superior.

Los cinco n"meros resumen se representan gráfcamente en un )ráfco de caja 5To1Kplot6.

Los cuartiles #orman los bordes de la caja y la mediana está dentro de la caja. Bos líneas J losbrazosK se e1tienden, una desde cada borde de la caja, hasta el dato con valor má1imo y mínimorespectivamente, mientras no sean valores atípicos.

Los gráfcos caja sirven especialmente cuando queremos comparar varios conjuntos de datos.

%P..$. Besvío estándarEl desvío est&ndar es una medida de dispersin basada en la media y utiliza todos losdatos. Burante muchos a-os la media y el desvío est&ndar #ueron, y tal vez sigan siendo, lasmedidas resumen m&s utilizadas.

El desvío estándar representa una distancia típica de cualquier punto del conjunto de datos a sucentro 5medido por la media6. Es una distancia promedio de cada observacin a la media.

El desvío estándar de los datos de toda una poblacin 5desvío estándar poblacional6 se denota

con la letra griega 5sigma min"scula6. +ero la mayoría de las veces los parámetros poblacionalesson desconocidos. Gu' se haceF &e calcula un estimador 5s, desvío estándar muestral6utilizando una muestra.

La distincin entre el desvío estándar poblacional y el desvío estándar muestral vale para todoslos estadísticos descriptos 5media, mediana, cuartiles, distancia intercuartil, etc.6. Nal comovimos en los capítulos ; y %4, si el cálculo de un estadístico se realiza utilizando una muestrapara estimar un parámetro, el resultado tendrá un error de muestreo.

El desvío estándar se calcula promediando la di#erencia entre cada dato y la media, elevadas alcuadrado. Como este resultado tiene las unidades al cuadrado, luego se saca la raíz cuadrada.

+ara un conjunto de n datos(%. &e calcula la distancia de cada dato a la media( 1iK 1. &e eleva al cuadrado( 51iK 16

$. &e promedie dividiendo por nK% y, así, se obtiene la varianza muestral

Page 17: La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

7/18/2019 La Estadística Es Más Que El Cálculo de Promedios y Porcentajes

http://slidepdf.com/reader/full/la-estadistica-es-mas-que-el-calculo-de-promedios-y-porcentajes 17/17

Cuanto más grande es la varianza muestral, más dispersos están los datos. !na medida dedispersin debe tener las mismas unidades que los datos.

%P.$. Centro y dispersin en di#erentes tipos de distribuciones.El gráfco caja 5bo1plot6 describemás precisamente el rango donde se encuentran los datos. El rango intercuartil que #orma lacaja contiene el 349 de los datos y los brazos se e1tienden hasta el "ltimo dato de cada lado.

El desvío est&ndar no signifca nada si los datos no son /ormales ni apro1imadamente0ormales.La media no describe el centro si los datos no son sim7tricos.

(a mediana y la distancia intercuartil pueden #allar si los datos #orman grupos.

%;. Htras medidas de posicin( los percentiles

El cuartil in#erior es el percentil 3.La mediana es el percentil 34.

Los percentiles se utilizan para determinar la posicin relativa, en porcentaje, de la posicin queocupa un valor dado, de una variable, en relacin a todos los valores de la misma en un grupo oen una poblacin.

%;.%. Cmo se calcula un percentil en un conjunto de datosF%;.%.%. Cuando los datos no están agrupados

Gorma general para )allar el percentil H para cualquier conjunto de datos#

4aso . Hrdene los datos de menor a mayor4aso 5. Calcule HB00 y multiplíquelo por la cantidad total de datos n.4aso 6. *edondee n UA%44 al entero más cercano.4aso E. Cuente desde el dato más chico hacia el más grande tantos lugares como el n"merohallado en el paso $.

%;.%.. Cuando los datos están agrupadosCuando los datos tienen muchos valores repetidos es más conveniente utilizar una tabla de#recuencias para calcular los percentiles.