Matemática y estadística básica para periodistas

download Matemática y estadística básica para periodistas

of 13

Transcript of Matemática y estadística básica para periodistas

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    1/13

    1

    PERIODISMO DE DATOSMATEMTICA Y ESTADSTICA PARA PERIODISTAS II

    Por Sandra CrucianelliKnight International Journalism Fellowship

    [email protected]

    @spcrucianelli

    MEDIDAS DE TENDENCIA CENTRAL

    En una distribucin de datos, stos tienen a acumularse hacia el centro

    Las medidas de tendencia central ms comunes son:a) Media Arimtica(Valor Medio o Promedio)b) Mediana(Valor Central)

    c) Moda (Valor Ms frecuente)

    Promedio o Media Arimtica

    Es la sumatoria () de todos los casos, dividida por el nmero de casos.P= n/ Nn: cada datoN: cantidad datos totales

    Se distorsiona si tiene valores extremos o no representativos delresto.

    Veremos un ejemplo en el que el Promedio no debe ser utilizado porfalta de representatividad.

    Supongamos que nos informan que en una oficina de la administracinpblica hay 7 categoras principales de salarios cuyos sueldos endlares son: 8.000 - 5.000- 1.200700500400 - 300.

    Si se suman esos valores y se divide entre 7 (nmero de datos totales)se obtiene el promedio mensual de salarios para los empleados de esaoficinaP= 2.300 $

    http://www.icfj.org/http://www.icfj.org/mailto:[email protected]:[email protected]:[email protected]://www.icfj.org/
  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    2/13

    2

    El promedio, en este caso no representa a ninguna de lascategoras.

    Cuando esto ocurre hay que calcular lo que se conoce comoMediaPonderada,es decir, dividir por intervalos las distintas clases y

    considerar la cantidad de empleados en cada categora.

    Veamos un ejemplo sobre otra escala salarial ms detallada: (Losnmeros entre parntesis corresponden a la cantidad de empleados)

    (1) 8000 $(9) 3200 $(18) 2599$(36) 2200$(32) 1800$

    (21) 1500$(15) 1200$(12) 1080$(57) 850$(86) 750$(92) 560$(105) 420$(210) 360$

    Clase 1: 8000 (1 funcionario) = No se promedia, ya que distorsionaracualquier otro valor.

    Clase 2: (incluye a quienes ganan valores entre 2.200 y 3.200)P= 2.457 $ (63 funcionarios) = Lo que se hizo aqu fue (9 x 3.200) + (18x 2.599) + (36 x 2.200) y a este resultado global se lo dividi entre 63que es la suma de 9 + 18 + 36. El mtodo consiste en ajustar cadacategora salarial al nmero de empleados cuya diferencia salarial nosea demasiado significativa considerando los extremos de la tabla.

    Clase 3: (incluye a quienes ganan valores entre 1.800 y1.080)P= 1.501 $ (80 funcionarios)

    Clase 4: (incluye a quienes ganan valores entre 850 y 360)P= 517 $ (550 funcionarios)

    Mediana ( Valor Central)

    Es el valor que representa el punto central de una serie de datos. Lamitad de los datos recogidos est por encima y la otra mitad por debajo.Tambin se dice que el 50 % de los valores quedan por debajo de esedato (la mediana o valor central) y el otro 50 % por encima.

    Al igual que la Moda, que veremos a continuacin, no tiene demasiada

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    3/13

    3

    aplicacin en las crnicas periodsticas ya que su uso no es popular,pero es importante que el reportero comprenda su significado porque enmuchos reportes estadsticos pueden aparecer como variables y resultaimportante que no confundan este valor con el promedio.

    Para calcular la mediana, dada una serie de datos numricos, lo que sehace es ordenar los datos de menor a mayor.

    Ejemplo 1

    7-10-10-12-13-15-17Mediana: 12

    Ejemplo 2

    7-10-10-12-13-15

    Se toma el P de los centrales internos. En este caso= 11La mediana es 11.

    A veces resulta difcil entender para qu sirve la mediana, y adems, esde difcil aplicacin en una crnica periodstica. No obstante, es unamedida de tendencia central y todo periodista debe conocer susignificado y el procedimiento para calcularla, en especial cuando setiene un conjunto de datos pares.

    No recomiendo usar a la mediana (o valor central) en especial porquelos lectores pueden confundirlo con el promedio. Y a veces el nmerocoincide, pero generalmente no.

    Se utiliza mucho en estadstica bsica, cuando tenemos muchos datos,que podemos ordenar de manera creciente (lo que nos dar una lneaascendente en el plano), y queremos decir que la mitad de los casosrelevados cayeron por debajo de ese valor y la otra mitad est porencima de ese valor.

    Por ejemplo en estudios clnicos, cuando un laboratorio quiere probar

    la eficacia de un nuevo medicamento y entrega un dossier de prensa.Tambin cuando se analizan tablas de frecuencia. Por ejemplo,frecuencias de temperatura climtica registradas a lo largo del ao.

    Hace unos aos supe de un gobierno centroamericano que utilizaba estedato para crear confusin en los reportes de prensa que entregaba suministerio de Economa. Esto ocurra cuando el promedio de ciertavariable no daba un buen resultado a sus intereses y entonces incluanel valor de la mediana (que en apariencia los favoreca ms) por lo quetodos los periodistas crean que se trataba de un promedio.

    Aunque ese no era el caso, debo aclarar que en muchos reportesestadsticos (como los mdicos o econmicos), se aconseja usar a la

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    4/13

    4

    mediana y no a la media arimtica o promedio, porque el conjunto dedatos tiene valores muy extremos, que no son promediables, por lo quela media arimtica se vera fuertemente distorsionada

    La idea es que no confundan el concepto y as eviten una posible

    manipulacin.

    ModaEs el valor ms frecuenteNo confundir con mayora. A veces coincide pero otras no.Ejemplo:16-20-16-17-16-23-12Moda: 16

    El programa Excel calcula automticamente estos valores, por eso esimportante que el reportero maneje este programa informtico, al cual

    nos referiremos durante las sesiones en los foros.

    Medidas de Proporcin

    Un nmero solo no dice nada.Para que adquiera significado es necesario efectuar una comparacin.Por eso las medidas de proporcin establecen bsicamentecomparaciones de X cantidad con respecto a Y cantidad

    a) RaznEs el cociente de una cantidad dividida por otra. Se la define como laprincipal operacin de transformacin o normalizacin estadstica, estoes, definir una norma para expresar datos primarios. Para calcular unarazn se divide la cantidad que se quiere normalizar (estudiar), por lacantidad normalizadora (referente).Veamos un ejemplo sobre un dato censal: Qu sera razn defeminidad?Si en un estudio, el total de la poblacin son 300 personas, de las cuales200 son mujeres y 100 son hombres, dicha razn es 200/100= 2Significa: 2 mujeres por cada hombre

    Hoy da Se est usando el trmino razn como ardid para enmascararestadsticas en lugar de otras medidas de proporcin, como elporcentaje, de mayores niveles de comprensin.

    b) ndice

    Es un tipo de medida que usa ms de dos indicadores u observacionespara resumirlos en un resultado, relacionados con un mismo fenmeno.Expresa la variacin de un conjunto de valores. El ms conocido es elndice de Precios al Consumidor. Otro ejemplo, usado en muchos paseses el IME (ndice Multivariado de Educacin), resume seis factores del

    proceso educativo en un solo nmero.Los ndices se calculan por mtodos estadsticos del anlisis factorial

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    5/13

    5

    EL IPC (ndice de Precios al Consumidor), rene a 20 categoras dedatos o ms, conforme el pas en el que se lo calcule.

    c) Proporcin

    Es la frecuencia de casos en una categora, dividida por el nmero decasos de todas las categoras. Se trata de la razn entre una parte y latotalidad.Las proporciones varan siempre entre 0 y 1.La suma de las proporciones siempre da 1Ejemplo: Poblacin total: 1560 personas (850 Mujeres y 710 Hombres).Proporcin Mujeres (850/1560=0,54) y Proporcin H: (710/1560=0,46).Si multiplicamos por 100 el valor de una proporcin lo que seobtiene es el porcentaje.

    d) Tasa

    De vital importancia para el reportero,expresa la frecuencia de casoscon relacin a un nmero fijo que se toma como referencia. Serefiere a nmeros referentes (per cpita, cada 10.000, cada 100.000).Se usa en crnicas periodsticas para comparar situaciones en distintasciudades o pases, porque permite usar el mismo nmero tomado comobase, que es fijo e independiente de la poblacin total.Ejemplo: Tasa de escolarizacin: nmero de escolares por cada

    100.000 nios en edad escolar. Tasa de ocupacin hospitalaria: Nmero de camas ocupadas

    en hospitales por cada 10.000 camas hospitalarias. Tasa de delito: Nmero de delitos denunciados por cada

    10.000 habitantes (pude calcularse sobre otra base, como 1.000,100.000, etc.) La base depende del tamao del escenario enestudio y/o de la convencin que se haya decidido en el lugar deuso.

    Las tasas se construyen de diferente manera conforme el pas o ciudaden que se estudien. Hay definiciones universales para algunos casos,pero en otros, como se explic antes, la base es diferente; por eso es

    importante que el reportero (en este caso de Honduras), conozca elsignificado real de las tasas que se calculan en su pas, como las queaparecen en el censo.

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    6/13

    6

    Ejemplo:Ttulo periodstico: Alarmante Ola de Robos en la Ciudad (BahaBlanca)Pero result que eso no era cierto, ya que cada ciudad tiene unacantidad de habitantes diferentes.

    Calculando la tasa de delitos por cada 1.000 habitantes resulta queDorrego tiene un valor mayor al resto: 3 delitos por cada 1.000Entonces: Es el ttulo el adecuado?

    e) PorcentajeExpresa una cantidad como un nmero de partes por cada 100unidades.Recuerde que, como ya dijimos, toda proporcin puede ser transformadaen %, pero no todo % puede ser transformado en proporcin.A diferencia de las proporciones, un porcentaje puede ser mayor de 100.(No confunda porcentaje puro con puntos porcentuales. Veremos esadiferencia en el foro de la semana)

    MEDIDAS DE CAMBIO

    Lo que no cambia no es noticia. Lo que cambia s.Toda variacin implica un cambio y los cambios suelen contener noticiasde relevancia.

    Se calculan a partir del estudio de variables

    Variable: Aquello que se modifica (o vara) conforme pasa el tiempoEjemplo: Partidas presupuestarias, accidentes, robos, clima, niosdesnutridos, etc.La medida de cambio ms utilizada en periodismo es la VARIACIONPORCENTUAL

    Ciudad Delitos Habitantes Tasa x c/1.000 Hab.

    Baha Blanca 536 284.313C. de Patagones 22 27.759

    Dorrego 42 16.469

    Pringles 12 23.765

    Rosales 39 60.879

    G. Chavez 29 11.967

    Monte Hermoso 14 5.603

    Puan 12 16.952Saavedra 16 19.751

    Tornquist 15 11.686

    Tres Arroyos 121 57.110

    Villarino 23 26.438

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    7/13

    7

    VARIACIN PORCENTUAL:

    El clculo de variaciones porcentuales es la operacin de mximaimportancia en el anlisis de tablas numricas. Resulta vital que el

    reportero entienda cmo se calculan e interpretan

    Por ejemplo: Supongamos que el cuadro muestra la evolucin de laDeuda Externa, conforme aparece a continuacin.

    AO DEUDA (en millonesde dlares)

    VARIACION NETA (enmillones de dlares)

    1991 58 -1992 74 161993 192 1181994 320 1281995 415 951996 512 971997 640 1281998 720 801999 960 240 (mayor valor neto)2000 1080 1202001 1280 200

    La VARIACION NETAes la cantidad en millones de dlares, que se agrega

    cada ao, a la deuda del ao anterior. Es un nmero absoluto que se calculamediante una simple resta. Para el caso del ejemplo, es la resta que se hacecon el valor de cada ao en estudio, respecto del valor del ao anterior. Parael ao 1991 no hay variacin neta calculada, porque se desconoce el monto dela deuda del ao anterior.

    El uso de la variacin neta, o nmeros abstractos para expresar cambioses ALTAMENTE INADECUADO en periodismo, ya que no permiten lascomparaciones.

    Un valor puede decir mucho o poco, depende de qu valor tiene para esa

    misma variable en otra circunstancia.

    Por ejemplo, si un candidato a presidente obtiene en una encuesta el 42 % deintencin de votos, ese nmero puede ser mucho o poco; depende delresultado obtenido en la medicin anterior.

    Si una encuesta previa arroj el resultado de 61 % de intencin de votos elvalor menor tiene un significado: la aprobacin popular baj y es un dato malopara el candidato y su partido. Ahora, si una encuesta previa haba medido 17% de intencin de voto para ese mismo candidato y en la encuesta posteriormidi 42 % entonces el significado es otro.

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    8/13

    8

    Otro ejemplo es el de la cantidad de delitos administrativos (por citar unavariable). Si se cometen 200 delitos de este tipo en un ao, en un pas con 120millones de habitantes, eso tiene un significado diferente a si se cometen 200delitos en el mismo ao, pero en un pas con 5 millones de habitantes. Es claroque la tasa de delitos contra la administracin pblica por cada 10.000

    habitantes ser mayor en el segundo pas que en el primero.

    Retomando el ejemplo de la tabla, el observador podra pensar que el ao enque mayor aumento de la deuda externa hubo fue 1999, ya que ese ao elincremento en millones de dlares fue de 240, pero no es la forma correcta deanalizar la evolucin de una variable, ya que para cada clculo, no se toma unnmero fijo como referente. Todas las bases de referencia en cada resta quese hace para cada ao, son distintas.Por eso, reitero, es importantsimo usar medidas de cambio para expresarvariables que estn o pueden cambiar a lo largo del tiempo. La ms usada esla variacin porcentual.

    CMO SE CALCULA LA VARIACION PORCENTUAL?

    Volvamos al caso del ejemplo anterior; si en vez de calcular la variacin neta,hubiramos calculado la variacin porcentual para cada ao respecto del aoinmediato anterior, se habra cado en la cuenta que el ao de mayorendeudamiento fue 1993. Ah haba una noticia escondida en la tabla.Slo haba que hacer algunos clculos para descubrirla, ya que nosaltaba a simple vista viendo los nmeros puros.Veamos cmo calcular la variacin porcentual de la deuda de 1992 respecto de1991.

    74 millones58 millones = 16 millones (deuda agregada en 1992 respectode 1991)

    Si 58 millones ............ 100%16 millones (la diferencia) ............ X= ??

    X= (16 x 100) / 58 = 28%

    Hagamos todos los clculos y volvamos a la tabla anterior, esta vezcalculando todas las variaciones porcentuales

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    9/13

    9

    AO DEUDA (enmillones de

    dlares)

    VARIACION NETA (enmillones de dlares)

    VARIACIONPORCENTUAL

    1991 58 -

    1992 74 16 28 %1993 192 118 159% (mayor

    endeudamiento)

    1994 320 128 66%

    1995 415 95 30%

    1996 512 97 23%

    1997 640 128 25%

    1998 720 80 12,5%

    1999 960 240 (mayor valor neto) 33%2000 1080 120 12,5%

    2001 1280 200 18,5%

    Si el resultado da negativo (porque el Valor Final es menor que el ValorInicial, la variacin porcentual es negativa (signo -).En un caso as no hay incremento, sino decrecimiento (caso cada de labolsa = baj cuatro puntos, significa que la variacin porcentual fuenegativa).

    Puntos Porcentuales

    "El candidato A meda la semana pasada 10 % de in tencin de voto. Hoymide 12 %.

    El reportero escribi que la intencin de voto del candidato aument 2 %(dos por ciento)

    Es correcto?

    NO = La variacin netafue de 2 puntos porcentuales.

    Pero la variacin porcentualfue mayor (de cunto?)

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    10/13

    10

    TANTAS VECES MS

    1991: se adeudaban 58 millones 2001: se adeudan 1280 millones

    El reportero escribe: Ahora se debe 22 veces ms dinero que hace diezaos. Falso.

    Divisin: 1280/58: 22 (Pero el 22 contiene la base, o lo que se adeudabaen el primer ao tomado en estudio)Correcto: 21 veces ms que hace 10 aos

    Otro ejemplo:El asesino tiene 20 aosLa vctima tiene 60 aosEl reportero escribi: La vctima es tres veces ms vieja que el asesino.Falso. Si fuera tres veces ms vieja tendra 80.En este caso es dos veces.

    INTERPOLACIN DE DATOS EXTERNOS

    Mientras una variable va creciendo o decreciendo, hay otras variablesque tambin sufren modificaciones permanentes e impactan directamente en laque estamos estudiando.

    Por ejemplo, si en una ciudad X la cantidad de accidentes de trnsito es de 120por da y en otra ciudad Y es de 190 por da, estos nmeros no se puedenconsiderar aislados ya que la cantidad de habitantes de una ciudad difiere de laotra

    Veamos un ejemplo aplicado a sueldos de empleados pblicos

    En 1980: ganaban en promedio 11.133 $ anualesEn 2008: ganan en promedio 19.000 $ anuales

    Ahora ganan ms: Falso

    Hay que considerar el ndice de Precios al Consumidor: IPC

    Datos IPC1980 = 38.82008 = 90,9

    Haciendo cuentas:

    38,8 (IPC 1980) ---------- 11.133$ (el sueldo en 1980, con 38,8 de IPC)90,9 (IPC 2008) -------- x = 26.082,21$ (SUELDO IDEAL)

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    11/13

    11

    SUELDO IDEAL = EL QUE DEBERAN GANAR PARA MANTENER ELMISMO PODER ADQUISITIVO

    La conclusin es que si ahora ganan 19.000, entonces tienen menor

    poder adquisitivo)

    Cmo calcular la Cada del Salario?

    Cada del Salario: Sueldo IdealSueldo RealCada del Salario: 26.082,21 $ - 19.000 $ = 7.082,21 $

    Cmo se calcula la Cada del Salario Porcentual?

    26,082,21 $ (salario ideal) ------------- 100%7.082,21 $ (cada del salario) --------- x = 27 %

    El salario cay un 27 %

    Recuperacin Porcentual

    Con este concepto se comete uno de los errores ms comunes = CasoBolsa Dow Jones (DJ)

    Da 1: El ndice DJ cerr con 1759,89 puntosDa 2: El ndice DJ cerr con 1569,26 puntos

    La diferencia entre el da 2 y el da 1 es de = 190,63 puntosConclusin: Perdi el 10,83 %.Qu porcentaje tena que tener el Da 3 para recuperarse? 10,83?NO. La base es otra. En puntos es 190.63, pero el % es diferente.

    Haciendo cuentas:

    1569,26........100%190,63..........x= 12,14%

    MEDIDAS DE DISPERSIN

    Las medidas de dispersin nos informan cunto una variable se alej delo esperado. Lo esperado est directamente relacionado con elpromedio.

    Por qu un avin que cae es noticia? Porque lo esperado es queeso no ocurra ya que el promedio de aviones que se caen es muy bajorespecto de la cantidad de aviones que vuelan.

  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    12/13

    12

    Las medidas de dispersin ms frecuentemente usadas con laVarianza,laCovarianza y laDesviacin Estndar.

    VARIANZA:Es un indicador de cambio. Mide la dispersin calculada, respecto de la

    media arimtica (promedio)de una serie de datos.Nos indica cunto una medicin se aleja de lo esperadoDe este modo, la varianza se convierte en noticia.

    La varianza siempre ser mayor que cero. Mientras ms se aproxima acero, ms concentrados estn los valores de una serie de datos,alrededor de la media. Por el contrario, mientras mayor sea la varianza,ms dispersos estn.

    No es intencin de esta clase introducirlos en el clculo de la varianza,pero s que comprendan su significado ya que frecuentemente, en

    censos o reportes estadsticos pueden encontrar este tipo determinologa.

    Enestadstica,el anlisis de varianza(ANOVA) sirve para comparar silos valores de un conjunto de datos numricos son significativamentedistintos a los valores de otro o ms conjuntos de datos.

    En conclusin, cuando observen una varianza alta con relacin alpromedio de una serie de valores, detnganse en ese dato y busquenms informacin consultando fuentes acadmicas, ya queprobablemente detrs de la varianza puede estar escondida una noticia.

    Ejemplo de variable con varianza baja: Enfermeras trabajando enhospitales pblicos menores de 40 aos. (El promedio de la edad de lasenfermeras es de 35; luego, las de 40 tienen una varianza baja; las de60, tendrn una varianza ms alta)

    COVARIANZA

    Cuando dos fenmenos varan al mismo tiempo, se dice que covaranPor ejemplo, todos los aos vara el nmero de nacimiento de nios

    prematuros, pero al mismo tiempo tambin vara la condicin defumadoras de las madres que los dan a luz.

    Hay dos posibilidades:1) Un fenmeno depende del otro2) Uno explica al otro

    Podemos realizar investigaciones para tratar de encontrar respuestas alos diferentes interrogantes que nos plantean las estadsticas.

    http://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://es.wikipedia.org/wiki/Estad%C3%ADstica
  • 8/12/2019 Matemtica y estadstica bsica para periodistas

    13/13

    13

    DESVIACIN ESTANDAR (DS)

    Muchas veces la Varianza no aparece en un reporte estadstico, pero sla DS. Es una forma ms comn de mencionar a la Varianza ya que laDS est definida como la raz cuadrada de la varianza.

    Cmo saber si varan mucho o si la desviacin es grande?Siempre compararlos con la mediaEjemplo: nmero de crmenes cometidos en distintas ciudades.(Variacin entre una y otra).

    Recomendaciones

    Mire los nmeros con detenimiento

    Vea qu variables est analizando Analice qu posibles cruces puede hacer en las tablas

    Revise sus procedimientos y clculos Para visualizar mejor los datos de una tabla e interpretar mejor su

    contenido, grafique sus conclusiones No pierda perspectiva: Mire hacia atrs y hacia delante.