Estadística inferencial

41
Investigación Cuantitativa Su valor en la investigación basada en datos Por Sandra Crucianelli @spcrucianelli

Transcript of Estadística inferencial

Page 1: Estadística inferencial

Investigación Cuantitativa

Su valor en la investigación basada en datos

Por Sandra Crucianelli@spcrucianelli

Page 2: Estadística inferencial

El Valor de la ObservaciónAsociar cambios a noticias

Un rápido test de medición: ¿mayor puntaje en el menor tiempo?

http://www.thatquiz.org/Medidas y Gráficos de línea

Page 3: Estadística inferencial

Dimensionando un problemaEstadística Descriptiva

Analiza todos los casosEjemplos: censo nacional poblacional, censonacional agropecuario, censo electoral, censoeconómico.

¿Otros casos de censos? ¿Censos propios a partir de trabajos de campo?

Page 4: Estadística inferencial

Dispersión de los datosRango: es la diferencia entre el valor máximo y el valor mínimo en ungrupo de números . Se expresa como un intervalo: [ 2- 40]Desviación típica o estándar : diferencia entre el valor de la variable ysu media o promedioVarianza: cuadrado de la desviación. D y V: Nos indican qué tanto se aleja una serie de valores dela media o del valor esperado

Medidas de posición no centralesQuintiles: Es la quinta parte de una población estadística ordenada de menor a mayor. Se calcula ordenando a la población desde el individuo más pobre al más adinerado, para luego dividirla en 5 partes de igual número de individuos; con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primer quintil ( Q1) representa la porción de la población más pobre y así hasta el quinto quintil (Q5), representante de la población más rica.Cuartiles: Medida de localización que divide la población o muestra en cuatro partes iguales. Otras medidas: decil (entre 10) y percentil (entre 100)

Page 5: Estadística inferencial

Correlación

Cuando 2 o + fenómenos crecen o decrecen en forma simultánea debido a factores externos. Si lo hacen al mismo tiempo, se dice que están positivamente correlacionados. Si mientras uno crece, el otro decrece, se dice que están negativamente correlacionados.

Page 6: Estadística inferencial

Estadística InferencialObtiene conclusiones generales a partir de una muestra en estudio, extraída del Universo a estudiar

Permite formular prediccionesCasos: encuestas electorales, de

opinión pública, de mercadeo

Page 7: Estadística inferencial

¿Qué debe informar una encuesta?

Ficha Técnica1) Tamaño del Universo y de la muestra2) Margen de error estadístico3) Nivel de confianza4) Método de muestreo5) Texto del cuestionario y fecha realización6) Autor de la encuesta7) Origen de la financiación del trabajo

Page 8: Estadística inferencial

Ficha Técnica: condición de calidad Universo o Población: Se llama así al conjunto total de

elementos que son objeto de estudio. Puede estar formado/a por personas, hogares, empresas u objetos.

Muestra: Es una parte de ese universo que lo representa Tamaño de la muestra: Magnitud de los elementos que van a

ser relevados, medidos o estudiados (factor determinante en el resultado)

Error de muestreo: Error cometido y estimado, admitido por el encuestador. Se expresa como intervalos (+/- 5%)

Nivel o Intervalo de Confianza: Probabilidad de que los resultados obtenidos se encuadren dentro del error admitido por el encuestador. En electorales, se trabaja con IC que varían entre el 95 y el 99%

Z: (Zeta) Coeficiente que representa al IC

Page 9: Estadística inferencial

¿De dónde sale Z?

Z = valor crítico de una distribución normal estandarizadaSe llama valor crítico al valor de Z necesario para construir un

intervalo de confianza para la distribución. Normalmente en Estadística, la variable Z suele representar a una distribución normalizada, es decir la distribución normal

con media 0 y desviación 1. Se calcula con la ayuda de tablas o software.

Un nivel de confianza del 95% lleva a un valor Z de 1,96.

Page 10: Estadística inferencial

Metodología de la EncuestaDeterminar objetivo o necesidad de informaciónDeterminar el diseño del cuestionario y las

fuentes de datos (estudio minucioso del padrón)Desarrollar un esquema para la recolección de

datosDeterminar el tamaño de la muestraRecolectar los datosClasificación de datosAnálisis de datosConclusión

Page 11: Estadística inferencial

Regla de la Aleatoriedad

Todos y cada uno de los miembros de una población sobre la que se

pretenden generalizar los resultados (muestra) han de tener la misma

probabilidad de formar parte de la muestra

Page 12: Estadística inferencial

¿Cómo cumplir con esta regla?

Dar a cada miembro de la población en estudio la misma posibilidad de ser incluido, usando un método estadístico-matemático correcto

El proceso en el que se agudiza este requerimiento es en la determinación del tamaño de la muestra y la selección de los individuos o elementos a incluir.

Page 13: Estadística inferencial

Pirámide Poblacional En general, para que las conclusiones tengan

representatividad la muestra se conforma según la distribución geográfica

Ejemplo: muestra=1.000 ciudadanos Ciudad dividida en 8 secciones: Las mismas

concentran el 25%-20%-15%-10%-9%-7%-8%-6% Se relevarán: 250, 200,150,100,90,70,80 y 60

personas respectivamente. Igualmente, edades y sexo deben responder a

proporción de la pirámide

Page 14: Estadística inferencial

Pirámide Poblacional

Indispensable para estudios generales (en especial electorales)

Encuestas representativas deben basarse en este concepto

Sin pirámide poblacional no hay representatividad.

Sin pirámide poblacional se viola la regla de aleatoriedad.

Page 15: Estadística inferencial

Muestreo

• Imposibilidad de analizar a toda la población.• Usa menos recursos y da buenos resultados.• El resultado nunca será “igual”, pero puede

ser confiable.• Los intervalos de confianza, expresados en %,

nos dan una idea de la probabilidad de que el valor obtenido se acerque al real.

Page 16: Estadística inferencial

ProbabilidadConjunto de posibilidades de que un evento ocurra o no. La escala es de 0 a 1. Si un evento tiene P de no ocurrir, p=0. Si ocurre con certeza, p=1. Lo contrario, la posibilidad de que un evento no ocurra se denota con la letra q. La suma de p + q debe dar 1.Según lo anterior, la condición más desfavorable en este campo es:p = q = 0,5Está relacionado con el Principio de Incertidumbre. Cuando no hay estudios previos, se le asignan estos valores a p y q

Page 17: Estadística inferencial

Cálculo Probabilidad Simple• Supongamos que una persona tiene 12 pares de medias, 5 de las cuales son

marrones y 7 son negras...todas mezcladas. • Si se despierta todas las mañanas con poco tiempo y cuando abre el cajón, saca un

par sin mirar ¿qué probabilidad tiene de sacar una marrón?• P = 5 / 12 (se calcula dividiendo 5 entre 12) = 0,4 • Por lo tanto, multiplicando por 100, Daniel tiene un 40 % de probabilidad de sacar

un par de medias color marrón... Obviamente, la probabilidad de que saque una negra es

• P= 7 / 12 = 0,6 y en porcentaje el 60 %, aunque se podría haber llegado al mismo resultado restando (1 - 0,4), ya que como les expliqué, la suma de las probabilidades puras siempre da 1.

• Este es el concepto más simple de probabilidad (dividir una parte entre el total) y luego multiplicar por 100

Page 18: Estadística inferencial

Teoría de la ProbabilidadP de formar parte de la muestra

Ciudad con 1.000.000 de electores (U)Muestra de 1.500 (m)P=m/U= 1.500/1.000.000= 0,0015Convirtiendo en %, si multiplicamos por 100, laP de un elector de ser elegido para formar partedel estudio es de 0.15 %

Page 19: Estadística inferencial

A la inversa: Un encuestado ¿cuántos electores representa?

Se lo llama Factor de Representación y como reporteros, lo podemos calcular.

FR=U/m= 1.000.000/1.500= 666,666 667

Conclusión: Un entrevistado representa a 667 empadronados.

Page 20: Estadística inferencial

¿Qué podrían calcular? 1) La cantidad promedio de automóviles que circulan diariamente

(excluya camiones y colectivos) y la cantidad de accidentes de tránsito que se producen diariamente. Con esos datos pueden calcular la probabilidad porcentual que un conductor tiene de ser víctimas de un accidente de tránsito

2) Con el número de hogares totales y el número de hogares en los que diariamente se cometen delitos calificados contra la propiedad , podrían calcular la probabilidad % que cada hogar tiene de resultar víctima.

3) En tiempos de encuestas electorales, con el dato de la cantidad de electores, si las consultoras realizan encuestas sobre n cantidad de personas (muestra) pueden calcular la probabilidad % que tiene un elector de formar parte de la muestra.

Page 21: Estadística inferencial

Teoría del Muestreo

Tiene por objeto estudiar a una población a partir de una muestra.

Cualquier periodista medianamente entrenado puede estudiar una muestra (propia o ajena), con el objeto de encontrar una noticia o varias en los resultados.

Tal actitud ubica al periodista en un rol activo y no en mero transmisor

Page 22: Estadística inferencial

Tipos de muestreo

Veremos los de uso corriente en periodismo:

1) Método Aleatorio Simple

2) Método Estratificado (Proporcional): Es el usado en encuestas electorales

Page 23: Estadística inferencial

Muestreo Aleatorio

Se usa si se dispone de una lista total de los elementos de la población y el azar determina a cuál se estudiará

Todos los individuos tienen la misma chance de formar parte de la muestra

Mismo concepto del sorteo de lotería Ningún procedimiento debe violar la aleatoriedad de

la medición

Page 24: Estadística inferencial

Ejemplo Aleatorio Simple

En una ciudad hay 900 médicos y quiero entrevistarlos para consultarlos sobre sus hábitos de fumar.

La muestra fue determinada en 270 Numeraré a los 900 médicos y sortearé 270 Si uno no contesta: se da como parte de la encuesta

(NC). Si no se lo encuentra, se sortea otro.

Page 25: Estadística inferencial

Muestreo por Estratos (Proporcional)

Se divide a la población por grupos (primero regiones y luego circuitos).

Se toma una sub-muestra de cada uno mediante el método aleatorio

Respeta pirámide proporcional (en número, edad y sexo)

Page 26: Estadística inferencial

Ejemplo: estratificado proporcional para una ciudad

• Ciudad con 100.000 electores• Muestra: 400• 6 circuitos electorales (35%, 25%,10%,10%,15%, 5%)• Calcular proporciones sobre la base de 400http://www.csgnetwork.com/csgpercent.html

• Seleccionar la manzana al azar (aleatorio simple) dentro de cada circuito.

• Se usan programas informáticos (SPSS)

Page 27: Estadística inferencial

¿Cómo determinar el tamaño de la muestra?

• ¿Cuántos elementos debo medir para que ese conjunto sea representativo del total?

• El tamaño de la muestra se calcula mediante fórmulas.

• Previamente el investigador establece nivel de confianza y margen de error con los que trabajará.

Page 28: Estadística inferencial

Datos previos

IC Z80 % 1.2885 % 1.4490 % 1.6495 % 1.9697.5 % 2.2499 % 2.57

Page 29: Estadística inferencial

ErrorAdmitido: Se expresa en porcentaje en la ficha

técnica, pero en las fórmulas se indica en decimales

Ej: error del 5 %, en la fórmula va 0,05Para investigación social, el error máximo

admisible no debería superar el 5 % (criterio de calidad)

En encuestas electorales, lo ideal sería trabajar con errores que van del 1 al 3 %

Se expresan como intervalo: +/- 3%

Page 30: Estadística inferencial

Regla

• Trabajar con un nivel de confianza alto o con un margen de error pequeño. (¡90 no es alto!)

• Es imposible combinar las dos situaciones optimas, salvo si se emplea una muestra muy grande.

Page 31: Estadística inferencial

¿De dónde sale el número 384?Tamaño de muestra

Método Aleatorio Simple

Primera aproximación, independiente del Universo total:

m= [Z² x (pq)] / e²(El cuadrado del coeficiente que corresponde al IC por elproducto de p por q (situación de proporcionalidad másdesfavorable), dividido entre el cuadrado del error estimado).

m = [(1,96)².(0,5 x 0.5)] / (0,05)² = 384 Tamaño de muestra que corresponde al IC 95 %, con error del+/- 5%

Ajuste de la muestra: M= 384/ [1 + (384/U)] (Cuando conozco el Universo)

Page 32: Estadística inferencial

Método estratificado proporcional (otra fórmula) Poblaciones < de 100.000

(Para IC 95%): Ciudades medianas o pequeñasMuestra error 4% error 5% error 10%

500 ----- 222 831000 385 286 912000 476 333 953000 517 353 974000 541 364 985000 556 370 9810.000 588 385 9915.000 600 390 9920.000 606 392 10025.000 610 394 10050.000 617 397 100100.000 621 398 100

Page 33: Estadística inferencial

Poblaciones > 100.000 (electorales nacionales)

Error Tamaño Muestra1 % 10.0002 % 2.5003% 1.1114% 6255% 4006% 2787% 2048% 1569% 12310% 100

Page 34: Estadística inferencial

Verificación del error muestral La verificación del error responde a una fórmula y su igualdad se debe cumplir

e = Z √ (p q)/m • Error: = El coeficiente Zeta multiplicado por la raíz cuadrada de la división del

producto p x q, dividido entre m (tamaño de la muestra) • O despejando de m = 4 (p x q)/e²

Ejemplo: Encuesta con muestra de 700 encuestados, IC del 95 % y error del +/- 2 % • e = 1.96 √(0.5 x 0,5)/ 700 = 0,037 • e % = 0,037 x 100 = 3,7 % • En realidad se trabajó con el (+/-) 3,7 % de error

Page 35: Estadística inferencial

Cálculo de intervalos

• Cantidato A : 20 % intención de voto• Cantidato B: 15 % intención de voto

Si se trabajó con +/- 3 % error la predicción es:A: [17 % - 23 %]B: [12 % - 18%]

Page 36: Estadística inferencial

Regla de la Aleatoriedad: ¿Se cumplió?

• Mapa del país: Pirámide Poblacional. Cada región debe estar representada

• Dentro de cada región: Pirámide poblacional. Cada circuito electoral debe estar representado

• Dentro de cada circuito: Sorteo aleatorio de manzanas (al azar). Todas deben tener la misma posibilidad de salir sorteadas.

• En cada manzana sorteada se elige un número aleatorio de hogares (al azar). Todos deben tener la misma posibilidad de ser elegidos.

• En cada hogar seleccionado, cada morador debe tener la misma posibilidad de completar la encuesta.

Page 37: Estadística inferencial

Nivel de éxito

• Es el número de gente que respondió dividido por el número total de gente que se intentó contactar

• Cuando la tasa de respuesta cae por debajo del 50 % el riesgo aumenta. Los no localizados pueden distorsionar demasiado el resultado (¿Se achica la muestra?)

Page 38: Estadística inferencial

Niveles de Predicción

• Dependen del momento en que se realice la encuesta. No se debe olvidar que una encuesta es una foto del momento en que se realiza.

• Cuanto más nos acercamos al día de la elección, más predicción se obtiene.

• La encuesta comienza a ser predictiva, en términos electorales, aproximadamente 30 días antes del día de la elección

• El pronóstico se mantiene siempre y cuando el escenario político-social-económico no observe grandes cambios.

Page 39: Estadística inferencial

Los demonios de Campbell(Donald T. Campbell- Harvard)

• El contexto: Si se mide algo en dos momentos diferentes y se encuentra una diferencia, ésta puede deberse a factores externos.

• La maduración: Si se mide algo en mismos individuos (políticos), hay que considerar que el paso del tiempo modifica posturas u opiniones y en consecuencia respuestas. Factor edad y sucesos influyen.

• Regresión estadística: No conviene, basándose en estudios previos, analizar los extremos, ya que una nueva medición puede acercarlos hacia el centro (caso Brasil, aumento dólar y riesgo país)

• Selección: Si dos grupos a comparar no fueron seleccionados aleatoriamente, la comparación no sirve.

• Mortalidad de la muestra: Si la experimentación dura un cierto tiempo, resulta difícil mantener las mismas condiciones.

Page 40: Estadística inferencial

Herramientas Digitales• http://www.newslab.org/links/calculatorlinks.htm

• http://www.percent-change.com/

• http://www.quickmath.com/webMathematica3/quickmath/page.jsp?site=quickmath&s1=numbers&s2=percentages&s3=basic#reply

• http://www.metric-conversions.org/es/calculadoras-para-conversiones.htm

• http://www.csgnetwork.com/fincountdaysfromtocalc.html

• http://jumk.de/calc/longitud.shtml

Page 41: Estadística inferencial

Links Encuestas PLANIFICACIÓN DE LA COBERTURA ELECTORALhttp://aceproject.org/ace-es/topics/me/mef/mef02 FÓRMULAS ELECTORALEShttp://www.iidh.ed.cr/comunidades/redelectoral/docs/red_diccionario/formula%20electoral.htm10 REGLAS PRÁCTICAS DE CÓMO LEER ENCUESTAS ELECTORALEShttp://www.zagoyasociados.com.ar/index.php/informacion/articulos-de-interes/66-diez-reglas-practicas-de-como-leer-encuestas-

electorales.htmlOBSERVATORIO ELECTORAL LATINOAMERICANOhttp://www.observatorioelectoral.org TECNICAS DE MUESTREOhttp://www.bioestadistica.uma.es/libro/node87.htm FIANCIAMIENTO DE CAMPAÑASwww.opensecrets.org CONSULTORIO POLÍTICOhttp://www.consultoriopolitico.org/ VOTÁ INTELIGENTEhttps://votainteligente.com.ar/ LA ESPIRAL DEL SILENCIOhttp://www.alipso.com/monografias/espiral_del_silencio_op/ FINANCIAMIENTO ELECTORALhttp://dineroypolitica.org/ EL GÉNERO EN LA COBERTURA ELECTORALhttp://www.slideshare.net/ACTransparencia/resultadosmonitoreo