Estadística inferencial
-
Upload
sandra-crucianelli -
Category
Education
-
view
666 -
download
2
Transcript of Estadística inferencial
Investigación Cuantitativa
Su valor en la investigación basada en datos
Por Sandra Crucianelli@spcrucianelli
El Valor de la ObservaciónAsociar cambios a noticias
Un rápido test de medición: ¿mayor puntaje en el menor tiempo?
http://www.thatquiz.org/Medidas y Gráficos de línea
Dimensionando un problemaEstadística Descriptiva
Analiza todos los casosEjemplos: censo nacional poblacional, censonacional agropecuario, censo electoral, censoeconómico.
¿Otros casos de censos? ¿Censos propios a partir de trabajos de campo?
Dispersión de los datosRango: es la diferencia entre el valor máximo y el valor mínimo en ungrupo de números . Se expresa como un intervalo: [ 2- 40]Desviación típica o estándar : diferencia entre el valor de la variable ysu media o promedioVarianza: cuadrado de la desviación. D y V: Nos indican qué tanto se aleja una serie de valores dela media o del valor esperado
Medidas de posición no centralesQuintiles: Es la quinta parte de una población estadística ordenada de menor a mayor. Se calcula ordenando a la población desde el individuo más pobre al más adinerado, para luego dividirla en 5 partes de igual número de individuos; con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primer quintil ( Q1) representa la porción de la población más pobre y así hasta el quinto quintil (Q5), representante de la población más rica.Cuartiles: Medida de localización que divide la población o muestra en cuatro partes iguales. Otras medidas: decil (entre 10) y percentil (entre 100)
Correlación
Cuando 2 o + fenómenos crecen o decrecen en forma simultánea debido a factores externos. Si lo hacen al mismo tiempo, se dice que están positivamente correlacionados. Si mientras uno crece, el otro decrece, se dice que están negativamente correlacionados.
Estadística InferencialObtiene conclusiones generales a partir de una muestra en estudio, extraída del Universo a estudiar
Permite formular prediccionesCasos: encuestas electorales, de
opinión pública, de mercadeo
¿Qué debe informar una encuesta?
Ficha Técnica1) Tamaño del Universo y de la muestra2) Margen de error estadístico3) Nivel de confianza4) Método de muestreo5) Texto del cuestionario y fecha realización6) Autor de la encuesta7) Origen de la financiación del trabajo
Ficha Técnica: condición de calidad Universo o Población: Se llama así al conjunto total de
elementos que son objeto de estudio. Puede estar formado/a por personas, hogares, empresas u objetos.
Muestra: Es una parte de ese universo que lo representa Tamaño de la muestra: Magnitud de los elementos que van a
ser relevados, medidos o estudiados (factor determinante en el resultado)
Error de muestreo: Error cometido y estimado, admitido por el encuestador. Se expresa como intervalos (+/- 5%)
Nivel o Intervalo de Confianza: Probabilidad de que los resultados obtenidos se encuadren dentro del error admitido por el encuestador. En electorales, se trabaja con IC que varían entre el 95 y el 99%
Z: (Zeta) Coeficiente que representa al IC
¿De dónde sale Z?
Z = valor crítico de una distribución normal estandarizadaSe llama valor crítico al valor de Z necesario para construir un
intervalo de confianza para la distribución. Normalmente en Estadística, la variable Z suele representar a una distribución normalizada, es decir la distribución normal
con media 0 y desviación 1. Se calcula con la ayuda de tablas o software.
Un nivel de confianza del 95% lleva a un valor Z de 1,96.
Metodología de la EncuestaDeterminar objetivo o necesidad de informaciónDeterminar el diseño del cuestionario y las
fuentes de datos (estudio minucioso del padrón)Desarrollar un esquema para la recolección de
datosDeterminar el tamaño de la muestraRecolectar los datosClasificación de datosAnálisis de datosConclusión
Regla de la Aleatoriedad
Todos y cada uno de los miembros de una población sobre la que se
pretenden generalizar los resultados (muestra) han de tener la misma
probabilidad de formar parte de la muestra
¿Cómo cumplir con esta regla?
Dar a cada miembro de la población en estudio la misma posibilidad de ser incluido, usando un método estadístico-matemático correcto
El proceso en el que se agudiza este requerimiento es en la determinación del tamaño de la muestra y la selección de los individuos o elementos a incluir.
Pirámide Poblacional En general, para que las conclusiones tengan
representatividad la muestra se conforma según la distribución geográfica
Ejemplo: muestra=1.000 ciudadanos Ciudad dividida en 8 secciones: Las mismas
concentran el 25%-20%-15%-10%-9%-7%-8%-6% Se relevarán: 250, 200,150,100,90,70,80 y 60
personas respectivamente. Igualmente, edades y sexo deben responder a
proporción de la pirámide
Pirámide Poblacional
Indispensable para estudios generales (en especial electorales)
Encuestas representativas deben basarse en este concepto
Sin pirámide poblacional no hay representatividad.
Sin pirámide poblacional se viola la regla de aleatoriedad.
Muestreo
• Imposibilidad de analizar a toda la población.• Usa menos recursos y da buenos resultados.• El resultado nunca será “igual”, pero puede
ser confiable.• Los intervalos de confianza, expresados en %,
nos dan una idea de la probabilidad de que el valor obtenido se acerque al real.
ProbabilidadConjunto de posibilidades de que un evento ocurra o no. La escala es de 0 a 1. Si un evento tiene P de no ocurrir, p=0. Si ocurre con certeza, p=1. Lo contrario, la posibilidad de que un evento no ocurra se denota con la letra q. La suma de p + q debe dar 1.Según lo anterior, la condición más desfavorable en este campo es:p = q = 0,5Está relacionado con el Principio de Incertidumbre. Cuando no hay estudios previos, se le asignan estos valores a p y q
Cálculo Probabilidad Simple• Supongamos que una persona tiene 12 pares de medias, 5 de las cuales son
marrones y 7 son negras...todas mezcladas. • Si se despierta todas las mañanas con poco tiempo y cuando abre el cajón, saca un
par sin mirar ¿qué probabilidad tiene de sacar una marrón?• P = 5 / 12 (se calcula dividiendo 5 entre 12) = 0,4 • Por lo tanto, multiplicando por 100, Daniel tiene un 40 % de probabilidad de sacar
un par de medias color marrón... Obviamente, la probabilidad de que saque una negra es
• P= 7 / 12 = 0,6 y en porcentaje el 60 %, aunque se podría haber llegado al mismo resultado restando (1 - 0,4), ya que como les expliqué, la suma de las probabilidades puras siempre da 1.
• Este es el concepto más simple de probabilidad (dividir una parte entre el total) y luego multiplicar por 100
Teoría de la ProbabilidadP de formar parte de la muestra
Ciudad con 1.000.000 de electores (U)Muestra de 1.500 (m)P=m/U= 1.500/1.000.000= 0,0015Convirtiendo en %, si multiplicamos por 100, laP de un elector de ser elegido para formar partedel estudio es de 0.15 %
A la inversa: Un encuestado ¿cuántos electores representa?
Se lo llama Factor de Representación y como reporteros, lo podemos calcular.
FR=U/m= 1.000.000/1.500= 666,666 667
Conclusión: Un entrevistado representa a 667 empadronados.
¿Qué podrían calcular? 1) La cantidad promedio de automóviles que circulan diariamente
(excluya camiones y colectivos) y la cantidad de accidentes de tránsito que se producen diariamente. Con esos datos pueden calcular la probabilidad porcentual que un conductor tiene de ser víctimas de un accidente de tránsito
2) Con el número de hogares totales y el número de hogares en los que diariamente se cometen delitos calificados contra la propiedad , podrían calcular la probabilidad % que cada hogar tiene de resultar víctima.
3) En tiempos de encuestas electorales, con el dato de la cantidad de electores, si las consultoras realizan encuestas sobre n cantidad de personas (muestra) pueden calcular la probabilidad % que tiene un elector de formar parte de la muestra.
Teoría del Muestreo
Tiene por objeto estudiar a una población a partir de una muestra.
Cualquier periodista medianamente entrenado puede estudiar una muestra (propia o ajena), con el objeto de encontrar una noticia o varias en los resultados.
Tal actitud ubica al periodista en un rol activo y no en mero transmisor
Tipos de muestreo
Veremos los de uso corriente en periodismo:
1) Método Aleatorio Simple
2) Método Estratificado (Proporcional): Es el usado en encuestas electorales
Muestreo Aleatorio
Se usa si se dispone de una lista total de los elementos de la población y el azar determina a cuál se estudiará
Todos los individuos tienen la misma chance de formar parte de la muestra
Mismo concepto del sorteo de lotería Ningún procedimiento debe violar la aleatoriedad de
la medición
Ejemplo Aleatorio Simple
En una ciudad hay 900 médicos y quiero entrevistarlos para consultarlos sobre sus hábitos de fumar.
La muestra fue determinada en 270 Numeraré a los 900 médicos y sortearé 270 Si uno no contesta: se da como parte de la encuesta
(NC). Si no se lo encuentra, se sortea otro.
Muestreo por Estratos (Proporcional)
Se divide a la población por grupos (primero regiones y luego circuitos).
Se toma una sub-muestra de cada uno mediante el método aleatorio
Respeta pirámide proporcional (en número, edad y sexo)
Ejemplo: estratificado proporcional para una ciudad
• Ciudad con 100.000 electores• Muestra: 400• 6 circuitos electorales (35%, 25%,10%,10%,15%, 5%)• Calcular proporciones sobre la base de 400http://www.csgnetwork.com/csgpercent.html
• Seleccionar la manzana al azar (aleatorio simple) dentro de cada circuito.
• Se usan programas informáticos (SPSS)
¿Cómo determinar el tamaño de la muestra?
• ¿Cuántos elementos debo medir para que ese conjunto sea representativo del total?
• El tamaño de la muestra se calcula mediante fórmulas.
• Previamente el investigador establece nivel de confianza y margen de error con los que trabajará.
Datos previos
IC Z80 % 1.2885 % 1.4490 % 1.6495 % 1.9697.5 % 2.2499 % 2.57
ErrorAdmitido: Se expresa en porcentaje en la ficha
técnica, pero en las fórmulas se indica en decimales
Ej: error del 5 %, en la fórmula va 0,05Para investigación social, el error máximo
admisible no debería superar el 5 % (criterio de calidad)
En encuestas electorales, lo ideal sería trabajar con errores que van del 1 al 3 %
Se expresan como intervalo: +/- 3%
Regla
• Trabajar con un nivel de confianza alto o con un margen de error pequeño. (¡90 no es alto!)
• Es imposible combinar las dos situaciones optimas, salvo si se emplea una muestra muy grande.
¿De dónde sale el número 384?Tamaño de muestra
Método Aleatorio Simple
Primera aproximación, independiente del Universo total:
m= [Z² x (pq)] / e²(El cuadrado del coeficiente que corresponde al IC por elproducto de p por q (situación de proporcionalidad másdesfavorable), dividido entre el cuadrado del error estimado).
m = [(1,96)².(0,5 x 0.5)] / (0,05)² = 384 Tamaño de muestra que corresponde al IC 95 %, con error del+/- 5%
Ajuste de la muestra: M= 384/ [1 + (384/U)] (Cuando conozco el Universo)
Método estratificado proporcional (otra fórmula) Poblaciones < de 100.000
(Para IC 95%): Ciudades medianas o pequeñasMuestra error 4% error 5% error 10%
500 ----- 222 831000 385 286 912000 476 333 953000 517 353 974000 541 364 985000 556 370 9810.000 588 385 9915.000 600 390 9920.000 606 392 10025.000 610 394 10050.000 617 397 100100.000 621 398 100
Poblaciones > 100.000 (electorales nacionales)
Error Tamaño Muestra1 % 10.0002 % 2.5003% 1.1114% 6255% 4006% 2787% 2048% 1569% 12310% 100
Verificación del error muestral La verificación del error responde a una fórmula y su igualdad se debe cumplir
e = Z √ (p q)/m • Error: = El coeficiente Zeta multiplicado por la raíz cuadrada de la división del
producto p x q, dividido entre m (tamaño de la muestra) • O despejando de m = 4 (p x q)/e²
Ejemplo: Encuesta con muestra de 700 encuestados, IC del 95 % y error del +/- 2 % • e = 1.96 √(0.5 x 0,5)/ 700 = 0,037 • e % = 0,037 x 100 = 3,7 % • En realidad se trabajó con el (+/-) 3,7 % de error
Cálculo de intervalos
• Cantidato A : 20 % intención de voto• Cantidato B: 15 % intención de voto
Si se trabajó con +/- 3 % error la predicción es:A: [17 % - 23 %]B: [12 % - 18%]
Regla de la Aleatoriedad: ¿Se cumplió?
• Mapa del país: Pirámide Poblacional. Cada región debe estar representada
• Dentro de cada región: Pirámide poblacional. Cada circuito electoral debe estar representado
• Dentro de cada circuito: Sorteo aleatorio de manzanas (al azar). Todas deben tener la misma posibilidad de salir sorteadas.
• En cada manzana sorteada se elige un número aleatorio de hogares (al azar). Todos deben tener la misma posibilidad de ser elegidos.
• En cada hogar seleccionado, cada morador debe tener la misma posibilidad de completar la encuesta.
Nivel de éxito
• Es el número de gente que respondió dividido por el número total de gente que se intentó contactar
• Cuando la tasa de respuesta cae por debajo del 50 % el riesgo aumenta. Los no localizados pueden distorsionar demasiado el resultado (¿Se achica la muestra?)
Niveles de Predicción
• Dependen del momento en que se realice la encuesta. No se debe olvidar que una encuesta es una foto del momento en que se realiza.
• Cuanto más nos acercamos al día de la elección, más predicción se obtiene.
• La encuesta comienza a ser predictiva, en términos electorales, aproximadamente 30 días antes del día de la elección
• El pronóstico se mantiene siempre y cuando el escenario político-social-económico no observe grandes cambios.
Los demonios de Campbell(Donald T. Campbell- Harvard)
• El contexto: Si se mide algo en dos momentos diferentes y se encuentra una diferencia, ésta puede deberse a factores externos.
• La maduración: Si se mide algo en mismos individuos (políticos), hay que considerar que el paso del tiempo modifica posturas u opiniones y en consecuencia respuestas. Factor edad y sucesos influyen.
• Regresión estadística: No conviene, basándose en estudios previos, analizar los extremos, ya que una nueva medición puede acercarlos hacia el centro (caso Brasil, aumento dólar y riesgo país)
• Selección: Si dos grupos a comparar no fueron seleccionados aleatoriamente, la comparación no sirve.
• Mortalidad de la muestra: Si la experimentación dura un cierto tiempo, resulta difícil mantener las mismas condiciones.
Herramientas Digitales• http://www.newslab.org/links/calculatorlinks.htm
• http://www.percent-change.com/
• http://www.quickmath.com/webMathematica3/quickmath/page.jsp?site=quickmath&s1=numbers&s2=percentages&s3=basic#reply
• http://www.metric-conversions.org/es/calculadoras-para-conversiones.htm
• http://www.csgnetwork.com/fincountdaysfromtocalc.html
• http://jumk.de/calc/longitud.shtml
Links Encuestas PLANIFICACIÓN DE LA COBERTURA ELECTORALhttp://aceproject.org/ace-es/topics/me/mef/mef02 FÓRMULAS ELECTORALEShttp://www.iidh.ed.cr/comunidades/redelectoral/docs/red_diccionario/formula%20electoral.htm10 REGLAS PRÁCTICAS DE CÓMO LEER ENCUESTAS ELECTORALEShttp://www.zagoyasociados.com.ar/index.php/informacion/articulos-de-interes/66-diez-reglas-practicas-de-como-leer-encuestas-
electorales.htmlOBSERVATORIO ELECTORAL LATINOAMERICANOhttp://www.observatorioelectoral.org TECNICAS DE MUESTREOhttp://www.bioestadistica.uma.es/libro/node87.htm FIANCIAMIENTO DE CAMPAÑASwww.opensecrets.org CONSULTORIO POLÍTICOhttp://www.consultoriopolitico.org/ VOTÁ INTELIGENTEhttps://votainteligente.com.ar/ LA ESPIRAL DEL SILENCIOhttp://www.alipso.com/monografias/espiral_del_silencio_op/ FINANCIAMIENTO ELECTORALhttp://dineroypolitica.org/ EL GÉNERO EN LA COBERTURA ELECTORALhttp://www.slideshare.net/ACTransparencia/resultadosmonitoreo