Estadística Descriptiva

download Estadística Descriptiva

If you can't read please download the document

Transcript of Estadística Descriptiva

  • 1. Diplomado en Metodologa de la Investigacin UNIVERSIDAD EVANGLICA DEL PARAGUAY FACULTAD DE HUMANIDADES Y CIENCIAS DE LA EDUCACIN Estadstica Descriptiva e Inferencial aplicada al proceso de la Investigacin Cientfica Prof. Eduardo Lysak 2011

2. Contenidos a ser desarrollados:

  • Introduccin a la Estadstica Descriptiva

3. Tablas de frecuencia 4. Grficos 5. Medidas de Tendencia Central 6. Medidas de Variabilidad 7. Donde surgi Estadstica ? La palabra Estadstica procede del vocablo Estado, pues era funcin principal de los Gobiernos de los Estados establecer registros de poblacin, nacimientos, defunciones, impuestos, cosechas.La necesidad de poseer datos cifrados sobre la poblacin y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas. 8. Historia de la Estadstica2011 3100 aC los egipcios ya analizaban los datos de la poblacin y la renta del pas mucho antes de construir la pirmides observamos en uno de los libros del Pentateuco, bajo el nombre de Nmeros, el censo que realiz Moiss despus de la salida de Egipto. Textualmente dice: "Censo de las tribus:existan los censos chinos ordenados por el emperador Tao hacia el ao 2.200 a.C. Se erigi la figura del censor, cuya misin consista en controlar el nmero de habitantes y su distribucin por los distintos territorios el paso de la estadstica deductiva a la estadstica inductiva 1830. 0 9. La Estadstica se ocupa de los mtodos y procedimientos para recoger ,clasificar ,resumir ,hallar regularidadesyanalizar losdatos ,as como derealizarinferencias a partir de ellos, con la finalidad de ayudar a la toma dedecisionesy en su caso formularpredicciones . ESTADSTICA 10.

  • Mtodo Cientfico y Estadstica
  • Plantear hiptesis
  • Obtener conclusiones
  • Recoger datos y analizarlos
  • Disearexperimento

11. ESTADSTICA DESCRIPTIVA INFERENCIAL comprende las tcnicas que se emplean para resumir y describir datos numricos El problema crucial de la estadstica inferencial es llegar a proposiciones acerca de la poblacin a partir de la observacin efectuada en muestras bajo condiciones de incertidumbre Tablas, Grficos, Medidas de Dispersin, Medidas de Centralizacin, etc. Muestreo, Estimacin de parmetros, Contraste deHiptesis 12.

  • Poblacin y Muestra

POBLACIN MUESTRA 13.

  • Poblacin y muestra
  • Poblacines el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).
  • Normalmente es demasiado grande para poder abarcarlo.
  • Muestraes un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)
  • Debera ser representativo

14. Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). 15.

  • Poblacin y muestra

Queremos conocerla POBLACION MUESTRA Disponemos de ella para conocer Muestraaleatoria Estadgrafos Inferenciaestadstica Parmetros 16. NATURALEZA DE LOS DATOS: Variables y Escalas de Medicin 17. VARIABLE Se llama variable a unacaractersticaque se observa en una poblacin o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Una variable se puede clasificar de la siguiente manera. VARIABLE CUANTITATIVA CUALITATIVA toma valores numricos describe cualidades DISCRETA CONTNUA 18. Identifica cada una de las siguientes variables de acuerdo a su tipo.

  • Edad

19. Sexo 20. N de hijos 21. N de llamadas diarias en un Callcenter 22. Religin 23. Estado Civil 24. Grado Militar 25. Opinin sobre atencin en un Banco 26. Tiempo empleado para medir una r eaccin qumica 27. ESCALAS DE MEDICIN DE VARIABLES ESCALA NOMINAL ORDINAL DE INTERVALO DE RAZN CUALITATIVAS CUANTITATIVAS 28. ESCALAS DE MEDICIN DE VARIABLES Escala Nominal

  • nicamente nos permite establecer relaciones de igualdad/desigualdad entre los objetos que estamos midiendo.

29. Los nmeros asignados a estos objetos podran ser sustituidos por letras o nombres sin que ello afecte al resultado de la medicin. Ejemplo: si medimos la variableestado civil,(1) soltero/a (2) casado/a (3) viudo/a (4) divorciado/a 30. ESCALAS DE MEDICIN DE VARIABLES Escala Ordinal E s aquella que, adems de relaciones de igualdad/desigualdad, nos permite establecer relaciones de orden entre los objetos que estamos midiendo. Ejemplo: El seleccionador de personal de una empresa establece un orden tras entrevistar a los candidatos a un puesto de trabajo . 1 2 3 4 no es posible afirmar que la distancia que separa a los candidatos 31. ESCALAS DE MEDICIN DE VARIABLES Escala de Intervalo Nos permite establecer relaciones de igualdad/desigualdad y de orden entre los objetos que medimos. Asimismo, los intervalos entre los nmeros de la escala son iguales, por lo que podemos realizar operaciones de suma y resta Ejemplo: Para medir la temperatura utilizamos una escala de intervalo. Como la temperatura en celsius 0 es arbitraria, no implica ausencia de temperatura hace que no podamos afirmar por ejemplo que la mitad de 80 es 40 32. ESCALAS DE MEDICIN DE VARIABLES Escala de Razn Es la que permite el nivel ms alto de medicin. En esta escala existe el 0 emprico, por lo que podemos realizar cualquier tipo de operacin aritmtica con los nmeros de la escala. Ejemplo: la estatura de un grupo de estudiantes, n de hijos, edad, tiempo de reaccin, longitud. 33. Presentacin de Datos. Tablas y Grficos 34. Tablas La presentacin de los cuadros o tablas varia de acuerdo al contenido y al uso a los que estn destinados.En su elaboracin, deben considerarse dos requisitos primordiales:

  • Ser de fcil lectura e interpretacin.

35. Ser auto explicativos.No existen pautas uniformes de presentacin de los cuadrosestadsticos. Lo que se busca es que el usuario interprete la informacin dada. En la presentacin de la informacin se deben tener en cuenta elsentido comn y el punto de vista de los usuarios. 36. TABLAS DE FRECUENCIAS Tabular datos consiste en confeccionar una tabla en la que aparecen bien organizados los valores de la variables que se estn estudiando, junto con otros datos que ahora explicamos:

  • Frecuencia absoluta:f iNmero de individuos que toma cada valor.

37. Frecuencia relativa : f i/nResulta de dividir la frecuencia absoluta entre el total de la poblacin. Da el tanto por uno. 38. Frecuencia absoluta acumulada F i :Suma de las frecuencias relativas de los valores menores o iguales que l(slo tiene sentido para variables estadsticas cuantitativas) 39. Frecuencia relativa acumulada:F i/n Suma de las frecuencias relativas de los valores menores o iguales que l. 40. TABLAS DE FRECUENCIAS DE VARIABLES CUALITATIVAS Ejemplo:suponiendo que se ha recolectado la opinin de 10 estudiantes sobre la despenalizacin de la marihuana . 41. INDIFERENTES A FAVOR EN CONTRA ORDENAMOSLOS DATOS 42. Opinin Indiferente En contra A favor f i 5 3 2 f i=10 n f i/n 5/10 = 0,5 3/10 = 0,3 2/10 = 0,2 1 f% 50% 30% 20% 100% Frecuencias Absolutas Frecuencias relativas Porcentajes categoras AGRUPAMOS 43. TABLAS DE FRECUENCIAS DE VARIABLES CUANTITATIVAS DISCRETAS Ejemplo:los datos siguientes corresponden al numero de intentos realizados para ingresar a la facultad de medicina de 20 estudiantes.ORDENAMOSLOS DATOS 44. intentos f i f i=20 f i/n 1 F i 1 2 3 4 5 4 5 6 2 3 0,20 0,25 0,30 0,10 0,15 4 9 15 17 20 Frecuencias Absolutas Frecuencias relativas Frecuencias acumuladas 45. intentos f i f i/n F i 1 2 3 4 5 4 5 6 2 3 0,20 0,25 0,30 0,10 0,15 4 9 15 17 20 Como leer tablas de frecuencias?

  • Cuntos estudiantes ingresaron en 3 intentos (X=3)?

46. intentos f i f i/n F i 1 2 3 4 5 4 5 6 2 3 0,20 0,25 0,30 0,10 0,15 4 9 15 17 20 Como leer tablas de frecuencias?

  • Cuntos estudiantes lograron ingresar en menos de 3 intentos

X < 3={1, 2} 47. intentos f i f i/n F i 1 2 3 4 5 4 5 6 2 3 0,20 0,25 0,30 0,10 0,15 4 9 15 17 20 Como leer tablas de frecuencias?

  • Cuntos estudiantes lograron ingresar en por lo menos 3 intentos

X 3 ={3, 4, 5} 48. TABLAS DE FRECUENCIAS DE VARIABLES CUANTITATIVAS CONTNUAS Ingresos mensuales en miles de Gs. f i f i= n MARCA DE CLASE = (Li + Ls)/2 1000 1990 2000 2990 3000 3990 4000 4990 5000 5990 12 16 8 4 2 X 1495 2495 3495 4495 5495 INTERVALOS Li(lmite inferior) Ls (lmite superior) 49. Grficos Un grfico es una representacin pictrica, de figuras geomtricas o de superficies con el fin de estudiar los cambios en una sola variable, o bien, para comparar diversas variables similares o relacionadas. Para un estudio estadstico no basta con la adecuada presentacin del material numrico, sino que, adems, es necesario un grfico queayude a facilitar su comprensin, pues, todo grfico es la expresin de los nmeros proporcionados por los cuadros estadsticos y es un complemento de este. Las cualidades esenciales del grfico son:simplicidad, claridad y veracidad.Permite identificar con facilidad las caractersticas similares o diferenciadas de una variable. 50. Grficos

  • Ventajas
  • Rpida y fcil interpretacin de los datos numricos de los cuadro.

51. Agradable a la vistaLos grficos estadsticos pueden clasificarse segn el mtodo derepresentacin empleado: 52. Grfico 1. Cantidad de horas dedicadas por los alumnos a conectarse a Internet. 1- DIAGRAMA DE BARRAS: Aplicable en variables nominales, ordinales y discretas Grficos 53. 2- DIAGRAMAS CIRCULARES Toda clase de variable, los datos deben estar en % Grafico3. Redes Sociales utilizadas con mayor frecuencia.Grficos 54. 3- HISTOGRAMAS:

  • Un histograma es una representacin grfica de una variable en forma de barras.

55. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. Grficos 56. Los histogramas se obtiene a partir de tablas en las que hay intervalos de clases. Ingresos mensuales en miles de Gs. f i 1000 1990 2000 2990 3000 3990 4000 4990 5000 5990 12 16 8 4 2 X 1495 2495 3495 4495 5495 Grficos 57. 58. MEDIDAS DESCRIPTIVAS Medidas Descriptivas Tendencia Central Posicin Variabilidad

  • Media o promedio

59. Mediana 60. Moda

  • Cuartiles

61. Deciles 62. Percentiles

  • Rango

63. Varianza 64. Desviacin Tpica 65. 1. Media Estadstico (media muestral) Parmetro (media poblacional) Calculo de la Media: Calcular el promedio de las siguientes edades: 25, 31, 28, 29, 30 66. intentos f i 1 2 3 4 5 4 5 6 2 3 como calcular promedio cuando los datos estn tabulados? Frmula de la Media cuando los datos estn agrupados. f i.x i 4 10 18 8 15 67. 2. Mediana (Me) Es una medida de centralizacin que divide a la distribucin de una poblacin en dos partes iguales Calcular la Me de las siguientes edades: 25, 31, 28, 29, 30 25,28,29,30,31 n= 5(impar) ORDENAR Posicin de la mediana 1 23 4 5 Me=29 68. 2. Mediana (Me) Otro ejemplo: 25, 31, 28, 28, 30, 26, 29, 30 25,26,28,28,29,30,30,31 n= 8(par) 1 2 3 4 567 8 Me=(28+29)/2= 28,5 Se promedia 69. COMPARACIN ENTRE MEDIA Y MEDIANA: ROBUSTEZ Un rasgo que diferencia a media y mediana es su comportamiento frente a datos atpicos. EJEMPLO: Supongamos que tenemos las siguientes observaciones: 1,5 1,8 1,7 1,5 1,6 1,9 2,1 1,8 1,6 70. COMPARACIN ENTRE MEDIA Y MEDIANA: ROBUSTEZ Ahora, hagamos la suposicin que nos equivocamos al escribir el valor 21 en vez de 2,1 1,5 1,8 1,7 1,5 1,6 1,9 21 1,8 1,6 x Dato atpico 71. SIMETRA 72. CUARTLES Los cuartiles son medidas estadsticas de posicin que tienen la propiedad de dividir la serie estadstica en cuatro grupos de nmeros iguales de trminos. 73. Diagrama de Caja - Boxplot Los diagramas de Caja-Bigotes (boxplots) son una presentacin visual que describe varias caractersticas importantes al mismo tiempo, tales como ladispersin y simetra . Para su realizacin se representan los trescuartilesy los valoresmnimoymximode los datos, sobre un rectngulo, alineado horizontal o verticalmente. 74. Diagrama de Caja - Boxplot O O - Valor Mximo - Valor Mnimo - Mediana - Q3 - Q1 Datos atpicos 75. Medidas de dispersin Mediante lamedia, la mediana y la modaconocemos una parte de la informacin acerca de las caractersticas de los datos, pero para completar esa informacin necesitaramos saber si todos los estn prximos o no a estas medidas.Para medir esta desviacin respecto a los valores centrales utilizamos los parmetros de dispersin. 76. Medidas de dispersin PARA ENTENDER LAS MEDIDAS DE DISPERSIN CONSIDEREMOS EL SIGUIENTE EJEMPLO: GRUPO 1 GRUPO 2 EDAD = SON IGUALES? 77. GRUPO 1 78. GRUPO 2 79. RANGO Algo que responde a la identificacin de la dispersin de los datos de una muestra es el rango, el cual se define como la diferenciaentre el dato mayor menos el dato menor de un conjunto de datos.24 8 172432 Rango = 32 2 = 30 80. VARIANZA y DESVIACIN TPICA Son las dos medidas de variabilidad mas importantes, tienen por objetivo medir en grado de variacin de los datos respecto al valor de la media 81. Varianza Estadstico (varianza muestral) Parmetro (varianza poblacional) Desviacin Tpica:es la raz cuadrada de la varianza 82. Propiedades de la varianza 1. La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2. Si a todos los valores de la variable se les suma un nmero la varianza no vara. 3. Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero. 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. 83. Supongamos que un grupo de profesionales en un pas A tienen un salariopromedio de US$26.888 y varianza US$14.400. En un pas B otro grupo deprofesionales con iguales caractersticas reciben un salario promedio deUS$8.570 con desviacin estndar de US$80. Cul grupo de salariospresenta una menor variabilidad?