1. Descripcion de Datos

download 1. Descripcion de Datos

of 33

description

Investigación científica

Transcript of 1. Descripcion de Datos

  • Anlisis de datos 1. DESCRIPCION

  • La Estadstica trata del recuento, la ordenacin y clasificacin de datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.

    Un estudio estadstico consta de las siguientes fases: a) Recogida de datos b) Organizacin y representacin de datos c) Anlisis descriptivo de datos (y luego

    anlisis inferencial) d) Obtencin de conclusiones

  • Planteado el test o encuesta oportuno, una vez elegido el tema al que se quiere hacer el estudio estadstico, y recogidos los datos que correspondan, el primer anlisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionar en gran medida su posterior tratamiento.

    PASO 1: RECOGIDA DE DATOS

  • PASO 2: ORGANIZACIN DE LOS DATOS

    Determinado el modo de agrupamiento de las observaciones,

    procedemos a su recuento, construyendo la tabla de

    frecuencias.

    Posteriormente podremos visualizar tales frecuencias de forma

    grfica con el diagrama estadstico apropiado.

    a) TABLA DE FRECUENCIAS (Tabla en APA)

    b) GRFICOS (Figura en APA): diagrama de barras,

    histograma, polgono de frecuencias, diagrama de

    sectores, pictogramas, pirmides de poblacin,

    climogramas, etc.

  • Recuento

  • Tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

    Frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

    Frecuencia relativa decimal es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.

    Se representa por hi.

    La suma de las frecuencias relativas decimales es igual a 1.

    ii

    fh =N

    TABLA DE FRECUENCIAS

  • Frecuencia relativa porcentual es la frecuencia relativa decimal multiplicada por 100. Se puede expresar por %i La suma de las frecuencias relativas porcentuales es 100.

    Frecuencias acumuladas es la suma de las frecuencias correspondientes de todos los valores inferiores o iguales al valor considerado. Se representa por:

    Fi la frecuencia absoluta acumulada Hi la frecuencia relativa decimal acumulada %Ai la frecuencia relativa porcentual acumulada Para que tengan sentido los frecuencias acumuladas, los valores de la variable deben estar ordenados.

    i i% =100h

  • DATOS

    xi

    Frecuenci

    a

    absoluta

    fi

    Frecuencia

    absoluta

    acumulada

    Fi

    Frecuencia relativa Frecuencia relativa

    acumulada Decimal

    Porcentual

    Decimal

    Hi Porcentual

    %Ai

    5 6 6 0,0150 1,5 % 0,0150 1,5 %

    6 48 54 0,1200 12 % 0,1350 13,5 %

    7 95 149 0,2375 23,75 % 0, 3725 37,25 %

    8 105 254 0,2625 26,25 % 0,6350 63,50 %

    9 87 341 0,2175 21,75 % 0,8525 85,25 %

    10 59 400 0,1475 14,75 % 1 100 %

    N = 400 1 100 %

    ii

    fh =N

    i i% =100h

    TABLA DE FRECUENCIAS CON VARIABLE CUANTITATIVA DISCRETA

  • xi fi Fi hi Hi % %Ai

    [0, 5) 2.5 1 1 0.025 0.025 2.5 2.5

    [5, 10) 7.5 1 2 0.025 0.050 2.5 5

    [10, 15) 12.5 3 5 0.075 0.125 7.5 12.5

    [15, 20) 17.5 3 8 0.075 0.200 7.5 20

    [20, 25) 22.5 3 11 0.075 0.2775 7.5 27.5

    [25, 30) 27.5 6 17 0.150 0.425 15 42.5

    [30, 35) 32.5 7 24 0.175 0.600 17.5 60

    [35, 40) 37.5 10 34 0.250 0.850 25 85

    [40, 45) 42.5 4 38 0.100 0.950 10 95

    [45, 50) 47.5 2 40 0.050 1 5 100

    N = 40 1 100

    TABLA DE FRECUENCIAS CON VARIABLE CUANTITATIVA CONTINUA

  • LAS GRFICAS ESTADSTICAS PERMITEN VISUALIZAR LA INFORMACIN CONTENIDA EN LAS TABLAS DE MANERA RPIDA Y SENCILLA

    EXISTEN MUCHOS TIPOS DE GRFICAS ESTADSTICAS, UNAS SE EMPLEAN CON VARIABLES CUANTITATIVAS Y OTRAS CON VARIABLES CUALITATIVAS DIAGRAMA DE BARRAS HISTOGRAMA

    GRAFICAS ESTADISTICAS

  • Diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas, relativas, porcentajes o frecuencias acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia.

    Grupo

    sanguneo fi

    A 6

    B 4

    AB 1

    0 9

    N = 20 0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    A B AB O

    fi

    Grupo sanguneo

  • Histograma se utiliza para presentar datos cuantitativos de tipo continuo. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los intervalos de los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas, relativas , porcentajes o frecuencias acumuladas. Los datos se representan mediante barras pegadas unas a otras de una altura proporcional a la frecuencia.

    Puntuacin Marca de

    clase xi fi

    11-17 14 6

    18-24 21 4

    25-31 28 15

    32-38 35 13

    39-45 42 1

    46-52 49 1

    N = 40

  • Polgono de frecuencias se realiza para cualquier tipo de variable. Es el polgono que se forma al unir los puntos medios de las barras tanto en histogramas como en diagramas de barras.

  • Diagrama de sectores es un grfico donde se suele representar los porcentajes. Cada sector es proporcional al porcentaje que representa. Los grados de cada sector es:

    igrados =360h

    9%

    21%

    19% 15%

    15%

    15% 6%

    Poblacin de la encuesta por edad

    12 Aos

    13 Aos

    14 Aos

    15 Aos

    16 Aos

    17 Aos

    18 Aos

  • Pictograma es un grfico con figuras

  • Pirmide de poblacin consiste en dos histogramas, uno para hombres y otro para mujeres, correspondientes a habitantes de una misma comunidad ms o menos extensa, repartidos por edades. Es til para estudiar su situacin demogrfica y buscar explicaciones a situaciones presentes , pasadas y futuras.

    Pirmide de poblacin Per 1900 Pirmide de poblacin Per 2005

  • a)Descripcin de datos b)Prueba de hiptesis

    PASO 3: ANALISIS DE DATOS

  • Para este anlisis se utilizan los parmetros estadsticos:

    a) Medidas de centralizacin MEDIA, MEDIANA y MODA b) Medidas de dispersin RECORRIDO, DESVIACIN MEDIA,. c) Medidas de posicin PERCENTILES y CUARTILES

    PASO 3: ANALISIS DE DATOS

  • MEDIA ARITMTICA es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.

    Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

    Evidentemente esta medida slo se puede hallar para variables cuantitativas.

    Medidas de dispersin RECORRIDO, DESVIACIN MEDIA,.

  • Ejemplo de clculo de media:

    Si Ud. Conoce el tiempo que le lleva arreglarse por la maanas, podr planear mejor su inicio del da y reducir al mnimo cualquier retraso (o adelanto) para llegar a su destino. A lo largo de 10 das hbiles consecutivos, Ud. recaba los tiempos en minutos que le lleva arreglarse que se muestran a continuacin.

    =396

    10= 39.6

    Da 1 2 3 4 5 6 7 8 9 10

    Tiempo

    (min)

    39 29 43 52 39 44 40 31 44 35

  • xi fi xi fi

    [10, 20) 15 1 15

    [20, 30) 25 8 200

    [30,40) 35 10 350

    [40, 50) 45 9 405

    [50, 60) 55 8 440

    [60,70) 65 4 260

    [70, 80) 75 2 150

    42 1 820

    Ejemplo de clculo de media:

    En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media

  • MODA es el valor que tiene mayor frecuencia absoluta (Mo). Se puede hallar para cualquier tipo de variable, aunque para variables cuantitativas es poco til.

    La moda de los tiempos en minutos que le lleva arreglarse que se muestran a continuacin la distribucin:

    Mo= 39, 44

    Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.

    Tiempo

    (m)

    29

    31

    35

    39

    39

    40

    43

    44

    44

    52

  • MEDIANA es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor (Me)

    La mediana se puede hallar slo para variables cuantitativas.

    Clculo de la mediana con pocos datos

    1. Ordenamos los datos de menor a mayor.

    2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma.

    3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

    29, 31,35,39,39,40,43,44,44,52 Me= 39.5

  • fi Fi

    [60, 63) 5 5

    [63, 66) 18 23

    [66, 69) 42 65

    [69, 72) 27 92

    [72, 75) 8 100

    100

    Clculo de la mediana para datos agrupados

    Se divide N entre dos para ver dnde est el centro

    100/2 = 50

    Se busca en la columna de Fi

    dnde estara 50.

    Luego el valor o intervalo mediano ser:

    Clase de la mediana: [66, 69)

  • RELACIN ENTRE MEDIA Y MEDIANA

    a) Si , la distribucin es completamente simtrica

    b) Si los valores de y son prximos, la distribucin es aproximadamente simtrica.

    c) Si los valores de y son poco prximos, la distribucin es asimtrica

    ex=M

    x eM

    x eM

  • 0

    1

    2

    3

    4

    5

    1 2 3 4 5 6 7 8 9 10

    Notas del control

    Grupo B

    0

    1

    2

    3

    4

    5

    1 2 3 4 5 6 7 8 9 10

    Notas del control

    Grupo A

    ACTIVIDAD 1

    a) A partir de las siguientes grficas realiza la tabla de frecuencias y calcula MEDIA, MEDIANA y MODA de cada una de las distribuciones.

    b) Indica tipo de variable y tipo de grfico en cada caso.

    c) Indica cmo es simtricamente cada una de ellas.

  • 10%

    22%

    30%

    15%

    23% Espaguetis

    Cocido

    Lentejas

    Gazpacho

    Paella

    ACTIVIDAD 2

    En un restaurant se da a elegir a la clientela entre varios primeros platos. El resultado de las distintas elecciones nos lo da el siguiente grfico.

    a) Indica tipo de variable, y tipo de grfica.

    b) Sabiendo que se le ha preguntado a 240 personas, realiza la tabla

    de frecuencias y calcula las medidas de centralizacin que ms

    sentido tengan.

  • Medidas de dispersin RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA

    Recorrido es la diferencia entre los valores extremos, es decir, entre el mayor valor y el menor

    RECORRIDO = Valor mayor - Menor valor

  • Medidas de dispersin RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA

    VARIANZA

    Es la suma de las diferencias con respecto a la media elevada al cuadrado

    y dividida por el tamao de la muestra menos 1.

    DESVIACION ESTANDAR

    Es la raz cuadrada de la suma de los cuadrados de las diferencias con

    respecto a la media dividida por el tamao de la muestra menos 1.

  • Medidas de dispersin RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA

    Tiempo X

    Xi - X Xi - X

    29 -10.6 112.36

    31 -8.6 73.96

    35 -4.6 21.16

    39 -0.6 0.36

    39 -0.6 0.36

    40 0.4 0.16

    43 3.4 11.56

    44 4.4 19.36

    44 4.4 19.36

    52 12.4 153.76

    Media 39.6

    Varianza 45.82

    Desviacion tipica 6.77

    Los tiempos necesarios para arreglarse varia en 6.77 minutos de la media de 39.6; es

    decir varia entre 32.83 y 46.37 minutos.

    La varianza esta en minutos cuadrados.

  • Taller: Edad de los doctorandos

    Elabore una tabla de frecuencia y

    calcule la media aritmtica, mediana,

    moda, varianza y desviacin tpica de

    las edades de los estudiantes del IX

    semestre de la FAE UNCP. Interprete

    los resultados.

  • Ejemplo: Variable Calidad de servicio

    Moda: 3.05

    Media: 3.14

    Mediana: 3.16

    Desviacin estndar: 0.62

    Punto ms alto observado (mximo): 5

    Punto ms baja observada (mnimo): 1

    Rango: 4

    Figura 6: Calidad de servicio en la administracin acadmica de la UNCP

    1 2 3 4 5

    0.62

    Desviacin

    estndar

    (promedio de

    desviacin)

    Mediana (3.16)

    Media (3. 14)

    Moda (305)

    Rango (4)

    CALIDAD PUNTAJE

    EXCELENTE 5

    BUENA 4

    REGULAR 3

    DEFICIENTE 2

    MUY DEFICIENTE 1

    La calidad de los servicios administrativos en la UNCP es regular. La categora que ms se repiti fue 3.05. Cincuenta por ciento de los sujetos est por encima del valor 3.16 y el restante cincuenta por ciento se sujeta por debajo de este valor (mediana) en promedio los sujetos se ubican en 3.14 (favorable). Asimismo se desvan de 3.14, en promedio, 0.62 unidades de escala. Hay usuarios que calificaron la calidad como muy deficiente y otros como excelente.

  • Contacto:

    [email protected]

    Cel: 964913378

    RPM: #961650207

    http://www.youtube.com/watch?v=g4TFaDVwQvA&feature=related