ANALISIS INFERENCIAL

84

Click here to load reader

description

LIC MELY RUIZ AQUINO

Transcript of ANALISIS INFERENCIAL

  • Lic, Mely Ruiz Aquino

    ANLISIS INFERENCIAL

  • Son enunciados formulados como respuestas tentativas a preguntas de investigacin.

    Pregunta de investigacin Hiptesis

  • Cmo funciona la Ciencia:

    1. Se formula una hiptesis.

    2. Se obtienen datos (muestra)

    3. La hiptesis es contrastada con la

    evidencia de la muestra.

    4. Conclusin

  • PRUEBA DE HIPOTESIS: busca responder a una pregunta sobre el valor de un parmetro en la poblacin (siempre utilizando los resultados de la muestra)

    Esta pregunta sobre el valor del parmetro en la poblacin se plantea utilizando hiptesis

    El procedimiento cuantifica en que medida los datos de la muestra apoyan la hiptesis planteada

  • http://seminariosdeinvestigacion.com/contraste-

    de-hipotesis/

    PRUEBA DE HIPTESIS

  • El estadstico de prueba se elige en

    funcin a 6 criterios:

    1. Tipo de estudio

    2. Nivel investigativo

    3. Diseo de la investigacin

    4. Objetivo estadstico

    5.Escala de medicin de las variables

    6. Comportamiento de los datos

    7. Antecedentes de investigacin

    Eleccin de la prueba estadstica

  • https://www.youtube.com/watch?v=tCb7Mpcvj6

    c

  • 8

    Estadstica inferencial

    incluye: hacer

    inferencias, pruebas de

    hiptesis, determinar

    relacin y hacer

    Predicciones.

  • Una hiptesis estadstica es una suposicin acerca que una caracterstica de la poblacin, que debe ser probada con base en la informacin porporcionada por una muestra aleatoria.

    Hiptesis nula: H0 : Es la que se pretende probar,

    generalmente se establece con

    el fin de rechazarla.

    Hiptesis alternativa: H1 : Es la negacin de la hiptesis

    nula, establece adems la

    regin en la que se tomar la

    decisin de rechazar o no H0.

  • Para tomar una decisin sobre rechazar o no

    rechazar la hiptesis nula hay que especificar

    una Regla de decisin.

    Hay que especificar un punto de corte

    punto crtico:

    Si P es menor que Alfa (), se rechaza Ho

    Si P es mayor que Alfa (), se rechaza Ho

  • Regla de decisiones para la prueba de

    hiptesis

    H1 Ho

    0 0,01 0,05 0,02 0,03 0,04

    Nivel de significancia (alfa)

    p-valor p-valor

  • 1.-Pruebas paramtricas

    2.-Pruebas no paramtricas

  • Rho de

    Spearman

    R de pearson

  • Son fciles de utilizar y algunas son tan potentes

    como las paramtricas.

    El anlisis de datos cualitativos ha generado

    tcnicas propias, que actualmente constituyen

    toda una metodologa especfica que viene

    marcada por la propia idiosincrasia cualitativa y

    que toma determinadas opciones en relacin a

    las unidades del registro de los datos y la forma

    de tratarlos.

  • La Ji cuadrada o Chi cuadradra

    Los coeficientes de correlacin e independencia

    para tabulaciones cruzadas

    Los coeficientes de correlacin para rangos

    ordenados de Spearman y Kendall

  • Definicin:

    Es una prueba estadstica para evaluar la hiptesis acerca de la relacin entre dos variables categricas

    Se simboliza por x2

    Hiptesis a probar: Correlacionales

    Variables Involucradas: Dos

    Nivel de medicin de las variables :

    Nominal u ordinal ( o intervalos o razn reducida a ordinales)

    La Chi cuadrada se calcula a travs de una tabla de contingencia o tabulacin cruzada, de dos dimensiones y cada una representa una variable.

  • 22 ( xp )

    ( 1)( 1)

    Observed E ected

    Expected

    df r c

    Gl = (r-1)(c-1)

    (Observado Esperado)2

    Esperado

  • 20

    50 25 75

    40 45 85

    90 70 160

    SUMA DE FILAS

    SUMA DE COLUMNAS SUMA TOTAL

    REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL

    FRECUENCIA

    S DE

    VALORES

    OBSERVADOS

  • 21

    42.1875 32.8125

    47.8125 37.1875

    90 75160

    90 85160

    70 75160

    70 85160

    Usar la frmula para obtener las frecuencias esperadas.

    FRECUENCIAS DE VALORES

    ESPERADOS

  • 22

    Para obtener el valor de Chi-Cuadrado

    Calculado se tiene la frmula

    202

    0 : .

    : .

    ecalc

    e

    e

    f f

    f

    f Frecuencia del valor observado

    f Frecuencia del valor esperado

  • 23

    42.1875 32.8125

    47.8125 37.1875

    50 25

    40 45

    TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS

    202

    2 2 2 22

    2

    50 42.1875 25 32.8125 40 47.8125 45 37.1875

    42.1875 32.8125 47.8125 37.1875

    1.4468 1.8601 1.2766 1.6413 6.2248

    ecalc

    e

    calc

    calc

    f f

    f

  • 24

    Para calcular el grado de libertad (v) se realiza:

    1 1v Cantidad de filas Cantidad decolumnas

  • Prueba de bondad de ajuste para frecuencias

  • La bondad de ajuste describe cun bien se ajusta un conjunto de

    observaciones a un modelo terico (estudio experimental) o a un parmetro

    (estudio observacional)

    La bondad de ajuste se pueden emplear en el contraste de hiptesis, para

    comprobar si una muestra sigue una distribucin especfica (chi cuadrado,

    binomial, normal, etc.) o si dos muestras se obtienen a partir de dos

    distribuciones idnticas.

    Qu es la bondad de Ajuste?

  • Aplicativo

    Predictivo

    Explicativo

    Relacional

    Descriptivo Univariado

    Bivariado

    Multivariado

    Prueba de

    Bondad de Ajuste de

    Chi cuadrado

  • Observ

    ado

    Esperad

    o

    Diferen

    cia Diferencia

    2

    Dif2/Esper

    ado

    Cara 6 10 -4 16 1,6

    Escud

    o

    14 10 +4 16 1,6

    20 lanzamientos

    Suma = 3,2

  • www.CursodeEstadistica.com

    Aplicativo

    Predictivo

    Explicativo

    Relacional

    Descriptivo Univariado

    Multivariado

    Prueba de

    Chi cuadrado de

    Homogeneidad

    Bivariado

    Nivel Investigativo Relacional

    a.- Comparacin

    b.- Asociacin

    c.- Medida de Asociacin

    Grupos

    Medidas

  • Grupo 1 Grupo 2

    Factor 1

    Factor 2

    100% 100% 100%

    Tabla de contingencia

    Vari

    able

    ale

    ato

    ria

    Variable fija

  • Grupo 1 Grupo 2

    Factor 1 100%

    Factor 2 100%

    100%

    Tabla de contingencia

    Vari

    able

    fij

    a

    Variable Aleatoria

  • Propsito: Identificar las diferencias entre los grupos participantes.

    Ho: Las frecuencias de la variable aleatoria en los grupos no son

    diferentes.

    H1: Las frecuencias de la variable aleatoria en los grupos son

    diferentes.

    La prueba de hiptesis se realiza con el estadstico:

    Chi cuadrado de Homogeneidad.

    Contraste de hiptesis

  • Este son otros coeficientes para evaluar si las variables

    incluidas en la tabla de contingencia o tabulacin cruzada

    estn correlacionadas; algunos coeficientes son los

    siguientes:

    Phi, Coeficiente de contingencia o C dePearson,V de

    Gramer, Lamdba ,Gamma, Tau-b de Kendall(Tau-b) , D de

    Somers, Eta. etc.

  • Adems de servir para el cculo de la chi cuadrado y otros coeficientes, son tiles para describir conjuntamente a dos o ms variables .

    Esto se efecta convirtiendo las frecuencias observadas en frecuencia relativas o porcentaje.

    En una tabla cruzada puede haber tres tipos de porcentajes a cada celda:

    Porcentaje en relacin al total de frecuencias observadas (N)

    Porcentaje en relacin al total marginal de la columna

    Porcentaje en relacin al total marginal del rengln

  • Coeficiente de asociacin de Spearman

    La funcin de la correlacin de Spearman es determinar si

    existe

    ordinal

    que la

    de las

    una relacin lineal entre dos variables a nivel

    y que esta relacin no sea debida al azar; es decir,

    relacin sea estadsticamente significativa. Si una

    variables es intervalar y la otra ordinal tambin se

    utiliza Spearman.

    Por ejemplo:

    Se desea saber si existe relacin entre la actitud hacia el

    psiclogo y la actitud hacia la psicoterapia, en un grupo de

    padres de familia. La actitud es evaluada como sigue:

    1 = muy desfavorable hasta 7 = muy favorable.

  • Spearman

    Decisiones para seleccionar

    Spearman el coeficiente de correlacin de

    Es un problema de Asociacin V1: actitud hacia el psiclogo

    V2: actitud hacia la psicoterapia

    2 variables medidas a nivel ordinal

    Ho: No hay relacin lineal entre la actitud hacia el psiclogo y

    la actitud hacia la psicoterapia, en padres de familia (r = 0)

    Prueba estadstica: coeficiente de correlacin de Spearman Regla de decisin: Si p 0.05 se rechaza Ho

    Nota: El nivel de significancia que se establece en ciencias

    sociales y en psicologa normalmente es 0.05, este puede variar en la regla de decisin a 0.01 y 0.001 si se requiere

    mayor certeza en la prueba de hiptesis.

  • Spearman en SPSS

    El coeficiente de asociacin Spearman en men

    el paquete

    estadstico SPSS se encuentra en el Analizar /

    Correlaciones / Bivariadas.

  • Spearman en

    La Actitud hacia el psiclogo (V1) y

    SPSS

    por el otro la Actitud hacia la

    psicoterapia (V2), deben ser

    incluidas en la seccin de Variables. Se tiene que activar la prueba de

    Spearman en la seccin de

    Coeficientes de correlacin.

    Si se agregaran ms de dos

    variables en la seccin de Variables,

    en el resultado se presentarn

    asociadas slo por parejas en una de

    de tabla conocida como matriz

    correlacin cuya cantidad

    columnas y renglones corresponde al nmero total de variables que se

    estn correlacionando.

  • Spearman en SPSS Interpretacin de resultados:

    1. La matriz de correlacin presenta por pares de variables el

    coeficiente de Pearson y el nivel de significancia obtenido, adems

    del nmero de casos (ver datos en el crculo), la correlacin entre

    cada pareja de variables se repite dos veces, se pueden tomar los

    resultados de cualquiera de las dos.

    En el presente ejemplo, el nivel de significancia (0.015) es menor a

    0.05, por lo que se rechaza la hiptesis nula, entonces: existe

    relacin lineal entre la actitud hacia el psiclogo y la actitud hacia la

    psicoterapia, en padres de familia. Adems la correlacin es

    moderada (est en el rango entre 0.5 y 0.8) y directamente

    proporcional (tiene signo positivo). Cor relacio nes

    * . La correlacin es signif icativ a al niv el 0,05 (bilateral).

    Actitud hacia el psiclogo

    Actitud hacia

    la psicoterapia

    Rho de Spearman Actitud hacia el psiclogo Coef iciente de

    correlacin

    Sig. (bilateral)

    N

    1.000

    .

    9

    .769*

    .015

    9

    Actitud hacia la Coef iciente de

    psicoterapia correlacin

    Sig. (bilateral)

    N

    .769*

    .015

    9

    1.000

    .

    9

  • rS = 0.769*

    * p < 0.05

    Figura 1. Relacin entre la actitud hacia el

    psiclogo y la actitud hacia la psicoterapia en un

    grupo de padres de familia.

    Actitud hacia

    el Psiclogo

    Actitud hacia

    la

    psicoterapia

  • 45

    COEFIENTE DE CORRELACIN

    El coeficiente de correlacin es un valor cuantitativo de la relacin entre dos o ms variables.

    El coeficiente de correlacin puede variar desde -1 hasta 1.

    La correlacin de proporcionalidad directa o positiva se establece con los valores +1 y de proporcionalidad

    inversa o negativa con -1.

    No existe relacin entre las variables cuando el coeficiente es cero (0).

    -1 1 0 Relacin positiva Relacin negativa

    No existe relacin

  • Se encontr moderada y

    el psiclogo

    una relacin lineal estadsticamente significativa, directamente proporcional, entre la actitud hacia

    y la actitud hacia la psicoterapia, en padres de

    familia (rS = 0.769, p < 0.05).

  • Son ms potentes que las no paramtricas y por consiguiente las inferencias que se realizan son ms fiables.

    El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramtrico, sobre todo en investigaciones educativas y sociales.

  • PRUEBA DE KOLMOGOROV-SMIRNOV

    Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para

    contrastar la hiptesis de normalidad de la poblacin, el estadstico

    de prueba es la mxima diferencia:

    siendo Fn(x) la funcin de distribucin muestral y Fo(x) la funcin

    terica o correspondiente a la poblacin normal especificada en la

    hiptesis nula.

    La distribucin del estadstico de Kolmogorov-Smirnov es

    independiente de la distribucin poblacional especificada en la

    hiptesis nula y los valores crticos de este estadstico estn

    tabulados. Si la distribucin postulada es la normal y se estiman sus

    parmetros, los valores crticos se obtienen aplicando la correccin

    de significacin propuesta por Lilliefors.

  • PRUEBA DE KOLMOGOROV-SMIRNOV

    Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para

    contrastar la hiptesis de normalidad de la poblacin, el estadstico

    de prueba es la mxima diferencia:

    siendo Fn(x) la funcin de distribucin muestral y Fo(x) la funcin

    terica o correspondiente a la poblacin normal especificada en la

    hiptesis nula.

    La distribucin del estadstico de Kolmogorov-Smirnov es

    independiente de la distribucin poblacional especificada en la

    hiptesis nula y los valores crticos de este estadstico estn

    tabulados. Si la distribucin postulada es la normal y se estiman sus

    parmetros, los valores crticos se obtienen aplicando la correccin

    de significacin propuesta por Lilliefors.

  • PRUEBA DE SHAPIRO-WILK

    Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba

    de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan

    las observaciones de menor a mayor. A continuacin se calculan las diferencias entre: el primero y el

    ltimo; el segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos

    coeficientes tabulados por Shapiro y Wilk. El estadstico de prueba es:

    donde D es la suma de las diferencias corregidas.

    Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico

    proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de

    significacin dado.

    La secuencia para realizar los contrastes de normalidad es:

    Analiza

    Estadsticos Descriptivos

    Explorar

  • https://www.youtube.com/watch?v=E1OEAIgY

    HkU

  • Tabla 14: Pruebas de normalidad para las distribuciones de contraste de las

    variables en los profesionales de la salud del Departamento de Ciruga del

    Hospital Daniel Alcides Carrin en el 2012.

    Distribuciones de contraste Normalidad

    Z p-valor

    Cultura organizacional 0,95 0,324

    Comunicacin 2,05 0,000

    Calidad 1,12 0,161

    Capacidades directivas 1,42 0,036

    Identidad 1,97 0,001

    Reconocimientos - incentivos 1,74 0,005

    Contribucin personal 2,27 0,000

    Satisfaccin laboral 0,75 0,631

    Evaluacin institucional del personal 1,11 0,167

    Desarrollo, capacitacin y actualizacin para el desempeo personal 0,94 0,343

    Comunicacin 0,70 0,705

    Salud y condiciones laborales 1,50 0,022

    Fuente: ApndicesC y D.

    En cuanto a las distribuciones que contrastan nuestras hiptesis, podemos

    observar que, hay distribuciones que carecen de normalidad (p-valor < 0,050), y

    siendo el objetivo del estudio relacionar distribuciones, emplearemos un contraste

    estadstico no paramtrico, y que indique la relacin hallada entre estas variables

    numricas.

  • Coeficiente de Correlacin de Pearson y la regresin lineal

    Prueba t

    Prueba de contraste de la diferencia de proporciones

    Anlisis de varianza unidireccional (ANOVA Oneway)

    Anlisis de varianza factorial (ANOVA)

    Anlisis de covarianza (ANCOVA)

  • Definicin.-

    Es una prueba estadstica para analizar la relacin entre dos o ms variables medidas en un nivel por intervalos o razn

    Se simboliza por r

    Hiptesis a probar:

    Correlacionalmente, del tipo : A mayor X, mayor Y;

    A mayor X, menor Y, Altos valores en X estn asociados con altos valores en Y, Altos valores en X se asocian con bajos valores de Y

  • 55

    FRMULA DE COEFIENTE DE CORRELACIN DE PEARSON

  • 56

    Existe relacin entre la Masa corporal y la fuerza en los alumnos

    universitarios?. Si existe, Qu tipo de correlacin?

    Alumno Masa Corporal(Kg) Fuerza(Kp)

    Carmen 60,00 100,00

    Pedro 65,00 105,00

    Juan 70,00 102,00

    Lus 75,00 135,00

    Ana 80,00 95,00

    Carlos 85,00 125,00

    Elena 90,00 140,00

    Rosa 95,00 130,00

    Lus 100,00 148,00

    Variable independiente Variable dependiente

  • 57

    UNA VARIABLE INDEPENDIENTE Y DOS DEPENDIENTES

    Relacin positiva

    Relacin negativa

  • 5.2 Representacin grfica de una relacin

    inteligencia

    ren

    dim

    ien

    to

    ren

    dim

    ien

    to

    ren

    dim

    ien

    to

    inteligencia inteligencia

    Relacin lineal positiva Relacin lineal negativa Sin relacin

    Nota: El coeficiente de correlacin de Pearson mide relacin LINEAL.

  • Representacin grfica de una relacin (2)

    ren

    dim

    ien

    to

    ren

    dim

    ien

    to

    inteligencia inteligencia

    Relacin lineal Relacin no lineal

    Nota: El coeficiente de correlacin de Pearson mide relacin LINEAL.

  • Representacin grfica de una relacin (3)

    inteligencia

    ren

    dim

    ien

    to

    ren

    dim

    ien

    to

    ren

    dim

    ien

    to

    inteligencia inteligencia

    Relacin lineal perfecta (casi perfecta)

    Relacin lineal dbil Relacin lineal fuerte/moderada

    Ahora necesitamos un ndice que nos informe tanto del grado en que X e Y estn relacionadas, y si la relacin es positiva o negativa

  • 5.3 Covarianza e ndice de correlacin de Pearson

    ren

    dim

    ien

    to

    inteligencia

    Observad que cuando la relacin lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas.

    inteligencia

    ren

    dim

    ien

    to

    Observad que cuando la relacin lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas.

    Caso 1

    Caso 2

  • 62

    REPRESENTACIN GRFICA CON SPSS

    Sean las variables:

    X= Masa Corporal

    Y= Fuerza

    Pasos para representar:

    Ingresar al paquete estadstico

    SPSS.

    Definir las variables antes mencionados.

    Ingresar los datos presentados en la tabla anterior.

    Grficos/Interactivos/ Diagrama de dispersin/

  • 63

    COEFICIENTE DE CORRELACIN

  • 64

    COEFICIENTE DE CORRELACIN = r

  • 65

    COEFICIENTE DE CORRELACIN = r

  • Definicin:

    Es una prueba estadstica para evaluar si dos grupos difieren entre s de manera significativa respecto a su medias.

    Se simboliza por t

    Hiptesis a probar:

    De diferencia entre dos grupos.La hipteisis de investigacin propone que los grupos difieren significativamente entre s y la hiptesis nula no difiere significativamente

  • La prueba T Student se utiliza para

    contrastar hiptesis sobre medias en

    poblaciones con distribucin normal.

  • La prueba T Student fue desarrollada en 1899 por el

    qumico ingls William Sealey Gosset (1876-1937),

    mientras trabajaba en tcnicas de control de calidad

    para las destileras Guiness en Dubln . Debido a que

    en la destilera, su puesto de trabajo no era

    inicialmente de estadstico y su dedicacin deba

    estar exclusivamente encaminada a mejorar los

    costes de produccin, public sus hallazgos

    annimamente firmando sus artculos con el nombre

    de "Student".

  • Existen dos versiones de la prueba T Student:

    una que supone que las varianzas

    poblacionales son iguales y otra versin que no

    asume esto ltimo. Para decidir si se puede

    suponer o no la igualdad de varianza en las dos

    poblaciones, se debe realizar previamente la

    prueba F-Snedecor de comparacin de dos

    varianzas.

  • Las pruebas T de dos muestras para probar la

    diferencia en las medias pueden ser

    desapareadas o de muestras independientes y

    dependientes o apareadas.

  • Se utiliza para contrastar la hiptesis nula:

  • Ejemplo:

    En un estudio de 28 pacientes con sobrepeso

    sometidos a dos dietas alimenticias, donde en

    el grupo experimental recibe dietas en base a

    vegetales y el grupo control otro tipo de dieta,

    deseamos saber si existen diferencias entre los

    dos grupos.

  • Base de datos en

    SPSS

  • Para realizar la Prueba T Student para muestras

    independientes, elegir:

  • Transfiera las variables a las ventanas Contrastar

    variables y Variable de agrupacin:

  • Los resultados van en una tabla pivote llamada Prueba T:

  • La prueba T para muestras relacionadas se

    comparan dos variables medidas en las

    mismas personas (o personas emparejadas).

    Se utiliza para contrastar la hiptesis nula:

  • Ejemplo:

    Se investiga la efectividad con nios de dos

    mtodos de enseanza, se utilizan dos grupos

    de 15 nios distintos, pero se emparejan por

    variables relevantes como el sexo, la edad y el

    rendimiento escolar. Cuanto mayor sea la

    puntuacin mejor ser la efectividad.

  • Base de datos en

    SPSS

  • Para realizar la Prueba T Student para muestras

    relacionadas, elegir:

  • Transfiera las variables a la ventana Variables

    relacionadas:

  • Los resultados van en una tabla pivote llamada Prueba T: