ANALISIS INFERENCIAL
Click here to load reader
description
Transcript of ANALISIS INFERENCIAL
-
Lic, Mely Ruiz Aquino
ANLISIS INFERENCIAL
-
Son enunciados formulados como respuestas tentativas a preguntas de investigacin.
Pregunta de investigacin Hiptesis
-
Cmo funciona la Ciencia:
1. Se formula una hiptesis.
2. Se obtienen datos (muestra)
3. La hiptesis es contrastada con la
evidencia de la muestra.
4. Conclusin
-
PRUEBA DE HIPOTESIS: busca responder a una pregunta sobre el valor de un parmetro en la poblacin (siempre utilizando los resultados de la muestra)
Esta pregunta sobre el valor del parmetro en la poblacin se plantea utilizando hiptesis
El procedimiento cuantifica en que medida los datos de la muestra apoyan la hiptesis planteada
-
http://seminariosdeinvestigacion.com/contraste-
de-hipotesis/
PRUEBA DE HIPTESIS
-
El estadstico de prueba se elige en
funcin a 6 criterios:
1. Tipo de estudio
2. Nivel investigativo
3. Diseo de la investigacin
4. Objetivo estadstico
5.Escala de medicin de las variables
6. Comportamiento de los datos
7. Antecedentes de investigacin
Eleccin de la prueba estadstica
-
https://www.youtube.com/watch?v=tCb7Mpcvj6
c
-
8
Estadstica inferencial
incluye: hacer
inferencias, pruebas de
hiptesis, determinar
relacin y hacer
Predicciones.
-
Una hiptesis estadstica es una suposicin acerca que una caracterstica de la poblacin, que debe ser probada con base en la informacin porporcionada por una muestra aleatoria.
Hiptesis nula: H0 : Es la que se pretende probar,
generalmente se establece con
el fin de rechazarla.
Hiptesis alternativa: H1 : Es la negacin de la hiptesis
nula, establece adems la
regin en la que se tomar la
decisin de rechazar o no H0.
-
Para tomar una decisin sobre rechazar o no
rechazar la hiptesis nula hay que especificar
una Regla de decisin.
Hay que especificar un punto de corte
punto crtico:
Si P es menor que Alfa (), se rechaza Ho
Si P es mayor que Alfa (), se rechaza Ho
-
Regla de decisiones para la prueba de
hiptesis
H1 Ho
0 0,01 0,05 0,02 0,03 0,04
Nivel de significancia (alfa)
p-valor p-valor
-
1.-Pruebas paramtricas
2.-Pruebas no paramtricas
-
Rho de
Spearman
R de pearson
-
Son fciles de utilizar y algunas son tan potentes
como las paramtricas.
El anlisis de datos cualitativos ha generado
tcnicas propias, que actualmente constituyen
toda una metodologa especfica que viene
marcada por la propia idiosincrasia cualitativa y
que toma determinadas opciones en relacin a
las unidades del registro de los datos y la forma
de tratarlos.
-
La Ji cuadrada o Chi cuadradra
Los coeficientes de correlacin e independencia
para tabulaciones cruzadas
Los coeficientes de correlacin para rangos
ordenados de Spearman y Kendall
-
Definicin:
Es una prueba estadstica para evaluar la hiptesis acerca de la relacin entre dos variables categricas
Se simboliza por x2
Hiptesis a probar: Correlacionales
Variables Involucradas: Dos
Nivel de medicin de las variables :
Nominal u ordinal ( o intervalos o razn reducida a ordinales)
La Chi cuadrada se calcula a travs de una tabla de contingencia o tabulacin cruzada, de dos dimensiones y cada una representa una variable.
-
22 ( xp )
( 1)( 1)
Observed E ected
Expected
df r c
Gl = (r-1)(c-1)
(Observado Esperado)2
Esperado
-
20
50 25 75
40 45 85
90 70 160
SUMA DE FILAS
SUMA DE COLUMNAS SUMA TOTAL
REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL
FRECUENCIA
S DE
VALORES
OBSERVADOS
-
21
42.1875 32.8125
47.8125 37.1875
90 75160
90 85160
70 75160
70 85160
Usar la frmula para obtener las frecuencias esperadas.
FRECUENCIAS DE VALORES
ESPERADOS
-
22
Para obtener el valor de Chi-Cuadrado
Calculado se tiene la frmula
202
0 : .
: .
ecalc
e
e
f f
f
f Frecuencia del valor observado
f Frecuencia del valor esperado
-
23
42.1875 32.8125
47.8125 37.1875
50 25
40 45
TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS
202
2 2 2 22
2
50 42.1875 25 32.8125 40 47.8125 45 37.1875
42.1875 32.8125 47.8125 37.1875
1.4468 1.8601 1.2766 1.6413 6.2248
ecalc
e
calc
calc
f f
f
-
24
Para calcular el grado de libertad (v) se realiza:
1 1v Cantidad de filas Cantidad decolumnas
-
Prueba de bondad de ajuste para frecuencias
-
La bondad de ajuste describe cun bien se ajusta un conjunto de
observaciones a un modelo terico (estudio experimental) o a un parmetro
(estudio observacional)
La bondad de ajuste se pueden emplear en el contraste de hiptesis, para
comprobar si una muestra sigue una distribucin especfica (chi cuadrado,
binomial, normal, etc.) o si dos muestras se obtienen a partir de dos
distribuciones idnticas.
Qu es la bondad de Ajuste?
-
Aplicativo
Predictivo
Explicativo
Relacional
Descriptivo Univariado
Bivariado
Multivariado
Prueba de
Bondad de Ajuste de
Chi cuadrado
-
Observ
ado
Esperad
o
Diferen
cia Diferencia
2
Dif2/Esper
ado
Cara 6 10 -4 16 1,6
Escud
o
14 10 +4 16 1,6
20 lanzamientos
Suma = 3,2
-
www.CursodeEstadistica.com
Aplicativo
Predictivo
Explicativo
Relacional
Descriptivo Univariado
Multivariado
Prueba de
Chi cuadrado de
Homogeneidad
Bivariado
Nivel Investigativo Relacional
a.- Comparacin
b.- Asociacin
c.- Medida de Asociacin
Grupos
Medidas
-
Grupo 1 Grupo 2
Factor 1
Factor 2
100% 100% 100%
Tabla de contingencia
Vari
able
ale
ato
ria
Variable fija
-
Grupo 1 Grupo 2
Factor 1 100%
Factor 2 100%
100%
Tabla de contingencia
Vari
able
fij
a
Variable Aleatoria
-
Propsito: Identificar las diferencias entre los grupos participantes.
Ho: Las frecuencias de la variable aleatoria en los grupos no son
diferentes.
H1: Las frecuencias de la variable aleatoria en los grupos son
diferentes.
La prueba de hiptesis se realiza con el estadstico:
Chi cuadrado de Homogeneidad.
Contraste de hiptesis
-
Este son otros coeficientes para evaluar si las variables
incluidas en la tabla de contingencia o tabulacin cruzada
estn correlacionadas; algunos coeficientes son los
siguientes:
Phi, Coeficiente de contingencia o C dePearson,V de
Gramer, Lamdba ,Gamma, Tau-b de Kendall(Tau-b) , D de
Somers, Eta. etc.
-
Adems de servir para el cculo de la chi cuadrado y otros coeficientes, son tiles para describir conjuntamente a dos o ms variables .
Esto se efecta convirtiendo las frecuencias observadas en frecuencia relativas o porcentaje.
En una tabla cruzada puede haber tres tipos de porcentajes a cada celda:
Porcentaje en relacin al total de frecuencias observadas (N)
Porcentaje en relacin al total marginal de la columna
Porcentaje en relacin al total marginal del rengln
-
Coeficiente de asociacin de Spearman
La funcin de la correlacin de Spearman es determinar si
existe
ordinal
que la
de las
una relacin lineal entre dos variables a nivel
y que esta relacin no sea debida al azar; es decir,
relacin sea estadsticamente significativa. Si una
variables es intervalar y la otra ordinal tambin se
utiliza Spearman.
Por ejemplo:
Se desea saber si existe relacin entre la actitud hacia el
psiclogo y la actitud hacia la psicoterapia, en un grupo de
padres de familia. La actitud es evaluada como sigue:
1 = muy desfavorable hasta 7 = muy favorable.
-
Spearman
Decisiones para seleccionar
Spearman el coeficiente de correlacin de
Es un problema de Asociacin V1: actitud hacia el psiclogo
V2: actitud hacia la psicoterapia
2 variables medidas a nivel ordinal
Ho: No hay relacin lineal entre la actitud hacia el psiclogo y
la actitud hacia la psicoterapia, en padres de familia (r = 0)
Prueba estadstica: coeficiente de correlacin de Spearman Regla de decisin: Si p 0.05 se rechaza Ho
Nota: El nivel de significancia que se establece en ciencias
sociales y en psicologa normalmente es 0.05, este puede variar en la regla de decisin a 0.01 y 0.001 si se requiere
mayor certeza en la prueba de hiptesis.
-
Spearman en SPSS
El coeficiente de asociacin Spearman en men
el paquete
estadstico SPSS se encuentra en el Analizar /
Correlaciones / Bivariadas.
-
Spearman en
La Actitud hacia el psiclogo (V1) y
SPSS
por el otro la Actitud hacia la
psicoterapia (V2), deben ser
incluidas en la seccin de Variables. Se tiene que activar la prueba de
Spearman en la seccin de
Coeficientes de correlacin.
Si se agregaran ms de dos
variables en la seccin de Variables,
en el resultado se presentarn
asociadas slo por parejas en una de
de tabla conocida como matriz
correlacin cuya cantidad
columnas y renglones corresponde al nmero total de variables que se
estn correlacionando.
-
Spearman en SPSS Interpretacin de resultados:
1. La matriz de correlacin presenta por pares de variables el
coeficiente de Pearson y el nivel de significancia obtenido, adems
del nmero de casos (ver datos en el crculo), la correlacin entre
cada pareja de variables se repite dos veces, se pueden tomar los
resultados de cualquiera de las dos.
En el presente ejemplo, el nivel de significancia (0.015) es menor a
0.05, por lo que se rechaza la hiptesis nula, entonces: existe
relacin lineal entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia. Adems la correlacin es
moderada (est en el rango entre 0.5 y 0.8) y directamente
proporcional (tiene signo positivo). Cor relacio nes
* . La correlacin es signif icativ a al niv el 0,05 (bilateral).
Actitud hacia el psiclogo
Actitud hacia
la psicoterapia
Rho de Spearman Actitud hacia el psiclogo Coef iciente de
correlacin
Sig. (bilateral)
N
1.000
.
9
.769*
.015
9
Actitud hacia la Coef iciente de
psicoterapia correlacin
Sig. (bilateral)
N
.769*
.015
9
1.000
.
9
-
rS = 0.769*
* p < 0.05
Figura 1. Relacin entre la actitud hacia el
psiclogo y la actitud hacia la psicoterapia en un
grupo de padres de familia.
Actitud hacia
el Psiclogo
Actitud hacia
la
psicoterapia
-
45
COEFIENTE DE CORRELACIN
El coeficiente de correlacin es un valor cuantitativo de la relacin entre dos o ms variables.
El coeficiente de correlacin puede variar desde -1 hasta 1.
La correlacin de proporcionalidad directa o positiva se establece con los valores +1 y de proporcionalidad
inversa o negativa con -1.
No existe relacin entre las variables cuando el coeficiente es cero (0).
-1 1 0 Relacin positiva Relacin negativa
No existe relacin
-
Se encontr moderada y
el psiclogo
una relacin lineal estadsticamente significativa, directamente proporcional, entre la actitud hacia
y la actitud hacia la psicoterapia, en padres de
familia (rS = 0.769, p < 0.05).
-
Son ms potentes que las no paramtricas y por consiguiente las inferencias que se realizan son ms fiables.
El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramtrico, sobre todo en investigaciones educativas y sociales.
-
PRUEBA DE KOLMOGOROV-SMIRNOV
Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para
contrastar la hiptesis de normalidad de la poblacin, el estadstico
de prueba es la mxima diferencia:
siendo Fn(x) la funcin de distribucin muestral y Fo(x) la funcin
terica o correspondiente a la poblacin normal especificada en la
hiptesis nula.
La distribucin del estadstico de Kolmogorov-Smirnov es
independiente de la distribucin poblacional especificada en la
hiptesis nula y los valores crticos de este estadstico estn
tabulados. Si la distribucin postulada es la normal y se estiman sus
parmetros, los valores crticos se obtienen aplicando la correccin
de significacin propuesta por Lilliefors.
-
PRUEBA DE KOLMOGOROV-SMIRNOV
Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para
contrastar la hiptesis de normalidad de la poblacin, el estadstico
de prueba es la mxima diferencia:
siendo Fn(x) la funcin de distribucin muestral y Fo(x) la funcin
terica o correspondiente a la poblacin normal especificada en la
hiptesis nula.
La distribucin del estadstico de Kolmogorov-Smirnov es
independiente de la distribucin poblacional especificada en la
hiptesis nula y los valores crticos de este estadstico estn
tabulados. Si la distribucin postulada es la normal y se estiman sus
parmetros, los valores crticos se obtienen aplicando la correccin
de significacin propuesta por Lilliefors.
-
PRUEBA DE SHAPIRO-WILK
Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba
de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan
las observaciones de menor a mayor. A continuacin se calculan las diferencias entre: el primero y el
ltimo; el segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos
coeficientes tabulados por Shapiro y Wilk. El estadstico de prueba es:
donde D es la suma de las diferencias corregidas.
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico
proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de
significacin dado.
La secuencia para realizar los contrastes de normalidad es:
Analiza
Estadsticos Descriptivos
Explorar
-
https://www.youtube.com/watch?v=E1OEAIgY
HkU
-
Tabla 14: Pruebas de normalidad para las distribuciones de contraste de las
variables en los profesionales de la salud del Departamento de Ciruga del
Hospital Daniel Alcides Carrin en el 2012.
Distribuciones de contraste Normalidad
Z p-valor
Cultura organizacional 0,95 0,324
Comunicacin 2,05 0,000
Calidad 1,12 0,161
Capacidades directivas 1,42 0,036
Identidad 1,97 0,001
Reconocimientos - incentivos 1,74 0,005
Contribucin personal 2,27 0,000
Satisfaccin laboral 0,75 0,631
Evaluacin institucional del personal 1,11 0,167
Desarrollo, capacitacin y actualizacin para el desempeo personal 0,94 0,343
Comunicacin 0,70 0,705
Salud y condiciones laborales 1,50 0,022
Fuente: ApndicesC y D.
En cuanto a las distribuciones que contrastan nuestras hiptesis, podemos
observar que, hay distribuciones que carecen de normalidad (p-valor < 0,050), y
siendo el objetivo del estudio relacionar distribuciones, emplearemos un contraste
estadstico no paramtrico, y que indique la relacin hallada entre estas variables
numricas.
-
Coeficiente de Correlacin de Pearson y la regresin lineal
Prueba t
Prueba de contraste de la diferencia de proporciones
Anlisis de varianza unidireccional (ANOVA Oneway)
Anlisis de varianza factorial (ANOVA)
Anlisis de covarianza (ANCOVA)
-
Definicin.-
Es una prueba estadstica para analizar la relacin entre dos o ms variables medidas en un nivel por intervalos o razn
Se simboliza por r
Hiptesis a probar:
Correlacionalmente, del tipo : A mayor X, mayor Y;
A mayor X, menor Y, Altos valores en X estn asociados con altos valores en Y, Altos valores en X se asocian con bajos valores de Y
-
55
FRMULA DE COEFIENTE DE CORRELACIN DE PEARSON
-
56
Existe relacin entre la Masa corporal y la fuerza en los alumnos
universitarios?. Si existe, Qu tipo de correlacin?
Alumno Masa Corporal(Kg) Fuerza(Kp)
Carmen 60,00 100,00
Pedro 65,00 105,00
Juan 70,00 102,00
Lus 75,00 135,00
Ana 80,00 95,00
Carlos 85,00 125,00
Elena 90,00 140,00
Rosa 95,00 130,00
Lus 100,00 148,00
Variable independiente Variable dependiente
-
57
UNA VARIABLE INDEPENDIENTE Y DOS DEPENDIENTES
Relacin positiva
Relacin negativa
-
5.2 Representacin grfica de una relacin
inteligencia
ren
dim
ien
to
ren
dim
ien
to
ren
dim
ien
to
inteligencia inteligencia
Relacin lineal positiva Relacin lineal negativa Sin relacin
Nota: El coeficiente de correlacin de Pearson mide relacin LINEAL.
-
Representacin grfica de una relacin (2)
ren
dim
ien
to
ren
dim
ien
to
inteligencia inteligencia
Relacin lineal Relacin no lineal
Nota: El coeficiente de correlacin de Pearson mide relacin LINEAL.
-
Representacin grfica de una relacin (3)
inteligencia
ren
dim
ien
to
ren
dim
ien
to
ren
dim
ien
to
inteligencia inteligencia
Relacin lineal perfecta (casi perfecta)
Relacin lineal dbil Relacin lineal fuerte/moderada
Ahora necesitamos un ndice que nos informe tanto del grado en que X e Y estn relacionadas, y si la relacin es positiva o negativa
-
5.3 Covarianza e ndice de correlacin de Pearson
ren
dim
ien
to
inteligencia
Observad que cuando la relacin lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas.
inteligencia
ren
dim
ien
to
Observad que cuando la relacin lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas.
Caso 1
Caso 2
-
62
REPRESENTACIN GRFICA CON SPSS
Sean las variables:
X= Masa Corporal
Y= Fuerza
Pasos para representar:
Ingresar al paquete estadstico
SPSS.
Definir las variables antes mencionados.
Ingresar los datos presentados en la tabla anterior.
Grficos/Interactivos/ Diagrama de dispersin/
-
63
COEFICIENTE DE CORRELACIN
-
64
COEFICIENTE DE CORRELACIN = r
-
65
COEFICIENTE DE CORRELACIN = r
-
Definicin:
Es una prueba estadstica para evaluar si dos grupos difieren entre s de manera significativa respecto a su medias.
Se simboliza por t
Hiptesis a probar:
De diferencia entre dos grupos.La hipteisis de investigacin propone que los grupos difieren significativamente entre s y la hiptesis nula no difiere significativamente
-
La prueba T Student se utiliza para
contrastar hiptesis sobre medias en
poblaciones con distribucin normal.
-
La prueba T Student fue desarrollada en 1899 por el
qumico ingls William Sealey Gosset (1876-1937),
mientras trabajaba en tcnicas de control de calidad
para las destileras Guiness en Dubln . Debido a que
en la destilera, su puesto de trabajo no era
inicialmente de estadstico y su dedicacin deba
estar exclusivamente encaminada a mejorar los
costes de produccin, public sus hallazgos
annimamente firmando sus artculos con el nombre
de "Student".
-
Existen dos versiones de la prueba T Student:
una que supone que las varianzas
poblacionales son iguales y otra versin que no
asume esto ltimo. Para decidir si se puede
suponer o no la igualdad de varianza en las dos
poblaciones, se debe realizar previamente la
prueba F-Snedecor de comparacin de dos
varianzas.
-
Las pruebas T de dos muestras para probar la
diferencia en las medias pueden ser
desapareadas o de muestras independientes y
dependientes o apareadas.
-
Se utiliza para contrastar la hiptesis nula:
-
Ejemplo:
En un estudio de 28 pacientes con sobrepeso
sometidos a dos dietas alimenticias, donde en
el grupo experimental recibe dietas en base a
vegetales y el grupo control otro tipo de dieta,
deseamos saber si existen diferencias entre los
dos grupos.
-
Base de datos en
SPSS
-
Para realizar la Prueba T Student para muestras
independientes, elegir:
-
Transfiera las variables a las ventanas Contrastar
variables y Variable de agrupacin:
-
Los resultados van en una tabla pivote llamada Prueba T:
-
La prueba T para muestras relacionadas se
comparan dos variables medidas en las
mismas personas (o personas emparejadas).
Se utiliza para contrastar la hiptesis nula:
-
Ejemplo:
Se investiga la efectividad con nios de dos
mtodos de enseanza, se utilizan dos grupos
de 15 nios distintos, pero se emparejan por
variables relevantes como el sexo, la edad y el
rendimiento escolar. Cuanto mayor sea la
puntuacin mejor ser la efectividad.
-
Base de datos en
SPSS
-
Para realizar la Prueba T Student para muestras
relacionadas, elegir:
-
Transfiera las variables a la ventana Variables
relacionadas:
-
Los resultados van en una tabla pivote llamada Prueba T: