2007 [email protected] / [email protected] 1 Hipótesis de trabajo, pruebas de hipótesis e...
-
Upload
sarita-pinales -
Category
Documents
-
view
10 -
download
0
Transcript of 2007 [email protected] / [email protected] 1 Hipótesis de trabajo, pruebas de hipótesis e...
20072007
[email protected] / [email protected]@uab.es / [email protected] 11
Hipótesis de trabajo, pruebas Hipótesis de trabajo, pruebas de hipótesis e intervalos de de hipótesis e intervalos de
confianzaconfianzaLaboratorio de Bioestadística y Epidemiología, sección Ensayos ClínicosLaboratorio de Bioestadística y Epidemiología, sección Ensayos Clínicos
Unidad de Bioestadística Unidad de Bioestadística Universidad Autónoma de BarcelonaUniversidad Autónoma de Barcelona
20072007
[email protected] / [email protected]@uab.es / [email protected] 22
Debe estar lo más claramente formulada.Debe estar lo más claramente formulada. Debe ser ‘estadística’ y ‘científicamente’ Debe ser ‘estadística’ y ‘científicamente’
correctacorrecta– Prohíbo circulación de camiones en Rondas. Prohíbo circulación de camiones en Rondas.
Tres semanas después encargo un estudio Tres semanas después encargo un estudio para ver si el número de accidentes en Rondas para ver si el número de accidentes en Rondas con camiones disminuye.con camiones disminuye.
Las ‘técnicas de pesca’ se han de evitar Las ‘técnicas de pesca’ se han de evitar siempre.siempre.
Hipótesis de trabajoHipótesis de trabajo
20072007
[email protected] / [email protected]@uab.es / [email protected] 33
Por supuesto, LA HIPÓTESIS DE TRABAJO Por supuesto, LA HIPÓTESIS DE TRABAJO SE FORMULA CON ANTERIORIDAD A SE FORMULA CON ANTERIORIDAD A CUALQUIERA DE LOS PASOSCUALQUIERA DE LOS PASOS
Hipótesis de trabajoHipótesis de trabajo
20072007
[email protected] / [email protected]@uab.es / [email protected] 44
En el fondo todo está En el fondo todo está relacionadorelacionado
20072007
[email protected] / [email protected]@uab.es / [email protected] 55
Inferencia estadísticaInferencia estadística
PruebasPruebas estadísticas estadísticas
Intervalo de confianzaIntervalo de confianza
20072007
[email protected] / [email protected]@uab.es / [email protected] 66
¿Qué es lo que busca todo ¿Qué es lo que busca todo el mundo?el mundo?
p
20072007
[email protected] / [email protected]@uab.es / [email protected] 77
¿Para qué se usa la ¿Para qué se usa la estadística?estadística?
MUESTRA
POBLACIÓN
InferirProbabilidad
Prueba estadísticaIntervalo de confianza
20072007
[email protected] / [email protected]@uab.es / [email protected] 88
Errores de Tipo I y IIErrores de Tipo I y II
El valor del error tipo I ó es de 0.05 (5%)
El valor del error tipo II ó es igual o superior a 0.20 (20%)
El poder (1 - ) es igual ó superior a 0.80 (80%)
20072007
[email protected] / [email protected]@uab.es / [email protected] 99
Variable binariaVariable binaria: : {evento,no evento}{evento,no evento}
– ProporcionesProporciones:: p = r/n p = r/n suma de eventos en un grupo de individuossuma de eventos en un grupo de individuos denominador fijo: n individuosdenominador fijo: n individuos distribución binomialdistribución binomial
– RecuentosRecuentos:: suma de eventos raros en un periodo de tiempo o suma de eventos raros en un periodo de tiempo o
un territorioun territorio 0,1,2,…,k0,1,2,…,k denominador personas-tiempo denominador personas-tiempo tasas tasas distribución Poissondistribución Poisson
DatosDatos categóricos.categóricos.Definiciones básicasDefiniciones básicas
20072007
[email protected] / [email protected]@uab.es / [email protected] 1010
Datos cuantitativosDatos cuantitativos
Distribución de la muestraDistribución de la muestraTendencia central:Tendencia central: X mediaX media
Dispersión o variabilidad:Dispersión o variabilidad: DE desviación estándarDE desviación estándar
Distribución de la media de una muestraDistribución de la media de una muestraTendencia central:Tendencia central: mediamedia
Dispersión o variabilidad:Dispersión o variabilidad: error estándard error estándard
20072007
[email protected] / [email protected]@uab.es / [email protected] 1111
Distribución normalDistribución normal
X
X + ‘2’DS =>95%
Distribución de la
muestra
X
X +’2’ EEM
Distribución de la media
20072007
[email protected] / [email protected]@uab.es / [email protected] 1212
¿p?¿p? Probabilidad de observar, por azar, una Probabilidad de observar, por azar, una
diferencia como la de la muestra o mayor, diferencia como la de la muestra o mayor, cuando Hcuando H00 es cierta es cierta
Es una medida de la evidencia en contra Es una medida de la evidencia en contra de la Hde la H00– Es el azar una explicación posible de las Es el azar una explicación posible de las
diferencias observadas?diferencias observadas?Supongamos que así es (HSupongamos que así es (H00).).¿Con qué probabilidad observaríamos unas ¿Con qué probabilidad observaríamos unas
diferencias de esa magnitud, o incluso mayor? diferencias de esa magnitud, o incluso mayor? P-P-valorvalor
Si P-valor pequeño, rechazamos HSi P-valor pequeño, rechazamos H00..– ¿Difícil?... No, es como un juicio!¿Difícil?... No, es como un juicio!
20072007
[email protected] / [email protected]@uab.es / [email protected] 1313
¿p?¿p?
Se acepta un valor máximo de 5% (0,05).Se acepta un valor máximo de 5% (0,05).– Si pSi p0,05 0,05 diferencias estadísticamente diferencias estadísticamente
significativas.significativas.
– Si p>0,05 Si p>0,05 diferencias estadísticamente NO diferencias estadísticamente NO significativas.significativas.
NO implica importancia clínica.NO implica importancia clínica.
NO implica magnitud de efecto!!NO implica magnitud de efecto!!– Influenciada por el tamaño de la muestra. Si Influenciada por el tamaño de la muestra. Si n n p p
20072007
[email protected] / [email protected]@uab.es / [email protected] 1414
Errores y aciertosErrores y aciertos
Realidad
Ttos. I guales Ttos. Dif erentes
Ttos. I guales AciertoError tipo I I
()Conclusión
Ttos. Dif erentesError tipo I
()Acierto
20072007
[email protected] / [email protected]@uab.es / [email protected] 1515
SituacionesSituaciones ConclusiónConclusión: Diferencias estadísticamente : Diferencias estadísticamente
significativassignificativas– Realidad:Realidad: Hay diferencias Hay diferencias Acierto Acierto– Realidad:Realidad: No hay diferencias No hay diferencias Error tipo I ( Error tipo I ())
ConclusiónConclusión: Diferencias NO estadísticamente : Diferencias NO estadísticamente significativassignificativas– Realidad:Realidad: No hay diferencias No hay diferencias Acierto Acierto– Realidad:Realidad: Hay diferencias Hay diferencias
Error tipo II (Error tipo II ())Muestra insuficienteMuestra insuficiente
20072007
[email protected] / [email protected]@uab.es / [email protected] 1616
Utilidad de Creer en la Existencia Utilidad de Creer en la Existencia de Dios (según Pascal)de Dios (según Pascal)
Realidad
Dios Existe Dios No Existe
Dios Existe Acierto No PenalizaciónDecisiónde Pascal
Dios No Existe Condena Eterna Acierto
H0: Dios No ExisteH1: Dios Existe
20072007
[email protected] / [email protected]@uab.es / [email protected] 1717
Sentido/No sentido de la Sentido/No sentido de la prueba estadísticaprueba estadística
Una o dos colasUna o dos colas– Sentido – una colaSentido – una cola
El ‘fenómeno’ existe si A es mayor que BEl ‘fenómeno’ existe si A es mayor que B
– No Sentido – dos colasNo Sentido – dos colasEl ‘fenómeno’ existe si A es diferente que BEl ‘fenómeno’ existe si A es diferente que B
20072007
[email protected] / [email protected]@uab.es / [email protected] 1818
Pruebas de hipótesisPruebas de hipótesis
Unilateral (una cola)Unilateral (una cola)
HHoo: : EE - - CC 0 0HH11: : EE - - CC > 0 > 0
Bilateral (dos colas)Bilateral (dos colas)
HHoo: : EE - - CC = 0 = 0HH11: : EE - - CC > 0 ó > 0 ó EE - - CC < 0 < 0
20072007
[email protected] / [email protected]@uab.es / [email protected] 1919
Revisión de la Revisión de la aplicabilidad de las aplicabilidad de las distintas pruebas distintas pruebas
estadísticasestadísticas
20072007
[email protected] / [email protected]@uab.es / [email protected] 2020
NormalidadNormalidad
MÉTODOS PARAMÉTRICOS
20072007
[email protected] / [email protected]@uab.es / [email protected] 2121
No normalidadNo normalidad
MÉTODOS NO PARAMÉTRICOS
X
20072007
[email protected] / [email protected]@uab.es / [email protected] 2222
Pruebas paramétricas y no-Pruebas paramétricas y no-paramétricasparamétricas
Una prueba paramétrica requiere la Una prueba paramétrica requiere la estimación de uno o más parámetros estimación de uno o más parámetros (estadísticos) de la población(estadísticos) de la población– Ej.: Una estimación de la diferencia entre la Ej.: Una estimación de la diferencia entre la
media antes y después de una intervenciónmedia antes y después de una intervención Las pruebas no-paramétricas no Las pruebas no-paramétricas no
involucran ningún tipo de estimación de involucran ningún tipo de estimación de parámetrosparámetros– Ej.: Facilitarnos la una estimación de la P[X>Y], Ej.: Facilitarnos la una estimación de la P[X>Y],
probabilidad de que, selecionando un paciente probabilidad de que, selecionando un paciente después del tratamiento, su valor sea mayor después del tratamiento, su valor sea mayor que antes del tratamientoque antes del tratamiento
20072007
[email protected] / [email protected]@uab.es / [email protected] 2323
Advantage of non-parametric testAdvantage of non-parametric test– No assumptions about the distribution of the dataNo assumptions about the distribution of the data
– Handles every kind of outcome variableHandles every kind of outcome variable DisadvantageDisadvantage
– Non-parametric test do not have the same statistical Non-parametric test do not have the same statistical power as parametric test dopower as parametric test do
Data issuesData issues– Ranks of data, not data in original units, usedRanks of data, not data in original units, used– Effect of outliers is removed (can be good or bad)Effect of outliers is removed (can be good or bad)
Use n-p. test when p. methods are inappropriate Use n-p. test when p. methods are inappropriate due to lack of distribution requirementsdue to lack of distribution requirements
Pruebas paramétricas y no-Pruebas paramétricas y no-paramétricasparamétricas
20072007
[email protected] / [email protected]@uab.es / [email protected] 2424
Pruebas estadísticasPruebas estadísticas2 grupos 3 grupos
Tipo de Datos datos independientes Datos apareados datos independientes datos apareados
Nominales (p.e. sexo) A. J i al cuadrado (2)B. Prueba exacta de FisherNota:1) Si N>40 usar 2
2) Si N=20-40 usar 2 solamente si laf recuencia esperada en cada celda5; si no usar el test exacto deFisher3) Si N<20 usar siempre el testexacto de Fisher
A. Prueba deMcNemar
A. J i al cuadrado (2)Nota: No se puede usar si el 20%de las celdas tienen unaf recuencia esperada <5 o sialguna celda tiene una f recuenciaesperada <1
A. Prueba de Cochran Q
Ordinales o intervalossi no se cumple ladistribución normal enlos grupos
A. Prueba de la U deMann-Whitney
A. Prueba deWilcoxon
A. Prueba de Kruskal-Wallis A. Prueba de Friedman
I ntervalos (p.e.edad,peso, tensión arterial)
A. Prueba de la t deStudent (t-test)
A. Prueba de la t de Studentpara datos apareados
A. Análisis de la Varianza(ANOVA)Nota:1) No es apropiado usar varios t-test para comparar 3 grupos2) Si hay una dif erencia entre 3grupos, existen varias pruebaspara localizar la dif erencia(Prueba de Student-Newman-Keuls)
A. Análisis de la varianza paramedidas repetidasNota:1) No es apropiado usar varios t-test apareados para comparar 3medidas repetidas2) Si hay una dif erencia entre 3medidas, existen varias pruebaspara localizar la dif erencia
20072007
[email protected] / [email protected]@uab.es / [email protected] 2525
Más chuletario Más chuletario
V. CUANTITATIVA NO NORMAL EN ALGUN GRUPO
Estadística /Pruebas no paramétricas /2 muestras relacionadas /Wilcoxon
NORMALIDAD? Estadísticos / Pruebas no paramétricas /K-S de 1 muestra / Normal
COMPARACIÓN
DE MEDIAS
Grupos independientes
Grupos apareados
V. CUANTITATIVA NORMALEN AMBOS GRUPOS
V. DIFERENCIA NO NORMAL
Estadística /Pruebas no paramétricas /2 muestras independientes /U de Mann-Whitney
Estadística /Comparar medias /Prueba T para muestras independientes
V. DIFERENCIA NORMAL
Estadística /Comparar medias /Prueba T para muestras relacionadas
V. CUANTITATIVA .vs. V. CUALITATIVA (2 grupos)
20072007
[email protected] / [email protected]@uab.es / [email protected] 2626
Más chuletario Más chuletario V. CUANTITATIVA .vs. V. CUALITATIVA ( 2 grupos)
NORMALIDAD ?(NPAR TEST K-S (NORMAL))
INDEPENDENCIA ?ASIGNACIONES ALEATORIAS
HOMOSCEDASTICIDAD?H0:
n
ó n
(TEST DE LEVENE)
ANOVASI
NPAR TEST K-W (Kruskal-Wallis)NO
p > 0.05 No se rechaza H0
p < 0.05 Test a posteriori
--> Test de Scheffé
20072007
[email protected] / [email protected]@uab.es / [email protected] 2727
Más chuletario Más chuletario V. CUANTITATIVA .vs. V. CUANTITATIVA
Incumplimiento de condiciones de aplicabilidad
* 1 v. cuantitativa aleatoria .vs. 1 v. cuantitativa diseñadaREGRESION
CORRELACION
Cumplimiento de condiciones de aplicabilidad
* NONPAR CORR (Test de Spearman)
(Normalidad de la v. cuantitativa en los grupos a comparar, homoscedasticidad)
* 2 v. cuantitativas aleatorias
(Normalidad de las dos v. cuantitativas en su conjunto)
20072007
[email protected] / [email protected]@uab.es / [email protected] 2828
Análisis de la Co-varianza Análisis de la Co-varianza (ANCOVA)(ANCOVA)
Los valores que estamos Los valores que estamos comparando pueden estar comparando pueden estar afectados directamente por otros afectados directamente por otros (covarianción)(covarianción)– TA al final del estudioTA al final del estudio– TA al inicio del estudioTA al inicio del estudio
Medias ajustadasMedias ajustadas: Media al : Media al final del estudio si las TA al final del estudio si las TA al inicio fuesen las mismas.inicio fuesen las mismas.
20072007
[email protected] / [email protected]@uab.es / [email protected] 2929
Intervalo de ConfianzaIntervalo de Confianza
Def.: “Si se realiza el mismo experimento en las mismas condiciones, el 95% de las veces la media que obtendremos estará entre los
márgenes”
Intuitivamente: “El verdadero valor se encuentra dentro del intervalo con una
confianza del 95%”
20072007
[email protected] / [email protected]@uab.es / [email protected] 3030
Amplitud del ICAmplitud del IC También depende de la También depende de la informacióninformación que que
la muestra proporciona sobre el la muestra proporciona sobre el verdadero valor poblacionalverdadero valor poblacional
– Mayor Mayor tamaño de muestratamaño de muestra -> -> mayor precisión -> IC más estrechomayor precisión -> IC más estrecho
– Mayor Mayor dispersióndispersión de la medida -> de la medida ->IC más amplioIC más amplio
20072007
[email protected] / [email protected]@uab.es / [email protected] 3131
p=0.002
Relación entre IC y Relación entre IC y significación (p)significación (p)
p=0.05
IC al 95%
0
20072007
[email protected] / [email protected]@uab.es / [email protected] 3232
Intervalo de ConfianzaIntervalo de Confianza
2 gruposDif. NS
2 gruposDif. Sig.
20072007
[email protected] / [email protected]@uab.es / [email protected] 3333
Superioridad no observada
Superioridad observada
Intervalo de confianza para evaluar ensayos de superioridad
0
20072007
[email protected] / [email protected]@uab.es / [email protected] 3434
Distribución normalDistribución normal
X
X + ‘2’DS =>95%
Distribución de la
muestra
X
X +’2’ EEM
Distribución de la media
20072007
[email protected] / [email protected]@uab.es / [email protected] 3535
EstimaciónEstimación
Un estimador es una cantidad Un estimador es una cantidad numérica calculada sobre una numérica calculada sobre una muestra y que esperamos que sea muestra y que esperamos que sea una buena aproximación de cierta una buena aproximación de cierta cantidad con el mismo significado en cantidad con el mismo significado en la población (parámetro).la población (parámetro).
20072007
[email protected] / [email protected]@uab.es / [email protected] 3636
EstimaciónEstimación
Problema que presenta el uso de estimadores puntuales:
– El problema de los estimadores puntuales es que solo dan una idea de lo que puede valer el parámetro que estimamos, sin conocer como de buena es la aproximación; es decir, simplemente proporcionan un valor (de los muchos posibles) que puede proponerse como valor del parámetro.
– Si realizamos diversas muestras, obtendremos tantas estimaciones del parámetro como muestras
20072007
[email protected] / [email protected]@uab.es / [email protected] 3737
EstimaciónEstimación Ventaja de la estimación por intervalos de confianza:Ventaja de la estimación por intervalos de confianza:
– Se trata de asignar al parámetro poblacional desconocido, por ejemplo μ, un intervalo de valores, digamos (a, b) entre los cuales está μ con una cierta confianza (1- α). Es decir, si se cumple que
– diremos entonces que (a, b) es un intervalo de confianza para el parámetro μ construido al (1- )% de confianza o, lo que es lo mismo, al % de error.
¿INTERPRETACIÓN?
1)(aP
20072007
[email protected] / [email protected]@uab.es / [email protected] 3838
EstimaciónEstimación Por ejemplo, seleccionamos cinco muestras Por ejemplo, seleccionamos cinco muestras
aleatorias de n=5 y elaboramos sus aleatorias de n=5 y elaboramos sus intervalos de confianza. Consideramos un intervalos de confianza. Consideramos un nivel de confianza del 90%nivel de confianza del 90%
20072007
[email protected] / [email protected]@uab.es / [email protected] 3939
EstimaciónEstimación Un último ejemplo:Un último ejemplo:
Una muestra de n=100 individuos de una población tiene Una muestra de n=100 individuos de una población tiene media de peso 60 kg y desviación 5kg.media de peso 60 kg y desviación 5kg.
– Dichas cantidades pueden considerarse como aproximaciones Dichas cantidades pueden considerarse como aproximaciones (estimaciones puntuales)(estimaciones puntuales)
60 kg estima a μ60 kg estima a μ 5 kg estima a σ5 kg estima a σ 5/raiz(n)= 0,5 estima el error estándar (típico) EE5/raiz(n)= 0,5 estima el error estándar (típico) EE
– Estas son las llamadas estimaciones puntuales: un número concreto Estas son las llamadas estimaciones puntuales: un número concreto calculado sobre una muestra es aproximación de un parámetro.calculado sobre una muestra es aproximación de un parámetro.
– Una estimación por intervalo de confianza es una que ofrece Una estimación por intervalo de confianza es una que ofrece un intervalo como respuesta. Además podemos asignarle una un intervalo como respuesta. Además podemos asignarle una probabilidad aproximada que mida nuestra confianza en la probabilidad aproximada que mida nuestra confianza en la respuesta:respuesta:
Hay una confianza del 68% de que μ esté en 60±0,5Hay una confianza del 68% de que μ esté en 60±0,5 Hay una confianza del 95% de que μ esté en 60±1.Hay una confianza del 95% de que μ esté en 60±1.
Ojo: He hecho un poco de trampa. ¿Quien la ve? Ojo: He hecho un poco de trampa. ¿Quien la ve?
20072007
[email protected] / [email protected]@uab.es / [email protected] 4040
EstimaciónEstimación Pero hemos de tener en cuenta que todo intervalo de Pero hemos de tener en cuenta que todo intervalo de
confianza conlleva dos noticias, la buena y la malaconfianza conlleva dos noticias, la buena y la mala
La buena: hemos usado una técnica que en % alto de casos La buena: hemos usado una técnica que en % alto de casos acierta.acierta.
La mala: no sabemos si ha acertado en nuestro caso.La mala: no sabemos si ha acertado en nuestro caso.
20072007
[email protected] / [email protected]@uab.es / [email protected] 4141
Para quien guste de las Para quien guste de las fórmulasfórmulas