1 Ejemplo de análisis descriptivo de un conjunto de...
Transcript of 1 Ejemplo de análisis descriptivo de un conjunto de...
EJEMPLO ANÁLISIS DE DATOS - 1 -
1 Ejemplo de análisis descriptivo de un conjunto de datos
1.1 Introducción
En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos conceptos básicos y proporcionar un guía de trabajo que sirva de referencia en el análisis descriptivo. A lo largo del ejemplo, se comentaran los procedimientos propios de SPSS y se propondrán algunas cuestiones de interpretación de resultados.
1.2 Base de datos
La base de datos para este ejemplo se encuentra en la página:
http://www.udl.es/usuaris/q3695988/WebCursPrimer/
En dicha página, seleccionar la opción Casos Prácticos en la barra izquierda. Una vez en Casos prácticos, seleccionar la base de datos del ejemplo: Factores implicados en la evolución a ciertas intervenciones quirúrgicas.
1.3 Enunciado general del ejemplo
En un estudio se quiere evaluar la posible relación entre determinados factores clínicos y la evolución observada en determinados procesos post operatorios relacionados con una patología. Para ello, se han recogido los datos de un conjunto de pacientes sometidos a intervención quirúrgica en el último año. La información recogida es la siguiente: Género: 1 Hombre, 2 Mujer IMC Indice de masa corporal Concentración 1 Concentración 2 Concentración 3 Gravedad al ingreso: +, ++, +++ Ingreso: 1 Programado, 2 Urgencia Evolución +, ++, +++
1.4 Objetivos
• Realizar una descriptiva completa del conjunto de datos, justificando en cada caso
el método elegido • Estimar el rango de normalidad de los metabolitos incluidos en este estudio en
función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución.
• Determinar si la evolución está relacionada con la gravedad al ingreso. ¿Qué factores pueden influenciar esta relación?
• Comparar las concentraciones de los metabolitos entre hombres y mujeres. • Estudiar la relación entre los niveles de los metabolitos y la evolución
EJEMPLO ANÁLISIS DE DATOS - 2 -
2 Análisis
2.1 Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método elegido
2.1.1 Variables cualitativas
En este conjunto de datos, disponemos de distintas variables cualitativas (género, gravedad al ingreso, ingreso y evolución. Por otra parte, disponemos de distintas variable cuantitativas (imc, y las distintas concentraciones).
Empezaremos realizando una descriptiva de las variables cualitativas, teniendo en cuenta las distintas variables de que se dispone y los objetivos del estudio. Para ello, fundamentalmente podemos utilizar gráficos de barras y tablas de porcentajes.
En primer lugar, estudiaremos los resultados de la base de datos desde el punto de vista de tablas de porcentajes, relacionando la gravedad al ingreso con la evolución de los pacientes. El procedimiento para obtener esta tabla es:
Analizar>Estadisticos descriptivos>Tablas de contingencia
Seleccionaremos la gravedad al ingreso en las filas y la evolución en las columnas:
A continuación, indicaremos en la opción Casillas.. que nos interesan los porcentajes de fila:
EJEMPLO ANÁLISIS DE DATOS - 3 -
El resultado que se obtiene es:
Tabla de contingencia GRAVEDAD * EVOLUCIO
12 23 18 5322,6% 43,4% 34,0% 100,0%
12 25 7 4427,3% 56,8% 15,9% 100,0%
41 31 7 7951,9% 39,2% 8,9% 100,0%
65 79 32 17636,9% 44,9% 18,2% 100,0%
Recuento% de GRAVEDADRecuento% de GRAVEDADRecuento% de GRAVEDADRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+ ++ +++EVOLUCIO
Total
Los porcentajes parecen indicar que la gravedad al ingreso comporta una peor evolución. Para evaluar este punto, podemos calcular los residuales ajustados. En la opción Casillas seleccionaos esta opción:
La nueva tabla será:
EJEMPLO ANÁLISIS DE DATOS - 4 -
Tabla de contingencia GRAVEDAD * EVOLUCIO
12 23 18 5322,6% 43,4% 34,0% 100,0%
-2,6 -,3 3,612 25 7 44
27,3% 56,8% 15,9% 100,0%-1,5 1,8 -,5
41 31 7 7951,9% 39,2% 8,9% 100,0%
3,7 -1,4 -2,965 79 32 176
36,9% 44,9% 18,2% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+ ++ +++EVOLUCIO
Total
Donde puede verse que, efectivamente, podemos concluir que el porcentaje de pacientes con gravedad (+++) al ingreso evoluciona peor (+) que el resto.
EJEMPLO ANÁLISIS DE DATOS - 5 -
Podemos estimar la probabilidad de que un paciente con una gravedad (+++) al ingreso tenga una evolución (+). Para ello, recordad que el intervalo de confianza (95%) para una probabilidad π es:
npp
p)1(
96.1 000
−±∈π
(1)
Utilizando esta expresión podemos calcular, para el grupo de gravedad (+++) al ingreso:
)63.0,41.0(11.052.0
7948.052.096.152.0
∈±∈
×±∈
ππ
π
(2)
Este resultado puede compararse con el resultado para los pacientes con gravedad (+) al ingreso
)34.0,12.0(11.023.0
5377.023.096.123.0
∈±∈
×±∈
ππ
π
(3)
Podéis comprobar que ambos intervalos no se solapan, indicando que la probabilidad de evolucionar desfavorablemente es superior en el grupo de mayor gravedad al ingreso.
Ejercicio: calcular los intervalos de confianza para todas las probabilidades de la tabla anterior. Discutir los resultados y relacionarlos con la interpretación de los residuales ajustados.
Los resultados de una tabla de contingencia pueden representarse mediante una gráfica de barras. Para ello, utilizaremos la opción Gráficos>Barras, seleccionando la opción de Agrupado
EJEMPLO ANÁLISIS DE DATOS - 6 -
En el cuadro de diálogo correspondiente, indicaremos:
Es importante seleccionar la opción % de casos para que los resultados se expresen según porcentajes. En el eje de categorías situaremos la evolución, y los grupos vendrán definidos por gravedad. El resultado será:
EVOLUCIO
++++++
Porc
enta
je
60
50
40
30
20
10
0
GRAVEDAD
+
++
+++
Donde se indican los mismos porcentajes de la tabla anterior. Puede apreciarse que el porcentaje de pacientes con evolución desfavorable (+) aumenta con la gravedad al ingreso, mientras que la proporción de pacientes con buena evolución (+++) disminuye.
Ejercicio: Copia los resultados de la tabla a un fichero de Excel y calcula los intervalos de confianza para cada probabilidad. Incluye unas barras de error que complementen la gráfica de barras.
EJEMPLO ANÁLISIS DE DATOS - 7 -
Hasta este punto, hemos relacionado la evolución con la gravedad al ingreso. Seria interesante explorar si esta relación es similar en hombres y mujeres. Para ello, podemos repetir la tabla de contingencia incluyendo la variable género como una capa. Con ello, se realizará una tabla independiente para hombres y mujeres:
El resultado que obtendremos será:
Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO
6 9 8 2326,1% 39,1% 34,8% 100,0%
-1,4 -,4 2,34 7 6 17
23,5% 41,2% 35,3% 100,0%-1,4 -,2 1,9
22 20 2 4450,0% 45,5% 4,5% 100,0%
2,4 ,5 -3,632 36 16 84
38,1% 42,9% 19,0% 100,0%6 14 10 30
20,0% 46,7% 33,3% 100,0%-2,2 ,0 2,8
8 18 1 2729,6% 66,7% 3,7% 100,0%
-,8 2,5 -2,219 11 5 35
54,3% 31,4% 14,3% 100,0%2,9 -2,3 -,633 43 16 92
35,9% 46,7% 17,4% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+
++
+++
GRAVEDAD
Total
GENEROHombre
Mujer
+ ++ +++EVOLUCIO
Total
Puede apreciarse que no la tendencia es similar en ambos casos.
Ejercicio: Estima la probabilidad de que una mujer con gravedad (+++) al ingreso evolucione desfavorablemente (+). Compara este resultado con el correspondiente para los hombres. Repite este cálculo para el evolución (+++).
EJEMPLO ANÁLISIS DE DATOS - 8 -
Utilizando los mismos procedimientos, exploraremos la posible relación entre el tipo de ingreso y la evolución. Obtenemos:
Tabla de contingencia INGRESO * EVOLUCIO
24 39 19 8229,3% 47,6% 23,2% 100,0%
-2,0 ,7 1,641 40 13 94
43,6% 42,6% 13,8% 100,0%2,0 -,7 -1,665 79 32 176
36,9% 44,9% 18,2% 100,0%
Recuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESO
Programado
Urgencias
INGRESO
Total
+ ++ +++EVOLUCIO
Total
De estos resultados, podemos indicar que los pacientes de urgencias presentan una proporción superior de evolución desfavorable, si bien los resultados no son muy significativos. En este caso, seria conveniente considerar la gravedad al ingreso:
Tabla de contingencia INGRESO * EVOLUCIO * GRAVEDAD
5 14 13 3215,6% 43,8% 40,6% 100,0%
-1,5 ,1 1,37 9 5 21
33,3% 42,9% 23,8% 100,0%1,5 -,1 -1,312 23 18 53
22,6% 43,4% 34,0% 100,0%3 11 3 17
17,6% 64,7% 17,6% 100,0%-1,1 ,8 ,3
9 14 4 2733,3% 51,9% 14,8% 100,0%
1,1 -,8 -,312 25 7 44
27,3% 56,8% 15,9% 100,0%16 14 3 33
48,5% 42,4% 9,1% 100,0%-,5 ,5 ,125 17 4 46
54,3% 37,0% 8,7% 100,0%,5 -,5 -,141 31 7 79
51,9% 39,2% 8,9% 100,0%
Recuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESORecuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESORecuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESO
Programado
Urgencias
INGRESO
Total
Programado
Urgencias
INGRESO
Total
Programado
Urgencias
INGRESO
Total
GRAVEDAD+
++
+++
+ ++ +++EVOLUCIO
Total
Ejercicio: Utilizando tablas de frecuencias, explora la relación entre la evolución de los pacientes y su gravedad al ingreso teniendo en cuenta el tipo de ingreso y el género. Discute las limitaciones de los resultados que obtengas.
EJEMPLO ANÁLISIS DE DATOS - 9 -
2.1.2 Variables cuantitativas
Al realizar una descriptiva de la variables cuantitativas, es conveniente, en primer lugar, comprobar si se comportan como una normal. Para ello, podemos utilizar gráficas P-P. El procedimiento es: Gráficos>P-P:
El resultado para conc1 es:
Normal gráfico P-P de CONC3
Prob acum observada
1,0,8,5,30,0
Prob
acu
m e
sper
ada
1,0
,8
,5
,3
0,0
EJEMPLO ANÁLISIS DE DATOS - 10 -
Normal gráfico P-P sin tendencia d
Prob acum observada
1,21,0,8,6,4,20,0-,2
Des
viac
ión
de N
orm
al
,03
,02
,01
0,00
-,01
-,02
Puede observase que la gráfica P-P se acerca bastante a la diagonal, sin que la gráfica de desviaciones muestre diferencias importantes respecto a los valores esperados según la distribución normal.
Ejercicio: Comprobar la normalidad del resto de variables cuantitativas.
Podemos completar este análisis descriptivo de la normalidad mediante histogramas. Para ello, seleccionamos Gráficos>Histograma:
EJEMPLO ANÁLISIS DE DATOS - 11 -
El resultado para conc3 es:
CONC3
51,046,4
41,837,2
32,6
50
40
30
20
10
0
Desv. típ. = 4,48 Media = 42,8
N = 176,00
Ejercicio: Estudia la distribución del resto de variables cuantitativas mediante histogramas
Para el estudio descriptivo de variables cuantitativas continuas, es más interesante utilizar diagramas de cajas. Este tipo de gráficas nos permite comparar la distribución de cada variable en función de distintas variables cuantitativas. Así, podemos comparar la distribución de conc3 en función de la gravedad al ingreso. Para ello, seleccionamos: Graficos>Diagramas de Cajas>Simple:
EJEMPLO ANÁLISIS DE DATOS - 12 -
Obtenemos:
794453N =
GRAVEDAD
++++++
CO
NC
3
60
50
40
30
20
39
118
Podemos apreciar que no se observan cambios importantes en la distribución de esta variable en los distintos grupos de pacientes según la gravedad al ingreso. Los valores extremos en el caso de gravedad (+++) indican individuos con valores alejados del resto. Estos valores deben validarse para excluir errores en la entrada de datos.
Mediante diagramas de cajas, podemos explorar la distribución de una variable en función de dos variables cualitativas. Por ejemplo, podemos verificar si el tipo de ingreso y la gravedad determinan diferencias en la distribución de conc3. Para ello utilizaremos: Graficos>Diagramas de Cajas>Agrupados:
EJEMPLO ANÁLISIS DE DATOS - 13 -
462721 331732N =
GRAVEDAD
++++++
CO
NC
3
60
50
40
30
20
INGRESO
Programado
Urgencias
39
68
Podemos observar que no se producen variaciones apreciables.
Ejercicio: Determina si la gravedad al ingreso y el género determinan alguna variación importante en la distribución de imc, y de las concentraciones.
EJEMPLO ANÁLISIS DE DATOS - 14 -
El análisis exploratorio de estos datos nos indica que existen algunas diferencias importantes en función de la edad:
9284N =
GENERO
MujerHombre
CO
NC
2
130
120
110
100
90
80
3775
Esta descriptiva puede completarse mediante tablas de medias y desviaciones típicas. Para ello podemos utilizar Analizar>Comparar Medias>Medias:
Informe
CONC1
51,670 2,3444 8451,748 2,6864 9251,711 2,5221 176
GENEROHombreMujerTotal
Media Desv. típ. N
EJEMPLO ANÁLISIS DE DATOS - 15 -
Podemos completar el análisis, introduciendo distintas capas y pivotando la tabla resultante. Así, podemos comparar las medias en función del género, ingreso y gravedad:
Informe
CONC1
52,9 3,0 12 52,1 1,9 11 52,5 2,5 2354,2 2,6 6 51,8 1,9 11 52,7 2,4 1750,7 2,1 17 50,9 1,9 27 50,8 1,9 4452,1 2,8 35 51,4 1,9 49 51,7 2,3 8453,6 2,7 20 52,3 2,8 10 53,2 2,7 3051,1 3,4 11 51,4 1,5 16 51,3 2,4 2751,3 2,7 16 50,5 2,1 19 50,9 2,4 3552,3 3,0 47 51,2 2,2 45 51,7 2,7 9253,3 2,8 32 52,2 2,3 21 52,9 2,6 5352,2 3,4 17 51,6 1,6 27 51,8 2,5 4451,0 2,4 33 50,7 2,0 46 50,8 2,1 7952,2 2,9 82 51,3 2,0 94 51,7 2,5 176
GRAVEDAD++++++Total++++++Total++++++Total
GENEROHombre
Mujer
Total
Media Desv. típ. N Media Desv. típ. N Media Desv. típ. NProgramado Urgencias Total
INGRESO
Desde el punto de vista exploratorio, es interesante determinar la posible relación entre variables cuantitativas. Esta descriptiva puede realizarse mediante gráficas de dispersión: Graficos>Dispersión:
Obtenemos:
EJEMPLO ANÁLISIS DE DATOS - 16 -
CONC1
605856545250484644
CO
NC
2
120
110
100
90
80
Puede observarse que no existe una tendencia evidente entre los valores de ambas variables.
Ejercicio: Utilizando los procedimientos anteriores, realiza una descriptiva completa de los datos. En función de los resultados, indica una interpretación global de los mismos en función de los objetivos que se han planteado.
EJEMPLO ANÁLISIS DE DATOS - 17 -
2.2 Estimar el rango de normalidad de los metabolitos incluidos en este estudio en función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución.
Si podemos admitir una distribución normal, el intervalo de normalidad al 95% se calcula como:
sX ×± 96.1 (4)
Para ello, debemos calcular las medias y desviaciones típicas correspondientes a los casos de interés. Vamos a calcular dichas medias para hombres y mujeres:
Informe
53,64 60,89 57,434,949 4,488 5,939
,540 ,468 ,44884 92 176
22,51 20,50 21,46,951 ,955 1,385,104 ,100 ,104
84 92 17651,670 51,748 51,7112,3444 2,6864 2,5221
,2558 ,2801 ,190184 92 176
104,370 93,932 98,9146,0601 6,2720 8,0756
,6612 ,6539 ,608784 92 176
45,000 40,880 42,8474,2134 3,7652 4,4777
,4597 ,3925 ,337584 92 176
MediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaN
EDAD
IMC
CONC1
CONC2
CONC3
Hombre Mujer TotalGENERO
En función de estos resultados, los valores normales (que expresan entre que valores esperamos el 95% de los resultados individuales) para conc2 serian, para los hombres:
)25.116,49.92(88.1137.104
06.696.137.104±
×±
(5)
Para las mujeres serian:
)75.109,11.78(82.1593.93
07.896.193,93±
×±
(6)
Puede verse que los resultados esperados se sitúan ligeramente por debajo en hombres que en mujeres.
EJEMPLO ANÁLISIS DE DATOS - 18 -
Ejercicio: Calcula los intervalos de referencia para el resto de variables
Ejercicio: Calcula los intervalos de referencia de cada variable según el grado de evolución
Si estamos interesados en determinar qué variable puede ser utilizada para clasificar a los pacientes para predecir su posible evolución, debemos establecer qué variable presenta diferencias de distribución en función de la evolución. Para ello, podemos empezar utilizando diagramas de barras:
327965N =
EVOLUCIO
++++++
CO
NC
1
70
60
50
40
12215760
22
Puede observarse que existe una relación entre la evolución y la conc1. Esta variable podría utilizarse como indicativo de evolución en el diseño de un criterio diagnóstico.
Para explorar esta posibilidad, podemos calcular una curva ROC. El procedimiento indica si la variable en cuestión puede discriminar un determinado grupo de pacientes. En este caso, tomaremos como grupo de interés al grupo (+++). El procedimiento es: Gráficos>Curva COR
EJEMPLO ANÁLISIS DE DATOS - 19 -
El resultado que se obtiene es:
Curva COR
Los segmentos diagonales son producidos por los empates
1 - Especificidad
1,0,8,5,30,0
Sens
ibilid
ad
1,0
,8
,5
,3
0,0
Podemos apreciar que esta variable discrimina bien entre el grupo de buena evolución (+++) y el resto de grupos. Podemos incluir a las otras variables en la misma gráfica:
Curva COR
Los segmentos diagonales son producidos por los empates.
1 - Especificidad
1,0,8,5,30,0
Sens
ibilid
ad
1,0
,8
,5
,3
0,0
Procedencia de la cu
CONC3
CONC2
CONC1
EJEMPLO ANÁLISIS DE DATOS - 20 -
Podemos apreciar que conc3 no discrimina en absoluto, mientras que conc2 proporciona alguna discriminación pero en menor medida que conc1.
2.3 Determinar si la evolución está relacionada con la gravedad al ingreso. ¿Qué factores pueden influenciar esta relación?
Podemos estudiar esta relación mediante tablas de contingencia. En primer lugar, tenemos:
Tabla de contingencia GRAVEDAD * EVOLUCIO
12 23 18 5322,6% 43,4% 34,0% 100,0%
-2,6 -,3 3,612 25 7 44
27,3% 56,8% 15,9% 100,0%-1,5 1,8 -,5
41 31 7 7951,9% 39,2% 8,9% 100,0%
3,7 -1,4 -2,965 79 32 176
36,9% 44,9% 18,2% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+ ++ +++EVOLUCIO
Total
Pruebas de chi-cuadrado
21,976a 4 ,00021,339 4 ,000
18,551 1 ,000
176
Chi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidos
Valor glSig. asintótica
(bilateral)
0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 8,00.
a.
Por lo tanto, como ya habíamos comentado en el apartado 2.1.1, se observa una relación significativa entre la gravedad al ingreso y la evolución, de manera que la probabilidad de una buena evolución esta asociada a una menor gravedad al ingresos.
EJEMPLO ANÁLISIS DE DATOS - 21 -
Si consideramos el tipo de ingreso y el género como posibles factores de confusión encontramos:
Tabla de contingencia
6 9 8 2326,1% 39,1% 34,8% 100,0%
-1,4 -,4 2,34 7 6 17
23,5% 41,2% 35,3% 100,0%-1,4 -,2 1,9
22 20 2 4450,0% 45,5% 4,5% 100,0%
2,4 ,5 -3,632 36 16 84
38,1% 42,9% 19,0% 100,0%6 14 10 30
20,0% 46,7% 33,3% 100,0%-2,2 ,0 2,8
8 18 1 2729,6% 66,7% 3,7% 100,0%
-,8 2,5 -2,219 11 5 35
54,3% 31,4% 14,3% 100,0%2,9 -2,3 -,633 43 16 92
35,9% 46,7% 17,4% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+
++
+++
GRAVEDAD
Total
GENEROHombre
Mujer
+ ++ +++EVOLUCIO
Total
Tabla de contingencia
5 14 13 3215,6% 43,8% 40,6% 100,0%
-2,2 -,6 3,03 11 3 17
17,6% 64,7% 17,6% 100,0%-1,2 1,6 -,6
16 14 3 3348,5% 42,4% 9,1% 100,0%
3,1 -,8 -2,524 39 19 82
29,3% 47,6% 23,2% 100,0%7 9 5 21
33,3% 42,9% 23,8% 100,0%-1,1 ,0 1,5
9 14 4 2733,3% 51,9% 14,8% 100,0%
-1,3 1,2 ,225 17 4 46
54,3% 37,0% 8,7% 100,0%2,1 -1,1 -1,441 40 13 94
43,6% 42,6% 13,8% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+
++
+++
GRAVEDAD
Total
INGRESOProgramado
Urgencias
+ ++ +++EVOLUCIO
Total
EJEMPLO ANÁLISIS DE DATOS - 22 -
Estos resultados parecen indicar ambos factores no influencian de manera significativa la relación entre la gravedad al ingreso y la evolución.
Finalmente, aunque no disponemos de muestra suficiente, podemos considerar todos los factores simultáneamente:
Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO * INGRESO
2 4 6 12 3 10 7 2016,7% 33,3% 50,0% 100,0% 15,0% 50,0% 35,0% 100,0%
-1,6 -,8 2,8 -1,4 -,1 1,61 3 2 6 2 8 1 11
16,7% 50,0% 33,3% 100,0% 18,2% 72,7% 9,1% 100,0%-1,0 ,4 ,7 -,6 1,6 -1,3
9 8 0 17 7 6 3 1652,9% 47,1% ,0% 100,0% 43,8% 37,5% 18,8% 100,0%
2,3 ,5 -3,1 2,1 -1,3 -,512 15 8 35 12 24 11 47
34,3% 42,9% 22,9% 100,0% 25,5% 51,1% 23,4% 100,0%4 5 2 11 3 4 3 10
36,4% 45,5% 18,2% 100,0% 30,0% 40,0% 30,0% 100,0%-,3 ,2 ,2 -1,2 -,2 2,2
3 4 4 11 6 10 0 1627,3% 36,4% 36,4% 100,0% 37,5% 62,5% ,0% 100,0%
-1,0 -,5 2,0 -,9 2,0 -1,813 12 2 27 12 5 2 19
48,1% 44,4% 7,4% 100,0% 63,2% 26,3% 10,5% 100,0%1,2 ,2 -1,9 1,9 -1,8 -,120 21 8 49 21 19 5 45
40,8% 42,9% 16,3% 100,0% 46,7% 42,2% 11,1% 100,0%
Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD
+
++
+++
GRAVEDAD
Total
+
++
+++
GRAVEDAD
Total
INGRESOProgramado
Urgencias
+ ++ +++EVOLUCIO
Total + ++ +++EVOLUCIO
Total
Hombre MujerGENERO
EJEMPLO ANÁLISIS DE DATOS - 23 -
Pruebas de chi-cuadrado
11,792a 4 ,01914,805 4 ,005
9,501 1 ,002
357,033b 4 ,1346,935 4 ,139
3,670 1 ,055
475,089c 4 ,2784,774 4 ,311
1,509 1 ,219
499,694d 4 ,046
10,415 4 ,034
3,683 1 ,055
45
Chi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidos
GENEROHombre
Mujer
Hombre
Mujer
INGRESOProgramado
Urgencias
Valor glSig. asintótica
(bilateral)
6 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,37.
a.
5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 2,57.
b.
7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,80.
c.
5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,11.
d.
Podemos observar que en algunos casos, la relación deja de ser significativa. Parte de este cambio es debido a la falta de casos, sin descartar totalmente la posibilidad de interacciones significativas que determinen una evolución distinta en cada tipo de paciente. Por lo tanto, seria conveniente diseñar un estudio más completo y utilizar técnicas estadísticas más potentes (multivariantes) para explorar el problema.
2.4 Comparar las concentraciones de los metabolitos entre hombres y mujeres.
La comparación descriptiva de las concentraciones entre hombres y mujeres puede hacerse mediante diagramas de cajas. Por ejemplo, para conc2 tenemos:
9284N =
GENERO
MujerHombre
CO
NC
2
130
120
110
100
90
80
3775
EJEMPLO ANÁLISIS DE DATOS - 24 -
Podemos ver que existen diferencias apreciables. Podemos completar esta descripción mediante el cálculo de índices muestrales:
Informe
CONC2
104,4 6,1 ,7 90,6 118,2 8493,9 6,3 ,7 83,5 110,6 9298,9 8,1 ,6 83,5 118,2 176
GENEROHombreMujerTotal
Media Desv. típ.Error típ. de
la media Mínimo Máximo N
Finalmente, podemos comparar ambos grupos y estimar la diferencia de muestras. Para ello utilizaremos la opción:
Analizar>Comparar Medias>Prueba T para dos muestras independientes
Debemos definir los códigos de la variable género para definir los grupos que queremos comparar:
El resultado es:
Prueba de muestras independientes
,032 ,858 11,208 174 ,000 10,439 ,9314 8,6004 12,2770
11,225 173,434 ,000 10,439 ,9299 8,6033 12,2742
Se han asumidovarianzas igualesNo se han asumidovarianzas iguales
CONC2F Sig.
Prueba de Levenepara la igualdad de
varianzas
t gl Sig. (bilateral)Diferenciade medias
Error típ. dela diferencia Inferior Superior
95% Intervalo deconfianza para la
diferencia
Prueba T para la igualdad de medias
En este punto, debemos recordar que la prueba de Levene para la igualdad de varianzas permite evaluar si las muestras son compatibles con la hipótesis de que las varianzas poblacionales son iguales. En este caso, p=0.858, lo que indica que podemos asumir que las varianzas son iguales.
EJEMPLO ANÁLISIS DE DATOS - 25 -
La prueba de T evalúa si las muestras son compatibles con la hipótesis de igualdad de medias poblacionales. En este caso, siguiendo la primera fila puesto que asumimos igualdad de varianzas, p=0.000, lo que indica que las muestras no son compatibles con la hipótesis. La estimación de la diferencia de medias es entre 8.6 y 12,3, indicando que la concentración media en los hombres (grupo 1) es superior a la de las mujeres.
Ejercicio: Evaluar la igualdad de medias poblacionales en el resto de variables en función del sexo
2.5 Estudiar la relación entre los niveles de los metabolitos y la evolución
La descriptiva de respecto a la evolución de los pacientes proporciona el siguiente resultado:
327965N =
EVOLUCIO
++++++
CO
NC
2
130
120
110
100
90
80
15
Indicando que puede existir una relación significativa entre el nivel de conc2 y la evolución, sin que ello implique necesariamente una relación causa-efecto. Podemos estimar el valor medio de conc2 para cada nivel de evolución. Para ello utilizaremos: Gráficos>Barras de error>Simple:
EJEMPLO ANÁLISIS DE DATOS - 26 -
327965N =
EVOLUCIO
++++++
95%
IC C
ON
C2
120
110
100
90
Puede observarse que el valor medio se incrementa en cada grupo de evolución. A partir de estos resultados, podemos aventurar al interpretación de que las diferencias son significativas, dado que los intervalos no se solapan. Sin embargo, esta interpretación es provisional y deberíamos emplear un procedimiento estadístico que permitiera evaluar esta hipótesis. El procedimiento adecuado en este caso sería el análisis de la varianza (ANOVA).
Podemos evaluar el posible efecto de otras variables. Así, por ejemplo, si seleccionamos Graficos>Barras de error>Agrupados:
EJEMPLO ANÁLISIS DE DATOS - 27 -
Obtenemos:
164333 163632N =
EVOLUCIO
++++++
95%
IC C
ON
C2
120
110
100
90
80
GENERO
Hombre
Mujer
En esta gráfica, podemos observar que la concentración media es superior en hombres a cualquier nivel de evolución y que las diferencias son constantes. Por otra parte, la relación entre la concentración media y la evolución es similar en hombre y mujeres. Por lo tanto, podríamos concluir que la relación entre evolución y concentración es independiente del género. Como en el caso anterior, deberíamos utilizar un procedimiento de ANOVA para verificar esta interpretación. Ejercicio: Determina si la gravedad al ingreso es un factor que modifique la relación entre conc2 y la evolución.