1 Ejemplo de análisis descriptivo de un conjunto de...

27
EJEMPLO ANÁLISIS DE DATOS - 1 - 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos conceptos básicos y proporcionar un guía de trabajo que sirva de referencia en el análisis descriptivo. A lo largo del ejemplo, se comentaran los procedimientos propios de SPSS y se propondrán algunas cuestiones de interpretación de resultados. 1.2 Base de datos La base de datos para este ejemplo se encuentra en la página: http://www.udl.es/usuaris/q3695988/WebCursPrimer/ En dicha página, seleccionar la opción Casos Prácticos en la barra izquierda. Una vez en Casos prácticos, seleccionar la base de datos del ejemplo: Factores implicados en la evolución a ciertas intervenciones quirúrgicas. 1.3 Enunciado general del ejemplo En un estudio se quiere evaluar la posible relación entre determinados factores clínicos y la evolución observada en determinados procesos post operatorios relacionados con una patología. Para ello, se han recogido los datos de un conjunto de pacientes sometidos a intervención quirúrgica en el último año. La información recogida es la siguiente: Género: 1 Hombre, 2 Mujer IMC Indice de masa corporal Concentración 1 Concentración 2 Concentración 3 Gravedad al ingreso: +, ++, +++ Ingreso: 1 Programado, 2 Urgencia Evolución +, ++, +++ 1.4 Objetivos Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método elegido Estimar el rango de normalidad de los metabolitos incluidos en este estudio en función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución. Determinar si la evolución está relacionada con la gravedad al ingreso. ¿Qué factores pueden influenciar esta relación? Comparar las concentraciones de los metabolitos entre hombres y mujeres. Estudiar la relación entre los niveles de los metabolitos y la evolución

Transcript of 1 Ejemplo de análisis descriptivo de un conjunto de...

EJEMPLO ANÁLISIS DE DATOS - 1 -

1 Ejemplo de análisis descriptivo de un conjunto de datos

1.1 Introducción

En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos conceptos básicos y proporcionar un guía de trabajo que sirva de referencia en el análisis descriptivo. A lo largo del ejemplo, se comentaran los procedimientos propios de SPSS y se propondrán algunas cuestiones de interpretación de resultados.

1.2 Base de datos

La base de datos para este ejemplo se encuentra en la página:

http://www.udl.es/usuaris/q3695988/WebCursPrimer/

En dicha página, seleccionar la opción Casos Prácticos en la barra izquierda. Una vez en Casos prácticos, seleccionar la base de datos del ejemplo: Factores implicados en la evolución a ciertas intervenciones quirúrgicas.

1.3 Enunciado general del ejemplo

En un estudio se quiere evaluar la posible relación entre determinados factores clínicos y la evolución observada en determinados procesos post operatorios relacionados con una patología. Para ello, se han recogido los datos de un conjunto de pacientes sometidos a intervención quirúrgica en el último año. La información recogida es la siguiente: Género: 1 Hombre, 2 Mujer IMC Indice de masa corporal Concentración 1 Concentración 2 Concentración 3 Gravedad al ingreso: +, ++, +++ Ingreso: 1 Programado, 2 Urgencia Evolución +, ++, +++

1.4 Objetivos

• Realizar una descriptiva completa del conjunto de datos, justificando en cada caso

el método elegido • Estimar el rango de normalidad de los metabolitos incluidos en este estudio en

función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución.

• Determinar si la evolución está relacionada con la gravedad al ingreso. ¿Qué factores pueden influenciar esta relación?

• Comparar las concentraciones de los metabolitos entre hombres y mujeres. • Estudiar la relación entre los niveles de los metabolitos y la evolución

EJEMPLO ANÁLISIS DE DATOS - 2 -

2 Análisis

2.1 Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el método elegido

2.1.1 Variables cualitativas

En este conjunto de datos, disponemos de distintas variables cualitativas (género, gravedad al ingreso, ingreso y evolución. Por otra parte, disponemos de distintas variable cuantitativas (imc, y las distintas concentraciones).

Empezaremos realizando una descriptiva de las variables cualitativas, teniendo en cuenta las distintas variables de que se dispone y los objetivos del estudio. Para ello, fundamentalmente podemos utilizar gráficos de barras y tablas de porcentajes.

En primer lugar, estudiaremos los resultados de la base de datos desde el punto de vista de tablas de porcentajes, relacionando la gravedad al ingreso con la evolución de los pacientes. El procedimiento para obtener esta tabla es:

Analizar>Estadisticos descriptivos>Tablas de contingencia

Seleccionaremos la gravedad al ingreso en las filas y la evolución en las columnas:

A continuación, indicaremos en la opción Casillas.. que nos interesan los porcentajes de fila:

EJEMPLO ANÁLISIS DE DATOS - 3 -

El resultado que se obtiene es:

Tabla de contingencia GRAVEDAD * EVOLUCIO

12 23 18 5322,6% 43,4% 34,0% 100,0%

12 25 7 4427,3% 56,8% 15,9% 100,0%

41 31 7 7951,9% 39,2% 8,9% 100,0%

65 79 32 17636,9% 44,9% 18,2% 100,0%

Recuento% de GRAVEDADRecuento% de GRAVEDADRecuento% de GRAVEDADRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+ ++ +++EVOLUCIO

Total

Los porcentajes parecen indicar que la gravedad al ingreso comporta una peor evolución. Para evaluar este punto, podemos calcular los residuales ajustados. En la opción Casillas seleccionaos esta opción:

La nueva tabla será:

EJEMPLO ANÁLISIS DE DATOS - 4 -

Tabla de contingencia GRAVEDAD * EVOLUCIO

12 23 18 5322,6% 43,4% 34,0% 100,0%

-2,6 -,3 3,612 25 7 44

27,3% 56,8% 15,9% 100,0%-1,5 1,8 -,5

41 31 7 7951,9% 39,2% 8,9% 100,0%

3,7 -1,4 -2,965 79 32 176

36,9% 44,9% 18,2% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+ ++ +++EVOLUCIO

Total

Donde puede verse que, efectivamente, podemos concluir que el porcentaje de pacientes con gravedad (+++) al ingreso evoluciona peor (+) que el resto.

EJEMPLO ANÁLISIS DE DATOS - 5 -

Podemos estimar la probabilidad de que un paciente con una gravedad (+++) al ingreso tenga una evolución (+). Para ello, recordad que el intervalo de confianza (95%) para una probabilidad π es:

npp

p)1(

96.1 000

−±∈π

(1)

Utilizando esta expresión podemos calcular, para el grupo de gravedad (+++) al ingreso:

)63.0,41.0(11.052.0

7948.052.096.152.0

∈±∈

×±∈

ππ

π

(2)

Este resultado puede compararse con el resultado para los pacientes con gravedad (+) al ingreso

)34.0,12.0(11.023.0

5377.023.096.123.0

∈±∈

×±∈

ππ

π

(3)

Podéis comprobar que ambos intervalos no se solapan, indicando que la probabilidad de evolucionar desfavorablemente es superior en el grupo de mayor gravedad al ingreso.

Ejercicio: calcular los intervalos de confianza para todas las probabilidades de la tabla anterior. Discutir los resultados y relacionarlos con la interpretación de los residuales ajustados.

Los resultados de una tabla de contingencia pueden representarse mediante una gráfica de barras. Para ello, utilizaremos la opción Gráficos>Barras, seleccionando la opción de Agrupado

EJEMPLO ANÁLISIS DE DATOS - 6 -

En el cuadro de diálogo correspondiente, indicaremos:

Es importante seleccionar la opción % de casos para que los resultados se expresen según porcentajes. En el eje de categorías situaremos la evolución, y los grupos vendrán definidos por gravedad. El resultado será:

EVOLUCIO

++++++

Porc

enta

je

60

50

40

30

20

10

0

GRAVEDAD

+

++

+++

Donde se indican los mismos porcentajes de la tabla anterior. Puede apreciarse que el porcentaje de pacientes con evolución desfavorable (+) aumenta con la gravedad al ingreso, mientras que la proporción de pacientes con buena evolución (+++) disminuye.

Ejercicio: Copia los resultados de la tabla a un fichero de Excel y calcula los intervalos de confianza para cada probabilidad. Incluye unas barras de error que complementen la gráfica de barras.

EJEMPLO ANÁLISIS DE DATOS - 7 -

Hasta este punto, hemos relacionado la evolución con la gravedad al ingreso. Seria interesante explorar si esta relación es similar en hombres y mujeres. Para ello, podemos repetir la tabla de contingencia incluyendo la variable género como una capa. Con ello, se realizará una tabla independiente para hombres y mujeres:

El resultado que obtendremos será:

Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO

6 9 8 2326,1% 39,1% 34,8% 100,0%

-1,4 -,4 2,34 7 6 17

23,5% 41,2% 35,3% 100,0%-1,4 -,2 1,9

22 20 2 4450,0% 45,5% 4,5% 100,0%

2,4 ,5 -3,632 36 16 84

38,1% 42,9% 19,0% 100,0%6 14 10 30

20,0% 46,7% 33,3% 100,0%-2,2 ,0 2,8

8 18 1 2729,6% 66,7% 3,7% 100,0%

-,8 2,5 -2,219 11 5 35

54,3% 31,4% 14,3% 100,0%2,9 -2,3 -,633 43 16 92

35,9% 46,7% 17,4% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+

++

+++

GRAVEDAD

Total

GENEROHombre

Mujer

+ ++ +++EVOLUCIO

Total

Puede apreciarse que no la tendencia es similar en ambos casos.

Ejercicio: Estima la probabilidad de que una mujer con gravedad (+++) al ingreso evolucione desfavorablemente (+). Compara este resultado con el correspondiente para los hombres. Repite este cálculo para el evolución (+++).

EJEMPLO ANÁLISIS DE DATOS - 8 -

Utilizando los mismos procedimientos, exploraremos la posible relación entre el tipo de ingreso y la evolución. Obtenemos:

Tabla de contingencia INGRESO * EVOLUCIO

24 39 19 8229,3% 47,6% 23,2% 100,0%

-2,0 ,7 1,641 40 13 94

43,6% 42,6% 13,8% 100,0%2,0 -,7 -1,665 79 32 176

36,9% 44,9% 18,2% 100,0%

Recuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESO

Programado

Urgencias

INGRESO

Total

+ ++ +++EVOLUCIO

Total

De estos resultados, podemos indicar que los pacientes de urgencias presentan una proporción superior de evolución desfavorable, si bien los resultados no son muy significativos. En este caso, seria conveniente considerar la gravedad al ingreso:

Tabla de contingencia INGRESO * EVOLUCIO * GRAVEDAD

5 14 13 3215,6% 43,8% 40,6% 100,0%

-1,5 ,1 1,37 9 5 21

33,3% 42,9% 23,8% 100,0%1,5 -,1 -1,312 23 18 53

22,6% 43,4% 34,0% 100,0%3 11 3 17

17,6% 64,7% 17,6% 100,0%-1,1 ,8 ,3

9 14 4 2733,3% 51,9% 14,8% 100,0%

1,1 -,8 -,312 25 7 44

27,3% 56,8% 15,9% 100,0%16 14 3 33

48,5% 42,4% 9,1% 100,0%-,5 ,5 ,125 17 4 46

54,3% 37,0% 8,7% 100,0%,5 -,5 -,141 31 7 79

51,9% 39,2% 8,9% 100,0%

Recuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESORecuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESORecuento% de INGRESOResiduos corregidosRecuento% de INGRESOResiduos corregidosRecuento% de INGRESO

Programado

Urgencias

INGRESO

Total

Programado

Urgencias

INGRESO

Total

Programado

Urgencias

INGRESO

Total

GRAVEDAD+

++

+++

+ ++ +++EVOLUCIO

Total

Ejercicio: Utilizando tablas de frecuencias, explora la relación entre la evolución de los pacientes y su gravedad al ingreso teniendo en cuenta el tipo de ingreso y el género. Discute las limitaciones de los resultados que obtengas.

EJEMPLO ANÁLISIS DE DATOS - 9 -

2.1.2 Variables cuantitativas

Al realizar una descriptiva de la variables cuantitativas, es conveniente, en primer lugar, comprobar si se comportan como una normal. Para ello, podemos utilizar gráficas P-P. El procedimiento es: Gráficos>P-P:

El resultado para conc1 es:

Normal gráfico P-P de CONC3

Prob acum observada

1,0,8,5,30,0

Prob

acu

m e

sper

ada

1,0

,8

,5

,3

0,0

EJEMPLO ANÁLISIS DE DATOS - 10 -

Normal gráfico P-P sin tendencia d

Prob acum observada

1,21,0,8,6,4,20,0-,2

Des

viac

ión

de N

orm

al

,03

,02

,01

0,00

-,01

-,02

Puede observase que la gráfica P-P se acerca bastante a la diagonal, sin que la gráfica de desviaciones muestre diferencias importantes respecto a los valores esperados según la distribución normal.

Ejercicio: Comprobar la normalidad del resto de variables cuantitativas.

Podemos completar este análisis descriptivo de la normalidad mediante histogramas. Para ello, seleccionamos Gráficos>Histograma:

EJEMPLO ANÁLISIS DE DATOS - 11 -

El resultado para conc3 es:

CONC3

51,046,4

41,837,2

32,6

50

40

30

20

10

0

Desv. típ. = 4,48 Media = 42,8

N = 176,00

Ejercicio: Estudia la distribución del resto de variables cuantitativas mediante histogramas

Para el estudio descriptivo de variables cuantitativas continuas, es más interesante utilizar diagramas de cajas. Este tipo de gráficas nos permite comparar la distribución de cada variable en función de distintas variables cuantitativas. Así, podemos comparar la distribución de conc3 en función de la gravedad al ingreso. Para ello, seleccionamos: Graficos>Diagramas de Cajas>Simple:

EJEMPLO ANÁLISIS DE DATOS - 12 -

Obtenemos:

794453N =

GRAVEDAD

++++++

CO

NC

3

60

50

40

30

20

39

118

Podemos apreciar que no se observan cambios importantes en la distribución de esta variable en los distintos grupos de pacientes según la gravedad al ingreso. Los valores extremos en el caso de gravedad (+++) indican individuos con valores alejados del resto. Estos valores deben validarse para excluir errores en la entrada de datos.

Mediante diagramas de cajas, podemos explorar la distribución de una variable en función de dos variables cualitativas. Por ejemplo, podemos verificar si el tipo de ingreso y la gravedad determinan diferencias en la distribución de conc3. Para ello utilizaremos: Graficos>Diagramas de Cajas>Agrupados:

EJEMPLO ANÁLISIS DE DATOS - 13 -

462721 331732N =

GRAVEDAD

++++++

CO

NC

3

60

50

40

30

20

INGRESO

Programado

Urgencias

39

68

Podemos observar que no se producen variaciones apreciables.

Ejercicio: Determina si la gravedad al ingreso y el género determinan alguna variación importante en la distribución de imc, y de las concentraciones.

EJEMPLO ANÁLISIS DE DATOS - 14 -

El análisis exploratorio de estos datos nos indica que existen algunas diferencias importantes en función de la edad:

9284N =

GENERO

MujerHombre

CO

NC

2

130

120

110

100

90

80

3775

Esta descriptiva puede completarse mediante tablas de medias y desviaciones típicas. Para ello podemos utilizar Analizar>Comparar Medias>Medias:

Informe

CONC1

51,670 2,3444 8451,748 2,6864 9251,711 2,5221 176

GENEROHombreMujerTotal

Media Desv. típ. N

EJEMPLO ANÁLISIS DE DATOS - 15 -

Podemos completar el análisis, introduciendo distintas capas y pivotando la tabla resultante. Así, podemos comparar las medias en función del género, ingreso y gravedad:

Informe

CONC1

52,9 3,0 12 52,1 1,9 11 52,5 2,5 2354,2 2,6 6 51,8 1,9 11 52,7 2,4 1750,7 2,1 17 50,9 1,9 27 50,8 1,9 4452,1 2,8 35 51,4 1,9 49 51,7 2,3 8453,6 2,7 20 52,3 2,8 10 53,2 2,7 3051,1 3,4 11 51,4 1,5 16 51,3 2,4 2751,3 2,7 16 50,5 2,1 19 50,9 2,4 3552,3 3,0 47 51,2 2,2 45 51,7 2,7 9253,3 2,8 32 52,2 2,3 21 52,9 2,6 5352,2 3,4 17 51,6 1,6 27 51,8 2,5 4451,0 2,4 33 50,7 2,0 46 50,8 2,1 7952,2 2,9 82 51,3 2,0 94 51,7 2,5 176

GRAVEDAD++++++Total++++++Total++++++Total

GENEROHombre

Mujer

Total

Media Desv. típ. N Media Desv. típ. N Media Desv. típ. NProgramado Urgencias Total

INGRESO

Desde el punto de vista exploratorio, es interesante determinar la posible relación entre variables cuantitativas. Esta descriptiva puede realizarse mediante gráficas de dispersión: Graficos>Dispersión:

Obtenemos:

EJEMPLO ANÁLISIS DE DATOS - 16 -

CONC1

605856545250484644

CO

NC

2

120

110

100

90

80

Puede observarse que no existe una tendencia evidente entre los valores de ambas variables.

Ejercicio: Utilizando los procedimientos anteriores, realiza una descriptiva completa de los datos. En función de los resultados, indica una interpretación global de los mismos en función de los objetivos que se han planteado.

EJEMPLO ANÁLISIS DE DATOS - 17 -

2.2 Estimar el rango de normalidad de los metabolitos incluidos en este estudio en función de la evolución de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronóstico de evolución.

Si podemos admitir una distribución normal, el intervalo de normalidad al 95% se calcula como:

sX ×± 96.1 (4)

Para ello, debemos calcular las medias y desviaciones típicas correspondientes a los casos de interés. Vamos a calcular dichas medias para hombres y mujeres:

Informe

53,64 60,89 57,434,949 4,488 5,939

,540 ,468 ,44884 92 176

22,51 20,50 21,46,951 ,955 1,385,104 ,100 ,104

84 92 17651,670 51,748 51,7112,3444 2,6864 2,5221

,2558 ,2801 ,190184 92 176

104,370 93,932 98,9146,0601 6,2720 8,0756

,6612 ,6539 ,608784 92 176

45,000 40,880 42,8474,2134 3,7652 4,4777

,4597 ,3925 ,337584 92 176

MediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaNMediaDesv. típ.Error típ. de la mediaN

EDAD

IMC

CONC1

CONC2

CONC3

Hombre Mujer TotalGENERO

En función de estos resultados, los valores normales (que expresan entre que valores esperamos el 95% de los resultados individuales) para conc2 serian, para los hombres:

)25.116,49.92(88.1137.104

06.696.137.104±

×±

(5)

Para las mujeres serian:

)75.109,11.78(82.1593.93

07.896.193,93±

×±

(6)

Puede verse que los resultados esperados se sitúan ligeramente por debajo en hombres que en mujeres.

EJEMPLO ANÁLISIS DE DATOS - 18 -

Ejercicio: Calcula los intervalos de referencia para el resto de variables

Ejercicio: Calcula los intervalos de referencia de cada variable según el grado de evolución

Si estamos interesados en determinar qué variable puede ser utilizada para clasificar a los pacientes para predecir su posible evolución, debemos establecer qué variable presenta diferencias de distribución en función de la evolución. Para ello, podemos empezar utilizando diagramas de barras:

327965N =

EVOLUCIO

++++++

CO

NC

1

70

60

50

40

12215760

22

Puede observarse que existe una relación entre la evolución y la conc1. Esta variable podría utilizarse como indicativo de evolución en el diseño de un criterio diagnóstico.

Para explorar esta posibilidad, podemos calcular una curva ROC. El procedimiento indica si la variable en cuestión puede discriminar un determinado grupo de pacientes. En este caso, tomaremos como grupo de interés al grupo (+++). El procedimiento es: Gráficos>Curva COR

EJEMPLO ANÁLISIS DE DATOS - 19 -

El resultado que se obtiene es:

Curva COR

Los segmentos diagonales son producidos por los empates

1 - Especificidad

1,0,8,5,30,0

Sens

ibilid

ad

1,0

,8

,5

,3

0,0

Podemos apreciar que esta variable discrimina bien entre el grupo de buena evolución (+++) y el resto de grupos. Podemos incluir a las otras variables en la misma gráfica:

Curva COR

Los segmentos diagonales son producidos por los empates.

1 - Especificidad

1,0,8,5,30,0

Sens

ibilid

ad

1,0

,8

,5

,3

0,0

Procedencia de la cu

CONC3

CONC2

CONC1

EJEMPLO ANÁLISIS DE DATOS - 20 -

Podemos apreciar que conc3 no discrimina en absoluto, mientras que conc2 proporciona alguna discriminación pero en menor medida que conc1.

2.3 Determinar si la evolución está relacionada con la gravedad al ingreso. ¿Qué factores pueden influenciar esta relación?

Podemos estudiar esta relación mediante tablas de contingencia. En primer lugar, tenemos:

Tabla de contingencia GRAVEDAD * EVOLUCIO

12 23 18 5322,6% 43,4% 34,0% 100,0%

-2,6 -,3 3,612 25 7 44

27,3% 56,8% 15,9% 100,0%-1,5 1,8 -,5

41 31 7 7951,9% 39,2% 8,9% 100,0%

3,7 -1,4 -2,965 79 32 176

36,9% 44,9% 18,2% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+ ++ +++EVOLUCIO

Total

Pruebas de chi-cuadrado

21,976a 4 ,00021,339 4 ,000

18,551 1 ,000

176

Chi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidos

Valor glSig. asintótica

(bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 8,00.

a.

Por lo tanto, como ya habíamos comentado en el apartado 2.1.1, se observa una relación significativa entre la gravedad al ingreso y la evolución, de manera que la probabilidad de una buena evolución esta asociada a una menor gravedad al ingresos.

EJEMPLO ANÁLISIS DE DATOS - 21 -

Si consideramos el tipo de ingreso y el género como posibles factores de confusión encontramos:

Tabla de contingencia

6 9 8 2326,1% 39,1% 34,8% 100,0%

-1,4 -,4 2,34 7 6 17

23,5% 41,2% 35,3% 100,0%-1,4 -,2 1,9

22 20 2 4450,0% 45,5% 4,5% 100,0%

2,4 ,5 -3,632 36 16 84

38,1% 42,9% 19,0% 100,0%6 14 10 30

20,0% 46,7% 33,3% 100,0%-2,2 ,0 2,8

8 18 1 2729,6% 66,7% 3,7% 100,0%

-,8 2,5 -2,219 11 5 35

54,3% 31,4% 14,3% 100,0%2,9 -2,3 -,633 43 16 92

35,9% 46,7% 17,4% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+

++

+++

GRAVEDAD

Total

GENEROHombre

Mujer

+ ++ +++EVOLUCIO

Total

Tabla de contingencia

5 14 13 3215,6% 43,8% 40,6% 100,0%

-2,2 -,6 3,03 11 3 17

17,6% 64,7% 17,6% 100,0%-1,2 1,6 -,6

16 14 3 3348,5% 42,4% 9,1% 100,0%

3,1 -,8 -2,524 39 19 82

29,3% 47,6% 23,2% 100,0%7 9 5 21

33,3% 42,9% 23,8% 100,0%-1,1 ,0 1,5

9 14 4 2733,3% 51,9% 14,8% 100,0%

-1,3 1,2 ,225 17 4 46

54,3% 37,0% 8,7% 100,0%2,1 -1,1 -1,441 40 13 94

43,6% 42,6% 13,8% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+

++

+++

GRAVEDAD

Total

INGRESOProgramado

Urgencias

+ ++ +++EVOLUCIO

Total

EJEMPLO ANÁLISIS DE DATOS - 22 -

Estos resultados parecen indicar ambos factores no influencian de manera significativa la relación entre la gravedad al ingreso y la evolución.

Finalmente, aunque no disponemos de muestra suficiente, podemos considerar todos los factores simultáneamente:

Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO * INGRESO

2 4 6 12 3 10 7 2016,7% 33,3% 50,0% 100,0% 15,0% 50,0% 35,0% 100,0%

-1,6 -,8 2,8 -1,4 -,1 1,61 3 2 6 2 8 1 11

16,7% 50,0% 33,3% 100,0% 18,2% 72,7% 9,1% 100,0%-1,0 ,4 ,7 -,6 1,6 -1,3

9 8 0 17 7 6 3 1652,9% 47,1% ,0% 100,0% 43,8% 37,5% 18,8% 100,0%

2,3 ,5 -3,1 2,1 -1,3 -,512 15 8 35 12 24 11 47

34,3% 42,9% 22,9% 100,0% 25,5% 51,1% 23,4% 100,0%4 5 2 11 3 4 3 10

36,4% 45,5% 18,2% 100,0% 30,0% 40,0% 30,0% 100,0%-,3 ,2 ,2 -1,2 -,2 2,2

3 4 4 11 6 10 0 1627,3% 36,4% 36,4% 100,0% 37,5% 62,5% ,0% 100,0%

-1,0 -,5 2,0 -,9 2,0 -1,813 12 2 27 12 5 2 19

48,1% 44,4% 7,4% 100,0% 63,2% 26,3% 10,5% 100,0%1,2 ,2 -1,9 1,9 -1,8 -,120 21 8 49 21 19 5 45

40,8% 42,9% 16,3% 100,0% 46,7% 42,2% 11,1% 100,0%

Recuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDADResiduos corregidosRecuento% de GRAVEDAD

+

++

+++

GRAVEDAD

Total

+

++

+++

GRAVEDAD

Total

INGRESOProgramado

Urgencias

+ ++ +++EVOLUCIO

Total + ++ +++EVOLUCIO

Total

Hombre MujerGENERO

EJEMPLO ANÁLISIS DE DATOS - 23 -

Pruebas de chi-cuadrado

11,792a 4 ,01914,805 4 ,005

9,501 1 ,002

357,033b 4 ,1346,935 4 ,139

3,670 1 ,055

475,089c 4 ,2784,774 4 ,311

1,509 1 ,219

499,694d 4 ,046

10,415 4 ,034

3,683 1 ,055

45

Chi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidosChi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidos

GENEROHombre

Mujer

Hombre

Mujer

INGRESOProgramado

Urgencias

Valor glSig. asintótica

(bilateral)

6 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,37.

a.

5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 2,57.

b.

7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,80.

c.

5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mínimaesperada es 1,11.

d.

Podemos observar que en algunos casos, la relación deja de ser significativa. Parte de este cambio es debido a la falta de casos, sin descartar totalmente la posibilidad de interacciones significativas que determinen una evolución distinta en cada tipo de paciente. Por lo tanto, seria conveniente diseñar un estudio más completo y utilizar técnicas estadísticas más potentes (multivariantes) para explorar el problema.

2.4 Comparar las concentraciones de los metabolitos entre hombres y mujeres.

La comparación descriptiva de las concentraciones entre hombres y mujeres puede hacerse mediante diagramas de cajas. Por ejemplo, para conc2 tenemos:

9284N =

GENERO

MujerHombre

CO

NC

2

130

120

110

100

90

80

3775

EJEMPLO ANÁLISIS DE DATOS - 24 -

Podemos ver que existen diferencias apreciables. Podemos completar esta descripción mediante el cálculo de índices muestrales:

Informe

CONC2

104,4 6,1 ,7 90,6 118,2 8493,9 6,3 ,7 83,5 110,6 9298,9 8,1 ,6 83,5 118,2 176

GENEROHombreMujerTotal

Media Desv. típ.Error típ. de

la media Mínimo Máximo N

Finalmente, podemos comparar ambos grupos y estimar la diferencia de muestras. Para ello utilizaremos la opción:

Analizar>Comparar Medias>Prueba T para dos muestras independientes

Debemos definir los códigos de la variable género para definir los grupos que queremos comparar:

El resultado es:

Prueba de muestras independientes

,032 ,858 11,208 174 ,000 10,439 ,9314 8,6004 12,2770

11,225 173,434 ,000 10,439 ,9299 8,6033 12,2742

Se han asumidovarianzas igualesNo se han asumidovarianzas iguales

CONC2F Sig.

Prueba de Levenepara la igualdad de

varianzas

t gl Sig. (bilateral)Diferenciade medias

Error típ. dela diferencia Inferior Superior

95% Intervalo deconfianza para la

diferencia

Prueba T para la igualdad de medias

En este punto, debemos recordar que la prueba de Levene para la igualdad de varianzas permite evaluar si las muestras son compatibles con la hipótesis de que las varianzas poblacionales son iguales. En este caso, p=0.858, lo que indica que podemos asumir que las varianzas son iguales.

EJEMPLO ANÁLISIS DE DATOS - 25 -

La prueba de T evalúa si las muestras son compatibles con la hipótesis de igualdad de medias poblacionales. En este caso, siguiendo la primera fila puesto que asumimos igualdad de varianzas, p=0.000, lo que indica que las muestras no son compatibles con la hipótesis. La estimación de la diferencia de medias es entre 8.6 y 12,3, indicando que la concentración media en los hombres (grupo 1) es superior a la de las mujeres.

Ejercicio: Evaluar la igualdad de medias poblacionales en el resto de variables en función del sexo

2.5 Estudiar la relación entre los niveles de los metabolitos y la evolución

La descriptiva de respecto a la evolución de los pacientes proporciona el siguiente resultado:

327965N =

EVOLUCIO

++++++

CO

NC

2

130

120

110

100

90

80

15

Indicando que puede existir una relación significativa entre el nivel de conc2 y la evolución, sin que ello implique necesariamente una relación causa-efecto. Podemos estimar el valor medio de conc2 para cada nivel de evolución. Para ello utilizaremos: Gráficos>Barras de error>Simple:

EJEMPLO ANÁLISIS DE DATOS - 26 -

327965N =

EVOLUCIO

++++++

95%

IC C

ON

C2

120

110

100

90

Puede observarse que el valor medio se incrementa en cada grupo de evolución. A partir de estos resultados, podemos aventurar al interpretación de que las diferencias son significativas, dado que los intervalos no se solapan. Sin embargo, esta interpretación es provisional y deberíamos emplear un procedimiento estadístico que permitiera evaluar esta hipótesis. El procedimiento adecuado en este caso sería el análisis de la varianza (ANOVA).

Podemos evaluar el posible efecto de otras variables. Así, por ejemplo, si seleccionamos Graficos>Barras de error>Agrupados:

EJEMPLO ANÁLISIS DE DATOS - 27 -

Obtenemos:

164333 163632N =

EVOLUCIO

++++++

95%

IC C

ON

C2

120

110

100

90

80

GENERO

Hombre

Mujer

En esta gráfica, podemos observar que la concentración media es superior en hombres a cualquier nivel de evolución y que las diferencias son constantes. Por otra parte, la relación entre la concentración media y la evolución es similar en hombre y mujeres. Por lo tanto, podríamos concluir que la relación entre evolución y concentración es independiente del género. Como en el caso anterior, deberíamos utilizar un procedimiento de ANOVA para verificar esta interpretación. Ejercicio: Determina si la gravedad al ingreso es un factor que modifique la relación entre conc2 y la evolución.