Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

52
ILl INTRODUCCION 11.4 REGRESION LOGISTICA 11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 11.5 RESUMEN 1l.3 PROCEDIMIENTOS PARA SELECCIONAR V ARlABLES 11.1 INTRODUCCION Los conceptos basicos y la metodologia del analisis de regresi6n se cubrieron en los capitulos 9 y 10. En el capitulo 9 se estudia la situaci6n donde el objetivo es obtener una ecuaci6n que pueda emplearse para hacer predicciones y estimaciones respecto a alguna variable dependiente a partir del conocimiento de alguna otra variable individual identificada como variable independiente, predictiva 0 explicativa. En el capitulo 10 las ideas se ampliaron y las tecnicas descritas en el capitulo 9 para cubrir la situaci6n en que se considera que incluir informaci6n sobre dos 0 mas variables independientes producen una mejor ecuaci6n para hacer predicciones y estimaciones. EI analisis de regresi6n es una herramienta complicada y poderosa ampliamente utilizada en la investigaci6n de ciencias de la salud. Para hacer justicia al tema de estudio se necesita mas espacio que el disponible en un libro de texto de introducci6n a la estadistica. Sin embargo, para beneficio de aquellos lectores que pretendan profundizar en el estudio del analisis de regresi6n, en este capitulo se presentan temas adicionales que son utiles para estudiantes y profesionales de la estadistica.

Transcript of Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

Page 1: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

ILl INTRODUCCION 114 REGRESION LOGISTICA

112 VARIABLES CUALITATIVAS INDEPENDIENTES

115 RESUMEN

1l3 PROCEDIMIENTOS PARA SELECCIONAR V ARlABLES

111 INTRODUCCION

Los conceptos basicos y la metodologia del analisis de regresi6n se cubrieron en los capitulos 9 y 10 En el capitulo 9 se estudia la situaci6n donde el objetivo es obtener una ecuaci6n que pueda emplearse para hacer predicciones y estimaciones respecto a alguna variable dependiente a partir del conocimiento de alguna otra variable individual identificada como variable independiente predictiva 0 explicativa En el capitulo 10 las ideas se ampliaron y las tecnicas descritas en el capitulo 9 para cubrir la situaci6n en que se considera que incluir informaci6n sobre dos 0 mas variables independientes producen una mejor ecuaci6n para hacer predicciones y estimaciones EI analisis de regresi6n es una herramienta complicada y poderosa ampliamente utilizada en la investigaci6n de ciencias de la salud Para hacer justicia al tema de estudio se necesita mas espacio que el disponible en un libro de texto de introducci6n a la estadistica Sin embargo para beneficio de aquellos lectores que pretendan profundizar en el estudio del analisis de regresi6n en este capitulo se presentan temas adicionales que son utiles para estudiantes y profesionales de la estadistica

520 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

112 VARIABLES CUALlTA11VAS INDEPENDIENfES

Todas las variables independientes que se estudian en el capitulo anterior son de tipo cuantitativo es dedr propordonan valores numericos de conteo 0 medidon en el sentido habitual de la palabra Por ejemplo algunas de las variables independienshytes utilizadas en los ejemplos y ejercicios fueron edad nivel de cotinina urinaria numero de dgarros fumados por dia consumo de oxigeno por minuto calificacioshynes de examenes de aptitud y el numero de problemas habituales en medidna Sin embargo con frecuencia es recomendable utilizar una 0 mas variables cualitativas como variables independientes dentro del modelo de regresion Las variables cuashylitativas como se menciona en el capitulo 1 son variables cuyo valor son categoshyrias y transmiten el concepto de atributo mas que de cantidad 0 de numero La variable de estado civil por ejemplo es una variable cualitativa cuyas categorias son soltero casado viudo y divorciado Otros ejemplos de variables cualitashytivas son sexo (masculino 0 femenino) diagnostico grupo radal ocupacion y estashydo inmunologico ante alguna enfermedad En algunas situ adones el investigador puede sospechar que la inclusion de una 0 mas variables como estas en la ecuacion de regresion habran de contribuir en forma importante a reducir la suma de cuashydrados del error y por 10 tanto a proporcionar estimadones mas precisas de los parametros de interes

Suponga por ejemplo que se estudia la reladon entre la presion sanguine a sistolica (variable dependiente) y el peso y la edad (variables independientes) Tamshybien se desea incluir la variable cualitativa sexo entre las variables independientes o bien suponga que se quiere profundizar el conodmiento respecto a la naturaleza de la relacion entre la capacidad pulmonar y otras variables relevantes Las variables cuantitativas que pueden incluirse en el modelo son la estatura peso y edad asi como las variables cualitativas sexo zona de residencia (urbana suburbana rural) y grado de tabaquismo (fumador cotidiano ex fumador 0 nunca ha fumado)

Variables imagillarias Para incorporar una variable cualitativa indepenshydiente en el modele de regresion multiple esta debe ser cuantificada de alguna forma Esto puede lograrse mediante el uso de las llamadas variables imaginarias 0

jicticias

Una variable imaginaria es una variable que s610 wma un numero finiw de valores (como 0 y 1) para identifuar las diforentes categorias de una variable cualitativa

El termino se utiliza para indicar el hecho de que los valores numericos (como oy 1) asumidos por la variable no tienen significado cuantitativo sino que solo se utilizan para identificar las diferentes categorias de la variable cualitativa bajo conshysideracion A las variables cualitativas algunas veces se les llama variables indicativas y cuando solo hay dos categorfas se les llama variables dicot6micas

521 112 VARIABLES CUALITATIVAS INDEPENDIENTES

A continuaci6n se presentan ejemplos de variables cualitativas y variables imashyginarias para cuantificarlas

Variable cualitativa Variable imaginaria

Sexo (masculino femenino) I para varones opara mujeres

I para urbanoLugar de residencia (urbano rural suburbano) o para rural y suburbano

I para rural o para urbano y suburbano

Condici6n de tabaquismo [fumador ex fumador x _ I para fumador (no ha fumado por 5 arios 0 menos) ex fumador

I - 0 para otro caso (no ha fumado por mas de 5 afios) nunca ha fumado] _I para ex fumador ( 5 afios)

-x2 opara otro caso

_I para ex fumador (gt 5 afios) X3 shy opara otro caso

Observe que en estos ejemplos cuando la variable cualitativa tiene k categoshyrfas es necesario definir k 1 variables imaginarias para codificar adecuadamente todas las categorlas Esta regIa es aplicable para toda regresi6n multiple que conshytenga una constante de intercepci6n La variable sexo con dos categorfas puede cuantificarse mediante el uso de una sola variable imaginaria mientras que se neshycesitan tres variables imaginarias para cuantificar la variable grado de tabaquismo que tiene cuatro categorfas

Los siguientes ejemplos ilustran algunos de los usos de las variables cualitatishyvas en la regresi6n multiple En el primer ejemplo se supone que no existe interacci6n entre las variables independientes Dado que la suposici6n de no interacci6n no corresponde a la realidad en muchos casos en el segundo ejemplo se ilustra el analisis adecuado para los casos en que existe interacci6n entre las variables

EJEMPLO 1121

En un estudio acerca de los facto res asociados con el peso de ninos recien nacidos se examin6 una muestra aleatoria simple de 32 registros de nacimientos La tabla 1121 muestra parte de los datos extrafdos de cada registro Se tienen dos variables independientes tiempo de gestaci6n en semanas que es una variable cuantitativa y el grado de tabaquismo de la madre que es una variable cualitativa

Solucion Para el analisis de los datos se cuantifica el grado de tabaquismo por medio de una variable imaginaria codificada con un 1 si la madre es fumadora y con un 0 si la madre no es fumadora Los datos de la tabla 1121 se presentan en el diagrama de dispersi6n de la figura 1121

522 CAPITULO II ANALISIS DE REGRESI6N TECNICAS ADICIONALES

TABlA 1121 Datos recolectados de una muestra aleatoria simple de 32 nacimientos ejemplo 1121

y Xl X2 Pesos al nacer Gestaci6n Estado de tabaquismo

Caso (gramos) (semanas) de lamadre

1 2940 38 Fuma (S) 2 3130 38 No fuma (N) 3 2420 36 S 4 2450 34 N 5 2760 39 S 6 2440 35 S 7 3226 40 N 8 3301 42 S 9 2729 37 N

10 3410 40 N 11 2715 36 S 12 3095 39 N 13 3130 39 S 14 3244 39 N 15 2520 35 N 16 2928 39 S 17 3523 41 N 18 3446 42 S 19 2920 38 N 20 2957 39 S 21 3530 42 N 22 2580 38 S 23 3040 37 N 24 3500 42 S 25 3200 41 S 26 3322 39 N 27 3459 40 N 28 3346 42 S 29 2619 35 N 30 3175 41 S 31 2740 38 S 32 2841 36 N

Este diagrama de dispersi6n sugiere que en general los periodos mas largos de gestaci6n estan asociados con mayores pesos al nacer

Para obtener mayor informaci6n acerca de la naturaleza de esos datos es necesario ingresarlos a una computadora y utilizar un prograshyrna conveniente para efectuar el amilisis Por ejemplo se registran las

523 112 VARIABLES CU4LITATIVAS INDEPENDIENTES

3600

3500 bull bull 3400 bull

3300 bull bullen

0 3200 bull E bull i 3100 bull-9 bull~ 3000 [l

bull c 2900 til bull0 2800ltJl

CL (J)

2700 bull 2600 bull 2500 bull

bull 2400

2300

2200

Yli4 i5 I I 36 37 38 39 40 41 42

Duraci6n de la gestaci6n (semanas)

HGUR41121 Pesos al nacer y duraci6n de gestaciones de 32 nacimientos (A) madres fumadoras y (e) no fumadoras

observacionesYI = 2940 xl 38 X21 = I para el primercasoY2 =3130 X l2 = 38 X 22 = 0 para el segundo casa y as sucesivamente La figura 1122 muestra la salida impresa obtenida mediante el uso del programa de regresion multiple de MINITAB

En la salida impresa es posible observar que la ecuaci6n de regresion es

J = bo + b1xjj + b2x2j (1121)1

)j = - 2390 + 143x1j - 245x2j

Para observar el efecto sobre esta ecuaci6n cuando se considera solo los hijos de madres fumadoras sea x2 = I Entonces la ecuacion se

bull 1conVlerte en

Yj -2390 + 143x1j - 245(1)

=-2635+ 143x1j (1122)

la cual tiene una intercepcion Y igual a -2635 y una pendiente de 143 Note que la intercepcionY para la nueva ecuacion es igual a (bo + b) = [-2390 + (-245)] -2635

Ahora considere solo a los hijos de madres no fumadoras Cuando x2 = 0 la ecuacion de regresion se reduce a

Yj=-2390+143xjj 245(0)

=-2390+143x1j (1123)

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 2: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

520 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

112 VARIABLES CUALlTA11VAS INDEPENDIENfES

Todas las variables independientes que se estudian en el capitulo anterior son de tipo cuantitativo es dedr propordonan valores numericos de conteo 0 medidon en el sentido habitual de la palabra Por ejemplo algunas de las variables independienshytes utilizadas en los ejemplos y ejercicios fueron edad nivel de cotinina urinaria numero de dgarros fumados por dia consumo de oxigeno por minuto calificacioshynes de examenes de aptitud y el numero de problemas habituales en medidna Sin embargo con frecuencia es recomendable utilizar una 0 mas variables cualitativas como variables independientes dentro del modelo de regresion Las variables cuashylitativas como se menciona en el capitulo 1 son variables cuyo valor son categoshyrias y transmiten el concepto de atributo mas que de cantidad 0 de numero La variable de estado civil por ejemplo es una variable cualitativa cuyas categorias son soltero casado viudo y divorciado Otros ejemplos de variables cualitashytivas son sexo (masculino 0 femenino) diagnostico grupo radal ocupacion y estashydo inmunologico ante alguna enfermedad En algunas situ adones el investigador puede sospechar que la inclusion de una 0 mas variables como estas en la ecuacion de regresion habran de contribuir en forma importante a reducir la suma de cuashydrados del error y por 10 tanto a proporcionar estimadones mas precisas de los parametros de interes

Suponga por ejemplo que se estudia la reladon entre la presion sanguine a sistolica (variable dependiente) y el peso y la edad (variables independientes) Tamshybien se desea incluir la variable cualitativa sexo entre las variables independientes o bien suponga que se quiere profundizar el conodmiento respecto a la naturaleza de la relacion entre la capacidad pulmonar y otras variables relevantes Las variables cuantitativas que pueden incluirse en el modelo son la estatura peso y edad asi como las variables cualitativas sexo zona de residencia (urbana suburbana rural) y grado de tabaquismo (fumador cotidiano ex fumador 0 nunca ha fumado)

Variables imagillarias Para incorporar una variable cualitativa indepenshydiente en el modele de regresion multiple esta debe ser cuantificada de alguna forma Esto puede lograrse mediante el uso de las llamadas variables imaginarias 0

jicticias

Una variable imaginaria es una variable que s610 wma un numero finiw de valores (como 0 y 1) para identifuar las diforentes categorias de una variable cualitativa

El termino se utiliza para indicar el hecho de que los valores numericos (como oy 1) asumidos por la variable no tienen significado cuantitativo sino que solo se utilizan para identificar las diferentes categorias de la variable cualitativa bajo conshysideracion A las variables cualitativas algunas veces se les llama variables indicativas y cuando solo hay dos categorfas se les llama variables dicot6micas

521 112 VARIABLES CUALITATIVAS INDEPENDIENTES

A continuaci6n se presentan ejemplos de variables cualitativas y variables imashyginarias para cuantificarlas

Variable cualitativa Variable imaginaria

Sexo (masculino femenino) I para varones opara mujeres

I para urbanoLugar de residencia (urbano rural suburbano) o para rural y suburbano

I para rural o para urbano y suburbano

Condici6n de tabaquismo [fumador ex fumador x _ I para fumador (no ha fumado por 5 arios 0 menos) ex fumador

I - 0 para otro caso (no ha fumado por mas de 5 afios) nunca ha fumado] _I para ex fumador ( 5 afios)

-x2 opara otro caso

_I para ex fumador (gt 5 afios) X3 shy opara otro caso

Observe que en estos ejemplos cuando la variable cualitativa tiene k categoshyrfas es necesario definir k 1 variables imaginarias para codificar adecuadamente todas las categorlas Esta regIa es aplicable para toda regresi6n multiple que conshytenga una constante de intercepci6n La variable sexo con dos categorfas puede cuantificarse mediante el uso de una sola variable imaginaria mientras que se neshycesitan tres variables imaginarias para cuantificar la variable grado de tabaquismo que tiene cuatro categorfas

Los siguientes ejemplos ilustran algunos de los usos de las variables cualitatishyvas en la regresi6n multiple En el primer ejemplo se supone que no existe interacci6n entre las variables independientes Dado que la suposici6n de no interacci6n no corresponde a la realidad en muchos casos en el segundo ejemplo se ilustra el analisis adecuado para los casos en que existe interacci6n entre las variables

EJEMPLO 1121

En un estudio acerca de los facto res asociados con el peso de ninos recien nacidos se examin6 una muestra aleatoria simple de 32 registros de nacimientos La tabla 1121 muestra parte de los datos extrafdos de cada registro Se tienen dos variables independientes tiempo de gestaci6n en semanas que es una variable cuantitativa y el grado de tabaquismo de la madre que es una variable cualitativa

Solucion Para el analisis de los datos se cuantifica el grado de tabaquismo por medio de una variable imaginaria codificada con un 1 si la madre es fumadora y con un 0 si la madre no es fumadora Los datos de la tabla 1121 se presentan en el diagrama de dispersi6n de la figura 1121

522 CAPITULO II ANALISIS DE REGRESI6N TECNICAS ADICIONALES

TABlA 1121 Datos recolectados de una muestra aleatoria simple de 32 nacimientos ejemplo 1121

y Xl X2 Pesos al nacer Gestaci6n Estado de tabaquismo

Caso (gramos) (semanas) de lamadre

1 2940 38 Fuma (S) 2 3130 38 No fuma (N) 3 2420 36 S 4 2450 34 N 5 2760 39 S 6 2440 35 S 7 3226 40 N 8 3301 42 S 9 2729 37 N

10 3410 40 N 11 2715 36 S 12 3095 39 N 13 3130 39 S 14 3244 39 N 15 2520 35 N 16 2928 39 S 17 3523 41 N 18 3446 42 S 19 2920 38 N 20 2957 39 S 21 3530 42 N 22 2580 38 S 23 3040 37 N 24 3500 42 S 25 3200 41 S 26 3322 39 N 27 3459 40 N 28 3346 42 S 29 2619 35 N 30 3175 41 S 31 2740 38 S 32 2841 36 N

Este diagrama de dispersi6n sugiere que en general los periodos mas largos de gestaci6n estan asociados con mayores pesos al nacer

Para obtener mayor informaci6n acerca de la naturaleza de esos datos es necesario ingresarlos a una computadora y utilizar un prograshyrna conveniente para efectuar el amilisis Por ejemplo se registran las

523 112 VARIABLES CU4LITATIVAS INDEPENDIENTES

3600

3500 bull bull 3400 bull

3300 bull bullen

0 3200 bull E bull i 3100 bull-9 bull~ 3000 [l

bull c 2900 til bull0 2800ltJl

CL (J)

2700 bull 2600 bull 2500 bull

bull 2400

2300

2200

Yli4 i5 I I 36 37 38 39 40 41 42

Duraci6n de la gestaci6n (semanas)

HGUR41121 Pesos al nacer y duraci6n de gestaciones de 32 nacimientos (A) madres fumadoras y (e) no fumadoras

observacionesYI = 2940 xl 38 X21 = I para el primercasoY2 =3130 X l2 = 38 X 22 = 0 para el segundo casa y as sucesivamente La figura 1122 muestra la salida impresa obtenida mediante el uso del programa de regresion multiple de MINITAB

En la salida impresa es posible observar que la ecuaci6n de regresion es

J = bo + b1xjj + b2x2j (1121)1

)j = - 2390 + 143x1j - 245x2j

Para observar el efecto sobre esta ecuaci6n cuando se considera solo los hijos de madres fumadoras sea x2 = I Entonces la ecuacion se

bull 1conVlerte en

Yj -2390 + 143x1j - 245(1)

=-2635+ 143x1j (1122)

la cual tiene una intercepcion Y igual a -2635 y una pendiente de 143 Note que la intercepcionY para la nueva ecuacion es igual a (bo + b) = [-2390 + (-245)] -2635

Ahora considere solo a los hijos de madres no fumadoras Cuando x2 = 0 la ecuacion de regresion se reduce a

Yj=-2390+143xjj 245(0)

=-2390+143x1j (1123)

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 3: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

521 112 VARIABLES CUALITATIVAS INDEPENDIENTES

A continuaci6n se presentan ejemplos de variables cualitativas y variables imashyginarias para cuantificarlas

Variable cualitativa Variable imaginaria

Sexo (masculino femenino) I para varones opara mujeres

I para urbanoLugar de residencia (urbano rural suburbano) o para rural y suburbano

I para rural o para urbano y suburbano

Condici6n de tabaquismo [fumador ex fumador x _ I para fumador (no ha fumado por 5 arios 0 menos) ex fumador

I - 0 para otro caso (no ha fumado por mas de 5 afios) nunca ha fumado] _I para ex fumador ( 5 afios)

-x2 opara otro caso

_I para ex fumador (gt 5 afios) X3 shy opara otro caso

Observe que en estos ejemplos cuando la variable cualitativa tiene k categoshyrfas es necesario definir k 1 variables imaginarias para codificar adecuadamente todas las categorlas Esta regIa es aplicable para toda regresi6n multiple que conshytenga una constante de intercepci6n La variable sexo con dos categorfas puede cuantificarse mediante el uso de una sola variable imaginaria mientras que se neshycesitan tres variables imaginarias para cuantificar la variable grado de tabaquismo que tiene cuatro categorfas

Los siguientes ejemplos ilustran algunos de los usos de las variables cualitatishyvas en la regresi6n multiple En el primer ejemplo se supone que no existe interacci6n entre las variables independientes Dado que la suposici6n de no interacci6n no corresponde a la realidad en muchos casos en el segundo ejemplo se ilustra el analisis adecuado para los casos en que existe interacci6n entre las variables

EJEMPLO 1121

En un estudio acerca de los facto res asociados con el peso de ninos recien nacidos se examin6 una muestra aleatoria simple de 32 registros de nacimientos La tabla 1121 muestra parte de los datos extrafdos de cada registro Se tienen dos variables independientes tiempo de gestaci6n en semanas que es una variable cuantitativa y el grado de tabaquismo de la madre que es una variable cualitativa

Solucion Para el analisis de los datos se cuantifica el grado de tabaquismo por medio de una variable imaginaria codificada con un 1 si la madre es fumadora y con un 0 si la madre no es fumadora Los datos de la tabla 1121 se presentan en el diagrama de dispersi6n de la figura 1121

522 CAPITULO II ANALISIS DE REGRESI6N TECNICAS ADICIONALES

TABlA 1121 Datos recolectados de una muestra aleatoria simple de 32 nacimientos ejemplo 1121

y Xl X2 Pesos al nacer Gestaci6n Estado de tabaquismo

Caso (gramos) (semanas) de lamadre

1 2940 38 Fuma (S) 2 3130 38 No fuma (N) 3 2420 36 S 4 2450 34 N 5 2760 39 S 6 2440 35 S 7 3226 40 N 8 3301 42 S 9 2729 37 N

10 3410 40 N 11 2715 36 S 12 3095 39 N 13 3130 39 S 14 3244 39 N 15 2520 35 N 16 2928 39 S 17 3523 41 N 18 3446 42 S 19 2920 38 N 20 2957 39 S 21 3530 42 N 22 2580 38 S 23 3040 37 N 24 3500 42 S 25 3200 41 S 26 3322 39 N 27 3459 40 N 28 3346 42 S 29 2619 35 N 30 3175 41 S 31 2740 38 S 32 2841 36 N

Este diagrama de dispersi6n sugiere que en general los periodos mas largos de gestaci6n estan asociados con mayores pesos al nacer

Para obtener mayor informaci6n acerca de la naturaleza de esos datos es necesario ingresarlos a una computadora y utilizar un prograshyrna conveniente para efectuar el amilisis Por ejemplo se registran las

523 112 VARIABLES CU4LITATIVAS INDEPENDIENTES

3600

3500 bull bull 3400 bull

3300 bull bullen

0 3200 bull E bull i 3100 bull-9 bull~ 3000 [l

bull c 2900 til bull0 2800ltJl

CL (J)

2700 bull 2600 bull 2500 bull

bull 2400

2300

2200

Yli4 i5 I I 36 37 38 39 40 41 42

Duraci6n de la gestaci6n (semanas)

HGUR41121 Pesos al nacer y duraci6n de gestaciones de 32 nacimientos (A) madres fumadoras y (e) no fumadoras

observacionesYI = 2940 xl 38 X21 = I para el primercasoY2 =3130 X l2 = 38 X 22 = 0 para el segundo casa y as sucesivamente La figura 1122 muestra la salida impresa obtenida mediante el uso del programa de regresion multiple de MINITAB

En la salida impresa es posible observar que la ecuaci6n de regresion es

J = bo + b1xjj + b2x2j (1121)1

)j = - 2390 + 143x1j - 245x2j

Para observar el efecto sobre esta ecuaci6n cuando se considera solo los hijos de madres fumadoras sea x2 = I Entonces la ecuacion se

bull 1conVlerte en

Yj -2390 + 143x1j - 245(1)

=-2635+ 143x1j (1122)

la cual tiene una intercepcion Y igual a -2635 y una pendiente de 143 Note que la intercepcionY para la nueva ecuacion es igual a (bo + b) = [-2390 + (-245)] -2635

Ahora considere solo a los hijos de madres no fumadoras Cuando x2 = 0 la ecuacion de regresion se reduce a

Yj=-2390+143xjj 245(0)

=-2390+143x1j (1123)

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 4: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

522 CAPITULO II ANALISIS DE REGRESI6N TECNICAS ADICIONALES

TABlA 1121 Datos recolectados de una muestra aleatoria simple de 32 nacimientos ejemplo 1121

y Xl X2 Pesos al nacer Gestaci6n Estado de tabaquismo

Caso (gramos) (semanas) de lamadre

1 2940 38 Fuma (S) 2 3130 38 No fuma (N) 3 2420 36 S 4 2450 34 N 5 2760 39 S 6 2440 35 S 7 3226 40 N 8 3301 42 S 9 2729 37 N

10 3410 40 N 11 2715 36 S 12 3095 39 N 13 3130 39 S 14 3244 39 N 15 2520 35 N 16 2928 39 S 17 3523 41 N 18 3446 42 S 19 2920 38 N 20 2957 39 S 21 3530 42 N 22 2580 38 S 23 3040 37 N 24 3500 42 S 25 3200 41 S 26 3322 39 N 27 3459 40 N 28 3346 42 S 29 2619 35 N 30 3175 41 S 31 2740 38 S 32 2841 36 N

Este diagrama de dispersi6n sugiere que en general los periodos mas largos de gestaci6n estan asociados con mayores pesos al nacer

Para obtener mayor informaci6n acerca de la naturaleza de esos datos es necesario ingresarlos a una computadora y utilizar un prograshyrna conveniente para efectuar el amilisis Por ejemplo se registran las

523 112 VARIABLES CU4LITATIVAS INDEPENDIENTES

3600

3500 bull bull 3400 bull

3300 bull bullen

0 3200 bull E bull i 3100 bull-9 bull~ 3000 [l

bull c 2900 til bull0 2800ltJl

CL (J)

2700 bull 2600 bull 2500 bull

bull 2400

2300

2200

Yli4 i5 I I 36 37 38 39 40 41 42

Duraci6n de la gestaci6n (semanas)

HGUR41121 Pesos al nacer y duraci6n de gestaciones de 32 nacimientos (A) madres fumadoras y (e) no fumadoras

observacionesYI = 2940 xl 38 X21 = I para el primercasoY2 =3130 X l2 = 38 X 22 = 0 para el segundo casa y as sucesivamente La figura 1122 muestra la salida impresa obtenida mediante el uso del programa de regresion multiple de MINITAB

En la salida impresa es posible observar que la ecuaci6n de regresion es

J = bo + b1xjj + b2x2j (1121)1

)j = - 2390 + 143x1j - 245x2j

Para observar el efecto sobre esta ecuaci6n cuando se considera solo los hijos de madres fumadoras sea x2 = I Entonces la ecuacion se

bull 1conVlerte en

Yj -2390 + 143x1j - 245(1)

=-2635+ 143x1j (1122)

la cual tiene una intercepcion Y igual a -2635 y una pendiente de 143 Note que la intercepcionY para la nueva ecuacion es igual a (bo + b) = [-2390 + (-245)] -2635

Ahora considere solo a los hijos de madres no fumadoras Cuando x2 = 0 la ecuacion de regresion se reduce a

Yj=-2390+143xjj 245(0)

=-2390+143x1j (1123)

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 5: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

523 112 VARIABLES CU4LITATIVAS INDEPENDIENTES

3600

3500 bull bull 3400 bull

3300 bull bullen

0 3200 bull E bull i 3100 bull-9 bull~ 3000 [l

bull c 2900 til bull0 2800ltJl

CL (J)

2700 bull 2600 bull 2500 bull

bull 2400

2300

2200

Yli4 i5 I I 36 37 38 39 40 41 42

Duraci6n de la gestaci6n (semanas)

HGUR41121 Pesos al nacer y duraci6n de gestaciones de 32 nacimientos (A) madres fumadoras y (e) no fumadoras

observacionesYI = 2940 xl 38 X21 = I para el primercasoY2 =3130 X l2 = 38 X 22 = 0 para el segundo casa y as sucesivamente La figura 1122 muestra la salida impresa obtenida mediante el uso del programa de regresion multiple de MINITAB

En la salida impresa es posible observar que la ecuaci6n de regresion es

J = bo + b1xjj + b2x2j (1121)1

)j = - 2390 + 143x1j - 245x2j

Para observar el efecto sobre esta ecuaci6n cuando se considera solo los hijos de madres fumadoras sea x2 = I Entonces la ecuacion se

bull 1conVlerte en

Yj -2390 + 143x1j - 245(1)

=-2635+ 143x1j (1122)

la cual tiene una intercepcion Y igual a -2635 y una pendiente de 143 Note que la intercepcionY para la nueva ecuacion es igual a (bo + b) = [-2390 + (-245)] -2635

Ahora considere solo a los hijos de madres no fumadoras Cuando x2 = 0 la ecuacion de regresion se reduce a

Yj=-2390+143xjj 245(0)

=-2390+143x1j (1123)

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 6: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

524 CAPiTULO 11 ANillsIS DE REGRESION TECNICAS ADICIONALES

The regression equation is y = -2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p Constant -23896 3492 -684 0000 xl 143100 9128 1568 0000 x2 -24454 4198 -583 0000

s = 1155 R-sq 896 R-sq(adj) 889

Analysis of Variance

SOURCE DF SS MS F P Regression 2 3348720 1674360 12545 0000 Error 29 387070 13347 Total 31 3735789

SOURCE DF SEQ SS xl 1 2895839 x2 1 452881

FIGURA t 122 Resultados impresos parciales del paquete MINITAB para el analisis de regresi6n multiple ejemplo 1121

3600

3500 bull3400

3300 bull ~ 3200 E 3100~ 9 bullQ 3000 1i 2900

Madres no fumadoras c iii 0 2800(J)

D 2700

2600 2500

2400

2300

35 36 ----I--_L______I_--~______________I-shy

37 38 39 40 41 42 Duraci6n de la gestaci6n (semanas)

FIGURA 1123 Pasos al nacer y duraci6n de la gestaci6n para 32 nacimientos y rectas de regresi6n ajustada (amp) madres fumadoras y (e) no fumadoras

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 7: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

112 VARIABLES CUAUTATIV AS INDEPENDIENTES 525

La pendiente de esta ecuacion es la misma que la pendiente de la ecuacion de las madres fumadoras pero las intercepciones y son difeshyrentes La intercepcion para la ecuacion de madres que no fuman es mayor que la intercepcion y correspondiente a las madres que sf fuman Los resultados muestran que para la muestra los bebes de madres que no fuman pes an en promedio mas que los bebes nacidos de madres que fuman cuando se toma en cuenta el tiempo de gestacion La difeshyrencia total en promedio es de 245 gramos Dicho de otra forma se puede afirmar que para esta muestra los bebes nacidos de madres que sf fuman pesan en promedio 245 gramos menos que los bebes nacidos de madres que no fuman cuando el tiempo de gestacion es tomado en cuenta La figura 1123 muestra el diagrama de dispersion de los datos originales junto con la grafica de las dos rectas de regresion (ecuaciones 1122 y 1123) bull

FJEMPLO 1122

En este punto surge una pregunta respecto a las inferencias que pueden hacerse respecto ala poblacion muestreada con base en los resultados obtenidos en el ejemshyplo 1121 Antes que nada se desea saber si la diferencia muestral de 245 gramos es significativa En otras palabras ~fumar tiene efectos sobre el peso al nacer Es posible contestar esta pregunta mediante el siguiente procedimiento de prueba de hipotesis

Soludon 1 Datos Los datos son los mismos que en el ejemplo 1121 2 Supuestos Se considera que las suposiciones que fundamentan el

anaIisis de regresion multiple se cumplen

3 Hipotesis Ho ~2 0 HA ~2 =t O Suponga que a = 05 4 Estadistica de prueba La estadfstica de prueba es t = (b

2 0)s bull

2 5 Distribucion de la estadistica de prueba Cuando las suposicioshy

nes se cumplen y Ho es verdadera la estadfstica de prueba sigue una distribucion t de Student con 29 grados de libertad

6 RegIa de decision Se rechaza Ho si la t calculada es mayor 0 igual que 204520 es menor 0 igual que -20452

7 Calculo de Ia estadistica de prueba EI valor calculado de la estashydfstica de prueba aparece en Ia figura 1122 como el porcentaje de t para el coeficiente asociado con la variable que aparece en la coshylumna 3 de la tabla 1121 Este coeficiente por supuesto es b

2bull Se

aprecia que la t calculada es -583 8 Decision estadistica Puesto que -583 lt -20452 se rechazaH o 9 Conclusion Se concluye que en la poblacion muestreada el heshy

cho de que las madres fumen 0 no fumen influye sobre el peso al nacer de sus bebes

10 Valor de p Para esta prueba p lt 2(005) puesto que -583 es meshy nor que -27564 bull

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 8: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

526 CAPITULO 11 ANALISIS DE REGRESION TECNlCASADICIONALES

lnlervalo de conJianza para 32

Dado que se puede concluir que en la poshyblacion muestreada el grado de tabaquismo de las madres sf tiene efectos sobre el peso de los recien nacidos uno se puede preguntar ahora de que magnitud son estos efectos La mejor estimacion puntual de la diferencia en promedio del peso al nacer cuando la duracion de la gestacion es tomada en cuenta es de 245 gramos a favor de los bebes de madres que no fuman Es posible obtener una estimacion del intervalo para el valor medio de la diferencia utilizando la informacion de la salida impresa por medio de la siguiente expresion

Para un intervalo de confianza de 95 por ciento se tiene

-24454 plusmn 20452 (4198) -3303975 -1586825

Asi se tiene 95 por ciento de confianza de que la diferencia se encuentra entre 159 y 331 gramos

Ventajas de las variables imaginarias Ellector puede haber supuesto coshyrrectamente que un analisis alternativo de los datos del ejemplo 1121 consistiria en el ajuste de dos ecuaciones de regresion una para la submuestra de madres que sf fuman y otra para la de madres que no fuman Sin embargo este metodo carece de algunas ventajas de la tecnica de variable imaginaria yes menos recomendable cuanshydo el segundo procedimiento es valido Si se logra justificar la suposicion de que las dos rectas de regresion tienen la misma pendiente es posible obtener una mejor estimacion de tal pendiente comun mediante el uso de variables imaginarias 10 cual implica combinar los datos de las dos submuestras En el ejemplo 1121 la estimashycion que utiliza una variable imaginaria se basa en un tamano total de la muestra de 32 observaciones mientras que las estimaciones por separado se apoyarian en una muestra de tan s610 16 observaciones El metodo de la variable imaginaria tambien proporciona inferencias mas precisas respecto a otros parametros dado que se disposhyne de mas grados de libertad para calcular el cuadrado medio del error

ulO de variables imaginarias con interacci6n presente Ahora consishyderese la situaci6n en la que se supone que existe interaccion entre las variables Por ejemplo suponga que hay dos variables independientes una de ellas es cuantishytativa Xl y la otra es de tipo cualitativo con tres niveles de respuesta que proporcioshynan dos variables imaginarias X

2 y Xgbull Por 10 tanto el modelo es

(1124)

donde ~4XI X2 Y ~5Xl Xg son los terminos de interacci6n y representan la interaccion entre las vJiables independientes cuantitativas y cualitativas Es importante obsershyvar que no es necesario incluir terminos que contenganX2Xg en el modelo porque siempre seran igual acero debido a que cuando X2 = 1 X~ 0 y ruanda X3 1 X

2 = O EI modelo de la ecuaci6n 1124 abre la posibilidad de una pendiente y una intercepci6n y diferentes para cada nivel de la variable cualitativa

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 9: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

527 112 VARIABLES CUALITATIVAS INDEPENDIENTES

Suponga que se utiliza la codificaci6n de la variable imaginaria para cuantifishycar como sigue

x - I para nivel 1 3 - 0 para otro caso

X = I para nivel 2 2 opara otro caso

Por 10 tanto las tres ecuaciones de regresi6n simple para los tres niveles de la variable cualitativa son

Nivell (X2 = 1 X3 =0)

Yj = bo+ b1x jj + b2(1) + b3(O) + b4xlP) + bOxjO) = bo + bjx + b + b4x1j 2 1j

(bo+ b2) + (b j + b4)x jj (1125)

Nivel2 (X2 =0 X3 =1)

Yj bo + bjx1j + b2(O) + b3(1) + b4x jj(O) + bOx l) = bo + bjx lj + b3 + b5xlj

= (bo+ bg) + (b l + bS)xjj (1126)

Nive13 (X2 = 0 X3 =0)

Y = bo + bjx lj + b2(O) + b3(O) + b4xIO) + b5x lO)

Yj bo + bjx jj (1127)

Estos resultados se ilustran con el siguiente ejemplo

EJEMPLO 1123

Un grupo de investigadores en salud mental desea comparar tres metodos (A By C) para el tratamiento de la depresi6n grave Tambien desean estudiar la relaci6n entre la edad y la eficacia del tratamiento as como la interacci6n (si existe) entre edad y tratamiento Cada individuo de una muestra aleatoria simple de 36 pacientes todos los cuales presentaban un diagn6stico y grado de depresi6n semejantes recibi6 uno de los tres tratamientos Los resultados se muestran en la tabla 1122 La variashyble dependiente representa la eficacia del tratamiento la variable cuantitativa indeshypendiente XI representa la edad del paciente y la variable independiente que se refiere al tipo de tratamiento es una variable cualitativa que ocurre en tres niveles Se utiliza el siguiente c6digo de variables imaginarias para cuantificar la variable cualitativa

X = I si el tratamiento es A 2 ootro caso

X3 = I si el tratamiento es B ootro caso

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 10: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

528 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1122 Datos para el ejemplo 1123

Medidade Metodode eficacia Edad tratamiento

56 21 A 41 23 B 40 30 B 28 19 C 55 28 A 25 23 C 46 33 B 71 67 C 48 42 B 63 33 A 52 33 A 62 56 C 50 45 C 45 43 B 58 38 A 46 37 C 58 43 B 34 27 C 65 43 A 55 45 B 57 48 B 59 47 C 64 48 A 61 53 A 62 58 B 36 29 C 69 53 A 47 29 B 73 58 A 64 66 B 60 67 B 62 63 A 71 59 C 62 51 C 70 67 A 71 63 C

El diagrama de dispersi6n para estos datos se muestra en la figura 1124 La tabla 1123 muestra los datos como fueron alimentados a la computadora para su amilisis y la figura 1125 contiene la salida impresa de los resultados del analisis al utilizar el programa de regresi6n mUltiple de MINITAB

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 11: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

529 112 VARIABLES CUALITATIVAS INDEPENDIENTES

~(~~~~I~~~~~~15 20 25 30 35 40 45 50 55 60 65 70 75 80

Edad

FIGURA 1124 Diagrama de dispersi6n de los datos del ejemplo 1123 (e) tratamiento A (amp)Tratamiento B ()Tratamiento C

Solucion AI examinar la salida impresa de los resultados se obtiene mayor inforshymacion acerca de la naturaleza de las relaciones entre las variables La ecuacion por mfnimos cuadrados es

Las tres ecuaciones de regresion para los tres tratamientos son las sishyguientes

Tratamiento A (ecuacion 1125)

Yj

= (621 + 413) + (l03 - 703)x1j

= 4751 + 327x1j

Tratamiento B (ecuacion 1126)

Yj (621 + 227) + (103 - 51O)x1j

= 2891 + 520x1j

Tratamiento C (ecuacion 1127)

Yj = 621 + L03x1j

La figura 1126 muestra el diagrama de dispersion de los datos originales junto con las ecuaciones de regresion para los tres tratamienshy

80

75

70

65

9 60 c

1 55E

~ 50gt

Qi11 45 ~

40g UJ 35

30

25

Tratamiento C

- Tratamiento A

Tratamiento B

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 12: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

530 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1123 Datos para el ejemplo 1123 codificados para el amilisis por computadora

y Xl X2 Xa X1X2 middot XIX3

56 21 1 0 21 0 55 28 1 0 28 0 63 33 f 0 33 0 52 33 0 33 0 58 38 1 0 38 0 65 43 1 0 43 0 64 48 1 0 48 0 61 53 1 0 53 0 69 53 1 0 53 0 73 58 1 0 58 0 62 63 1 0 63 0 70 67 1 0 67 0 41 23 0 1 0 23 40 30 0 1 0 30 46 33 0 1 0 33 48 42 0 1 0 42 45 43 0 1 0 43 58 43 0 1 0 43 55 45 0 1 0 45 57 48 0 1 0 48 62 58 0 1 0 58 47 29 0 1 0 29 64 66 0 1 0 66 60 67 0 1 0 67 28 19 0 0 0 0 25 23 0 0 0 0 71 67 0 0 0 0 62 56 omiddot 0 0 0 50 45 0 0 0 0 46 37 0 0 0 0 34 27 0 0 0 0 59 47 0 0 0 0 36 29 0 0 0 0 71 59 0 0 0 0 62 51 0 0 0 0 71 63 0 0 0 0

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 13: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

531 112 VARIABLES CUALITATIVAS INDEPENDIENTES

The regression equation is y == 621 + 103 xl + 413 x2 + 227 x3 - 0703 x4 - 0510 x5

Predictor Coef Stdev t-middotratio p Constant 6211 3350 185 0074 xl 103339 007233 1429 0000 x2 41304 5085 812 0000 x3 22707 5091 446 0000 x4 -07029 01090 -645 0000 x5 -05097 01104 --462 0000

s == 3925 R-sq == 914 R-sq(adj) 900

Analysis ofVariance

SOURCE DF SS MS F P Regression 5 493285 98657 6404 0000 Error 30 46215 1540 Total 35 539500

SOURCE DF SEQ SS xl 1 342443 x2 1 80380 x3 1 119 x4 1 37500 x5 1 32842

FIGURA 1125 Salida impresa por computadora para el amilisis de regresi6n mUltishyple de MINITAB ejemplo 1123

tos La inspecci6n visual de la figura 1126 sugiere que los tratamientos A y B no difieren mucho can respecto a sus pendientes aunque sus inshytercepciones y difieren de manera considerable La grafica sugiere que el tratamiento A esmejorque el tratamiento B para pacientesj6venes aun cuando la diferencia es menas evidenteen pacientes can mayor edad E1 tratamiento C es claramente menos aconsejable que los tratamientos A y B-para pacientesj6venesaun cuando es casi tan efectivo ~omo el tratashy

miento B en pacientes can mayor edad Estas impresionessubjetivas son compatiblescon la observaci6n de que existe interacci6n entre edad y tratamiento

frocedimientosde inferencia Sin embargo 10 que se aprecia en la figura 1126 son los resultados de la muestra ~Que se pu~de ltoncluir acerca de la poblaci6n a partir de la cul1 fueron extrafdas las muestras

Para ofrecer una respuesta es necesario observar los valores de ten la salida impresa por cegtmputadora de la figura 1125Cada una de ellas es i~ estadfstica de prueba

b -0 t=--shy

Sb

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 14: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

532 CAPITULO 11middot ANALISIS DE REGRESION TECNICAS ADICIONALES

80 Tratamiento C

75

70 Tralamienlo A shy

65 g c 60

91 E 55 ~ 50Cii u ltU 45 middot0 u ltU 40 ru

35

30

25

-

Edad

FIGURA 1126 Diagrama de dispersi6n de los datos para el ejemplo 1123 con rectas de regresi6n ajustadas (e) tratamiento A (6) tratamiento B y (_) tratamierito C

para probar Ho ~i = O En la ecuacion 1125 se aprecia que la intercepshycion y de la recta de regresion para el tratamiento A es igual abo + b

2bull

Debido a que el valor de t es de 812 para Ho ~2 = 0 es mayor que el valor critico t de 20423 (con a = 05) es posible rechazar Ho ~2 = 0 y conduir que la intercepcion y de la recta de regresion de la poblacion para el tratamiento A es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C el cual tiene una intershycepcion y de ~o De forma similar puesto que la razon t de 446 para probaI Ho ~3 = 0 tambien es mayor que el valor crftico t de 20423 se puede conduir (en un nivel de significacion de 05) que la intercepcion y de la recta de regresionde la poblacionpara el tratamienw B tambien es diferente de la intercepcion y de la recta de regresion de la poblacion para el tratamiento C (vease laintercepci6n y de la ecuaci6n 1126)

A continuacion se consideran las pendientes En la ecuacion 1125 se aprecia que la pendiente de la recta de regresion para el tratamiento A es igual a b

l (la pendiente de la recta para el tratamiento C) + b

4 bull

Puesto que la razon de t es de -645 para probar Ho ~4 0 es menor que el valor critico de t de -20423 se puede conduir (para a = 05) que las pendientes de las rectas de regresion de la poblacion para los tratamienshytos Aye son diferentes De forma similar dado que la razon de t calcushylada para probar Ho ~5 = 0 tambien es menor que -20423 se concluye (para a = 05) que las rectasde regresion de la poblacion para los tratashymientos Bye tienen pendientes difetentes (vease la pendiente de la ecuaci6n 1126) De esta forma se concluye que existe interaccion entre la edad y el tipo de tratamiento Esto se refleja por la ausencia de parashylelismo entre las rectas de regresion en la figura 1126 bull

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 15: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS

EJERCICIOS 533

Otra pregunta de interes es la siguiente (son diferentes las pendientes de las rectas de regresion de la poblacion para los ttatamientos A y B Para responder a esta pregunta es necesario hacer uso de tecnicas de cHculo que se encuentran fuera del area de estudio de este libro Ellector interesado puede consultar los libros que tratan espedficamente sobre el amilisis de regresion

En la seccion IDA se hizo mencion sobre los problemas que existen cuando se hacen inferencias multiples con los mismos datos de la muestra Como ya se indico se pueden consultar las obras que tratan sobre el analisis de regresion para conocer los procedimientos a seguir cuando se desean inferencias multiples como las que se presentaron en esta seccion

Haga 10 siguiente para cada uno de los ejercicios

a) Dibuje un diagrama de dispersion con los datos que inc1uya diferentes sfmbolos para las variables con diferentes categorfas

b) Utilice codigo para las variables imaginarias y efectile las regresiones lineales para analishyzar los datos

c) Proponga las pruebas de hipotesis adecuadas y elabore los intervalos de confianza de acuerdo con un nivel de significacion y confianza adecuados

d) Calcule el valor p para cada prueba

1121 Woo et al (A-I) aseguran que los metodos actuales para medir el gasto cardiaco necesitan la inserdon de un cateter de termodilucion que es un procedimiento invasivo asociado con riesgos y complicaciones Los investigadores examinaron el metodo no invasivo de bioimpedancia electrica transtonkica (BET) en comparadon con el procedimiento de inshysercion del cateter (Td) Los individuos estudiados eran pacientes con enfermedad crltica y fundon ventricular izquierda defidente y cardiomiopatfa dilatada isquemica 0 idiopltitishyca Los resultados por pares de las mediciones cardiacas mediante los dos metodos se dividieron en dos categorias aquellos cuya diferencia entre el gasto cardiaco por los dos metodos fue menor a 5 lmin y aquellos en los que la diferencia fue mayor que 5 Imin Los resultados son los siguientes

Dpound I1 erenClaS menores Diferencias mayores que5 Vmin que5 Vmin

Td BET Td BET Td BET

488 503 364 28 397 29 28 323 7041 81 364 418 482 437 398 257 548 408 57 56 857 55 773 357

(Continua)

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 16: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

534 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

Diferencias menores Diferencias mayores que5 Imin que5 Imin

Td BET Td BET Td BET

37 34 218 33 474 53 286 313 338 273 464 29 236 283 249 58 349 423 404 403 31 7 257 347 433 44 269 59 43 633 451 48 264 34 31 41 736 72 416 56 582 69 238 237 19 373 328 533 329 313 34 43 658 793 52 q35 75 66 479 34 349 313 441 325 805 57 408 45 506 313 292 513 389 34 65 1003 341 39 559 303 438 4 448 217 28 273 263 57 35 315 603 7 345 347 292 42 417 41 575 453 249 277 489 463

343 617 436 617 218 303 495 29 391 458 623 363 476 377 366 285 495 617 27 353 358 223 313 205 29 49 619 563 61 74 715 51

FGEgtITE Utilizada con autorizaci6n de Mary A Woo DNSc R N

1122 De acuerdo con Schwartz et al (A-2) las investigaciones han demostrado que en los pacienshytes con apnea del suefio obstructiva la reducci6n de peso causa una disminuci6n de la graveshydad de la apnea Los mecanismos involucrados no son daros pero Schwartz y sus colegas

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 17: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 535

supusieron que el decremento en la colapsabilidad de las vias respiratorias superiores explishyca la disminucion de la severidad de la apnea con la perdida de peso Para determinar si la perdida de peso causa la disminucion en ia colapsabilidad midieron la presion crftica de las vias respiratorias superiores antes y despues de reducir el indice de masa corporal en 13 pacientes con apnea del suefio obstructivo Estudiarona 13 individuos de control con peso estable de la misma edad e indice de masa corporal todos varones ycon frecuencia respirashytoria irregular durante la fase de movimiento ocular no nipido antes y despues de la atenshycion habitual Los siguientes datos corresponden a los cam bios en la presion crftica de las vias respiratorias superiores (CPCRIT) (cm HP) e indices de masa corporal (CIMC) (kgm2) despues de la intervenci6n e ingreso al grupo (0 grupo con perdida de peso 1 grupo con cuidados generales) de los individuos

Individuo CPCRIT CIMC Grupo Individuo CPCRIT CIMC Grupo

1 -40 -74420 0 14 2 -9783 1 2 -52 -62894 0 15 -27 0000 1 3 -92 -89897 0 16 -28 0000 1 4 -59 -42663 0 17 -18 4440 1 5 -72 -80755 0 18 -22 13548 1 6 -63 -lO5133 0 19 -3 -9278 1 7 -47 -3lO76 0 20 -9 -7464 1 8 -93 -66595 0 21 -4 19881 1 9 -49 -57514 0 22 -17 -9783 1 lO 4 -53274 0 23 -27 13591 1 11 -27 -105106 0 24 13 9031 1 12 -104 -149994 0 25 10 -14125 1 13 -17 -25526 0 26 3 1430 1

)imJTE Utilizadacon autorizaci6n de Alan R Schwartz M D

1123 EI prop6sito de un estudio realizado por Loi et ai (A-3) era investigar los efectos de la mexileshytina sobre el metabolismo de la teofilina en varones y mujeJesj6venes sanos no fumadores La teofilina se utiliza como broncodilatador para el tratamiento de asma y enfermedades obstrucshytivas pulmonares La mexiletina es un agente antiarritmico tipo [ eficaz que se utiliza para tratar arritmias ventriculares La siguiente tabla muestra el cambio en porcentaje de depurashycion de teofilina en el plasma (y) las concentraciones plasmaticas estables promedio de mexishyletina (lJglml) (X) y el sexo correspondiente a 15 individuos que participaron en el estudio

Individuo Y X Sexoa

1 410 105 1 2 462 46 1 3 443 58 1 4 531 70 1 5 578 107 1 6 484 68 1 7 313 71 1 8 396 87 1

Individuo Y X Sexoa

9 10 11 12 13 14 15

218 73 0 491 72 0 474 82 0 273 54 0 397 58 0 485 153 0 397 57 0

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 18: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

536 CAPITULO 11 ANALISIS DE REGRESION TECllCAS ADICIONALES

1124 Un grupo de investigadores queria estudiar los efectos de la biorretroalimentaci6n y la desshytreza manual sobre la capacidad de los pacientes para desempenar con precisi6n una tarea complicada Se eligieron aleatoriamente 28 pacientes entre los que fueron enviados para recibir terapia ffsica Posteriormente estos pacientes fueron asignados al azar para recibir 0

no biorretroalimentaci6n La variable dependiente es el numero de repeticiones consecutishyvas de la tarea terminada antes de cometer un error Los resultados se muestran en la tabla siguiente

Calificacion Numerode Calificacion Numero de Biorretroshy de destreza repeticiones Biorretroshy de destreza repeticiones alimentacion manual (Y) alimentacion manual (Y)

Sf 225 88 No 149 50 Sf 88 102 Sf 251 75 No 162 73 No 102 75 SI 90 105 Sf 90 112 No 245 51 No 180 55 Sf 150 52 Sf 25 115 Sf 87 106 No 142 50 Sf 212 76 No 88 87 Sf 112 100 No 87 106 Sf 77 112 No 101 91 No 137 89 Sf 211 75 No 171 52 Sf 136 70 No 199 49 No 100 100 Sf 137 75 Sf 100 100

113 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

En general los investigadores de ciencias de la salud al considerar el uso del amllisis de regresi6n lineal para resolver problemas se encuentran con un gran numero de variables entre las cualestienen que seleccionar las variables indepenshydientes para utilizarlas como predictoras de la variable dependiente A los invesshytigaclores les gustaria induir en su modelo tantas variables como fuera posible para maximizar la capacidad predictiva del modelo Sin embargo los investigadoshyres deben darse cuenta de que agregar otras variables independientes al conjunto de variables independientes siempre aumenta el coeficiente de determinaci6n R2 Por 10 tanto las variables independientes no deben agregarse al modelo de manera indiscriminada sino s610 por una buena raz6n En muchas situaciones por ejemshyplo algunas variables predictivas potenciales son mas caras que otras en terminos de costos de recolecci6n de datos Por 10 tanto a los investigadores conscientes de los costos no les gustaincluir variables caras en el modelo a menos que haya evishydencia de que haran una contribuci6n valiosa ala capacidad predictiva del modelo

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 19: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

537 ns PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Los investigadores que pretenden utilizar el anHisis de regresi6n multiple de manera mas eficaz deben ser capaces de utilizar alguna estrategia para hacer selecshydones inteligentes de entre las variables -disponibles potencialmente predictivas Existen much as estrategias que se utilizan actualmente y cada una tiene sus defenshysores Las estrategias varian desde el punto de vista de complejidad y tedio asociashydo a su utilizaci6n Desgraciadamente las estrategias no siempre producen la misma soluci6n cuando se aplican al mismo problema

Regresi6n escalonada 0 gradual Tal vez la estrategia mas ampliamente utilizada que permite seleccionar variables independientes para el modelo de reshygresi6n multiple es el procedimiento de doble paso EI procedimiento consiste en una serie de pasos En cada paso del procedimiento cada variable dentro del moshydelo es evaluada para ver si de acuerdo con los criterios especificados debe contishynuar dentro del modelo

Par ejemplo suponga que se pretende aplicar una regresi6n gradual paso para un modelo que contiene k variables predictivas Se calcula la medida del criteshyrio para cada variable De todas las variables que no satisfacen el criterio de inClushysi6n en el modelo se elimina la que menos satisface el criterio Si se elimina una en este paso se calcula una ecuad6n de regresi6n para el modelo menor y la medida del criterio se calcula para cadavariable que queda dentro del modelo Si cualquieshyra de estas variables no satisface el criterio para su inclusi6n dentro del modelo se elimina la que menos satisface el criterio Si en este paso se elimina una variable se reingresa dentro del modelo la variable que fue eliminada en el primer paso y el procedimiento de evaluaci6ncontinua hasta que no hay mas variables que puedan ser eliminadas 0 reingresadas

La naturaleza del procedimiento gradual es tal que aunque en un paso se elimina del modelo una variable esta se evalua para un posible reingreso dentro del modelo en los pasos subsecuentes

El procedimiento gradual STEPWISE del paquete MINITAB por ejemplo utilizala estadistica F asociada como criterio de evaluaci6n para deddir si la variashyble debe eliminarse 0 agregarse al modelo A menos que se especifique otra cosa el valorcritico de F es 4 Los resultados impresos del procedimiento STEPWISE conshytienen la estadistica t (que es la raiz cuadrada de F) en lugar de la estadistica F En cada paso MINITAB calcula laestadistica F para cada variable dentro del modelo Si la estadistica F para cualquiera de esas variables es menor que d valor critico especificado (4 si no se especifica otro valor) entonces se suprime del modelo la variable con el valor menor de F Se reajusta la ecuad6n de regresi6n para el modeshy10 reducido se imprime el resultado y el procedimiento pasa al siguiente paso Si no es posible eliminar ninguna variable el procedimiento trata de agregar una variable Se calcula laestadistlca F para cada variable que no esta dentro del modeshy10 De estas variables se agrega la que tenga la mayorestadistica F asociada siemshypre que esta sea mayor que el valor crftico especificado (4 si no se espedfica otro valor) La ecuaci6n de regresi6n se reajusta para el nuevo modelo se imprime el resultado y el procedimiento pasa al siguiente paso El procedimiento termina cuanCio es imposible agregar 0 suprimir variables

El siguiente ejemplo ilustra el uso del procedimiento gradual para seleccioshynar variables para el modelo de regresi6n multiple

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 20: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

533 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

FJEMPLO 1131

Un director queria utilizar las caracterfsticas individuales del personal de enfermeshyria para desarrollar un modelo de regresi6n que predijera el desempefio en el trashybajo (DESTRAB) Las siguientes variables estan disponibles para efectuar el proceso de selecci6n de las variables independientes que se incluiran en el modelo

Xl asertividad (ASERT) X2 = entusiasmo (ENTU) X3 = pretensi6n (PRET) X

4 = habilidades de comunicaci6n (COMUN)

Xv ingenio (INGE) X6 iniciativa (INIC)

Se pretendeutilizar el procedimiento gradual para seleccionar las variables indeshypendientes a partir de las disponibles en la tabla y elaborar un modelo de regresi6n multiple que prediga el desempefio en el trabajo

Soindon La tabla 1131 muestra las mediciones tomadas respecto de la variable dependiente DESTRAB y de cada una de las seis variables indepenshydientes para una muestra de 30 enfermeras

TABlA 1131 Mediciones de siete variables para el ejemplo 1131

y Xl X2 X3 X4 X5 X6

45 74 29 40 66 93 47 65 65 50 64 68 74 49 73 71 67 79 81 87 33 63 64 44 57 59 85 37 83 79 55 76 76 84 33 45 56 48 54 59 50 42 60 68 41 66 71 69 37 73 76 49 65 75 67 43 74 83 71 77 76 84 33 69 62 44 57 67 81 43 66 54 52 67 63 68 36 69 61 46 66 64 75 43 71 63 56 67 60 64 35 70 84 82 68 64 78 37 79 78 53 82 84 78 39 83 65 49 82 65 55 38 75 86 63 79 84 80 41

(ContinUa)

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 21: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

539 U3 PROCEDIMIENTOS PARA SELECCIONAR VARIABLES

Y Xl X2 X3 X4 X5 X6

67 61 64 75 60 81 45 67 71 45 67 80 86 48 52 59 67 64 69 79 54 52 71 32 44 48 65 43 66 62 51 72 71 81 43 55 67 51 60 68 81 39 42 65 41 45 55 58 51 65 55 41 58 71 76 35 68 78 65 73 93 77 42 80 76 57 84 85 79 35 50 58 43 55 56 84 40 87 86 70 81 82 75 30 84 83 38 83 69 79 41

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Stepwisemiddot MTB gt Stepwise C1 C2-C7 SUBCgt FEnter 40

Teclear Cl en Response y C2-C7 en Predictors SUBCgt FRemove 40

Stepwise Regression

F-to-Enter 400 F-to-Remove 400

Response is Cl on 6 predictors with N 30

Step 1 2 Constant 7226 31955

C4 0888 0787 T-Ratio 974 813

C7 -045 T-Ratio -220middot

S 590 5 R-Sq 7721 8068

FIGURA 1131 Procedimiento gradual de MINITAB y resultados impresos para los datos de la tabla 1131

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 22: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

540 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Para obtener un modelo util mediante el procedimiento gradual se utiliza el paquete MINITAB Las observaciones correspondientes a la variable dependiente DESTRABy a las seis posibles variables indepenshydientes se almacenan en las column as 1 ala 7 de MINITAB respectivashymente La figura 1131 muestra el procedimiento MINITAB correcto y los resultados impresos

Para obtener los resultados de la figura 1131 los valores de F para ingresar y eIiminar se inicializaron autorruiticamente en 4 En el paso 1 no hay variables consideradas para sacarlas del modelo La variable PRET (coshylumna 4) tiene la mayor estadfstica F asodada cuyo valor es F = (974)2 = 948676 Puesto que ~48676 es mayor que 4 PRET se agrega al modelo En el paso 2 la variable INIC (columna 7) califica para agregarse al modelo porque su F asociada es (-22)2 = 484 valor mayor que 4 y es la variable con la mayor estadistica F asodada Por 10 tanto se agrega al modelo Desshy

pues del paso 2 no es posible agregar 0 sacar mas variables por 10 tanto el procedimiento termina Como puede apreciarse el modelo que se escogio mediante el procedimiento gradual es un modelo de dos variables indeshypendientes PRET e INIC La ecuacion de regresi6n estimada es

bull Para cambiar de 4 a alglin otro valor K el criterio que permite que una variashy

ble entre al modelo se debe seleccionar Options y teclear el valor que se qui era considerar para K en la caja Enter Por 10 tanto el nuevo criterio para la estadfsshytica F esK y no 4 Para cambiar el criterio de supresion de variables del modelo de 4 a otro valor K se debe seleccionar Options y teclear el valor deseado de Ken la caja Remove El valor K para ingresar una variable debeser mayor 0 igual que el valor K para eliminar

EJERCICIOS

1131 Uno de los objetivos de un estudio realizado por Brower et al (A-4) fue determinar si existe una correlaci6n psicol6gica farmacol6gica 0 demografica particular de dependencia de esteroides anab6licos androgenicos (EAA) Los individuos eran varones delgados y todos elIos utilizaban EAA y llenaron un cuestionario de manera an6nima Las variables para las que se recolectaron datos induyen m1mero de sfntomas de dependencia (SINTDEP) cantishydad de esteroides diferentes probados (NUMDROG) dosis maxima expresada como z cantidad (DOSMAX) diferencia en el peso corporal en libras antes y despues de utilizar esteroides (DIFPESO) total de sfntomas agresivos informados (SINTAGR) sensaci6n de no ser suficientemente fuertes antes de utilizar esteroides (en una escala de 1-5 1 significa que nunca consideraron que no eran suficientemente fuertes y 5 significa que todo el tiempo consideraron que no eran suficientemente fuertes) (NOFUER) que no se sintieron suficien~ temente fuertes despues utilizar esteroid~s (con la misma escala que en NOFUER) (NOFUER2) calificaci6n de la prueba de detecci6n de alcoholismo (CAGE) y diferencia en el total del peso levantado por el metodo de bench press antes y despues de utilizar esteroides (PESOBENCH) Los resultados para 31 individuos son los siguientes Aplique el analisis de regresi6n de doble paso de estos datos con SINTDEP como la variable dependiente

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 23: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 541

SINTDEP NUMDROG DOSMAX CAGE SINTAGR NOFUER NOFUER2 DIFPESO PESOBENCH

3 5 241501 0 4 3 2 53 205 7 7 156525 1 4 4 4 40 130 3 2 142402 1 4 3 3 34 90 3 0 81220 0 4 3 3 20 75 3 2 -122474 2 4 3 4 20 -15 3 7 161385 0 2 3 3 34 125 1 1 -102328 0 2 4 3 25 40 2 4 -47416 0 4 4 5 44 85 4 2 124212 2 0 4 3 25 50 3 6 241501 0 4 3 3 55 125 0 2 00000 0 2 1 1 17 65 2 1 294491 0 2 2 2 20 75 1 0 -108538 0 4 3 3 -60 100 0 2 -56689 3 4 3 3 5 50 1 1 -84476 2 1 5 3 13 40 1 3 -29054 2 4 3 2 15 30 4 7 20792 0 4 4 5 17 70 6 0 -54549 3 4 4 4 16 15 3 3 142402 0 4 4 4 52 195 3 5 146032 0 4 4 5 35 90 4 1 41846 4 4 4 3 15 50 3 2 81220 1 4 1 1 20 30 2 8 161385 0 2 3 2 43 125 3 1 -42369 4 1 1 4 0 20 2 4 189222 1 2 2 3 15 75 4 5 114967 2 3 3 3 49 130 6 3 -41145 0 4 5 3 27 70 0 1 -63423 0 0 3 3 15 25 3 1 239759 1 2 4 4 20 50 2 3 -43849 2 2 3 3 13 65 7 8 203585 0 2 4 4 55 155

FUENfE Utilizada can autorizaci6n de Kirk] Brower M D

1132 Erickson y Yount (A-5) afirman que la disminucion esponUinea de la temperatura corporal se asocia con frecuencia a las intervenciones quirurgicas Los investigadores compararon los efectos de tres combinaciones de cubiertas phlsticas revestidas con aluminio (para cubrir todo el cuerpo la cabeza 0 parte del cuerpo) para controlar las condiciones de la temperatushyra timpanica en 60 adultos sometidos a cirugia mayor abdominal con anestesia general Las cubiertas fueron colocadas desde el momento en que los pacientes fueron llevados a la sala de operacion y fueron retiradas hasta que salieron de la unidad de recuperaci6n (REGU) Las variables sobre las que los investigadores obtuvieron mediciones son temperatura antes del traslado al quirofano (TIEMPl) temperatura al ingresar a REGU CITEMP4) edad (EDAD) fndice de masa corporal (IMC) tiempo que duro la cirugfa (TPOGIR) cubierta corporal (CORP) cubierta craneal (CAB) y cubierta con una sabana caliente al entrar a la

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 24: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

542 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

sala de operaci6n (SABCORP) Los resultados se muestran en la siguiente tabla Aplique el anaIisis de regresi6n gradual a estos datos La variable dependiente es TTEMP4

EDAD IMC TPOCIR CORP CAB SABCORP TTEMPI TTEMP4

59 192 12 1 1 1 998 975 39 266 13 0 0 0 990 962 75 237 17 1 0 0 985 966 34 240 8 0 1 1 1004 996 71 182 13 1 1 0 989 948 65 220 13 0 1 1 998 973 41 253 6 1 0 1 997 993 46 205 10 1 0 0 1007 981 56 288 17 0 0 1 988 972 42 272 26 0 1 0 996 958 51 377 18 0 0 1 1003 987 38 227 10 1 0 1 1000 986 68 283 20 1 1 0 997 959 37 298 10 0 0 I 1006 995 35 362 22 0 1 1 1004 990 65 349 16 1 1 0 1003 976 71 314 37 1 0 0 991 972 65 275 8 1 1 0 983 968 60 312 11 0 0 1 989 980 48 209 12 0 0 1 999 974 37 259 16 1 1 1 994 1001 66 301 13 1 0 0 993 978 71 267 14 0 1 1 1004 985 30 211 16 1 0 0 1002 986 69 289 20 1 1 0 999 992 47 312 27 0 1 0 1003 968 30 283 16 0 0 1 998 976 42 396 25 0 0 0 999 990 39 266 17 1 1 0 1000 990 42 296 14 0 0 1 998 982 34 353 14 0 1 1 997 981 57 314 13 0 1 1 991 979 54 421 23 1 0 0 989 982 40 238 9 1 1 0 991 971 45 299 17 1 1 1 1005 993 50 287 20 1 0 0 994 969 46 334 13 0 1 1 992 974 33 253 14 0 0 1 990 986 45 321 18 0 1 1 992 978 63 334 7 1 0 0 1002 1003

(ContinUa)

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 25: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 543

EDAD IMC TPOCIR ORP CAB SABCORP TTEMPI TTEMP4

57 271 7 1 1 0 985 975 43 217 12 0 0 0 1006 987 75 256 11 1 1 0 991 972 45 486 24 0 1 1 1004 987 41 215 15 0 0 0 1000 967 75 257 16 0 1 0 996 972 40 284 26 1 0 0 1006 978 71 194 22 0 0 1 996 962 76 291 35 1 1 0 999 966 61 293 16 0 1 0 991 971 38 304 17 1 1 1 998 988 25 216 28 0 0 1 992 969 80 246middot 42 1 0 0 1005 960 62 266 19 1 0 0 992 976 34 204 15 0 1 1 1001 966 70 275 13 1 0 1 989 984 41 274 13 0 0 1 990 963 43 246 13 1 1 1 995 973 65 248 21 1 0 0 1000 991 45 215 19 0 1 1 1004 956 FUENTE Utilizada con autorizaci6n de Roberta S Erickson Ph D R N

1l33 EI crecimiento de infantes y los factores que influyen fueron considerados en un estudio realishyzado por Kusin et al (A-6) Los individuos eran recien nacidos en dos poblados de Madura al este de Java Los investigadores querfan evaluar la relaci6n entre la alimentaci6n de los bebes y el crecimiento por medio de un estudio longitudinal en el que el crecimiento y la alimentashyci6n al seno materna y alimentaci6n complementaria fueran medidos simultaneamente Las variables sobre las que se hicieron las mediciones son peso (en kilogramos) al momenta de nacer (PC) peso (en kilogramos) a una edad especlfica (PEE) calorias aportadas por la leche materna (CLM2) protefnas aportadas por la leche materna (PLM2) sexo (1 = nina 2 nino) (SX) patr6n de alimentacion al seno-complementaria (1 = mixta2 3 = solo leche materna) (SLM) calorfas provenientes de alimentos complementarios (CCOMP2) y protein as proveshynientes de aIimentos complementarios (PCOMP2) Lo~ siguientes datos corresponden a 28 individuos cpn 30 semanas de edad Realice el amilisis de regresi6n gradual de estos datos

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

250 1 58 1 30033 15300 586 289 310 1 67 1 36660 45000 715 850 290 1 64 1 34404 15300 671 289 330 1 54 1 2820 50080 55 1190 330 1 71 1 38352 34200 7048 646 280 2 60 1 38916 6300 759 119 300 2 65 1 40749 00 795 00

(Continua)

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 26: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

544 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICION~LES

PG SX PEE SLM CLM2 CCDMP2 PLM2 PCOMP2

300 1 69 1 41595 20840 811 373 340 1 83 1 39621 12600 773 238 300 1 66 3 45543 00 888 00 300 2 60 1 35391 12600 690 238 300 1 75 1 38211 31840 745 524 280 2 66 1 41736 10440 814 197 310 1 69 1 32289 24300 630 459 320 1 71 1 33840 22870 660 364 275 1 70 1 36519 19800 712 374 270 2 87 3 48222 00 940 00 350 1 85 1 36660 27000 715 510 280 2 49 1 28059 14400 547 272 310 1 69 3 29610 00 578 00 300 1 80 1 36378 16600 710 292 325 1 87 1 39988 9900 780 187 330 1 76 2 30597 00 597 00 300 1 69 1 37224 28800 726 544 330 2 63 2 35814 00 699 00 320 1 89 2 44133 00 861 00 300 2 67 1 47376 18540 924 350 360 2 75 1 43287 12600 844middot 238

FUENTE Utilizada con autorizacion de Ulla Renquist

114 REGRESION LOGISTICA

Hasta ahora el estudio del analisis de regresi6n se ha limitad0a situaciones donde la variable dependiente es una variable continua como el peso la presion sanguishynea 0 el nivel plasmatico dealguna hormonaMuchos investigadores en ciencias de la salud estan motivados por el deseo de describir comprender y hacer uso de las relaciones entre las variables independientes y una variable dependiente (0 resultashydo) que sea discreta Son particularmente abundantes las circunstancias en donde la variable dependiente es dicotomica Una variable dicotomica como se recomashyra es una variable quepuede tomar solo uno de dos valores mutuaniente exduyentes Estos valores por 10 general se codifican como Y = 1 para exito y Y = 0 para fracaso Las variables dicotomicas induyen aquellas cuyos dos posibles valores son categorias como muerte 0 no-muerte curado 0 no curado enfermedad ocurrida 0

enfermedad no ocurrida fumador 0 no fumador El profesional en ciencias de la salud dedicado a investigar 0 aquel que necesita comprender los resultados del trabashyjo de otros investigadoresencuentra util tener al menos conocimientos basicos de regresi6n logistica Este tipo de analisis de regresi6n se utiliza de manera general cuando la variable dependiente es dicotomica EI proposito de esta seccion es ofreshy

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 27: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

545 114 REGRESION LOGISTICA

cer allector este nivel basico de comprensi6n Esta exposici6n se limitara a casos en que existe s610 una variable independientecontinua 0 dicot6mica

IlIodelo de regresi6n logistica Se recordani que en el capitulo 9 se estudia el analisis de regresi6nlineal simple que induye s610 dos variables EI modelo de regresi6n lineal simple se representa mediante la ecuaci6n

y=a+~x+e (1141)

en donde y es un valor arbitrario observado de la variable dependiente continua Cuando el valor observado de Yes JL Ix la media de una subpoblaci6n de valores de Ypara un valor dado de X la cantidad-e la diferencia entre Y observada y la recta de regresi6n (vease la figura 921) es cero por 10 tanto la ecuaci6n 1141 puede escribirse como

(1142)

Tambien puede escribirse as

E(Ylx) a + ~x (1143)

Generalmente ellado derecho de las ecuaciones 1141 a la 1143 pueden tomar cualquier valor entre menos infinito y mas inJinito

Aunque s610 participen dos variables el modelo de regresi6nlineal simple no es el indicado cuando Y esuna variable dicot6mica porque el valor esperado (0 media) de Yes la probabilidad de que Y = 1 Yentonces el rango se limita entre 0 y 1 inclusive Por esta situaci6n las ecuaciones 1141 ala 1143 son incompatibles con la realidad de la situaci6n

Si p = P(Y = 1) entonces la razonp(l-p) puede tomarvalores entre 0 y mas infinito Ademas ellogaritmo natural(ln) de pl(l -P) puede tomar valores entre menos infinito y mas infinito tal como ellado derecho de las ecuaciones 1141 ala 1143 Consecuentemente es posible escribir

(1144)[~l a+~xIn I-p

Ala ecuaci6n 1144 se Ie llama modelo de regresion logistica porque la transformacion de JL Ix (es decir P) en InlP(l-p)] es la transformaci6n logaritmica La ecuacion 1144 tamhien puede escribirse as

exp(a+~x) p (1145)

1+exp(a + ~x)

donde exp es el inver so dellogaritmo natural

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 28: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

546 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

TABlA 1141 Dos variables dicotolDicas c1asificadas de lDanera cruzada con valores codificados con 1 yO

Variable independiente (X)

Variable dependiente (Y) I 0

1 nll nlo

2 nOl noo

EI modelo de regresi6n logistica se utiliza ampliamente en investigaciones de ciencias de la salud Por ejemplo personal de epidemiologfa suele utilizar este modelo para calcular la probabilidad (interpretada como riesgo) de contagio es decir que un individuo adquiera alguna enfermedad durante cierto tiempo de exshyposicion a una condicion (Hamada factor de riesgo) que se sabe 0 se sospecha esta asociada con la enfermedad

Regresion logistica variable independiente dicotornica la situaci6n mas simple donde la regresi6n logfstica es aplicable es cuando ambas variables dependiente e independiente son dicot6micas Los valores de la variable depenshydiente (resultados) porio general indican si el individuo adquiri6 0 no la enfermeshydad 0 si el individuo muri6 0 no Los valores de lavariable independiente indican el estado del individuo en relaci6n con la presencia 0 ausencia de alglin factor de riesgo En el siguiente estudio se supone que la dicotomfa de las dos variables se codifican con 0 y J Cuando este es el caso las variables pueden entrecruzarse en una tabla como la 1141 que contiene dos renglones y dos columnas Las casillas de la tabla contienen las frecuencias de ocurrencia de todas los posibles pares de valores para las dos variables (1 1) (1 0) (0 1) Y (0 0)

El objetivo del analisis de datos que cumple con ese criterio es una estadistica conocida como raz6n de grados de probabilidad Para comprender el concepto de la raz6n de grados de probabilidad se debe entender el termino raz6n de gradas de probabilidad el cual utilizan frecuentemente los apostadores en eventos deportivos o en otro tipo de apuestas AI utilizar la terminologfa de probabilidad es posible definir el termino grados de probabilidad como sigue

DEFINICION

Los grados de probabilidad de exito son la razon de probabilidad de exito y probabilidad de fracaso

La raz6n de grados de probabilidad es una medida de cuanto mayores (0 menores) son los grados de probabilidad de que los individuos que poseen el factor de riesgo experimenten un resultado particular Esta conclusi6n sup one que el reshy

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 29: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

547 114 REGRESION LOGISTICA

sultado es un evento poco comlin Por ejemplo cuando el resultado es contagiarse de la enfermedad la interpretaci6n de la raz6n de grados de probabilidad asume que la enfermedad es poco comlin

Suponga por ejetnplo que la variable resultado es la adquisid6n 0 no adquishysici6n de cancer en la piel y que la variable independiente (0 factor de riesgo) es el niveI alto de exposici6n al sol EI amilisis de los datos recolectados respecto a la muestra de individuos puede produdr una raz6n de grados de probabilidad de 2 10 que indica que los grados de probabilidad de cancer en la piel son dos veces mayores entre los individuos con niveles altos de exposici6n al sol que entre los individuos que no tienen niveles altos de exposid6n

Los paquetes de software de computadorltl que ejecutan regresiones logfsticas frecuentemente ofrecen como parte de los resultados la estimaci6n de ex y p y los valores numericos de la raz6n de grados de probabilidad Como se vera la raz6n de

grados deprobabilidad es igual a exp(p)

FJEMPLO 1141

Enun estudio de tabaquismo y riesgo de enfermedad pelvica inflamatoria aguda Scholeset al (A-7) informaron los datos que se muestran en la tabla 1142 Se pretende utilizar el amilisis de regresi6n Iogfstica para determinar cuanto mayores son los grados de probabilidad de encontrar casos de enfermedad entre los indivishyduos que siempre han fum ado que entre los individuos que nunca han fumado

SoJuci6n Se puede utilizar el paquete de software SAS para analizar estos datos La variable independiente es tabaquismo (TABAQ) yia variable depenshydiente esta relacionada con la presencia 0 ausencia de enfermedad inflamatoria pelvica Mediante el comandoPROC LOGIST de SAS se produce como parte de los resultados la estadfstica que se muestra en la figura 1141

Es posible observar que la estim aci6n de a es -11527 y la estimashyci6n de Pes 6843 La estimaci6n de la raz6n de losgrados de probabilishydad es por 16 tanto DR exp(6843) = 198 De esta manera se estima que los grados deprobabilidad deencontrarun caso de inflamad6n pelvica

TABLA 1142 Casos de enfelDledad pclvica inflaDlatoriaaguda e individuos de control c1asificados porestado de tabaquisDlo

ltNunca ha fumado Casos Controles Total

Sf 77 123 200 No 54 171 225 Total 131 294 425 FUENTE Delia Scholes Janet R Dalingy Andy S Stergachis Current Cigarrete Smoshyking and Risk ofAcute Pelvic Inflammatory Disease AmericanJournal ofPublic Health 82 1352-1355 Utilizado con permiso de la American Public Health Association el titular de los derechos de autor

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 30: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

548 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Parameter Standard variable Estimate Error

INTERCEPT -11527 01561 SMOKE 06843 02133

FIGURA 1141 Resultados parciales mediante el uso del comando PROC LOGIST de SAS con los datos de la tabla 1142

es de casidos veces mas alto entre los individuos que siempre han fumashydo que entre los individuos que nunca han fumado bull

Regresi6n logfstica variable independiente continua Considere ahoshyra la situacion donde se tiene una variable dependiente dicot6mica y una variable independiente continua Suponga que usted tiene la posibilidad de utilizar una computadora para hacer los calculos De esta forma la exposlcion estanl dirigida a la evaluaci6n de la suficiencia del modelo como una representacion de los datos disponibles a la interpretacion de los elementos clave de los resultados impresos y al empleo de los resultados para contestar preguntas importantes respecto a la relacion entre las dos variables

FJEMPLO 1142

En una encuesta aplicada entre hispanoamericanos por el N adonal Center for Health Statistics (Centro Nacional de Estadisticas de Salud) se recolectaron (A-8) datos

sobre las concentraciones sericas totales de colesterol (CT) y las edades de los inshydividuos Estos datos se presentan en la tabla 1143 y se pretende utilizarlos para obtener informacion respecto a la relaci6n entre la edad y la presencia 0 ausencia de valores de colesterol total maYQres 0 iguales que 240 Se pretende tambien

TABlA 1143 Hispano~mericanos con niveles totales de colesterol en el suero (CT) Illayores 0 iguales a 240 Illiligralllos por decilitro por grupos de edades

Grupode edades (anos) Cantidad examinada (n) Cantidad con CT ~ 240 (nil)C

25-34 35-44 45-54 55-64 65-74

522 330 344 219 114

41 51 81 81 50

aLa publicaci6n original senala porcentajes en lugar de frecuencias En esta tabla las frecuencias que aparecen se obtuvieron de muitiplicar los porcentajes de cada grupode edad por el tamano de la muesshytra apropiada FUENTE M Carroll C Sempos R fulwood et al Serum Lipids and Lipoproteins of Hispanics 1982-84 National Center for Health Statistics Vital Health Statistics 11 (240)

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 31: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

549 114 REGRESION LOGiSTICA

Standard ChishyEffect Parameter Estimate Error Square Prob

INTERCEPT 1 -40388 02623 23701 00000 AGE 2 00573 000521 121 06 00000

FIGURA 1142 Impresi6n parcial de SAS del anaIisis de regresi6n loglstica para los datos de la tabla 1143

saber si es posible utilizar los resultados de este amllisis para predecir la probabilidad de que un hispanoamericano tenga valores de TC ~ 240 y saber la edad de la persona

Soludon La variable independiente es la variable continua edad (EDAD) y la variable dependiente 0 respuesta es el estado con respecto al nivel de CT La variable dependiente es dicot6mica porque puede aampumir uno de dos valores CT ~ 240 0 CT lt 240 Debido a que las edades indivishyduales no estan disponibles es necesario basar el analisis sobre los datos agrupados que apoyan el informe Se utiliza el paquete de software SAS Los valores ingresados a la computadora para la variable indeshypendierute son los puntos centrales de los grupos de edades 295 395 Y todos los demas El comando de SAS para efectuar el proceso es PROC CATMOn La impresi6n parcial del analisis se muestra en la figura 1142

La pendiente e intercepd6n de la regresi6n son 0573 y -40388 respectivamente Por 10 tanto la ecuaci6n esta dada por

-40388 + 0573x

donde Yi = In(njni2) nil es el numero de individuos en la i-esima cateshygoria de edades que tienen valores de CT mayores 0 iguales que 240 y nil + ni2 = ni representa el total de individuos en la i-esima categoria examinados

Prueba de Ho ~ = 0 Para llegar a la conclusion respecto a la suficiencia del modele logistico

se prueba la hip6tesis nula que dice que la pendiente de la recta de regresi6n es cero La estadfstica de prueba es z = bSb donde z es la estadistica normal estandar b es la pendiente de la muestra (0573) y Sb

es el error estandar (00521) tal como se muestra en la figura 1142 A partir de estos numeros se calcula z = 057300521 = lO99808 con un valor asociado para p menor que 0001 Por 10 tanto se concluye que el modelo logistico es adecuado El cuadrado de z es ji-cuadrada con 1 grado de libertad estadfstica que se muestra en la figura 1142

Para obtener la impresi6n visual de que tan bueno es el ajuste del modelo se grafican los puntos centrales de las categorias de edades contra In(n)ni2) y se sobrepone la recta de regresi6n ajustada sobre la grafica Los resultados se muestran en la figura 1143

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 32: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

550 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

o

-1 ~ lt [s -2 II

gtshy

-3

x= Edad

FIGURA 1143 Recta de regresion logfstica ajustada para el ejemplo 1142

Estimaci6n dep mediante la regresi6n logistica

Es posible utiliiar la ecuaci6n 1145 y los resultados del amilisis para estimar e1 valor de p la probabilidad de que un hispanoamericano con una edad dada (dentro de los rangosde edades de los datos) tenga un valor de CT ~ 240 Por ejemplo suponga que se pretende estimar la probabilidad de que un hispanoamericano que tiene 295 arios de edad tenga un valor de CT ~ 240 Lasustituci6n de 295 y los resultados mosshytrados en la figura 1142 en la ecuaci6n 1145 producen

p == 40388 + (0573)(295)] 08719

~ +exp [-40388 + (0573)(295)] bull

El paquete SAS calcula las probabilidades estimadas para los valores dados de X que representan los puntos centrales de los cinc grupos de edades y se muestran en la figura 1144 Es importe hacer notar que debido al redondeo los valores generados por SAS son diferentes de los obtenidos con la ecuaci6n 1145 Los resultados generados por SAS tambien contienena los errores estandar de las estishymgciones las proporciones observadas y sus errores estandar las diferencias entre ios valores observados yestimados y los valores de Yi para graficar la recta de regreshysi6n que se muestra en la figura 1143

Otrus fueRtes de informacion Se han estudiado solamente los conceptos basicos y la aplicaci6n de la regresi6n logistica La tecnica tiene muchas aplicacioshynes Por ejemplo se puede uti~izar en situaciones en las que existen dos 0 mas

variables independientes que pueden ser continuas dicot6micas 0 con mas de dos posibles valore~ (como las variables discretas con mas de dos categorias) EI anashy

lisis de regresion gradual se puede utilizar junto con la regresion logistica Tambien existen tecnicas disponibles para elaborar intervalbs de confianza para las razones de leis grados de probabilidad Ellector que quiera aprender mas acerca de la regresion logistica puede consultar los libros de Hosmer y Lemeshow (1) y Kleinbaum (2)

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 33: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 551

MAXIMUM-LIKELIHOOD PREDICTED VALUES FOR RESPONSE FUNCTIONS AND PROBABILITIES

------Observed----- -~----predicted-~----

Function Standard Standard Sample AGE EXM Number Function Error Function Error Residual ----~-~------~--------~--~----------------------------------------------~~-------------

1 295 0 1

1 PI P2

-24622952 007854406 092145594

016269372 001177494 001177494

-23493245 008711948 0 91288052

012050719 00095839 00095839

-01129707 -00085754 000857541

2 395 0 1

1

PI P2

-16993861 015454545 084545455

015228944 001989831 001989831

-1 7766203 014472096 085527904

008256409 001021952 001021952

007723419 00098245

-00098245

3 495 0 1

1 PI p2

-11777049 023546512 076453488

012707463 002287614 002287614

-12039161 023077929 076922071

006720744 001194843 001194843

002621126 000468583 -00046858

4 595 0 1

1 PI P2

-05328045 036986301 063013699

013997163 00326224 00326224

-06312119 034723579 065276421

008753496 001984095 001984095

00984074 002262723 -00226272

5 695 0 1

1 PI p2

-02468601 043859649 056140351

018874586 004647482 004647482

-00585077 048537724 051462276

012733053 003180541 003180541

-01883524 -00467807 004678075

FIGURA 1144 Impresi6n adicional de SASdel anaJisis de regresi6n logfstica para los datos del ejemplo UA2

EJERCICIOS

1141 Una muestra formada por 500 estudiantes de primaria fueron clasificados de manera cruzashyda de acuerdo con d estado de nutrici6n y desempefto escolar de la siguiente manera

Estado de nutricion y desempeno escolal de 500 estudiantes de primaria

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 34: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

552 CAPiTULO 11 Al~AuSIS DE REGRESION TECNICAS ADICIONALES

El ejercicio consiste en utilizar el amilisis de regresi6n logistica para ca1cular los coeficientes de regresi6n y estimar la niz6n de los grados de probabilidad asi como redactar la interpreshytaci6n de los resultados obtenidos

1142 La siguiente tabla muestra dentro de cada grupo el total de pacientes ingresados en un programa de tratamiento psicol6gico y el total de pacientes que mejoraron al termino de un ano de tratamiento

Grupo de edades Cantidad hospitalizada Cantidad mejorada

20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

30 32 34 40 35 45 30 25 20

6 8

11 17 18 31 22 19 16

Utilice la regresi6n loglstica para analizar los datos tal como se hizo en el ejempl0 1142 Redactar una interpretaci6n de los resultados yc6mo pueden ser (Hiles a los profesionales de la salud

115 RESUMEN

Se agreg6 este capitulo para apoyar a los lectores que quieren ampliar su conocishymiento acerca del amilisis de regresi6n y ser capaces de apHcar tecnicas a modelos mas complicados que los estudiados en los capitulos 9 y 10 En este capitulo se presentan algunos temas adicionales sobre amilisis de regresi6n Se estudia el amishylisis mas adecuado para variables independientes dicot6micas En este capitulo se presenta el concepto de codificaci6n de la variable imaginaria Tambien se presenshyta otro tema de estudio c6mo seleccionar las variables independientes mas titiles cuando se tiene una listalarga de c~mdidatas potenciales La tecnica que se muestra para tal prop6sito es el analisis escalonado 0 gradual Finalmente se presentan los conceptos basicos y los procedimientos asociados con el analisis de regresi6n logisshytica Se incluyen dos situaciones el caso en el que la variable independiente es dicot6mica y el caso en el que la variable independiente es continua

Debido a que los caIculos asociados para obtener resultados titiles a partir de los datos apropiados para el anaIisis por medio de las tecnicas presentadas en este capitulo son complicados y consumen mucho tiempo cuando se intentan manualshymente se recomienda utilizar la computadora para resolver los ejercicios

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 35: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

553 PREGlJNTAS Y EJERCICIOS DE REPASO

PREGUNTAS YF~ERCICIOSnE REPASO

1 (Que es una variable cualitativa

2 ~Que es una variable imaginaria

3 Explique e ilustre la tecnica de codificacion de la variable imaginaria

4 (Por que es importante conocer las tecnicas de selecci6n de variables para los investigadores de ciencias de la salud

5 (Que es la regresion gradual

6 Explique el concepto basico asociado con la regresion gradual

7 CCuando se utiliza la regresion loglstica

8 Describa y explique los componentes del modelo de regresion loglstica

9 Defina el termino grados de probabilidad

10 (Que es la razon de grados de probabilidad

11 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion logistica cuando la variable independiente es dicotomica

12 De un ejemplo representativo dentro de su campo de trabajo en el que sea adecuado el uso del analisis de regresion loglstica cuando la variable independiente es continua

13 Busque un articulo de ciencias de la salud en el que se hay a utilizado cada una de las siguienshytes tecnicas

a) Codificacion de la variable imaginaria

b) Regresi6n gradual

c) Regresi6n loglstica

Escriba un informe respecto al articulo en el que identifique las variables que intervienen los motivos por los que se seleccion61a tecnica y las conclusiones de los autores con base en el amHisis

14 El objetivo de un estudio realizado por Porrini et al (A-9) fue evaluar el consumo alimenticio y su correlaci6n con ciertos factores de riesgo de la cardiopatia coronaria Los individuos estudiados eranadultos que vivian al norte de ltalia El factor de riesgo para el que se recolecshytaron los datos es el nivel total de colesterol (CT) Los datos se recokctaron respecto a las siguientes variables de alimentacion energla (ENERGIA) total de grasas (TOTGRA) grashysas saturadas (GRASAT) grasas poliinsaturadas (GRAPOLI) grasas vegetales (GRAVEG) grasas animales (GRAANI) colesterol (COL) fibra (FIBRA) y alcohol (ALCOHOL) Adeshymas se tomaron mediciones respecto al indice de masa corporal (lMC) Las unidades de medicion son energla m] colesterol mg indice ltIe masa corporal kgm y gramos (g) para las demltls variables La siguiente tabla muestra los valores para estas variables en individuos varones con edades entre 20 y 39 aiios Utilice el analisis de regresi6n gradual para seleccioshynar las variables mas utilesque debe incluir el modelo para predecir el nivel de colesterol total

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 36: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

IiI IiI

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

223 22803 673 235 64 326 347 2075 220 238 267 179 17189 680 290 75 296 383 3325 152 0 238 197 16448 589 204 107 281 308 2729 125 263 218 187 25743 914 260 88 569 345 2862 307 275 231 325 28917 973 370 104 359 614 3095 232 636 283 281 22110 1028 320 108 43~8 590 3579 195 169 264 250 18534 699 277 100 241 458 3460 142 23 236 183 23995 1162 368 126 547 615 2425 229 45 300 211 20289 626 223 75 306 320 2135 199 636 277 248 24895 659 218 131 375 283 4145 180 636 208 198 22428 859 61 421 437 2399 213 0 227 250 27545 539 174 50 224 315 1590 243 915 219 178 20435 633 264 127 313 320 2074 159 602 221 222 20776 706 290 81 224 482 3023 221 167 266 205 29869 611 160 131 397 214 2740 296 341 222 159 32292 921 347 102 314 608 2582 246 848 219 215 15449 766 307 161 307 458 3019 195 106 298 196 27008 937 336 91 408 529 3725 328 0 216 275 26466 1059 324 124 592 467 4142 301 53 273 269 29055 920 331 90 330 590 4250 298 525 269 300 42595 1339 380 212 824 515 5191 409 398 287 220 35120 1132 440 178 434 698 5509 433 437 260 180 31306 1236 376 141 657 578 3420 263 0 249 226 43586 1675 544 343 912 763 4375 385 318 231 202 38322 1528 728 128 629 898 7884 191 91 244 185 17825 679 207 80 198 480 2951 162 96 188 l72 20413 788 315 58 420 368 4875 171 318 210

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 37: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

TABLA wntinuaci6n)

CT ENERGIA TOTGRA GRASAT GRAPOLI GRAVEG GRAANI COL FIBRA ALCOHOL IMC

285 40616 942 336 141 315 627 4912 219 1567 284 194 42802 1425 515 73 560 865 7470 469 318 235 257 28346 857 363 97 279 579 4647 354 598 241 198 40324 1436 523 169 673 763 4469 622 318 231 180 32458 1014 331 132 502 512 4091 448 212 246 177 23794 743 243 78 353 390 2574 209 635 273 183 27716 987 307 106 481 505 4929 302 205 209 248 18884 717 219 146 330 387 2154 209middot 0 260 167 23871 323 110 25 224 99 2342 433 0 249 166 14740 602 205 126 228 374 2225 119 60 252 197 25740 937 304 90 418 520 4044 272 325 242 191 29990 1101 385 122 433 668middot 4213 248 361 238 183 27462 761 193 100 434 327 2409 210 988 253 200 29598 917 305 102 426 491 4032 400 middot650 290 206 41043 1560 507 158 961 598 4231 391 277 205 229 27319 1222 389 263 770 452 3652 270 7 253 195 34406 1321 421 124 656 664 5261 45 1 417 232 202 middot30005 1140 366 123 442 698 3064 342 0 278 273 25888 867middot 242 203 487 380 2521 199 577 218 220 21441 910 233middot lOA 526 383 3102 233 439 246 155 22599 855 219 109 562 293 1823 208 530 234 295 36949 1218 437 217 479 738 4185 161 886 254 211 31142 1011 312 115 420 591 2772 340 346 284 214 21830 859 316 74 335 524 3729 217 370 238

~ FUENTE Utilizada con autorizaci6n de Marisa Porrini IJl

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 38: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

556 CAPiTULO 11 ANALJSIS DE REGRESI6N TECNICAS ADICIONALES

15 En la siguiente tabla estin los valores correspondientes al gasto cardiaco (lmin) y al consushymo de oxigeno 0102) registradosen una muestra de personas adultas (A) y nifios (C) quienes participaron en un estudio disefiado para investigar las relaciones entre esas variables Las mediciones se tomaron en reposo y durante el ejercicio La variable dependiente es el gastocardiaco Utilice las tecnicas de codificaci6n de variables imaginarias y analice los datos por regresi6n Explique los resultados Grafique los datos originales y las ecuaciones ajustadas de regresi6n

Gasto Grupo cardiaco (Umin) V0 (Umin) de edad

2

40 21 A 75 91 C 30 22 C 89 60 A 51 59 C 58 50 A 91 99 A 35 23 C 72 51 A 51 48 C 60 74 C 57 70 C

142 160 A 41 30 C

Gasto Grupo cardiaco (Imin) V0

2 (Umin) deedad

40 25 C 61 22 A 62 61 C 49 45 C

140 155 A 129 111 A 113 145 A 57 50 C

150 161 A 71 83 C 80 61 A 81 82 A 90 115 C 61 39 A

16 Una muestra aleatoria simple de individuos con edades entre 6 y 18 afios produjo datos respecto al total de potasio en el cuerpo (mEq) y agua corporal (litros) los cuales se muestran en la siguiente tabla La variable dependiente es el potasio total utilice las tecnicas de cod ishyficaci6n de variables imaginarias para cuantificar la variable cualitativa Realice eI analisis de datos por regresi6n Explique los resultados y grafique los datos originales y las ecuaciones ~ustadas de regresi6n

Potasio Agua total Potasio Agua total total corporal corporal Sexo total corporal corporal Sexo

795 1590 1250 1680 800

2100 1700 1260 1370 1000

middot1100 1500 1450 1100

13 16 15 21 10 26 15 16 18 11 14 20 19 14

M F M M F M F M F F M F M M

950 12 F 2400 26 M 1600 24 F 2400 30 M 1695 26 F 1510 21 F 2000 27 F 3200 33 M 1050 14 F 2600 31 M 3000 37 M 1900 25 F 2200 30 F

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 39: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

557 PREGUNTAS YEJERCICIOS DE REPASO

17 Los datos que se muestran en la siguiente tabla fueron recolectados como parte de un estushydio donde los individuos eran bebes prematuros con bajo peso al nacer de tres diferentes hospitales Utilice las tecnicas de codificaci6n de variables imaginarias y regresi6n mUltiple para analizar los datos2Es posible concluir que las tres muestras de poblaciones difieren con respecto al peso promedio al nacer cuando la tdad gestacional es tomada en cuenta 2Es posible concluir que existe interacci6n entre el hospitaldonde se registr6 el nacimiento y la edad gestacionalGrafique los datos originales y las ecuaciones ajustadas de regresi6J

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

14 30 A 9 27 B

12 33 A 11 29 C 13 35 A 8 27 B

10 32 A 7 26 A

12 30 C 8 28 A

15 32 B 13 31 A 14 32 C 15 33 B 10 27 A 18 35 B 14 36 C 12 34 A 11 28 B 12 30 B

Estado de Peso al gestaci6n Hospital nacer (kg) (semanas) dondenaci6

10 14 9

10 19 13 17 10 9

10 16 16 17 16 L2 15 18 15 12 12

29 C 33 C 28 A 28 C 36 B 29 B 35 C 30 A 28 A 31 A 31 B 33 B 34 B 35 C 28 A 30 B 34 B 34 C 30 A 32 C

18 Hertzman et at (A-lO) condujeron un estudio para identificar las determinantes que provocan niveles elevados de plomo en la sangre de ninos de edad preescolar compare la situaci6n actual con informacion anterior determine la tendencia hist6rica en La contaminaci6n arrishybiental por plomo en una comunidad canadiense y encuentre las bases para identificar las precauciones adecuadas y medidas de protecci6n contra futura exposici6n al plomo Los indishyviduos estudiados eran ninos con edades entre dos y cinco anos inclusive que vivian en una comunidad canadiense un lugar donde existe una de las mas grandes fundidoras de plomo y zinc de America del Norte Los individuos fueron repartidos en dos grupos 1) casos 0 grupo de ninos con niveles de plomo en la sangre de 18 )lglml 0 mas y 2) con troles 0 grupo de nmos con niveles de plomo en la sangre de 10 )lgldl 0 menos Los niveles de plomo fueron evaluados en muestras de agua para beber pinturas polvo domestico vegetales cultivados en casa y tierra Entre los analisis aplicados por los investigadores estaba el anaIisis de regresi6n mUltishyple logistico cuyas variables independientes eran sexo edad y los logaritmos de los niveles de plomo en las muestras del ambiente (covariancias) Encontraron que el nivel de plomo en la tierra era elfactor deriesgo mayor para losniveles-altos de plomo en la sangre El anaIisis produjo una relaci6n de 1425 para los grados de probabilidad los cuales se pueden interpreshytar como por cada diez veces que se incrementa el nivel de plomo en la tierra aumenta 1425 veces la proporci6n relativa de casos con respecto a los grupos de control La siguiente tabla

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 40: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

558 CAPITULO 11 ANliLlSIS DE REGRESION tiCNICAS ADICIONALES

muestra los niveles de plomo en la tierra para el grupo 1 (codificado como 1) y el grupo 2 (codificadb como 0) Utilice la regtesion logfstica para analizar estos datos Obtenga la raz6n de gtados de probabilidad y comparela contra la que obtuvieron los autores Realice las prueshybas con nivel de significacionde 05 y calcule el valor de p

Categorla Nivel de del plomo en el individuo suelo (ppm)

Categorili Nivel de del plomo en el

individuo suelo (ppm)

Categorla Nivel de del plomoen el

individuo suelo (ppm)

1 = caso 1290 0 197 1 852 0= control 90 1 916 0 137 1 894 1 755 0 137 0 193 1 59 0 125 1 1410 1 1720 1 562 1 410 1 574 0 325 1 1594 1 403 1 1317 0 321 1 61 1 2125 0 40 1 1290 1 2635 0 96 1 1409 1 2635 0 260 1 880 0 544 0 433 1 40 1 731 0 260 1 40 1 815 0 227 0 68 0 328 0 337 0 777 1 1455 1 867 1 1975 0 977 1 1694 1 1237 1 624 0 302 0 133 1 392 1 2860 0 269 1 427 1 2860 0 357 1 1000 1 4320 0 315 1 1009 1 859 0 315 0 1010 0 119 0 255 1 3053 1 115 0 422 0 1220 0 192 0 400 0 46 1 1345 0 400 0 181 0 55 0 229 0 87 0 55 1 229 0 131 1 606 0 768 0 131 1 1660 0 886 1 1890 0 82 1 58 1 221 0 1470 0 508 1 221 1 600 1 811 0 79 1 2120 1 527 1 1570 1 569 1 1753 1 909 0 105 0 57 1 1720 1 503 0 769 1 308

(ContinUa)

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 41: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

559 PREGUNTAS Y EJERCICIOS DE REPASO

Categoria Nivel de Categoria Nivel de Categoria Nivel de del plomo en el del plomo enel del plomoen el individno suelo (ppm) individuo suelo (ppm) individuo suelo (ppm)

0 0 1 0 1 1 0 1 0 1

161 161

1670 132 974

3795 548

I

622 788

2130

0 1 1 1 0 1 1 1 1 1

677 677 424

2230 421 628

1406 378 812 812

1 0 0 0 1 0 0 0

97 200

1135 320

5255 176 176 100

FUENTE Unhzada con autorlzac16n de Shona Kelly

Para cada uno de los siguientes estudios descritos en los ejercicios del 19 al 21 conteste todas las preguntas siguientes

a)middot ~Cual es la variable dependiente b) ~Cuales son las variables independientes

c) ~Cuales son las hip6tesis nula y alternativa adecuadas

d) ~Cual de las hip6tesis nulas es rechazada y por que

e) ~Cual es el objetivo mas relevante la predicci6n 0 la estimaci6n ~Son ambos igual de im portantes Explique su respuesta f)~Cual es la poblaci6n muestreada

g) ~Cual es la poblaci6n objetivo h) (Cuales variables estanrelacionadas can otras variables ~La relaci6n es directa 0 inversa

i) Describa la ecuaci6n de regresi6n mediante numeros adecuados para la estimaci6n de parametros

j) Asigne valores numericos para cualquier otra estadistica accesible k) Especifique para cada variable si es cuantitativa 0 cualitativa

I) Explique el significado de cualquier estadfstica para la que se dan los valores numericos

19 Brock y Brock (A-II) utilizaron el modele de regresi6n multiple en un estudio de la influenshycia de las variables seleccionadas sabre la actividad de lacolinesterasa (ChE) en 650 varones y 437 mujeres con fenotipo ChE-1 U 0 VA Los investigadores desarrollaron un modelo lineal con las mediciones de ChE transformadas a una escala logaritmica can el termino de intercepci6n 2016 Y coeficientes de regresi6n y sus variables asociadas como sigue fenotipo ChE-1 (-308) sexo (-104) peso (00765) estatura (-00723) Los investigadores informashyron que R = 535 Y P lt 001

20 Ueshima et ai (A-12) informaron respecto a un estudio disefiado para evaluar la respuesta al ejercicio en pacientes con fibrilaci6n ventricular cr6nica (FV) Setenta y nueve pacientes con FV fueron some tid os a ecocardiograHa en reposo bidimensional y en modo M as como a pruebas de rutina de sintomaslimifantes can analisis de-irliercambio de gases ventilatorios En el analisis de regresi6n gradual para evaluar los predictores potenciales de maximo conshysumo de oxigeno (Vo

2 max) las variables que ingresaron al procedimiento desde el paso 1

hasta el paso 7 respectivamente as como la R2 y los valores asociados de p fueron los

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 42: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

560 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONAIES

sigriientes presi6n sarigulhea sistoIica maxima (35 lt01) frecuencia canHaca maxima (045 03) fracci6n de eyecdon ventricular izquierda (47 45) edad (49 51) dimension del ventriculo Izquierdo (50 53) dimension diastolica ventricular izquierda (50 75) dimenshysion sist6lica ventricularizquierda (50 S4)

21 Ponticelli et at (A-13) detectaron hipertension arterial despues de un ano en S16 por ciento de 212 pacientes que recibieron trasplante renal tratados con ciclosporina con funciones estables del injerto A traves del analisis de regresion logfstica los autores encontraron que la presencia de hipertensi6n antes del transplante (p = 0001 Y 35 grados de probabilidad) el nivel de creatinina mayor a 2 mgdl al ano (p = 0001 Y 3S grados de probabilidad) y la terapia de mantenimiento con corticosteroides (p = OOS Y 33 grados de probabilidad) estashyban positivamente asociadas con la hipertensi6n un ano despues del trasplante

Para cada uno de los con juntos de datos de los ejercicios 22 al 29 realice cada una de las siguientes actividades

a) Aplique una 0 mas tecnicas estudiadas en este capftulo b) Aplique una 0 mas tecnicas estudiadas en los capftulos anteriores c) Elabore graficas d) Formule hipotesis relevantes aplique las pruebas adecuadas y calcule los valores de p e) Formule las dedsiones estadfsticas y las conclusiones estadfsticas que los resultados de las pruebas de hip6tesis justifiquen f) Describa las poblaciones para las que estas inferencias puedan ser aplicables

22 Un estudio de Davies et at (A-l4) estuvo motivado por el hecho de que en los estudios anteriores de las respuestas contractiles a los agonistas ~-adrenorreceptores en miocitos inshydividuales a partir de cora zones humanos con y sin insuficiencia habran observado una declinaci6n relacionada con la edad en las respuestas maximas al isoproterenol en frecuenshycias donde las respuestas maximas ante altas cantidades de Ca2 + en la misma celula eran invariables Para este estudio los investigadores calcularon el cociente de isoproterenoVCa2+

(ISOCA) a partir de mediciones tomadas de los miocitos de pacientes con edades entre 7 y 70 anos Los individuos fueron clasificados como viejos (gt50 anos) y jovenes Los siguientes datos corresponden a los valores de ISOCA edad y Fuente de miocitos de los individuas estudiados Las Fuentes de miodtos fueron reportadas como de donador 0 por biopsia

Edad ISOCA Fuente de miocitos

7 137 Donador 21 139 Donador 28 117 Donador 35 071 Donador 31 114 Donador 50 095 Donador 51 0S6 Biopsia 52 072 Biopsia 55 053 Biopsia 56 OSI Biopsia 61 0S6 Biopsia 70 077 Biopsia

FUENTE Utilizada con autorizaci6n del Dr Sian E Harding

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 43: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

561 PREGUNTAS Y EJERCICIOS DE REPASO

23 Hayton et ai (A-15) investigaron los efectos farmacocineticos y la biodisponibilidad del cefetamet y cefetamet pivoxil en nmos con edades entre 35 y 173 meses que recibieron antibi6tico durante y despues de cirugfaurol6gica Entre los datos farmacocineticos recolectados estin las siguientesmedicicmes del volumen de distribuci6n aparenteen estado estable (V) Tambien se muestran los datos recolectados previamente de nifioscon edades entre 3 y 12 afios (A-16) y personas adultas (A-I 7) Ademas se muestran los pesos de los individuos (P)

Bebes Niiios Adultos

P (kg) V (litros) P (kg) V (littos) P(kg) V (litros)

62 2936 13 472 61 197 75 3616 14 523 80 237 7 1735 14 585 96 200 71 2557 15 417 75 195 78 2883 16 501 60 196 82 2318 17 581 68 215 83 3689 17 703 722 219 85 4133 175 662 87 309 86 2989 17 498 665 204 88 3500 175 645

10 4235 20 773 10 4804 23 767 102 2833 25 982 103 4068 37 144 106 3640 28 109 107 4067 47 154 108 8366 29 986 11 4614 37 144 125 3168 131 4518

FUENTE Utilizada con autorizaci6n del Dr Klaus Stoeckel

24 De aruerdo con Fils-Alme etal (A-IS) mediante encuestas epidemiologicas se ha detectado que el a1coholismo es el trastorno mental 0 la adicci6n mas frecuente en la poblaci6n masculishyna de Estados Unidos de Norteamerica Fils-Aime y asociados investigaron las relaciones entre la edad en que comienza el consumo excesivo de alcohol los antecedentes familiares de a1coshyholismo la coincidencia de enfermedades psiquiitricas y las concentraciones del metabolito de monoaminas delliquido cefalorraqufdeo en personas alcoh6licas en abstinencia que busshycall iratamientopara esta enfermedad Los individuos eran varones blancos que comenzaron a consumir aIcoholde manera excesiva dasificados como -iniciados a temprana edad (ruando tenfan 25 aDOS 0 menos) e iniciados a mayor edad (ruando tenfan 26 0 mas aDOS) Entre los datos recolectad05 estin las siguientes mediciones respecto a las concentraciones (pmoVml) de tript6fano (TRIPT) y acido 5-hidroxi-indoleacetico (5-HIAA) delliquido cefalorraquldeo

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 44: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

----------- --------- ------

562 CAPITULO 11 ANALISISDE REGRESION TECNICAS ADICIONALES

Inicio 1 = temprano

5-HIAA TRIPT o =tardio5-HIAA TRIPT

57 3315 116 2599

81 3334 78 2505

206 3269 64 3543

123 3371 147 2345 102 2855 93 2972

128 3904 69 2564 20 8832 66 4894 90 6017

103 3143 68 3729 81 3150

143 3955 121 4288 149 3404 82 2547

100 3633 117 3309middotmiddot 41 3315

223 3418 96 2295 87 3232 96 3496 34 2656middot 98 4318 86 3510

118 3613 84 3117 99 3496

114 4612 140 3051 74 3067 45 middotQ782 51 5034 99 2564

Inicio 1 = temprano

o =tardio

102 51 92

104 50 93

146 96

112 23

109 80

HI 85

131 58

110 80 12 80 91

102 93 98 78

152 108 102 122 81 81 99 73

163 109 90

110 48 77 67 92

3181 1 2513 1 2764 1 3098 1 2900 1 4125 1 6081 1 2972 1 3962 0 4894 1 3543 1 2622 1 3012 1 2685 1 3059 0 3946 1 3356 0 3671 1 4155 1 1923 1 3589 1 3839 0 2627 0 3181 0 4428 0 3303 0 5386middot 1 3282 1 2754 1 4321 1 3386 1 3344 1 3789 2131 1 3030 0 4731 1 4581 1 3292 0 4494 0 3453 3373

(Continua)

1 0 1 0 0 1 0 1 1 1 0 1 1 0 1 0 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 45: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

563 PREGUNTAS Y EJERCICIOS DE REPASO

lnicio 1 =temprano

5middotHIAA TRIPT o =tardio

54 4335 1 93 2596 1 50 2960 1

118 3916 0 96 2797 0 49 3699 1

133 2394 0 105 2495 0 61 2496 1

197 2123 1 87 3320 0 50 3117 1

109 3308 0 59 3280 1

107 3151 1 85 3955 0

156 3126 0 110 2913 0

81 3786 1 53 3616 1 64 3277 1 57 2656 1 29 4953 0 34 4340 1

Inicio 1 =temprano

5-HIAA TRIPT o =tardio

86 101 88 38 75 35 53 77

179 151 57 45 76 46 98 84

119 41 40

149 116 76 96

3787 0 3842 1 2882 1 2949 1 2248 0 3203 0 3248 1 3455 0 4521 1 3240 1 3905 1 3642 1 5233 0 4150 1 2579 1 3249 1 3381 0 4020 1 4569 1 3781 1 2346 1 3901 1 3822 1

FUENTE Utilizada con autorizaci6n del Dr Markku Linnoila

25 El objetivo de un esttidio realizado por Ahrahamsson et al (A-19) era investigar los efectos antitromb6ticos de un inhibidor del activador delplasmin6geno el (PAl-1) en ratas a las que se administr6 una endotoxina Los individuos de experimentaci6n eran ratas macho Sprague-Dawley con pesos entre 300 y 400 gramos Entre los datos recolectadosestan las siguientes mediciones respecto a la actividad del PAl-l y las concentraciones pulmonares de ]251 en ratas anestesiadas a las que se administraron tres drogas

Endotoxina

Actividad del PAI-l Farmacos

127 158 175 154 161 118 137 77 219 172 260 277

(Continua)

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 46: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

564 CAPITULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

Farmacos Actividad del PAImiddotl

(Vlml) Fibrina 1251 en los pulmones

( de ref samle)

203 195 414 244

216 169 272 192

Endotoxina + PRAP-l dosis baja 107 103 248 164 176 230 184 276 201 158

49 28

187 109 96

126 148

17 97 86

Endotoxina + PRAP-l dosis alta 132 130 75

140 166 194 121 III 208 211

86 24 17 41

114 110 26 53 71 90

FUENTE Utilizada con autorizaci6n del Dr Tommy Abrahamsson

26 Pearse y Sylvester (A-20) condujeron un estudio para determinar las contribuciones por seshyparado de la isquemia y perfusionextracorporal al dano vascular que ocurria en los pulmoshynes aislados de corderos y determinar la dependencia de oxfgeno de esa lesion Los pulmones fueron sometidos a isquemia unicamente despues a perfusion extracorporal y por ultimo a ambas situaciones Entre los datos recolectados esmn las siguientesobservaciones respecto al cambio en la presion arterial pulmonar (mm Hg) y la evaluacion de la permeabilidad vascular pulmonar mediante el coeficiente de reflexion de la albumina en los pulmones perfundidos con y sin isquemia previa

Pulmones isquemicos perfundidos PuImones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexi6n

80 0220 340 0693 30 0560 310 0470

100 0550 40 0651 230 0806 480 0999 150 0472 320 0719

(ContinUa)

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 47: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

565 PREGUNTAS Y EJERCICIOS DE REPASO

Pulmones isquemicos perfundidos Pulmones perfundidos

Cambioen Cambioen la la presion Coeficiente presion Coeficiente pulmonar de reflexion pulmonar de reflexion

430 0759 270 0902 180 0489 250 0736 270 0546 250 0718 130 0548 00 0467

Fuente Utilizada con autorizac6n del Dr David B Pearse

27 El prop6sito de un estudio de Balzamo et al (A-21) fue investigar en conejos anestesiados los efectos producidos por la ventilaci6n mecanica en las concentraciones de la sustancia P (SP) medida por radioinmunoensayos en nervios y musculos asociados con la respiraci6n y que participan en la inervaci6n sensitiva del sistema respiratorio y el coraz6n La sustancia P es un neurotransmisor localizado en las neuronas sensitivas primarias de los sistemas nervioshysos central y aut6nomo Entre los datos recolectados estan las siguientes mediciones de las concentraciones de SP en los nervios vagos cervicales (X) y los ganglios nudosos corresponshydientes (GN) dellado derecho e izquierdo

SPXder SPGNder SPXizq SPGNizq

06500 96300 33000 19300 25600 37800 06200 28700 11300 73900 09600 13100 15500 32800 27000 56400

359000 220000 45000 91000 190000 228000 86000 80000 136000 23000 70000 83000 80000 158000 41000 47000 74000 16000 55000 25000 33000 116000 97000 80000

198000 180000 138000 80000 85000 62000 110000 172000 54000 78000 119000 53000

119000 169000 82000 106000 477000 359000 39000 33000 142000 102000 32000 19000 29000 16000 27000 35000 66000 37000 28000 25000 37000 13000

FUENTE Utilizada con autorizaci6n del Dr Yves Jammes

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 48: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

566 CAPITULO 11 ANALISIS DE REGRESI6N TECNICAS ADICIONALES

28 Sheeringa y Zeartah (A-22) examinaron la presencia de trastdrnbs de estres postraumatico la severidad de la sintomatologfa postraumarica y el patron de manifestacion de grupos de sintomas en relacion con las seis variables independientes que pueden sobresalir en eI desashyrrollo de trastornosmiddotpostraumaticos en niiios menores de 48 meses de edad Los siguientes datos se recolectaron durante el curso del estudio

Variable de predicci6n Variables respuesta

Agudo Testigol Amenaza al Genero Edad rep Lesion exper cuidador Reexp Entorp Excit TeAgr

0 1 0 1 1 3 0 0 1 0 1 0 0 0 2 2 1 1 1 1 0 0 0 1 3 1 1 0 1 0 0 0 1 3 0 4 1 0 1 1 0 1 1 1 1 1 0 1 0 3 I 0 1 0 1 0 1 0 4 2 0 1 0 1 0 0 1 0 5 2 0 4 1 1 0 0 0 1 2 1 3 2 1 1 1 1 1 0 4 1 0 0 0 0 1 1 1 0 1 3 0 1 1 0 1 0 1 0 1 3 0 2 1 0 1 1 0 0 3 0 0 1 1 0 1 0 4 1 2 1 1 0 0 1 1 3 2 1 3 1 0 0 1 1 1 3 1 2 1 0 0 1 1 1 3 1 2 2 0 0 0 0 1 5 2 1 1 0 0 0 0 1 1 2 2 2 0 1 0 1 1 0 4 4 0 3

0 1 1 1 0 2 1 2 3 0 0 1 1 1 1 1 2 1

1 1 0 0 0 4 1 1 1 0 1 0 0 0 3 2 1 0 0 1 0 0 Q 3 1 2 4 0 1 0 0 0 1 3 1 2 4 0 1 0 0 1 0 2 2 0 0 1 1 0 0 0 1 2 0 3 0 1 0 0 0 1 2 0 2 0 0 1 0 1 2 3 3 1 1 1 0 1 0 1 2 1 1 1 1 0 1 1 1 3 2 0 4 1 1 0 0 6 0 2 4 2 0 0 0 0 0 1 0 2

(Continua)

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 49: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

567 PREGUNTAS Y EJERCICIOS DE REPASO

Variable de prediccion Variables respuesta

Agudo Testigo Amenaza ill Genero Edad rep Lesion exper cuidador Reexp Entorp Exdt TeAgr

0 0 1 0 0 1 2 3 2 3 0 0 1 0 0 1 3 1 4 3 0 0 1 0 0 1 3 1 2 3 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0shy 1 4 3 2 3 1 0 0 1 1 0 4 2 3 2 0 0 1 1 1 0 1 2 2 1

Clave Genero 0 varon 1 = mujer

Edad 0 = menos de 18 meses de edad al momenta de sufrir el traumatismo 1 mayor de 18 meses

Agudorep 0 = el traumatismo fue agudo un solo golpe 1 se repitio el traumatismo 0 fue cronico

Lesion 0 = el individuo no fue lastimado en el traumatismo 1 = el individuo fue lastimado ffsicamente en el traumatismo

Testigoexper 0 el individuo fue testigo pero no sufrio directamente el traumatismo 1 = el individuo experimento directamente el traumatismo

Amenaza al cuidador 0 el cuidador no fue amenazado en el traumatismo 1 = el cuidador fue amenazado en el traumatismo

Reexp = Numero de ocasiones en que present6 sfntomas de revivir el traumatismo Entorp Numero de ocasiones en que presento sfntomas de evasionlentorpecimiento de la sensibilidad Excit Numero de ocasiones en que p~sento sfntomas del grupode hiperexcitacion TeAgr = Numero de Qcasiones en que presento sintomas de agresi6n1nuevos temores

FUENTE Utilizada con autorizacion del Dr Michael-S Scheeringa

29 Uno de los objetivos de un estudio realizado por Mulloy y McNicholas (A-23) fue comparar la respiraciony el intercambio de gases durante l~s ~oras de suefro y ejercicio en enfermos con obstruccionpulmonar cr6nica Los investigadores tambien pretendian determinar si los estudios de ejereicio pueden ayudar en la prediccion de desaturacion nocturna en la enfershymedad pulmonar obstructiva cronica Los individuos (13 varonis y seis mujeres) eran pashycientes ambulatorios externos que recibian atenci6n en una clinica de problemas respiratorios Los pacientes tenian una edad media de 648 afros con desviacion estandar de 52 afros y todos presentaban enfermedad pulmonar obstructiva cronica grave estable Entre los datos recolectados estan las mediciones respecto a las siguientes variables

Somiddot Somas Descenso Edad IMC Pao PaOOt VEF ExSo media durante baja durante de So durante

(anos) (kIm2) (mmHg) (mmHg) ( pronosticado) mas baja el suefin el suefto el suefto

67 2346 525 54 22 74 706 56 296 62 2531 5775 49575 19 82 8549 76 1166 68 2311 72 438 41 95 8872 82 111 61 2515 72 474 38 88 9111 76 1845 70 2454 78 4005 40 88 9286 92 08 71 2547 6375 45375 31 85 8895 80 13 60 1949 8025 4215 28 91 9478 90 4

--shy(Continua)

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 50: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

568 CAPiTULO 11 ANALISIS DE REGRESION TECNICAS ADICIONALES

So So mas Descenso Edad Me PaD Paco VEF ExSo media durante baja durante de So durante

(aiios) (kIm2) (mmHg) (mmHg) ( pronosticado) masbaja el sueiio el sueiio el sueiio

57 2137 8475 402 20 91 9372 89 58 69 2578 6825 438 32 85 9091 79 13 57 2213 8325 43725 20 88 9439 86 95 74 2674 5775 51 33 75 8989 80 1411 63 1907 78 44175 36 81 9395 82 13 64 1961 9075 4035 27 90 9507 92 4 73 3030 6975 3885 53 87 90 76 18 63 2612 5175 468 39 67 6931 46 349 62 2(71 72 411 27 88 8795 72 22 67 2475 8475 40575 45 87 9295 90 217 57 2598 8475 4005 35 94 934 86 845 66 3200 5175 53175 30 83 8017 71 16

Tratada como variable dependiente en los amilisis de los autores IMe =fndice de masa corporal Pao tensi6n de oxigeno arterial PaC02 presi6n de di6xido de carbono arterial VEF = volumen espiratorio forzado en 1 segundo Sao = saturaci6n de oxfgeno arterial FUENTE Dr Eithne Mulloy Usado can permiso

En el siguiente ejercicio se utiliza uua gran cantidad de datos disponible en disco para computadora que el editor puede proveerbull

1 Consulte los datos de perdida de peso de 588 pacientes con cancer y 600 pacientes sanos (grupo de control) (PERPESO) La perdidade peso entre los pacientes enfermos de cancer es un fen6meno bien conocido EI papel que desempeftanen e1 proceso las anormalidades metab6licas llama la atenci6n de los medicos Una investigacion de las relaciones entre estas variables proporcion6 datos respecto a la produccion totai de proteinas de todo el cuerpo (Y) y e1 pbrcentaje de peso corporal ideal por estatura (X) Los iildividuos eran pacientes con cancer pulmonar y personas sanas de la misma edad EI ejercicio tonsiste en seleccionar una muestra aleatoria de tamano15 a partir de cada grnpo para hacer 10 siguiente

a) Dibujar un diagram a de dispersi6n con los datos de la muestra utilizando diferentes sfmbolos plra cada unQ de los grupos

b) Utilizar variablesimagil1arias para analizar estos datos

c) Graficar los datos de las rectas de regresi6n sobre el diagrama de dispersion ~Es posible conduir que las dos poblaciones rnuestreadas difieren con respecto a la producci6n media de proteinas cuando se considera el porcentaje de peso corporal ideal

Prepareuua interpretaCi6n verbal de los resultados del analisis y efect6e una comparaci6n de resultados entre los compafteros estudiantes

BmuocRAFfA

Bibliografia de metodoiogta

1 David W Hosmery Stanley Lemeshow Applied LolJistic Regression Wiley New York

2 David G Kleinbaum LolJistic Regression A selfuarning Text New York Springer

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 51: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

BIBLIOGRAFIA 569

Bibliografia de aplicaciones

A-I Mary A Woo Michele Hamilton Lynne W Stevensony Donna L Vredevoe Comparison of Thermodilution and Transthoracic Electrical Bioimpedence Cardiac Outputs Heart amp Lung 20 357-362

Amiddot2 Alan R Schwartz Avram R Gold Norman Schubert Alexandra Stryzak Robert A Wise Solbert Permutt y Philip L Smith Effect of Weight Loss on Upper Airway Collapsibility in Obstructive Sleep Apnea American Review ofRespiratory Disease 144 494-498

A-3 Cho-MingLoi Xiaoxiong Wei y Robert E Vestal Inhibition ofTheophylline Metabolism by Mexiletine in Young Male and Female Nonsmokers Clinical Pharmacology amp Therapeutics 49571-580

A-4 Kirk] Brower Frederic C Blow] ames P Youngy Elizabeth M Hill Symptoms and Correlates of Anabolic-Androgenic Steroid Dependence British journal ofAddiction 86 759-768

A-5 Roberta S Erickson y Sue T Yount Effect of Aluminized Covers on Body Temperature in Patients Having Abdominal Surgery Heart amp Lung 20 255-264

A-6 ] A Kusin Sri Kardjati W M van Steenbergen y U H Renqvist Nutritional Transition During Infancy in East]ava Indonesia 2 A Longitudinal Study of Growth in Relation to the Intake of Breast Milk and Additional Foods EuropeanJournal ofClinical Nutrition 45 77 -84

A-7 Delia Scholes]anet R Daling y Alldy S Stergachis Current Cigarette Smoking and Risk of Acute Pelvic Inflammatory Disease Americanjournal ofPublic Health 82 1352-1355

A-8 M Carroll C Sempos R Fulwood et al Serum Lipids and Lipoproteins ofHispanics 1982-84 National Center for Health Statistics Vital and Health Statistics 11 (240)

Amiddot9 M Porrini P Simonetti G Testolin C Roggi M S Laddomada y M T Tenconi Relation Between Diet Composition and Coronary Heart Disease Risk Factors journal ofEpidemiology and Community Health 45 148-151

A-IO Clyde Hertzman Helen Ward Nelson Ames Shona Kelly y Cheryl Yates Childhood Lead Exposure in Trail Revisited Canadianjournal ofPublic Health 82 385-391

A-II A Brock y V Brock Factors Mfecting Inter-individual Variation in Human Plasma Cholinesterase Activity Body Weight Height Sex Genetic Polymorphism and Age Archishyves ofEnvironmental Contamination and Toxicology 2493-99

A-12 K Ueshima J Myers P M Ribisl] E Atwood C K Morris T Kawaguchi] Liu y V F Froelicher Hemodynamic Determinants ofExercise Capacity in Chronic Atrial Fibrillation American Heart journal 125 (No5 Parte 1) 1301-1305

A-13 C Ponticelli G Montagnino A Aroldi C Angelini M Braga y A Tarantino Hypertension Mter Renal Transplantation Americanjournal ofKidney Diseases 21 (No5 Suplemento 2) 73-78

A-l4 C H Davies N Ferrara y S E Harding p-Adrenoceptor Function Changes with Age of Subject in Myocytes from Non-failing Human Ventricle Cardiovascular Research 31152shy156

A-15 William L Hayton Johannes Kueer Ronald de Groot y Klaus Stoeckel Influence of Maturation and Growth on Cefetamet Pivoxil Pharmacokinetics Rational Dosing for Infants Antimicrobial Agents and Chemotherapy 40 567-574

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394

Page 52: Daniels Capítulo 11 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

570 CAPITULO 11 At~ALISIS DE REGRESI6N TECNICAS ADICIONALES

A-I6 W L Hayton R A Walstad E Thurmann-Nielsen T Kufaasj Rneer R] Ambros H E Rugstad E Monn E Bodd y K Stoeckel Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in ChildrenAntimicrobial Agents and Chemotherapy 720-725 Erratum 36 2575

A-I7 M P Ducharme D] Edwards P] McNamara y K Stoeckel Bioavailability of Syrup and Tablet Formulations of Cefetamet Pivoxil Antimicrobial Agents and Chemotherapy 37 2706shy2709middot

A-IS Marie-Lourdes Fils-Aime Michael J Eckardt David T George Gerald L Brown Ivan Mefford y Markku Linnoila Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5~Hydroxyindoleacetic Acid Levels Than Late-Onset Alcoholics Archives ofGeneral Psychilltry 53 211-216

A-I9 T Abrahamsson V Nerme M Stromqvist B Akerblom A Legnehed K Pettersson y A Westin Eriksson Anti-thrombotic Effect of PAl-1 Inhibitor in Rats Given Endotoxin Thrombosis and Haemostasis 75 118-126

A-20 David B Pearse y J T Sylvester Vascular Injury in Isolated Sheep Lungs Role ofIschemia Extracorporeal Perfusion and Oxygen AmericanJournal ofRespiratory and Critical Care Medishycine 153 196-202

A-21 Emmanuel Balzamo Pierre J oanny Jean Guillaume Steinberg Charles Oliver e YvesJ ammes Mechanical Ventilation Increases Substance P Concentration in the Vagus Sympathetic and Phrenic Nerves AmericanJournal ofRespiratory and Critical Care Medicine 153 153-157

A-22 Michael S Scheeringa y Charles H Zeanah Symptom Expression and Trauma Variables in Children Under 48 Months ofAge Infant Mental HealthJournal 16 259-270

A-23 Eithne Mulloy yWalter T McNicholas Ventilation and Gas Exchange During Sleep and Exercise in Severe COPD Chest 109 387-394